BAB II. REGRESI LINIER SEDERHANA 2.1 Pendahuluan Gejala-gejala alam dan akibat atau faktor yang ditimbulkannya dapat diukur atau dinyatakan dengan dua kategori yaitu fakta atau data yang bersifat kuantitatif dan fakta atau data yang bersifat kualitatif. Dalam pembicaraan ini akan diuraikan masalah regresi dan korelasi, sebagai pengukur hubungan antara dua variabel atau lebih. Dalam pembicaraan regresi dan korelasi data yang dianalisis harus bersifat kuantitatif atau terukur atau terhitung atau dapat dikuantitatifkan; jadi sekurang-kurangnya data dengan skala interval. Data kuantitatif dapat dibedakan atas dua macam yaitu: Data atau pernyataan yang bersifat bebas adalah pernyataan yang ditentukan dengan mana suka atau bebas pilih. Pernyataan ini sering disebut dengan variabel bebas atau variabel bebas atau variabel atau prediktor atau independent variable. Data atau pernyataan yang tergantung atau terikat pada variabel bebas disebut dengan variabel tak bebas atau variabel tergantung atau variabel tak bebas atau variabel endogen atau kreterium atau dependent variable. Apakah perlunya mempelajari regresi dan korelasi ?. Tujuan mempelajari regresi dan korelasi adalah untuk menemukan atau mencari hubungan antarvariabel, sebagai dasar untuk dapat dipakai melakukan penaksiran atau peramalan atau estimasi dari hubungan antarvariabel tersebut.
2.2 Pengertian Regresi dan Korelasi Telah dinyatakan dimuka bahwa regresi atau korelasi adalah metode yang dipakai untuk mengukur hubungan antara dua variabel atau lebih. Kedua metode regresi maupun korelasi sama-sama dipakai untuk mengukur derajat hubungan antarvariabel yang bersifat korelasional atau bersifat keterpautan atau ketergantungan. Penggunaan regresi adalah sebagai pengukur bentuk hubungan, dan korelasi adalah sebagai pengukur keeratan hubungan antarvariabel. Kedua cara pengukur hubungan tersebut mempunyai cara perhitungan dan syarat penggunaannya masing-masing. Penjelasan mengenai perbedaan antara regresi dan korelasi dalam pemakaiannya atau penerapannya terletak pada: 1.
Regresi adalah pengukur hubungan dua variabel atau lebih yang dinyatakan dengan bentuk hubungan atau fungsi. Untuk menentukan bentuk hubungan (regresi) diperlukan pemisahan yang tegas antara variabel bebas yang sering diberi simbul X dan variabel tak bebas dengan simbul Y. Pada regresi harus ada variabel yang ditentukan dan variabel yang menentukan atau dengan kata lain adanya ketergantungan variabel yang satu dengan variabel yang lainnya dan sebaliknya. Kedua variabel biasanya bersifat kausal atau mempunyai hubungan sebab akibat yaitu saling berpengaruh. Sehingga dengan demikian, regresi merupakan bentuk fungsi tertentu antara variabel tak bebas Y dengan variabel bebas X atau dapat dinyatakan bahwa regresi adalah sebagai suatu fungsi Y = f(X). Bentuk regresi tergantung pada fungsi yang menunjangnya atau tergantung pada persamaannya.
2.
Korelasi adalah pengukur hubungan dua variabel atau lebih yang dinyatakan dengan derajat keeratan atau tingkat hubungan antarvariabel-variabel. Mengukur derajat hubungan dengan metode korelasi yaitu dengan koefisien korelasi r. Dalam hal ini, dengan tegas dinyatakan bahwa dalam analisis korelasi tidak mempersoalkan apakah variabel yang satu tergantung pada variabel yang lain atau sebaliknya. Jadi metode korelasi dapat dipakai untuk mengukur derajat hubungn antarvariabel bebas dengan variabel bebas yang lainnya atau antar fua variabel.
7
PDF created with pdfFactory Pro trial version www.pdffactory.com
Perlu ditekankan bahwa penggunaan metode korelasi untuk mengukur hubungan antarvariabel yang satu dengan variabel yang lain, hendaknya anrata variabel itu diharapkan mempunyai kaitan atau relevansi. Jangan sekali-sekali menghubungkan atau mengkorelasikan variabel-variabel yang sangat jauh atau mustahil atau relevansinya sangat kecil. Beberapa contoh penggunaan korelasi dan regresi seperti di bawah ini. 1). 2). 3). 4). 5). 6). 7). 8). 9). 10).
Banyaknya anakan dengan produksi padi. Kepadatan penduduk dengan upah buruh harian. Berat induk sapi dengan berat anak yang baru dilahirkan. Nilai yang diperoleh pada mata ajaran statistika dengan matematika. Umur dengan berat badan anak balita. Kadar air pada biji dan volume biji. Luas daun dengan panjang akar. Besar buah dengan besar biji. Biaya advertensi dengan jumlah penjualan. Fluktuasi temperatur dengan jumlah anak-anak yang sakit pilek.
Selain contoh di atas, masih banyak lagi contoh yang lain yang serupa. Dari contohcontoh di atas dapat dilakukan pendekatan yang sesuai seperti: analisis regresi dapat dipakai pada contoh-contoh nomer: 1; 2; 3; 5; dan 9. Sedangkan, analisis korelasi dapat dipakai pada semua contoh di atas.
2.3 Macam-macam Regresi Telah disebutkan di muka bahwa regresi adalah bentuk hubungan antara variabel bebas X dengan variabel tak bebas Y, yang dinyatakan dalam bentuk fungsi matematis Y = f(X). Sehingga persamaan regresi atau bentuk fungsi, sesuai dengan variabel bebas X yang menyusunnya. Dengan demikian bentuk fungsi atau regresi dapat digolongkan menjadi beberapa macam yaitu:
2.3.1
Regresi linier.
Regresi linier ialah bentuk hubungan di mana variabel bebas X maupun variabel tergantung Y sebagai faktor yang berpangkat satu. Regresi linier ini dibedakan menjadi: 1). Regresi linier sederhana dengan bentuk fungsi: Y = a + bX + e, 2). Regresi linier berganda dengan bentuk fungsi: Y = b0 + b1X1 + . . . + bpXp + e Dari kedua fungsi di atas 1) dan 2); masing-masing berbentuk garis lurus (linier sederhana) dan bidang datar (linier berganda).
2.3.2
Regresi non linier.
Regresi non linier ialah bentuk hubungan atau fungsi di mana variabel bebas X dan atau variabel tak bebas Y dapat berfungsi sebagai faktor atau variabel dengan pangkat tertentu. Selain itu, variabel bebas X dan atau variabel tak bebas Y dapat berfungsi sebagai penyebut (fungsi pecahan), maupun variabel X dan atau variabel Y dapat berfungsi sebagai pangkat fungsi eksponen = fungsi perpangkatan.
8
PDF created with pdfFactory Pro trial version www.pdffactory.com
Regresi non linier dapat dibedakan menjadi: 1). Regresi polinomial ialah regresi dengan sebuah variabel bebas sebagai faktor dengan pangkat terurut. Bentuk-bentuk fungsinya adalah sebagai berikut. Y = a + bX + cX2 (fungsi kuadratik). 2
3
2
3
2
3
Y = a + bX + cX + bX (fungsi kubik) 4
Y = a + bX + cX + dX + eX (fungsi kuartik), Y = a + bX + cX + dX + eX4 + fX5 (fungsi kuinik), dan seterusnya. Selain bentuk fungsi di atas, ada suatu bentuk lain dari fungsi kuadratik, yaitu dengan persamaan: Y = a + bX + c√X. bentuk ini dapat ditulis menjadi: (1/2)
Y = a + bX + cX
,
Sehingga, modifikasi dari fungsi kubik adalah: (1/2)
Y = a + bX + cX
(3/2)
+ dX
, atau
3
Y = a + b√X + cX + d√X . Dari contoh-contoh tersebut di atas perhatikan pangkat dari variabel bebas X. 2).
Regresi hiperbola (fungsi resiprokal). Pada regresi hiperbola, di mana variabel bebas X atau variabel tak bebas Y, dapat berfungsi sebagai penyebut sehingga regresi ini disebut regresi dengan fungsi pecahan atau fungsi resiprok. Regresi ini mempunyai bentuk fungsi seperti: 1/Y = a + bX Y
atau
= a + b/X.
Selain itu, ada bentuk campuran seperti: 2
1/Y = a + bX + cX , dan masih banyak lagi bentuk-bentuk lainnya. 3).
Regresi fungsi perpangkatan atau geometrik. Pada regresi ini mempunyai bentuk fungsi yang berbeda dengan fungsi polinomial maupun fungsi eksponensial. X Regresi ini mempunyai bentuk fungsi: Y = a + b .
4).
Regresi eksponensial. Regresi eksponensial ialah regresi di mana variabel bebas X berfungsi sebagai pangkat atau eksponen. Bentuk fungsi regresi ini dalah: Y = ae Y = a
bX
atau
bX 10 .
Modifikasi dari bentuk di atas adalah: 1/Y
=
cX
a + be , ini disebut kurva logistik atau "tipe umum dari model pertumbuhan".
Modifikasinya juga seperti : (a + b/X)
Y = e , disebut dengan transformasi logaritmik resiprokal, yang umum disebut dengan model Gompertz.
9
PDF created with pdfFactory Pro trial version www.pdffactory.com
5). Regresi logaritmik. Bentuk fungsi dari regresi adalah: di mana variabel bebas Y berfungsi sebagai pangkat (eksponen) dan variabel bebas X mempunyai bentuk perpangkatan. Model regresi ini adalah: Y
e = a+b
X
atau dapat di tulis menjadi:
Y = ln a + b ln X (merupakan trasformasi lilier) 6). Regresi fungsi geometri. Bentuk dari fungsi ini adalah berupa bentuk regresi linier berganda di mana dalam fungsi ini terdapat fungsi trigonometri. Bentuk yang paling sederhana dari fungsi ini adalah: Y = a + b sin dX + c cos dX. Bentuk fungsi ini disebut kurva Faurier. Selain itu, ada lagi bentuk-bentuk yang lebih kompleks seperti: 2
2
Y = a + b sin X + c cos X + d sin X + e cos X +…; dan seterusnya.
2.4 K o r e l a s i Pembicaraan mengenai keeratan hubungan atau korelasi yang diukur dengan tingkat atau derajat keeratan hubungan. Tingkat atau derajat keeratan hubungan dapat diukur dengan memakai, koefisien korelasi dengan simbul r untuk bubungan linier sederhana dan indeks korelasi dengan simbul R untuk hubungan bukan linier sederhana. Koefisien korelasi r dipakai hanya untuk menyatakan keeratan hubungan yang bersifat linier sederhana, sedangkan indeks korelasi R untuk menyatakan keeratan hubungan dari bentuk-bentuk linier berganda dan bentuk non linier. Indeks korelasi R sering disebut juga koefisien korelasi berganda. Selain koefisien korelasi sederhana r, dan indeks korelasi R, terdapat juga modifikasi atau fraksi dari R, yang disebut dengan koefisien korelasi parsiil, korelasi rank, korelasi serial, dan korelasi biserial, korelasi kotingensi, dan korelasi kanonikal. Apabila r dan R, jika dikuadratkan akan memberikan suatu nilai tertentu yaitu r2 atau R2 yang kadang-kadang nilai r2 atau R2 keduanya diberi simbul yang sama yaitu R2 atau D. 2 Kedua nilai D atau R disebut koefisien determinasi atau koefisien penentu atau indeks penentu. Selanjutnya, mengenai korelasi dan modifikasinya akan dibicarakan tersendiri setelah pembicaraan regresi. Perlu ditekankan lebih luas bahwa hubungan dapat dibuat regresinya, demikian pula, tidak semua variabel atau gejala-gejala alam dapat dicari korelasinya. Oleh karena itu, agar lebih berhati-hati dalam menggunakan alat statistika ini di dalam penarikan kesimpulan, lebih-lebih membuat suatu keputusan yang lebih jauh. Akan tetapi, yang jelas bahwa kedua alat ukur tersebut di atas dapat memberikan sumbangan atau pandangan yang lebih jauh terhadap masalah yang dihadapi, karena terutama analisis regresi mempunyai daya ramal atau daya taksir yang menyakinkan apabila diuji dengan taraf nyata yang peka atau jitu. Dan inilah yang merupakan tujuan pembicaraan yang pokok pada analisis regresi dan korelasi selanjutnya.
2.5
Regresi Linier Sederhana
Telah dijelaskan di muka bahwa regresi adalah membicarakan bentuk hubungan atau fungsi antara dua variabel atau lebih. Perlu ditekankan bahwa dalam bentuk hubungan tersebut terdapat sebuah variabel tak bebas Y, dengan sekurang-kurangnya sebuah variabel bebas X. Untuk mendapatkan bentuk hubungan yang sesuai antara variabel bebas X dengan variabel tak bebas Y maka kedua variabel tersebut harus dinyatakan dalam nilai yang terukur atau kuantitatif sekurang-kurangnya dengan skala interval.
10
PDF created with pdfFactory Pro trial version www.pdffactory.com
Dari variabel-variabel yang akan dicari bentuk hubungannya terlebih dahulu hendaknya dijelaskan mana yang sebagai variabel bebas X dan mana yang sebagai variabel tak bebas Y. Dalam hal-hal tertentu, penentuan variabel bebas X dan variabel tak bebas Y sangat mudah, tetapi kadang-kadang hal tersebut sangat sulit ditelusuri antara yang mana variabel bebas X maupun yang mana variabel tak bebas Y. Apabila hubungan antara dua variabel atau lebih bersifat kausal atau hubungan sebab-akibat, maka variabel yang sebagai sebab merupakan variabel bebas atau variabel X dan akibat yang ditimbulkannya menjadi variabel tak bebas atau variabel Y. Setelah jelas mana variabel X dan variabel Y, maka selanjutnya perlu menentukan pola hubungan atau bentuk hubungan yang dinyatakan dalam bentuk persamaan matematik yang menyatakan hubungan fungsionalnya. Sehingga segala analisis statistika yang berkaitan dengan hal tersebut dinamakan dengan analisis regresi. Apakah beda antara analisis regresi dengan analisis-analisis yang lain ? Sebagai contoh apa perbedaan antara analisis regresi dengan analisis keragaman atau analisis varians, perbedaan tersebut terletak pada yaitu: dalam analisis keragaman tidak mencari bentuk hubungan antara variabel-variabel seperti pada analisis regresi, melainkan mencari perbedaan pengaruh perlakuan atau objek, yaitu perbedaan antara variabel bebas X atau variabel yang dipelajari; dengan mengukur respon dari perlakuan atau variabel X yang dinyatakan dengan variabel tak bebas Y yang sering disebut hasil atau akibat perlakuan. Tujuan utama dari analisis regresi adalah untuk memberikan dasar-dasar peramalan atau pendugaan dalam analisis peragam atau analisis kovarian. Analisis regresi sebagai alat untuk melakukan peramalan atau prediksi atau estimasi atau pendugaan yang sangat berguna bagi para pembuat keputusan. Biasanya variabel tak bebas Y adalah variabel yang diramalkan dan variabel bebas X yang telah ditetapkan sebagai peramal yang disebut prediktor. Untuk membuat ramalan antara variabel X dengan variabel Y, maka variabel X dan variabel Y tersebut harus mempunyai hubungan yang kuat. Kuat tidaknya hubungan antara variabel bebas X dan variabel tak bebas Y didasarkan pada analisis korelasi. Jadi antara analisis korelasi dan analisis regresi mempunyai kaitan yang sangat erat (akan dibicarakan di belakang).
2.5.1
Persamaan regresi linier sederhana
Bentuk hubungan yang paling sederhana antara variabel X dengan variabel Y adalah berbentuk garis lurus atau berbentuk hubungan linier yang disebut dengan regresi linier sederhana atau sering disebut regresi linier saja dengan persamaan matematikanya adalah sebagai berikut: [2.1].
Y = A + BX
Apabila A dan B mengambil nilai seperti: A = 0 dan B = 1,persamaan [2.1] akan menjadi: [2.2].
Y = X
Persamaan [2.2] adalah suatu bentuk persamaan yang paling sederhana dari regresi linier sederhana. Dari persamaan [2.1] A dan B disebut konstanta atau koefisien regresi linier sederhana atau parameter garis regresi linier sederhana. A disebut intercept coefficient atau intersep yaitu jarak titik asal atau titik acuan dengan titik potong garis regresi dengan sumbu Y; dan B disebut slope coefficient atau slup yang menyatakan atau menunjukkan kemiringan atau kecondongan garis regresi terhadap sumbu X. Dari persamaan garis regresi [2.1] di atas, dalam hubungan tersebut terdapat satu variabel bebas X dan satu variabel tak bebas Y. Sebagai ilustrasi hubungan antara variabel bebas X dan variabel tak bebas Y diberikan contoh dari persamaan [2.1] yaitu pengaruh tingkat pendapatan dengan konsumsi makanan bagi petani pedesaan, seperti pada Tabel 2.1 berikut ini.
11
PDF created with pdfFactory Pro trial version www.pdffactory.com
Tabel 2.1.
Pengaruh Tingkat Pendapatan terhadap Konsumsi Makanan Bagi Petani
No.
Pendapatan 125 150 175 200 225
1 2 3 4 5
Konsumsi 75 100 125 135 150
Dari gambar contoh di bawah menunjukkan semakin tinggi pendapatan sampai Rp 225.000 maka komsumsi makanan semakin meningkat. Sehingga dari pasanganpasangan nilai X,Y tersebut dapat dicari bentuk hubungan atau garis regresi antara variabel bebas Y atas variabel tak bebas X yang dtulis dengan Y/X. Dari Tabel 2.1 di atas dapat dibuat garis regresi liniernya seperti Gambar 2.1 berikut: 175 150 Konsumsi (Y)
125 100
B
75 50
A
25 0 100
125
150
175
200
225
250
Pendapatan (X)
Gambar 2.1. Model Linier Garis Regresi
2.5.2 Garis regresi linier sederhana Sekarang bagaimana caranya membuat persamaan garis regresi linier sederhana seperti Gambar 2.1 di atas, yang mempunyai bentuk persamaan matematis: Y = A + BX seperti pada persamaan [2.1]. Penentuan garis regresi antara variabel bebas X dengan variabel tak bebas Y, sering disebut regresi Y atas X ditulis dengan Y/x, yang mempunyai pengertian bahwa: setiap variabel bebas X akan memberikan atau menghasilkan suatu nilai variabel tak bebas Y yang tertentu; sehingga antara variabel X dan variabel Y yang tertentu akan menjadi pasangan-pasangan tetap disebut dengan pasangan nilai X,Y. Setiap pasangan nilai X,Y merupakan hubungan sebab (X) dan akibat (Y). Sejumlah pasangan antara nilai X,Y inilah yang akan menentukan persamaan regresi yang dibuat sesuai dengan asumsi atau model yang digunakan. Bagaimana persamaan regresi akan ditentukan jika hasil pengamatan atau yang berupa pasangan-pasangan nilai pengamatan antara X,Y telah didapatkan.
12
PDF created with pdfFactory Pro trial version www.pdffactory.com
2.5.3
Penetuan garis regresi linier sederhana
Untuk menentukan garis regresi berdasarkan pasangan-pasangan nilai X,Y diberikan dua metode yang umum yaitu: 1).
Metode tangan bebas. Metode tangan bebas merupakan suatu metode yang berdasarkan kira-kira dari diagram titik atau diagram pencar atau scatter diagram yang diperoleh dari hasil pengamatan antara variabel X dan variabel Y. Diagram pencar didapatkan dengan menggambar titik-titik pasangan pengamatan antara X dan Y atau X,Y pada suatu sistem salib sumbu atau sistem koordinat. Dengan memperhatikan letak titik-titik pasangan pada absis X dan ordinat Y, maka kumpulan titik-titik tersebut dapat memberi petunjuk untuk memperkirakan garis regresi yang akan dibuat. Metode ini hanya dapat dilakukan oleh seorang ahli dan berpengalaman seperti pada Gambar 2.2.
2).
Pendekatan matematis dengan metode kuadrat terkecil atau least squares method atau sering disebut dengan metode ordinary list squares (OLS). Bahwa suatu garis regresi yang akan didapat dan akan mendekati titik-titik pasangan X,Y. Tentu saja atau pada umumnya tidak dapat ditarik atau digambarkan suatu garis regresi yang sederhana, yang dapat melalui semua titik-titik pasangan X,Y.
Jika pencaran atau sebaran titik pasangan X,Y tersebut disekitar garis lurus, maka cukup beralasan untuk menduganya dengan persamaan regresi linier sederhana atau regresi garis lurus. Dilain pihak, jika sebaran titik-titik pasangan X,Y tersebut bukan linier, tetapi melengkung atau non linier yang paling menghampiri. Untuk hal tersebut dan menentukan analisis dan gambarnya dapat dilihat bentuk-bentuk hubungan pada bukubuku matematika. Bentuk mana yang paling sesuai atau paling dihampiri oleh titik-titik pasangan tersebut. Untuk pendekatan linier atau regresi linier sederhana, perhatikan diagram pencar berikut yang berasal dari Tabel 2.1 di muka antara tingkat pendapatan (X) dengan konsumsi (Y) diambil sebagaian saja seperti pada Tabel 2.2. Tabel 2.2.
Pengaruh Tingkat Pendapatan terhadap Konsumsi Makanan Bagi Petani
No.
Pendapatan
Konsumsi
1
125
75
2
150
100
Sehingga garis regresi linier yang dapat dibuat dari Tabel 2.2 seperti pada Gambar 2.2 berikut. Garis regresi yang melalui dua buah titik pengamatan P dan Q, di mana kedudukan kedua titik tersebut adalah bebas atau sembarang pada garis regresi yang melewati. Maka dapat dibuat persamaannya dengan menggunakan dua buah titik. Dasar teori, melalui dua buah titik dapat dibuat sebuah garis lurus yaitu PQ yang akan dicari persamaannya. Perhatikan sudut β yang sisi-sisi siku-sikunya adalah ∆Y = Y2 - Y1 dan ∆X = X2 - X1 sehingga tangen sudut β = ∆Y/∆X, maka persamaan garis PQ menjadi: Y = A + β X. Dari persamaan tersebut dengan penyelesaian matematika sehingga akan didapatkan bentuk persamaan liniernya seperti persamaan [2.1].
13
PDF created with pdfFactory Pro trial version www.pdffactory.com
125
Q 100 Konsunsi
P
β
75 50 25 0 120
∆ Y = Y2-Y1
∆X = X2 - X1
Y2
140
X2
Y1
A
X1
160
Pendapatan
Gambar 2.2. Perhitungan β = ∆Y/∆X Secara Sederhana
2.6
Pendekatan Matematis Regresi Linier Sederhana
Adalah tidak mungkin untuk memperkirakan bentuk hubungan antara dua variabel atau lebih tanpa diawali dengan membuat asumsi terlebih dahulu. Dalam beberapa hal dimungkinkan untuk mengecek atau menguji asumsi atau hipotesis setelah bentuk hubungan itu diperkirakan. Suatu bentuk hubungan atau fungsi linier atau regresi linier di samping mudah interprestasinya, juga dapat dipergunakan sebagai pendekatan bentuk hubungan yang bukan linier (non linier) menjadi bentuk linier. Fungsi linier sama dengan persamaan linier atau model linier atau regresi linier yang mempunyai bentuk hubungan atau bentuk fungsi: Y = A + BX. Seperti pada persamaan [2.1] A dan B adalah konstanta, yaitu parameter yang digunakan. A ialah: jarak titik acuan (0, 0) dengan perpotongan antara sumbu tegak Y dengan garis linier atau besarnya nilai variabel Y, apabila nilai X = 0. A sering disebut intersep atau intercept coefficient dan B ialah: koefisien arah adalah koefisien garis regresi yang sama dengan tangen arah yang menunjukkan besarnya pengaruh perubahan X terhadap perubah Y yaitu apabila variabel X naik atau turun atau berubah satu unit satuan X, maka variabel Y bertambah atau menurun atau berubah sebanyak B kali. B sering disebut kemiringan atau kecondongan garis regresi atau slope atau slope coefficient adalah tangen sudut yang dibuat oleh garis regresi dengan sumbu X. Perhatika Gambar 2.3 di bawah ini, yang menunjukkan garis-garis regresi linier dari beberapa pengamatan. Oleh karena dalam pembicaraan ini hendak berusaha mencari cara untuk menentukan persamaan garis regresi linier sederhana yang baik atau yang terbaik. Untuk itu haruslah terlebih dahulu mengetahui apa yang dimaksud dengan garis regresi yang baik. Suatu pertanyaan yang berhubungan dengan hal tersebut di atas adalah: "Kapankah suatu garis regresi dapat dikatakan sebagai garis regresi yang baik?". Dengan demikian kembali ke Gambar 2.3 di atas yang manakah dari ketiga garis tersebut termasuk garis regresi yang terbaik, yang dipakai untuk menghampiri titik-titik P, Q dan R. Apabila ada garis tertentu selain ketiga garis YPQ, YPR, dan YQR yang merupakan garis regresi terbaik sebagai penghampir titik-titik pasangan pengamatan Xi,Yi sebagai garis regresi tersebut.
14
PDF created with pdfFactory Pro trial version www.pdffactory.com
150 R
Konsunsi
125 100 75
Ŷ=α+βX
50
Q
25
P
0 120
140
160
Pendapatan Gambar 2.3. Penggambaran Regresi Penduga Ŷ = α + β X Sebuah garis dikatakan sebagai garis regresi terbaik yang disebut dengan garis regresi penduga diberi simbul dengan: Ŷ (dibaca Y topi atau Y cup atau Y penduga). Sehingga garis regresi linier sederhana dengan persamaan penduga menjadi : [2.3a]. Ŷ = α + β X
atau ditulis dengan
[2.3b]. Ŷ = β0 + β1 X
atau
untuk populasi
[2.3c]. Ŷ = β1 + β2 X [2.4a]. Ŷ = a + b X
atau ditulis dengan
[2.4b]. Ŷ = b0 + b1 X
atau
untuk sampel
[2.4c]. Ŷ = b1 + b2 X Suatu hal yang harus dipahami bahwa dalam pendugaan garis regresi, besarnya nilai variabel tak bebas Y, tidak hanya tergantung pada variabel bebas X saja, tetapi ada faktor-faktor lain yang ikut mempengaruhi. Faktor-faktor tersebut secara keseluruhan dinamakan kesalahan pengganggu (disturbance error) yang diberi simbul dengan e. Kadang-kadang nilai e diartikan faktor-faktor tertentu yang belum diketahui penyebabnya atau faktor-faktor yang belum dijelaskan. Faktor-faktor tersebut yang dapat terdiri atas: salah hitung, salah catat, salah ukur, alat kurang sempurna, dan nilai-nilai kebetulan, serta banyak lagi nilai-nilai yang lainnya. Kesalahan pengganggu e tersebut menyebabkan ramalan menjadi kurang tepat terhadap garis regresi penduga seperti: [2.5].
Ŷ = A + BX
untuk populasi
Jadi kesalahan e tersebut dapat mengakibatkan adanya resiko. Oleh karena itu, resiko tersebut hendaknya dibuat sekecil-kecilnya atau minimal. Untuk melakukan dugaan atau membuat keputusan selalu ada resiko walaupun betapa kecilnya.
15
PDF created with pdfFactory Pro trial version www.pdffactory.com
Karena dalam suatu pendugaan nilai A dan B tidak dapat dihitung (belum diketahui nilainya), biasanya ditaksir dengan nilai a dan b atau dengan nilai b0 dan b1; sehingga garis regresi linier penduga mempunyai bentuk persamaan: Ŷ = b0 + b1 X
[2.6].
untuk sampel
Jadi a dan b atau b0 dan b1 sebagai penaksir A dan B. Hubungan antara nilai kesalahan e, dengan nilai penduga Ŷ dan dengan nilai pengamatan Yi dapat ditulis: [2.7a]. Ŷ = b0 + b1 X dan Yi = Ŷ + e
atau
[2.7b]. e = Yi - Ŷ Untuk sejumlah n pasangan pengamatan, maka penulisannya menjadi seperti: [2.8].
ei = Yi - (b0 + b1 X)
Nilai e sebagai penduga nilai kesalahan E adalah kesalahan penggangu populasi dan e adalah kesalahan penganggu sampel. Nilai e dapat berharga positif bila nilai pengamatan Yi berada di atas garis penduga Ŷ; dapat berharga negatif bila nilai pengamatan Yi berada di bawah garis penduga Ŷ; dan dapat pula berharga nol bila nilai pengamatan Yi berada tepat pada garis penduga Ŷ. Seperti yang ditunjukkan pada Gambar 2.3 dengan menggambar scatter diagram dengan Ŷ, Yi, dan ei.
150 (+) e3
Konsumsi
125 100
Ŷ
75 e2 (-)
50 25
Y2
e1 (+
0 120
130
140
150
160
Pendapatan Gambar 2.3. Nilai Penduga Ŷ, Nilai Pengamatan Yi, dan Nilai Kesalahan Penganggu ei
16
PDF created with pdfFactory Pro trial version www.pdffactory.com
2.7
Pendekatan Garis Penduga Terbaik
Ada beberapa cara pendekatan matematika untuk mendapatkan garis regresi penduga yang terbaik seperti: 1. Garis penduga menjadi garis regresi terbaik apabila jumlah semua kesalahan adalah minimal ditulis dengan: ∑ei = minimal atau ∑( Yi - Ŷ) = minimal. Sesuai dengan teori aljabar maka akibatnya ∑ei sama dengan nol (minimal), sebab nilai negatif mengkompen nilai positif, seperti yang ditunjukkan pada Gambar 2.4. 2. Garis penduga merupakan garis regresi yang terbaik, apabila jumlah harga mutlak dari nilai kesalahan atau ∑│e│ adalah minimal. Cara ini lebih baik dari cara pertama sebab tidak ada saling kompensasi antara nilai ei yang negatif dengan positif. 3. Garis penduga merupakan garis regresi yang terbaik, apabila jumlah pangkat dua (kuadrat) nilai kesalahan-kesalahan (ei) adalah minimal atau ditulis dengan 2 rumus: ∑e i = 0. Cara pendekatan terakhir disebut dengan Metode Kuadrat Terkecil atau dengan Least Squares Methods. Sampai sekarang metode kuadrat terkecil ini adalah suatu metode yang paling ampuh pada perhitungan untuk menduga suatu garis regresi yang terbaik dibandingkan dengan metode-metode yang lainnya. Mengapa metode kuadrat terkecil, disebut metode yang terbaik bagi penduga garis regresi linier sederhana?. Di antaranya terdapat suatu teorema dari Gauss–Markov yang berbunyi sebagai berikut: Di antara penaksir-penaksir linier tak bias bagi parameter-parameter A dan B, di mana Y = A + BX + E, penaksir pangkat dua terkecil (metode kuadrat terkecil) yang mempunyai ragam paling kecil.
2.7.2. Metode kuadrat terkecil (OLS = ordinary least squares) Selain, hal-hal tersebut di atas, metode kuadrat terkecil mempunyai beberapa kelebihan daripada metode-metode lain, diantaranya: 1).
Dengan memakai nilai kuadrat, maka semua nilaidari kesalahan atau simpangan ei akan berubah menjadi positif.
2).
Dengan mengkuadratkan nilai kesalahan ei yang kecil (pecahan) maka akan diperkecil mendekati nol, dan bila nilai ini diminiumkan; sehingga garis regresi penduga yang dihasilkan akan mendekati ketepatannya, bila digunakan sebagai garis penduga.
3).
Perhitungan matematis dari metode kuadrat terkecil cukup sederhana.
4).
Selain teori kuadrat terkecil, ada suatu teori Maximum Like Lihood Estimation yang kedua-duanya membuktikan bahwa meminimalkan kesalahan ei merupakan estimasi atau penaksiran yang terbaik.
Suatu syarat penaksir garis atau garis penduga yang terbaik, di samping mempunyai nilai ragam galat atau ragam kesalahan atau ragam residu atau ragam sisa yang terkecil, tetapi harus memenuhi juga syarat-syarat yang lain yaitu: 1).
Model regresi atau bentuk fungsi yang dipakai haruslah mendekati titik-titik pasangan X,Y; dan harus betul-betul tepat atau cocok; hal ini akan dibicarakan pada uji kecocokan garis regresi penduga.
2).
Mempunyai derajad keeratan hubungan yang maksimum atau koefisien korelasi tertinggi, yang menunjukkan hubungan antara variabel bebas X dan variabel tak bebas Y. Hal ini akan dibahas dalam penggunaan koefisien korelasi dalam uji garis regresi.
17
PDF created with pdfFactory Pro trial version www.pdffactory.com
Manipulasi matematis dari metode kuadrat terkecil akan menghasilkan koefisien a dan b. Perhatikan pertanyaan matematis dari persamaan [2.7b] yang ditulis kembali seperti: ei = Yi - Ŷ
[2.9].
Persamaan [2.9] di atas merupakan modifikasi dari persamaan-persamaan [2.7a], [2.7b], atau [2.8]. Pernyataan matematis di atas dapat dijabarkan menjadi: Ŷ = b0 + b1 X dan Y = Ŷ + e sehingga ei = Yi - Ŷ
dapat ditulis:
[2.10]. Yi = b0i + b1i Xi + ei Telah disebutkan di muka, bahwa garis regresi penduga terbaik, adalah garis regresi 2 yang mempunyai nilai Σei minimal. 2
Secara matematis Σei minimal dapat dinyatakan dengan teori defrensial bahwa turunan 2 pertama dari: Σei terhadap b0 dan terhadap b1 haruslah sama dengan nol atau dapat 2 ditulis: δΣei / δbi = 0. Untuk memudahkan cara penulisan selanjutnya Σei2 disamakan dengan G, jadi G = Σei2. 2 Sehingga fungsi turunan Σe atau G terhadap setiap nilai b0, dan b1 adalah sebagai berikut: Dari teori minimum dan maksimum atau harga ekstrim dalam teori kalkulus (defrensial & integral) dapat dinyatakan bahwa suatu fungsi f(X1, X2, . . . , Xp) akan minimum jika, semua fungsi turunan pertama parsialnya (δY/δX) sama dengan nol; suatu syarat yang perlu dan khusus. Oleh karena itu, dengan mengandaikan syarat kedua minimalasasi itu telah terpenuhi, maka nilai G akan minimum jika semua fungsi turunan pertama parsiilnya, yaitu turunan pertama parsiil dari G terhadap masing-masing nilai b0 dan b1 sama dengan nol. Dengan mengambil fungsi turunan pertama parsiil G terhadap b0 dan b1 serta menyamakannya dengan nol, maka diperoleh dua persamaan seperti di bawah ini. Turunan Σe2i atau G terhadap b0 menjadi: Dari persamaan [2.11] turunannya menjadi: δG/δb0 = 2 Σ(Yi - b0 - b1 Xi) (- 1) = 0 2
Turunan Σe i atau G terhadap b1 menjadi: Dari persamaan [2.12] turunannya menjadi: δG/δb1 = 2 Σ(Yi - b0 - b1 Xi (- Xi) = 0 Perhatikan faktor pengali yang berada dimuka tanda sama dengan (=). Apabila dari persamaan-persamaan [2.11] dan [2.12] diselesaikan dan diubah cara penyajiannya, maka diperoleh persamaan-persamaan seperti: [2.13]. ΣYi - Σb0 - b1 ΣXi = 0 2
[2.14]. ΣYi Xi - b0 ΣXi - b1 ΣXi = 0 Persamaan-persamaan [2.13] dan [2.14] di atas disebut dengan persamaan normal. Persamaan (2.13) disebut dengan persamaan Normal 1. Persamaan (2.14) disebut dengan persamaan Normal 2. Perhatikan pengali dari setiap penaksir-penaksir yang berhubungan koefisien regresi seperti b0 dan b1 Apabila syarat-syarat dalam meminimalkan G dipenuhi, maka sistem persamaan normal dari [2.13] dan [2.14] dapat diselesaikan secara serentak untuk menentukan besarnya nilai b0 dan b1 sebagai penaksir pangkat dua terkecil atau Least Squares Method bagi parameter B0 dan B1.
18
PDF created with pdfFactory Pro trial version www.pdffactory.com
Biasanya, sistem persamaan normal [2.13], dan [2.14] dapat diselesaikan secara serentak untuk mendapatkan nilai b0 dan b1. Oleh karena jumlah sampel = n diketahui dan jumlah-jumlah yang terdapat dalam sistem persamaan normal itu dapat dihitung dari data sampel; dengan demikian koefisien regresi b0 dan b1 dalam analisis regresi linier sederhana yang mengandung sebuah variabel bebas X dan sebuah variabel tak bebas Y dapat ditaksir atau dihitung.
2.7.2 Perhitungan nilai koefisien regresi linier sederhana Jika diperhatikan kembali sistem persaman normal dari persamaan [2.13] dan [2.14] dapat dilihat keteraturan dari cara-cara penyelesaianya. Sehingga nilai b0 dan b1 dapat ditentukan dengan perhitungan seperti berikut. Dari persamaan [2.13] dapat ditentukan nilai b0 yaitu dengan membagi persamaan tersebut dengan jumlah pengamatan (n) sehingga didapatkan persamaan dengan penyelesaian sebagai berikut: [2.13].
ΣYi - Σb0 - b1 ΣXi = 0
(Persamaan Normal 1)
ΣYi /n - nb0 /n - b1 ΣXi/n = -
Y [2.15].
b0 - b1 X
=
0
atau
0
sehingga akhirnya menjadi:
b0 = Y - b1 X
Selanjutnya, dengan memasukkan persamaan [2.15] ke persamaan [2.14] di atas dapat ditentukan besarnya nilai b2. [2.16].
ΣYi Xi - b0 ΣXi - b1 ΣXi2 = 0
(Persamaan Normal 2)
[2.16a]. ΣYi Xi - ( Y - b1 X ) ΣXi - b1 ΣXi2 = 0
atau dapat ditulis
[2.16b]. ΣYi Xi - (ΣYi /n - b1 ΣXi/n) ΣXi - b1 ΣXi2 = 0 Sebelum penyelesaian persamaan [2.16b] dengan modifikasi X dan Y menjadi persamaan dengan huruf kecil dan perhatikan dengan teliti notasi perubah X dan Y yang ditulis dengan huruf kecil x dan y pada persamaan-persamaan berikut ini. Berikut ini diberikan hubungan antara X; Y dengan x; y: [2.17].
x1
x2 = (X2 - X 2 ), dan y = (Y - Y )
= (X1 - X 1 ), 2
2
2
[2.18a]. Σy = ΣY - (ΣY) /n 2 2 2 [2.18b]. Σx = ΣX - (ΣX) /n [2.18c]. Σxy = ΣXY - ΣX ΣY/n
disebut dengan JK Y disebut dengan JK X disebut dengan JHK XY
Dengan menggunakan persamaan [2.18a] sampai dengan persamaan [2.18c] maka perhitungan nilai b1 pada persamaan [2.16b] maka didapatkan nilai b1 menjadi: [2.19a]. b1 =
Σxy Σx 2
[2.19b]. b1 =
JHK XY atau dengan menggunakan notasi lain nilai b1 menjadi: JK X
atau dengan menggunakan notasi lain nilai b1 menjadi:
∑ X ∑Y n ( X )2 ∑ 2 ∑X − n
∑ XY − [2.19c]. b1 =
19
PDF created with pdfFactory Pro trial version www.pdffactory.com
Sehingga persamaan regresi penduga Ŷ dari suatu pengamatan atau untuk pengaruh variabel bebas X terhadap variabel tak bebas Y menjadi: [2.20]. Ŷ = b0 + b1 X Selanjutnya, untuk membuktikan bahwa garis regresi yang diperoleh tersebut merupakan garis regresi yang terbaik untuk menghampiri setiap titik-titik pengamatan X,Y. Unuk menjawab pernyataan tersebut maka dapat dikatakan bahwa garis regresi penduga Ŷ = b0 + b1 X nyata secara statistika, perlu dilakukan pengujian keberartiannya.
2.8. Pengujian Garis Regresi Linier Sederhana Pengujian garis regresi secara statistika dapat dilakukan dengan tiga cara yaitu: 1).
Uji ragam regresi atau uji F regresi
2).
Uji koefisien regresi dengan uji-t
3).
Uji r garis regresi
2.8.1 Uji varians regresi atau uji F regresi atau uji ragam regresi Uji keragaman untuk menentukan garis regresi yang terbaik sering disebut dengan uji F garis regresi atau lebih terkenal dengan sidik ragam regresi. Dari Gambar 2.4 dapat diuraikan bahwa persamaan [2.20] di mana ei = Yi - b0 - bi Xi. Dan jika persamaan [2.15] b0 = Y - b1 X disubstitusikan ke dalam persamaan [2.20] Ŷ = b0 + b1 X sehingga didapatkan pesamaan: [2.21a]. ei = Yi - ( Y - b1 X ) - b1 Xi
dengan membuka kurung maka
[2.21b]. ei = (Yi - Y ) - b1 (Xi - X ) [2.21c]. ei = yi - b1 xi Dari persamaan [2.21c] yaitu pesamaan untuk nilai ei, sehingga dengan mengkuadrat 2 jumlahkan nilai ei; selanjutnya didapatkan Σei atau disebut dengan JK Galat Regresi dengan kode G; sehingga menjadi: [2.22a]
G = Σ ei
[2.22b]
G = Σeiei. Ingat bahwa ei = yi - b1 xi.
[2.22c]
G = Σei(yi - b1 xi)
[2.22d]
G = Σeiyi - b1 ΣeI xi)
[2.22e]
G = Σeiyi
2
atau Persamaan [2.21c] sehingga
atau sebab ΣeIxi = 0
sehingga
Selanjutnya dari persamaan diatas didapatkan: [2.23a]
G = Σyiei
[2.23b]
G = Σyi (yi - b1 xi)
[2.23c]
G = Σyiyi - b1 Σyi xi Ingat : Σyiyi = Σyi = JK Total = JK Y
sehingga dapat menjadi: 2
Σyixi = JHK YiXi = JHK XY b1 Σyi xi disebut dengan JK Regresi = JK Reg. Dari persamaan [2.23c] didapatkan bahwa JK Galat Regresi sama dengan JK Total dikurangi dengan JK Regresi, di mana JK Total atau JK Y sudah dapat dihitung dari data pengamatan.
20
PDF created with pdfFactory Pro trial version www.pdffactory.com
Perhatikan Gambar 2.4, dan nilai-nilai Y , Ŷ, Yi, dan ei di bawah ini.
150
*
Konsumsi
125 100
Ŷ
ei
(Yi - Y )
= b0 + bi X
(Ŷ – Y )
Y75 50 25 0 120
X 140
130
X i 150
160
Pendapatan Gambar 2.4. Nilai-nilai Y , Ŷ, Yi, dan ei Sehingga, hubungan antara komponen-komponen pada analisis keragaman (JK Total, JK Regresi, dan JK Galat) seperti berikut: [2.24].
JK Galat = JK Total - JK Regresi.
Untuk menyederhanakan penulisan dan pengertian di atas, maka selanjutnya JK Galat Regresi disingkat dengan JK Galat, JK Regresi dengn JK Reg (tanpa titik) dan JK Total dengan JK Tot atau JK Y (tanpa titik). Sehingga sesuai dengan persamaan [2.23c], maka JK Regresi mempunyai rumus: [2.25a] [2.25b]
JK Regresi = b1 Σyi xi JK Regresi = b1 JHK XY
atau dapat ditulis:
Persamaan [2.25a,b] berlaku umum untuk p variabel bebas X sehingga persamaannya menjadi: [2.26a] [2.26b]
JK Regresi = b1 Σyi x1 + b2 Σyi x2 + . . . + bp Σyi xp JK Regresi = (b1 JHK X1Y + b2 JHK X2Y + . . . + bp JHK XpY)
Komponen penyusun Tabel Sidik Ragam Regresi adalah: 1). JK Regresi = b1 JHK XY 2). JK Total = Jk Y = ΣY2 - (ΣY)2/n 3). JK Galat = JK Total - JK Regresi Selanjutnya dihitung nilai KT atau varians seperti: 1).
KT Regresi
=
JK Regresi /(DB Regresi)
2).
KT Galat
=
JK Galat/ (DB Galat)
Berdasarkan pada asumsi sebaran normal untuk komponen pengganggu e, maka besarnya nilai F (F-hitung) adalah: [2.27]
Fhit =
KT Regresi KT Galat
21
PDF created with pdfFactory Pro trial version www.pdffactory.com
Hasil perhitungan keragaman di atas dibuatkan Tabel Sidik Ragam Regresi seperti pada Tabel 2.3 berikut di bawah ini. Tabel 2.3. Bagan Sidik Ragam Regresi Sumber Derajat Keragaman Bebas (DB) (SK) Regresi p = 1
Residual atau Galat Total
Jumlah Kuadrat (JK) b1 Σyi x1 atau (b1 JHK XY)
n–p–
Kuadrat Nilai Tengah F hitung (KT) (Fhit) JK Reg/p = KT Regresi KT Reg KT Galat JK Galat = n − p −1 KT Galat
JK Galat
1 n–1
F tabel 5%
1%
Lihat tabel F
Σyi2 = JK Total = JK Y
n = jumlah sampel (pasangan pengamatan) dan p jumlah variabel bebas X.
F-hitung disimbulkan dengan Fhit ini diartikan bahwa dalam pengujian F akan dibuktikan suatu hipotesis nol atau H0: Fhit = 0 dan H1: Fhit > 0 Kemudian F-hitung dibandingkan dengan F tabel yang biasa ditulis dengan: Fhitung ≈ Ftabel
(Di mana Ftabel = F(α, p,n-2)
dan α = taraf nyata )
Kreteria pengujian nilai Fhit adalah: 1).
Jika Fhit ≤ F(tabel 5%). Hal ini berarti bahwa garis regresi penduga (Ŷ) linier sederhana yang didapat tersebut bukan garis regresi yang terbaik untuk menghampiri pasangan pengamatan X,Y. Atau dapat dikatakan ini berarti bahwa terdapat hubungan bukan linier pada pasangan pengamatan X,Y tersebut.
2).
Jika Fhit > F(tabel 5%). Hal ini berarti bahwa terdapat hubungan linier antara pengaruh X terhadap Y. Atau dapat dikatakan bahwa garis regresi penduga (Ŷ) linier sederhana yang didapat tersebut adalah garis regresi penduga yang terbaik untuk menghampiri pasangan pengamatan X,Y.
2.8.2
Uji keberartian koefisien regresi (bi) atau uji t
Pengujian yang dilakukan dengan uji F seperti cara tersebut di atas, dapat memberikan petunjuk apakah setiap variabel X menunjukkan pengaruh atau hubungan yang nyata terhadap variabel tak bebas Y. Jika uji F atau uji ragam regresi menunjukkan bahwa Fhit > F(tabel 5%) barulah dilanjutkan dengan uji t dan sebaliknya. Modifikasi dari pengaruh variabel bebas X terhadap variabel tak bebas Y atu uji F, maka dapat dilakukan dengan uji t atau uji koefisien regresi apabila uji F signifikan. Secara umum uji t mempunyai rumus adalah:
W SW W nilai yang diuji, sehingga untuk pengujian koefisien regresi (bi), maka rumusnya menjadi: [2.28]. t-hitung W =
[2.29]. t-hitung b0 =
b0 Sb 0
dan
t-hitung b1 =
Di mana Sbi = salah baku bi
22
PDF created with pdfFactory Pro trial version www.pdffactory.com
b1 S b1
Dari persamaan [2.29] dalam menyederhakan penulisan salah baku koefisien regresi bi yang biasa ditulis dengan σBi (salah baku = standard error koefisien regresi Bi). Perhitungan nilai σBi didasarkan pada ragam galat regresi atau KT Galat Regresi. 2
Karena besarnya nilai σ e (Ragam Galat Regresi) populasi tidak diketahui, maka dapat 2 diduga dengan nilai S e atau KT Galat Regresi sampel yang mempunyai persamaan yaitu: [2.30].
S2e = KT Galat Regresi = JK Galat Regresi /(n-p-1)
Selanjutnya, dalam uji t nilai salah baku bi yang ditulis (Sbi) mempunyai persamaan seperti berikut: [2.31].
Sbi =
var bi
masing-masing untuk b0 dan b1 menjadi:
Untuk pengujian b0 nilai salah baku menjadi: [2.32a]. Sb0 =
var b0
KT Galat Re gresi n JK X Untuk pengujian b1 nilai salah baku menjadi: =
[2.32b]. Sb1 = =
∑ X 2
var b1 KT Galat Re gresi JK X
Seperti dalam uji F, penulisan t-hitung dapat ditulis dengan notasi thit (artinya uji t untuk pengujian hipotesis nol atau H0: bi = 0 dan H1: minimal satu dari bi ≠ 0). Kemudian t-hitung dibandingkan dengan t tabel yang biasa ditulis dengan: thitung ≈ ttabel
(Di mana ttabel = t(α/2,n-2)
dan α = taraf nyata )
Berdasarkan hasil uji t ternyata bahwa kreteria pengujian nilai thit adalah: 1).
Jika thit ≤ t(tabel 5%, db galat). Hal ini dapat dikatakan bahwa terima H0. Untuk pengujian b0 yang berarti bahwa b0 melalui titik acuan (titik 0,0) yaitu nilai Y = 0 jika X = 0. Untuk b1, jika thit ≤ t(tabel 5%, db galat) maka garis regresi penduga Ŷ dikatakan sejajar dengan sumbu X pada nilai b0.
2).
Jika thit > t(tabel 5%, db galat) Hal ini dikatakan bahwa tolak H0, yang berarti bahwa garis regresi penduga Ŷ tidak melalui titik acuan (X,Y = 0,0). Dengan kata lain, ini berarti bahwa koefisien arah b1 yang berangkutan dapat dipakai sebagai penduga dan peramalan yang dapat dipercaya. Pengujian yang dilakukan dengan cara tersebut di atas, dapat memberikan petunjuk apakah setiap variabel Xi memberikan pengaruh atau hubungan yang nyata terhadap variabel tak bebas Y. Perlu diingatkan bahwa dalam pengujian di atas (baik uji F maupun uji t), didasarkan metode kuadrat terkecil.
Selanjutnya, nilai salah baku koefisien regresi Sbi yang diperoleh, selain untuk pengujian hipotesis juga dapat dipakai pada perkiraan nilai interval koefisien regresi populasi βi yang sering disebut dengan perkiraan nilai populasi beta (β).
23
PDF created with pdfFactory Pro trial version www.pdffactory.com
Rumus dari perkiraan nilai βi adalah sebai berikut di bawah ini: [2.33a]. p {bi - tα/2 Sbi ≤ βi ≤ bi + tα/2 Sbi} = 1- α atau [2.33b]. p (bi ± tα/2 Sbi Sbi) = 1- α, dan untuk setiap b0 dan b1 seperti: [2.34a]. p {b0 - tα/2 Sb0 ≤ β0 ≤ b0 + tα/2 Sb0} = 1- α
untuk b0
[2.34b]. p {b1 - tα/2 Sb1 ≤ β1 ≤ b1 + tα/2 Sb1} = 1- α
untuk b1
2.8.3 Uji keeratan hubungan atau uji r Pada uji-uji sebelum ini, seperti uji Ragam Regresi (uji F), uji Koefisien Regresi (uji t) berdasarkan nilai Varians Galat Regresi. Sedangkan, pada uji keeratan hubungan selain memakai Varians Galat Regresi juga memakai parameter tertentu yaitu koefisien korelasi atau sering disebut dengan keeratan hubungan dengan simbul rxy atau ryx yang sering ditulis dengan r saja. Adapun rumus dari pada koefisien korelasi r adalah: Σxy
[2.35a]. rXY =
atau
Σx 2 Σy 2 JHK XY
[2.35b]. rXY =
atau menggunakan notasi lain maka nilai r
JK X JK Y
menjadi:
∑ X ∑Y ∑ XY −
[2.35c]. rXY =
( X )2 ∑ X 2 − ∑ n
n ( Y )2 ∑ Y 2 − ∑ n
(n = jumlah sampel)
Perhitungan nilai r berdasarkan rumus di atas disebut nilai koefisien korelasi seserhana atau koefisien korelasi order nol atau koefisien korelasi produc moment atau koefisien korelasi Pearson. Sepintas gambaran bahwa nilai r berkisar antara –1 sampai dengan + 1 atau sering ditulis dengan -1 ≤ r ≤ +2. Jadi nilai koefisien korelasi itu selalu pecahan seperti: r = 0,87; r = 0,78; r = - 0,347; dan lain sebagainya. Hubungan antara koefisien korelasi r dengan koefisien regresi b2. Lihatlah kembali rumus koefisien regresi seperti [2.19c] dan koefisien korelasi r seperti [2.35c]:
[2.19c]. b1 =
∑ X ∑Y ∑ XY − n (∑ X ) 2 ∑X − n
atau
2
( X )2 b1 ∑ X 2 − ∑ n b1 JK X
=
∑ X ∑Y ∑ XY − n
= JHK XY
24
PDF created with pdfFactory Pro trial version www.pdffactory.com
atau dan
[2.35c]. r =
r =
r
∑ X ∑Y ∑ XY − (∑ X ) 2 ∑ X 2 − n
n (∑ Y ) 2 ∑ Y 2 − n
atau dapat ditulis
∑ X ∑ Y di mana ∑ XY − n
( (JK X ) (JK Y ) )
= JHK XY
Dari kesamaan kedua persamaan di atas [2.19] dan [2.356] dapat ditulis menjadi: [2.36a] b1 JK X = r
( (JK X ) (JK Y ) )
Dari kesamaan [2.36a] di atas dapat ditulis kembali menjadi:
( (JK X ) (JK Y ) ) atau ( (JK X ) (JK X ) ) = r ( (JK X ) (JK Y ) ) atau
[2.36b] b1 JK X = r [2.36c] b1
Jadi:
[2.36d] b1
JK X
[2.36e] b1
JK X
JK X = r
= r
JK X
JK Y
atau atau
JK Y
Apabila kedua ruas dari persamaan: [2.36e] sama-sama dibagi dengan
n − 1 maka
didapatkan: [2.36e] b1 [2.36f]
b1
JK X n −1 KT X
= r = r
JK X
atau
n −1
atau
KT Y
[2.36g] b1 SX = r SY Apabila data yang dianalisis dinyatakan dalam nilai standar baku atau data di −
transformasi ke nilai Z (di mana ZX =
(Xi − X ) ) SX
−
dan ZY =
(Yi − Y ) ) , sehingga nilai SY
SX = SY = 1; sehingga persamaan [2.36g] menjadi: [2.36h] b1 = r Yang jelas dalam uji r, apabila nilai koefisien regresinya (b1) negatif, maka nilai koefisien korelasinya (r) juga negatif. Dalam uji r yang umum dialakukan adalah membandingkan nilai koefisien korelasi r yang dihitung atau r hitung dengan r tabel. Nilai r tabel dapat dilihat pada tabel r yang susunannya serupa dengan tabel t. rhitung ≈ rtabel
(di mana rtabel = r(α/2, n-2);
n-2 = db Galat; dan α = taraf nyata )
25
PDF created with pdfFactory Pro trial version www.pdffactory.com
Berdasarkan hasil uji r ternyata bahwa kreteria pengujian nilai rhitung adalah: 1).
Jika rhitung ≤ r(tabel 5%, db galat) Hal ini dapat dikatakan bahwa tidak terdapat hubungan linier atau korelasi sederhana antara variabel yang satu dengan variabel yang lainnya.
2).
Jika rhitung > r(tabel 5%, db galat) Hal ini dikatakan bahwa tolak H0, yang berarti bahwa terdapat hubungan linier atau korelasi sederhana antara variabel yang satu dengan variabel yang lainnya.
Selain pengujian r seperti di atas nilai r hitung dapat pula diuji dengan menggunakan uji t dengan rumus pengujian seperti berikut yaitu: [2.37a].
r Sr
t-hitung r =
di mana Sr = salah baku r
(1 − r 2 ) (n − 2)
Sr = [2.37b].
t-hitung r =
[2.37c].
t-hitung r =
sehingga
r
atau
(1 − r 2 ) (n − 2) r (n − 2) (1 − r 2 )
Berdasarkan hasil uji t untuk nilai r ternyata bahwa kreteria pengujian adalah: 1).
Jika thitung
2).
Jika thitung
≤ t(tabel 5%, db galat). Hal ini dapat dikatakan bahwa tidak terdapat hubungan atau korelasi antara variabel yang satu dengan variabel yang lainnya. > t(tabel 5%, db galat). Hal ini dikatakan bahwa tolak H0, yang berarti bahwa terdapat hubungan atau korelasi antara variabel yang satu dengan variabel yang lainnya.
Hubungan lain antara parameter r, b1, dan dengan garis regresi penduga Ŷ dapat dijabarkan kembali melalui persamaan: [2.35b] seperti berikut. [2.35b].
rXY
JHK XY
=
JK X JK Y 2
2
Modifikasi dari rumus r atau R adalah seperti berikut: [2.38a].
r
XY
=
( JHK XY ) ( JHK XY ) ( JK X ) ( JK Y )
atau
[2.38b].
r2XY
=
( JHK XY ) ( JHK XY ) ( JK X ) ( JK Y )
ingat: b1 =
[2.38c].
r
XY
=
b1
[2.38d].
r2XY
=
[2.38e].
r
Jadi [2.38f].
2
2
2 XY
=
( JHK XY ) ( JK Y )
( JHK XY ) ( JK X )
ingat: JK Y = JK Total
(b1 JHK XY ) ( JK Y ) JK Re gresi ( JK Total )
ingat: b1 JHK XY = JK Regresi) rumus di tas tersebut bersifat umum
2
JK regresi = r . JK Total
26
PDF created with pdfFactory Pro trial version www.pdffactory.com
Yang lebih penting dalam pembicaraan hubungan antara koefisien korelasi r; koefisien regresi b1; atau dengan garis regresi penduga Ŷ adalah parameter r2 yang dalam persamaan regresi sering ditulis dengan R2 yang disebut dengan koefisien determinasi atau koefisien penentu atau coeficien of determination. 2
Arti dari pada koefisien determinasi atau koefisien penentu (R ) adalah suatu nilai yang menunjukkan bahwa persentase dari variasi keragaman total Y atau variasi Y yang dapat diterangkan oleh variasi X. 2
Atau sering diartikan bahwa koefisien determinasi R adalah persentase dari variabel tak 2 bebas Y yang dipengaruhi oleh variabel bebas X. Sisanya 1 - R yang menunjukkan persentase dari variasi total atau variabel Y yang disebabkan oleh faktor lain diluar X atau variabel selain X. Dalam analisis keragaman atau uji F regresi di mana: [2.39a]. [2.39b]. [2.39c]. [2.39d].
JK regresi = JK Total - JK Galat
atau
2
r JK Total = JK Total - JK Galat JK Galat JK Galat
atau
2
= JK Total - r . JK Total
atau
2
= (1 - r ) . JK Total
Sehingga JK Total dapat dihitung dari JK Galat dan r sepert : JK Galat JK Re grasi = (1 - r 2 ) r2 Selanjutnya, dalam analisis keragaman regresi linier sederhana dan uji F di mana DB Regresi = 1 dan DB Galat = n – 2, sehingga Fhitung mempunyai rumus: [2.40].
JK Total =
KT Re grasi KT Galat JK Re grasi / 1 [2.41b]. F-hitung = JK Galat /(n − 2) (n − 2) JK Re grasi [2.41c]. F-hitung = JK Galat Masukan persamaan [2.40] ke dalam persamaan [2.41c] maka menghasilkan: [2.41a].
F-hitung
=
[2.42a].
F-hitung
=
(n − 2) r 2 JK Total (1- r 2 ) JK Total
sehingga didapatkan
(n − 2) r 2 (1- r 2 ) Kreteria pengujian nilai Fhitung sama seperti pengujian-pengujian di atas, sehingga kreteria pengujian adalah: [2.42b].
F-hitung
=
1).
Jika Fhit ≤ F(tabel 5%). Hal ini berarti bahwa garis regresi penduga (Ŷ) linier sederhana yang didapat tersebut bukan garis regresi yang terbaik.
2).
Jika Fhit > F(tabel 5%). Hal ini berarti bahwa terdapat hubungan linier yang nyata (p = 0,05), bahwa terdapat pengaruh antara variabel X terhadap variabel tak bebas Y.
27
PDF created with pdfFactory Pro trial version www.pdffactory.com
2.9
Peramalan atau Prediksi Garis Regresi
Pembicaraan mengenai perkiraan nilai populasi beta (β) pada persamaan [2.33] bertujuan untuk mengetahui perkiraan nilai interval koefisien regresi populasi βi baik b0 maupun b2. Selanjutnya, yang diharapkan pada garis regresi penduga adalah: a) penaksiran atau peramalan nilai rata-rata untuk nilai Xi tertentu yang telah diketaui yang )) sering diberi simbul μXY, dan b) penaksiran atau peramalan nilai individu Y apabila nilai Xi tertentu yang telah diketaui. Dalam penaksiran atau peramalan garis regresi membicarakan sejauh mana garis regresi penduga Ŷ yang telah didapat betul-betul dapat dipercaya sebagai penduga garis μXY yang terbaik. Dengan demikian, dalam penaksiran diperlukan selang kepercayaan nilai γ yaitu sebesar 1 – α di mana α adalah peluang kesalahan tipe I. Dalam perhitungan nilai selang kepercayaan juga menggunakan dasar Analisis Ragam Regresi. Suatu hal yang perlu diperhatikan di dalam penaksiran atau peramalan garis regresi adalah terdapat dua buah nilai taksiran yang berada di sebelah-menyebelah garis regresi penduga Ŷ, sehingga terdapat daerah atau range, yang umum disebut dengan selang kepercayaan Ŷ atau interval taksiran garis regresi penduga Ŷ; masing-masing taksiran tersebut adalah: 1).Taksiran nilai rata-rata. [2.43].
Ŷ - t(α/2, n – 2) S
Y
≤ μXY ≤
Ŷ + t(α/2, n – 2) S
Y
Di mana: S adalah nilai salah baku dari penaksiran rata-rata dengan rumus: Y
1
_
S 2 = KT Galat Regresi + Y n
( X 0 − X )2 JK X
;
_
X = nilai rata-rata Xi.
n = jumlah penamatan atau sampel, JK X dan KT Galat Regresi dari Analisis Varians Regresi X0 = suatu nilai Xi yang telah diketahui atau ditentukan 2).Taksiran nilai individu [2.44].
ˆ Ŷ - t(α/2, n – 2) S ˆˆ ≤ Yˆ ≤ Ŷ + t(α/2, n – 2) S ˆˆ Y
Y
Di mana:
S ˆˆ adalah nilai salah baku dari penaksiran individu dengan rumus: Y
_ ( X 0 − X )2 JK X JK X dan KT Galat Regresi dari Analisis Varians Regresi n = jumlah penamatan atau sampel _ X = nilai rata-rata Xi X0 = suatu nilai Xi yang telah diketahui atau ditentukan.
1
S 2ˆ = KT Galat Regresi 1 + + Yˆ n
2.9.1 Interpolasi dan ekstrapolasi Jelaslah bahwa dari uraian di atas, bahwa pemakaian persamaan penduga Ŷ = a + bX, dapat dipakai sebagai peramalan dari nilai-nilai Xi yang belum diketahui, atau untuk mencari nilai Y apabila Xi telah ditentukan.
28
PDF created with pdfFactory Pro trial version www.pdffactory.com
Di dalam penerapan praktis dari garis regresi penduga Ŷ = a + bX dipakai untuk mengadakan peramalan atau penafsiran, seperti disebutkan di atas. Ada dua pengertian pokok yang harus dipahami dalam penaksiran atau pendugaan adalah: 1).Interpolasi. 2).Ekstrapolasi Pengertian interpolasi adalah penaksiran atau peramalan nilai-nilai Y, jika harga-harga Xi yang dimasukan ke dalam persamaan regresi penduga Ŷ = a + bX terletak di dalam daerah ruang gerak X1 dan Xn hasil-hasil pengamatan atau dengan perkataan lain bahwa nilai Y yang diduga di mana nilai Xi terletak antara X1 dan Xn. Pengertian ekstrapolasi adalah penaksiran atau peramalan nilai Y, jika harga-harga X yang dimasukkan ke dalam persamaan regresi penduga Ŷ = a + bX terletak di luar batas daerah ruang X1 dan Xn hasil-hasil pengamatan atau dengan perkataan lain bahwa nilai Y yang diramalkan terletak di luar nilai antara X1 dan Xn. Timbul suatu pertanyaan apakah setelah didapatkan suatu garis regresi penduga Ŷ = a + bX sudah betul-betul merupakan garis regresi yang terbaik untuk melakukan penaksiran atau peramalan? Tentu saja jawabannya belum tentu, sebab garis regresi penduga tersebut harus tahan uji dari beberapa jenis pengujian garis regresi seperti yang telah diuraikan di atas.
2.10 Aplikasi Regresi Linier Sederhana Untuk dapat lebih memahami uraian teori di atas dan agar dapat menentukan nilai-nilai dalam regresi penduga Ŷ = b0 + b1X atau koefisien regresi yaitu nilai-nilai b0 dan b1, maka diberikan contoh olahan seperti di bawah ini, yang datanya terdiri dari satu variabel bebas X (prediktor) yaitu nilai X dan satu variabel tak bebas Y yaitu nilai Y, dan datanya seperti pada Tabel 2.4.
2.10.1 Perhitungan JK-JHK dan penentuan koefisien regresi linier sederhana b0 dan b1 Tabel 2.4. Perhitungan Regresi Dua Variabel yaitu Variabel X dan Variabel Y No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Jumlah Rata2
X 9,750 10,500 11,250 12,600 11,900 15,200 12,250 12,900 14,300 13,250 15,300 8,900 10,600 7,500 11,900 178,100 11,873
Y 0,650 0,750 0,900 1,150 0,950 1,750 1,050 1,000 1,700 1,250 1,800 0,600 0,500 0,720 0,950 15,720 1,048
X2 95,063 110,250 126,563 158,760 141,610 231,040 150,063 166,410 204,490 175,563 234,090 79,210 112,360 56,250 141,610 2183,330 145,555
29
PDF created with pdfFactory Pro trial version www.pdffactory.com
Y2 0,423 0,563 0,810 1,323 0,903 3,063 1,103 1,000 2,890 1,563 3,240 0,360 0,250 0,518 0,903 18,908 1,261
XY 6,338 7,875 10,125 14,490 11,305 26,600 12,863 12,900 24,310 16,563 27,540 5,340 5,300 5,400 11,305 198,253 13,217
Perhitungan JK-JHK dari data di atas seperti: JK Y
= = =
Σy2 = ΣY2 - (ΣY)2/n 18,908 - (5,720)2/15 2,4338
JK X
= = =
Σx1 = ΣX1 - (ΣX) /n 2183,330 - (178,100)2/15 68,6893
JHK XY
= = =
Σx1y = ΣX1Y - ΣX1 ΣY/n 198,253 - (178,100)(5,720)/15 11,6037
2
2
2
Selanjutnya, dilakukan perhitungan untuk mencari nilai b0 dan b1 seperti berikut ini. Nilai b1 adalah: JHK XY JK X 11,6037 68,6893
b1 = = =
0,16893
Nilai b0 adalah: b0 = = =
Y - b1 X 1,048 - (0.16893) (11,873) - 0,95776
Sehingga, persamaan peduganya menjadi: Ŷ
=
b0 + b1 X
Ŷ
=
- 0,95776 + 0,16893 X
Sehingga, dari persamaan peduga di atas dapat diartikan bahwa setiap perubahan satu satuan X, maka akan menyebabkan terjadinya perubahan Y sebesar 0,16893 satuan Y. Selanjutnya, dilakukan pengujian terhadap garis regresi penduga. Dalam pengujian garis regresi penduga terdapat tiga macam uji yaitu: 1). 2). 3).
Uji F atau uji ragam regresi atau uji varians regrsi; Uji koefisien regresi atau uji terhadap bi atau uji t; dan Uji koefisien korelasi atau uji r.
2.10.2 Pengujian garis regresi linier sederhana dengan uji F Dalam Uji F atau uji Ragam Regresi atau uji Varians Regresi diperlukan nilai-nilai JK Total, JK Regresi, dan JK Galat Regresi dari data Tabel 2.4 di atas seperti berikut: 1).
JK Total = = = =
2
Σy 2 2 ΣY - (ΣY) /n 2 18,908 - (5,720) /15 2,43384
30
PDF created with pdfFactory Pro trial version www.pdffactory.com
2). JK Regresi
= = =
b1 JHK XY (0,16893) (11,6037) 1,96021
3). JK Galat Regresi
= = =
JK Total - JK Regresi 2,43384 - 2.96021 0.47363
Selanjutnya, dihitung nilai KT atau varians seperti: 1).
KT Regresi
= = =
JK Regresi /(DB Regresi) 1,96021/1 1,96021
2).
KT Galat Regresi = = =
JK Galat/ (DB Galat) 0,47363/13 0,03643
Setelah perhitungan JK Total, JK Regresi, JK Galat Regresi, KT Regresi, dan KT Galat didapatkan, maka di lanjutkan dengan membuat Tabel Analisis Keragaman atau Tabel Analisis Varians Regresi seperti pada Tabel 2.5 berikut. Tabel 2.5. Bagan Sidik Ragam Regresi Dua Variabel Sumber Keragaman (SK)
Derajat Bebas (DB)
Jumlah Kuadrat (JK)
Kuadrat Tengah (KT)
F hitung
Regresi
1
1,96021
1,96021
53,8037
Residual Total
13 14
0,47363 2,43384
0,03643 -
F tabel 5% 1% **
4,67 9,07
Keterangan: Jumlah sampel (n) = 15. = berpengaruh sangat nyata pada p<0,01
**
Berdasarkan hasil analisis varians di atas ternyata bahwa Fhit > F(tabel 1%) atau dapat dikatakan bahwa hipotesis nol ditolak, yang berarti bahwa terdapat pengaruh variabel bebas X yang sangat nyata (p<0,01) terhadap variabel tak bebas Y.
2.10.3
Pengujian koefisien garis regresi linier sederhana dengan uji t
Setelah dilakukan pengujian dengan uji F maka selanjutnya, dilakukan pengujian terhadap koefisien regresi b0 dan b1 dengan uji t seperti berikut. bi Secara umum uji t mempunyai rumus adalah t-hitung bi = S bi Selanjutnya, dalam analisis regresi dua variabel nilai salah baku bi yang ditulis dengan Sbi mempunyai persamaan seperti berikut. Untuk pengujian b0 nilai salah baku Sb0 dari data di atas: Sb0 =
= =
KT Galat Re gresi ∑ X 2 n JK X 0,03643 2183,330 15 x 68,6893 0,277853
31
PDF created with pdfFactory Pro trial version www.pdffactory.com
Untuk pengujian b1 nilai salah baku Sb1 dari data di atas: KT Galat Re gresi JK X
Sb1 =
0,03643 68,6893
=
= 0,023030 Uji t terhadap nilai koefisien regresi b0: t-hitung b0 =
b0 Sb
0
- 0,95776 = 0,277853
= - 3,4470
{Nilai t negatif sama dengan nilai positif
(diambil harga
mutlaknya)}. Selanjutnya, uji t terhadap nilai koefisien regresi b1: t-hitung b1 =
b1 Sb
1
0,16893 = 0,023030
=
7,335101
Berdasarkan hasil uji t ternyata bahwa nlai thitung yang diperoleh dibandingkan dengan ttabel atau t(5%, db galat = 13) yaitu sebesar 2,131 dan t(1%,13) = 2,947. Ternyata bahwa t-hitung > ttabel 1% baik untuk nilai b0 maupun untuk b2. Ini berarti bahwa dari analisis tersebut H0 ditolak baik untuk uji b0 maupun untuk uji b1 Sehingga, dapat dikatakan bahwa: 1).
Garis regresi penduga Ŷ = - 0,95776 + 0,16893 X tidak melalui titik 0,0 atau titik acuan.
2).
Garis regresi penduga Ŷ = - 0,95776 + 0,16893 X tidak sejajar dengan sumbu X, atau mempunyai slop sebesar 0,16893
Selanjutnya, dengan nilai salah baku koefisien regresi b0 dan b1 yang diperoleh; selain untuk pengujian hipotesis, juga dapat dipakai pada perkiraan nilai interval koefisien regresi b0 dan b1 yang sering disebut dengan perkiraan nilai beta (β) populasi dengan rumus sebai berikut: p {bi - tα/2 sbi ≤ βi ≤ bi - tα/2 sbi} = 1- α
untuk masing-masing b0 dan b1 seperti:
Untuk perkiraan β0 dengan nilai salah baku Sb0 dengan α = 5% dari data di atas didapatkan: p {b0 - t(α/2,n-2) Sb0 ≤ β0 ≤ b0 + t(α/2,n-2) Sb0} = 1- α p {- 0,95776 - (2,131) (0,277853) ≤ β0 ≤ - 0,95776 + (2,131) (0,277853)} = 1- α p { - 1,558029 ≤ β0 ≤ - 0,35750} = 1 - α
32
PDF created with pdfFactory Pro trial version www.pdffactory.com
Jadi perkiraan nilai β0 berkisar antara - 1,558029 sampai dengan - 0,35750 Untuk perkiraan β1 dengan nilai salah baku Sb1 dengan α = 5% dari data di atas didapatkan: p {b1 - t(α/2,n-2) Sb1 ≤ β1 ≤ b1 + t(α/2,n-2) Sb1} = 1- α
untuk b0
p {0,16893 - (2,131) (0,023030) ≤ β1 ≤ 0,16893 + (2,131) (0,023030)} = 1- α p {0,119176 ≤ β1 ≤ 0,21868} = 1 - α Jadi perkiraan nilai β1 berkisar antara 0,119176 sampai dengan 0,21868 Berdasarkan perhitungan di atas maka dapat dibuat gambar Garis Regresinya seperti berikut: 2.0
Konsumsi Daging x100.000
1.8
Y = - 0,9578 + 0,1689 X R2 = 80,54%
1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 6.0
8.0
10.0
12.0
14.0
16.0
Pendapatan Petani ( x 100. 000)
2.10.4 Pengujian garis regresi linier sederhana dengan uji r Pada uji-uji sebelumnya seperti uji F dan uji t telah dilakukan. Selanjutnya, dilakukan uji r produc moment dari Pearson dengan rumus seperti:
∑ X ∑Y ∑ XY − r
=
(∑ X ) 2 ∑ X 2 − n
n (∑ Y ) 2 ∑ Y 2 − n
Untuk perhitungan nilai r diperlukan hasil penjumlahan data pada Tabel 3.1 di atas seperti: ΣX = 2 ΣX = ΣXY =
178,100 2183,330 198,253
ΣY 2 ΣY
= =
33
PDF created with pdfFactory Pro trial version www.pdffactory.com
15,720 18,908
Sehingga: 178,100) (15,720) 15 (178,100) 2 (15,720) 2 18,908 − 2183,330 − 15 15 198,53 −
r
=
=
0,897
Dalam uji r untuk pengujian hipotesis maka: H0: r = 0 (yang berarti bahwa tidak terdapat hubungan atau korelasi antara variabel X dengan variabel Y) H1 : r ≠ 0 (yang berarti bahwa terdapat hubungan atau korelasi antara variabel X dengan variabel Y Dalam uji r ini dialakukan pembandingan nilai koefisien korelasi r yang dihitung dengan r tabel ditandai dengan rhitung ≈ rtabel. Nilai r tabel = r(α/2, n-2), dengan n = 15 maka: Nilai r tabel 5% = r(5%, 13) = 0,514; dan Nilai r tabel 1% = r(1%, 13) = 0,642. Jadi r hitung = 0,897 > r tabel 1% = 0,642. Hal ini dapat dikatakan bahwa tolak H0 yang berarti bahwa terdapat hubungan atau korelasi yang sangat erat antara variabel X dengan variabel Y. Selain, pengujian r seperti di atas; nilai r dapat pula diuji dengan uji t; dengan rumus pengujian seperti berikut: t-hitung
=
r . Sr
Di mana Sr = salah baku r dengan rumus: Sr
=
(1 − r 2 ) (n − 2)
Sr
=
(1 − 0,897 2 ) (15 − 2)
=
0,13765
Sehingga: t-hitung =
=
r Sr 0,897 0,13765
= 6,51653 Berdasarkan hasil uji t, maka nilai thitung ≈ ttabel. Nilai ttabel atau t(5%, db galat = 13) yaitu sebesar 2,131 dan t(1%,13) = 2,947. Ternyata bahwa t-hitung > ttabel 1%. Hal ini dapat dikatakan bahwa terdapat hubungan atau korelasi yang sangat erat antara variabel bebas X dengan variabel tak bebas Y.
34
PDF created with pdfFactory Pro trial version www.pdffactory.com
Berdasarkan perhitungan koefisien korelasi r di atas, maka didapatkan koefisien determinasi R2 = (0,897)2 = 0,8054. Hal ini diartikan bahwa 80,54% variasi keragaman total Y atau variasi Y dapat diterangkan oleh variasi X, atau dapat diartikan bahwa 80,54% dari variabel tak bebas Y dipengaruhi oleh variabel bebas X. 2 Sisanya 1 - R = 19,46% dari variasi total Y dipengaruhi oleh faktor lain diluar X atau variabel selain X.
2.10.5
Peramalan atau prediksi pada garis regresi
Dalam perhitungan taksiran atau ramalan garis regresi diperlukan selang kepercayaan γ yaitu sebesar 1 – α, di mana α = 5%, sehingga γ = 95%. Dengan menggunakan dasar perhitungan analisis ragam regresi dan KT Galatnya seperti di atas didapatkan taksiran nilai rata-rata seperti berikut ini. 1).
Sebagai contoh: taksiran nilai rata-rata μXY untuk X0 = 10, seperti berikut: Ŷ - t(α/2, n – 2) S
≤ μXY ≤
Y
Ŷ + t(α/2, n – 2) S ; dengan nilai Ŷ menjadi: Y
Ŷ = - 0,95776 + 0,16893 X = - 0,95776 + 0,16893 (10) = 0,73154
S = Y
_ 2 1 (X0 − X ) KT Galat Regresi + JK X n
dapat dihitung dengan:
Ketentuan: Ŷ JK X KT Galat n_ X X0 t(5%, 13)
= = = = = = =
0,73154 68,6893 0,03643 15 11,873 10 2,131
Berdasarkan ketentuan di atas maka nilai S dapat dihitung: Y
1 ( X 0 − X )2 KT Galat Regresi + JK X n _
S = Y
=
_ 1 (10 − 11,873) 2 0,03643 + 68,6893 15
= 0,01377 Selanjutnya, taksiran nilai rata-rata μXY: Ŷ
- t(α/2, n – 2)
S
Y
≤ μXY ≤
Ŷ
+ t(α/2, n – 2)
S
Y
0,73154 - (2,131) (0,0138) ≤ μXY ≤ 0,73154 + (2,131) (0,0138) 0,7022
≤ μXY ≤
0,76088
35
PDF created with pdfFactory Pro trial version www.pdffactory.com
Jadi, taksiran rata-rata untuk Xi = X0 = 10; maka μXY berkisar antara 0,7022 sd 0,76088. Untuk taksiran rata-rata nilai-nilai Xi yang lain dapat dihitung seperti cara di atas. 2).
ˆ Sebagai contoh: taksiran nilai individu Yˆ untuk X0 = 10, seperti berikut: ˆ Ŷ - t(α/2, n – 2) S ˆˆ ≤ Yˆ ≤ Ŷ - t(α/2, n – 2) S ˆˆ Y
Y
Ŷ = - 0,95776 + 0,16893 X = - 0,95776 + 0,16893 (10) = 0,73154 _ 1 ( X 0 − X )2 + KT Galat Regresi 1 + Y n JK X Ketentuan:
S ˆˆ =
Ŷ = JK X = KT Galat = = _n = X X0 = t(5%, 13) =
dapat dihitung dengan:
0,73154 68,6893 0,03643 15 11,873 10 2,131
Berdasarkan ketentuan di atas maka nilai S ˆˆ dapat dihitung: Y
S ˆˆ = Y
_ 1 ( X 0 − X )2 + KT Galat Regresi 1 + n JK X
=
1 (10 − 11,873) 2 0,03643 1 + + 15 68,6893
=
0,01558
Selanjutnya, taksiran nilai individu: Ŷ
- t(α/2, n – 2)
S ˆˆ Y
ˆ ≤ Yˆ ≤
Ŷ
+ t(α/2, n – 2)
S ˆˆ Y
ˆ 0,73154 - (2,131) (0,0138) ≤ Yˆ ≤ 0,73154 + (2,131) (0,0138) ˆ 0,69835 ≤ Yˆ ≤ 0,76473 ˆ Jadi, taksiran individu untuk Xi = X0 = 10; maka Yˆ berkisar antara 0, 69835 sd 0, 76473. Untuk taksiran individu nilai-nilai Xi yang lain dapat dihitung seperti cara di atas. Hasil perhitungan taksiran rata-rata dan individu nilai-nilai Xi yang lain dapat dilihat pada Tabel 2.6 di bawah ini.
36
PDF created with pdfFactory Pro trial version www.pdffactory.com
Hasil Perhitungan Taksiran Rata-rata μXY dan Taksiran Individu ˆ Yˆ dari Nilai-nilai Xi
Tabel 2.6
ˆ μXY lower μXY upper Yˆ lower
No.
X
Y
Ŷ
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
9,750 10,500 11,250 12,600 11,900 15,200 12,250 12,900 14,300 13,250 15,300 8,900 10,600 7,500 11,900
0,650 0,750 0,900 1,150 0,950 1,750 1,050 1,000 1,700 1,250 1,800 0,600 0,500 0,720 0,950
0,689 0,816 0,943 1,171 1,053 1,610 1,112 1,221 1,458 1,281 1,627 0,546 0,833 0,309 1,053
Keterangan : n = X = Y = Ŷ = μXY =
ˆ Yˆ
=
0,656 0,794 0,932 1,159 1,048 1,558 1,105 1,205 1,420 1,259 1,574 0,499 0,813 0,241 1,048
0,722 0,838 0,953 1,183 1,057 1,662 1,119 1,238 1,496 1,302 1,680 0,592 0,853 0,377 1,057
0,653 0,789 0,924 1,151 1,036 1,556 1,095 1,199 1,417 1,254 1,571 0,497 0,807 0,239 1,036
ˆ Yˆ upper 0,726 0,843 0,961 1,190 1,069 1,664 1,129 1,244 1,499 1,307 1,682 0,595 0,858 0,379 1,069
15 (jumlah sampel) variabel bebas X variabel tak bebas Y nilai penduga dari Y taksiran rata-rata dari Y taksiran individu dari Y
Data pada Tabel 2.6
dapat digambar seperti pada gambar di bawah ini. Karena ˆ perbedaan nilai antara μXY dan Yˆ yang sangat sempit maka gambarnya kelihatan tiga garis yang seharusnya lima garis seperti pada Tabel 2.6 di atas. 2,0 1,8
Konsumsi daging
1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 6,0
8,0
10,0
12,0 Pendapatan
37
PDF created with pdfFactory Pro trial version www.pdffactory.com
14,0
16,0
2.11 Interpolasi dan ekstrapolasi Jelaslah bahwa dari uraian di atas, pemakaian persamaan penduga Ŷ = b0 + b1X, dapat dipakai sebagai peramalan dari nilai-nilai Xi yang belum diketahui, atau untuk mencari nilai Y apabila Xi telah ditentukan, Di dalam penerapan praktis dari garis regresi penduga Ŷ = - 0,95776 + 0,16893 X dapat dipakai untuk mengadakan peramalan atau penafsiran interpolasi dan ekstrapolasi Nilai interpolasi adalah nilai taksiran atau nilai ramalan dari nilai-nilai Y, jika harga-harga Xi yang dimasukan ke dalam persamaan regresi penduga Ŷ = - 0,95776 + 0,16893 X terletak di dalam daerah ruang gerak X1 dan Xn, seperti X = 10 maka nilai Y penduga = 0,73154; sebab nilai Xi = 10 berada di dalam antara X1 dan Xn. Nilai ekstrapolasi adalah nilai taksiran atau nilai ramalan dari nilai Y, jika harga-harga Xi yang dimasukkan ke dalam persamaan regresi penduga Ŷ = - 0,95776 + 0,16893 X terletak di luar batas daerah ruang X1 dan Xn. seperti X = 7,5 dan X = 15; maka nilai Y penduga = 0,30922 dan 1,57615; sebab nilai Xi = 7,5 dan Xi = 15 berada di luar Xminimum dan Xmaksimum.
2.12
Contoh Hasil Output Komputer dengan Menggunakan Solf-ware Execel
Perhitungan-perhitungan regresi seperti regresi linier sederhana di atas terdapat banyak perangkat lunak yang dapt membantunya seperti Excel, Minitab, SPSS, Statistica, Sistat, dan lain sebagainya. Dalam hal ini akan diberikan contoh keluaran komputer dengan program Excel seperti pada tabel berikut. 1
Summary Output Excel
Table 2.7 Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations
0.8974 0.8054 0.7904 0.1909 15
Table 2.8 ANOVA SV
DB
SS
MS
F
Significance F
Regression
1
2.9602
2.9602
53.8037
0.0000
Residual
13
0.4736
0.0364
Total
14
2.4338
Table 2.9 Parsial Regression Var
Coefficients Standart t Stat P-value Lower Upper Lower Upper Error 95% 95% 99.0% 99.0% Intercept - 0.95776 0.27785 - 3.4470 0.00433 - 2.55803 - 0.35750 - 2.79474 - 0.12079 X1
0.16893
0.02303 7.3351
0.00001 0.11918
38
PDF created with pdfFactory Pro trial version www.pdffactory.com
0.21868
0.09956
0.23830
Penjelasan tabel di atas seperti berikut: Table 2.7 Regression Statistics Multiple R adalah sama dengan koefisien korelasi r yang menunjukkan keeratan hubungan antara variabel bebas X dengan variabel tak bebas Y yaitu sebesar 0,8974. R Square adalah sama dengan koefisien determinasi R2 yang menunjukkan variasi keragaman total Y yang dapat diterangkan oleh variasi variabel X, atau dapat diartikan bahwa 80,54% dari variabel tak bebas Y dipengaruhi oleh variabel bebas X. Adjusted R Square adalah sama dengan koefisien determinasi R2 terkoreksi dengan _
simbul R 2 dan yang mengkoreksi adalah nilai Galat Regresi dan KT Total dengan _
rumus: R 2 = 1 −
_ Σei2 /(n − p − 1) ( n − 1) atau R 2 = 1 − (1− R 2 ) 2 Σy i /(n − 1) (n − p − 1)
Standard Error adalah sama dengan Salah Baku Y atau SY =
KT Y n
Observations adalah sama dengan jumlah sampel = n Table 2.8 ANOVA Pada Tabel Anova adalah persis sama dengan Sidik Ragam Regresi. Di mana SV = Sumber Variasi (SV) atau Sumber Keragaman (SK); DF = Degrees of Freesom atau = Derajat Bebas (DB); SS = Sum of Squares atau = JK; MS = Means Squarwes atau KT; F = F-hitung. Significance F adalah sama dengan nilai peluang dari nilai F-hitung. Dalam hal ini nilai F-hitung tidak dibangingkan dengan F tabel seperti biasa. Akan tetapi, nilai significance F dibandingkan peluang (p) standar yaitu 5% dan 1%. 1). Apabila nilai significance F ≥ (p = 0,05) mempunyai kesimpulan yang sama dengan Fhit ≤ F(tabel 5%); hal ini berarti terima H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana yang didapat tersebut bukan garis regresi yang terbaik. Atau variabel bebas X tidak berpengaruh terhadap variabel tak bebas Y. 2). Apabila nilai significance F < (p = 0,05) mempunyai kesimpulan yang sama dengan Fhit > F(tabel 5%); hal ini berarti tolak H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana yang didapat tersebut adalah garis regresi yang terbaik untuk menerangkan bahwa variabel bebas X berpengaruh nyata terhadap variabel tak bebas Y. Apabila nilai signifikanse F < (p = 0,01) mempunyai kesimpulan yang sama dengan Fhit > F(tabel 1%); hal ini berarti tolak H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana yang didapat tersebut adalah garis regresi yang terbaik untuk menerangkan bahwa variabel bebas X berpengaruh sangat nyata terhadap variabel tak bebas Y. Sebagai contoh dari hasil analis tersebut di atas didapat nilai F = 53,8037 dengan significance F = 0,0000. Ini berarti tolak H0 yang menyatakan bahwa garis regresi penduga Ŷ = - 0,95776 + 0,16893 X; adalah garis regresi yang terbaik untuk menerangkan bahwa variabel bebas X (pendapatan petani) berpengaruh sangat nyata terhadap variabel tak bebas Y (pengeluaran petani).
39
PDF created with pdfFactory Pro trial version www.pdffactory.com
Tabel 2.9 Parcial Regression Var adalah sama dengan variabel yang akan dijelaskan; dalam analisis ini adalah X. Intercept sama dengan b0 jarak antara titik potong garis regresi penduga Ŷ dengan titik acuan (0,0). Coefficients sama dengan bi dalam hal ini sama dengan b0 dan b2. Masing-masing b0 = - 0,95776 dan b1 = 0,16893. Standart Error dalam Tabel 3 ini berbeda dengan Standart Error dari Tabel 2. Standart Error di sini menunjukkan nilai yang sama dengan Sb0 dan Sb1 dalam pengujian b0 dan b1. Sebagai contoh Standart Error untuk b0 (Sb0) = 0,27785 dan Standart Error untuk b1 (Sb1) = 0,02303. t Stat sama dengan t-hitung untuk b0 dan b1 dengan rumus umum seperti: bi thitung bi = ; Sehinga nilai t-hitung untuk masing-masing b0 = - 3.44702 dan S bi b1 = 7.33510. P-value adalah sama dengan nilai peluang dari nilai t-hitung. Dalam hal ini nilai t-hitung tidak dibangingkan dengan t tabel seperti biasa. Akan tetapi, nilai P-value dibandingkan peluang (p) standar yaitu 5% atau 1%. 1). Untuk b0, maka 1). Apabila nilai P-value ≥ (p = 0,05) mempunyai kesimpulan yang sama dengan thit ≤ t(tabel 5%); hal ini berarti terima H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana melalui titik acuan (0,0) 2). Apabila nilai P-value < (p = 0,05) mempunyai kesimpulan yang sama dengan thit > t(tabel 5%); hal ini berarti tolak H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana melalui tidak melalui titik acuan (0,0). Untuk b1, maka 1). Apabila nilai P-value ≥ (p = 0,05) mempunyai kesimpulan yang sama dengan thit ≤ t(tabel 5%); hal ini berarti terima H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana sejajar dengan sumbu X pada nilai b0. 2). Apabila nilai P-value < (p = 0,05) mempunyai kesimpulan yang sama dengan thit > t(tabel 5%); hal ini berarti tolak H0 yang menyatakan bahwa garis regresi penduga (Ŷ) linier sederhana melalui tidak sejajar dengan sumbu X dengan slop sama dengan b2. Sebagai contoh dari hasil analisis tersebut di atas didapatkan nilai P-value untuk b0 = 0.00433. Ini berarti tolak H0 karena P-value < 0,05, yang berarti bahwa garis regresi penduga Ŷ = - 0,95776 + 0,16893 X; tidak melalui titik acuan (0,0). Demikian juga didapatkan nilai P-value untuk b1 = 0.00002. Ini berarti tolak H0 karena Pvalue < 0,05, yang berarti bahwa garis regresi penduga Ŷ = - 0,95776 + 0,16893 X; adalah garis regresi penduga tidak sejajar dengan sumbu X, arinya mempunyai slop atau kemiringan = 0,16893 dan sangat nyata.
40
PDF created with pdfFactory Pro trial version www.pdffactory.com
Lower dan Upper adalah sama dengan perkiraan nilai interval b0 dan b1 atau pendugaan nilai β0 dan β1 dengan rumus: p {bi - tα/2 sbi ≤ βi ≤ bi - tα/2 sbi} = 1- α . Nilai 95% atau 99% = 1- α tergantung pada nilai α yang dipakai 5% atau 1%. Perkiraan nilai β0 berkisar antara - 1,558029 sampai dengan - 0,35750 untuk nilai α = 5%; dan antara - 1,79474 sampai dengan - 0,12079 untuk α = 1%; Perkiraan nilai β1 berkisar antara 0,119176 sampai dengan 0,21868 untuk α = 5%; dan antara 0,09956 sampai dengan 0,23830 untuk α = 1%; Perhatikan nilai Lower dan Upper, apabila nilai Lower dan Upper bersifat definit positif atau definit negarif artinya baik Lower maupun Upper mempunyai tanda bilangan yang positif atau negarif ( + , - ) berarti dalam uji t-hitung bi menunjukkan signifikansi yang nyata pada taraf α = 5% atau 1%. Sebaliknya, apabila nilai Lower bertanda negarif dan Upper bertanda positif berarti dalam uji t-hitung bi menunjukkan signifikansi yang tidak nyata pada taraf nilai α = 5% atau 1%.
41
PDF created with pdfFactory Pro trial version www.pdffactory.com