REGRESI NON-LINIER POLYNOMIAL BERDERAJAT TIGA (KUBIK)
Untuk memenuhi tugas matakuliah Analisis Regresi yang dibina oleh Bapak Hendro Permadi
Oleh: Kelas GG Aldila Sakinah Putri
408312408014
Annisa Masruroh
408312408021
Winda Permatasari
409312417675
Rezha Kharisma Putri
409312417680
Inge Ratih Puspitasari
409312417682
Nine Winda Yunita
409312419793
UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA OKTOBER 2011
BAB I PENDAHULUAN
1.1.
Latar Belakang
Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan suatu variabel terhadap variabel yang lain. Variabel yang pertama disebut dengan variabel bebas atau variabel X karena seringkali digambarkan dalam grafik sebagai absis. Variabel yang kedua adalah variabel terikat atau variabel Y, dalam grafik digambarkan sebagai ordinat. Kedua variabel ini biasanya merupakan variabel acak (random). Regresi yang dipelajari di sini dibatasi pada regresi linear, baik itu sederhana maupun berganda. Untuk regresi sederhana, regresi yang melibatkan satu peubah tak bebas (Y) dan satu peubah bebas (X), kelinearan regresi ̂ diyakinkan melalui pengujian hipotesis. Jika hipotesis linear diterima, kita yakin hingga tingkat keyakinan tertentu, bahwa regresi itu bentuknya linear tidak diragukan. Namun, apabila ternyata hipotesis linear ditolak, maka regresi linear tidak cocok untuk digunakan dalam mengambil kesimpulan dan karenanya perlu meningkat pada pencarian regresi non-linear atau lengkung. Analisa regresi merupakan salah satu uji statistika yang memiliki dua jenis pilihan model yaitu linear dan non linear dalam parameternya. Model linear memiliki dua sifat yaitu regresi sederhana dan regresi berganda dengan kurva yang dihasilkan membentuk garis lurus. Untuk model non linear polynomial berderajat dua yang disebut kuadratik, berderajat tiga yang disebut kubik, berderajat empat disebul kuartil, dan seterusnya. Kurva yang dihasilkan polynomial tersebut membentuk garis lengkung. Disini kami akan menganalisis tentang model regresi non linear dalam parameternya bersifat kubik. Regresi non linier yang bersifat kubik biasa dinyatakan dalam bentuk Yi = β0X0i + β1Xi + β2Xi2 + β3Xi3 + ε. Dalam makalah ini kami mengambil contoh tentang banyaknya kertas yang digunakan foto copy ” AREMA” selama bulan Juni-September 2011.
1.2.
Rumusan Masalah 1. Bagaimana persamaan umum regresi non linear berderajat tiga? 2. Bagaimana aplikasi regresi non linear berderajat tiga? 3. Bagaimana menganalisa model regresi yang telah diperoleh?
1.3.
Tujuan 1. Untuk mengetahui persamaan umum regresi non linear berderajat tiga. 2. Untuk mengetahui aplikasi regresi non linear berderajat tiga. 3. Untuk mengetahui menganalisa model regresi yang telah diperoleh.
BAB II PEMBAHASAN
2.1 Kajian teori
Model regresi non linier polinomial berderajat tiga atau model regresi kubik mempunyai persamaan umum yang berbentuk : Y=
0X0i
+
1Xi
+
2 2Xi
3 3Xi
+
+ε
Dimana: Yi
= nilai pengamatan ke-i
Xi
= nilai peubah X yang ke-i = titik potong / parameter intersep
0
-
1
3
= Parameter pengaruh peubah X1, X2, X3 terhadap peubah Y pada derajat atau ordo ke 1, 2, 3.
ε
= galat ke-i yang diasumsikan berdistribusi bebas normal dengan nilai rata- rata 0 dan ragam (σ2)
X0i
= 1
i
= 1, 2, 3, ..., n Mengubah persamaan non linier bentuk kubik menjadi linier dengan
menggunakan rumus di bawah ini: Y=Xb
[
= [
]
[
]
]
Didapatkan Yi*= b0 + b1Xi + b2Xi2 + b3Xi3. Bentuknya tetap berupa polinomial kubik. Asumsi yang diperlukan dalam model regresi polinomial berderajat tiga adalah: 1. Bahwa ε merupakan peubah acak dengan nilai tengah dan variansi σ2 . 2. Bahwa ε i dan ε j , i tidak sama dengan j ( i ≠ j ), tidak berkorelasi satu sama lain atau dapat ditulis Cov (ε i, ε j) = 0.
1) Pendugaan koefisien regresi polinomial berderajat tiga Jika suatu data yang diberikan hanya dapat disajikan melalui kurva regresi non linear, maka kita harus menentukan bentuk kurvanya dan menduga parameternya. Dalam pendugaan koefisien regresi terlebih dahulu diperlukan model sampel untuk mendekati data yang diperoleh dari sampel. Model sampel yang digunakan untuk regresi polinomial berderajat tiga adalah sebagai berikut: Y1 = b0X0i + b1Xi + b2Xi2 + b3Xi3 + Є dimana: i
= 1, 2, 3, ..., n
X0i = 1 , untuk i = 1, 2, 3, ...,n Model sampel di atas terlihat bahwa koefisien b0 mengandung nilai X0i. dimana nilainya sama dengan 1. Pemberian peubah tiruan X0i bertujuan agar b0 dapat dihitung bersamaan dengan koefisien yang lainnya. Untuk menduga koefisien b0, b1, b2, b3 dapat menggunakan metode kuadrat terkecil yang dibantu dengan matriks. Y=Xb XT = XT X b (XT.X)-1 XT Y = (XT.X)-1 (XT.X) b = I b b = (XT.X)-1 XT Y
[
]= [
] [
]
Persamaan-persamaan di atas dapat diselesaikan secara serentak dengan menggunakan metode eliminasi, juga dengan metode Cramer. Sebaiknya pada permulaan sebelum mengidentifikasikan model regresi apa yag diperkirakan sesuai, maka perlu dilihat arah kecenderungan data untuk memperoleh gambaran awal kira-kira model regresi apa yang cocok, apakah model regresi linier atau regresi non linier. Apabila data merupakan model regresi non linier, maka sebelum melakukan analisis perlu terlebih dahulu ditransformasikan agar persamaan non linier menjadi regresi linier. Analisis regresi polinomial
apabila data mempunyai jarak atau interval yang sama, maka untuk memudahkan analisis regresi dapat dilakukan transformasi dari peubah asli menjadi peubah kode yaitu sebagai berikut : Xi = { Ti – ( Tmin + Tmaks / 2} / { Tmaks – Tmin ) / 2 } Dimana: Xi = peubah bebas kode Ti = peubah bebas asli Untuk mengetahui model regresi yang terbaik menggunakan analisis ragam regresi polinomial berderajat tiga. Pengujian untuk menentukan model regresi yang sesuai dilakukan mulai derajat yang paling rendah sampai dengan tiga, tetapi pengujian dapat dihentikan apabila diketahui bahwa tidak ada gunanya derajat yang lebih tinggi diuji. Berikut ini analisis ragam polinomial derajat tiga : SK
Db
JK
3
JKR3
KTR3 / 3
2
JKR2
KTR2
1
JKK2 = JKR3 – JKR2
KTK2 = JKK2
( n-4 )
JKS2 = JKT – JKR3
KTS2 = JKS2 / (n-4)
Regresi Kubik
KT
(pada X, X2, X3) Regresi kuadratik 2
(pada X, X ) Sokongan oleh X3/(X, X2) Dimana: JKRS
= ∑ bs { ∑ XiS Yi – ( ∑ XiS ∑ Yi ) / n }
JKt
= ∑ Yi2 – ( ∑ Yi )2 / n
Fhitung = KTR / KTsisa dan Fhitung= KTS KTsisa Untuk dapat menguji ketepatan model regresi, maka jumlah kuadrat galat perlu dipecah menjadi jumlah kuadrat galat murni dan jumlah kuadrat simpangan dari model (Gasperz 1900). Sehingga kuadratnya dapat ditulis sebagai berikut: JKG
= JKGM + JKSDM
JKGM
= ∑{ ∑ Yi2 – ( ∑ Yi )2 / ni}
JKSDG = JKG JKGM Dimana :
Xi
= ulangan pada peubah bebas ke-i
Yi
= pengamatan peubah tidak bebas ke-i
ni
= banyaknya ulangan pada peubah bebas ke-i Untuk menjelaskan keragaman pada regresi yang sesuai adalah
dengan koefisien determinasi yaitu sebagai berikut: R2
= JKregresi / JKtotal
Apabila persamaan regresi yang sesuai telah didapat maka dapat digunakan untuk peramalan pada peubah tidak bebas dan penentuan kondisi optimal pada peubah bebas. Namun dalam peramalan hanya berlaku pada daerah percobaan yang bersangkutan agar terhindar ekstrapolasi yang berlebihan. Tetapi sebelum melakukan penentuan kondisi optimal dan peramalan, maka perlu terlebih dahulu untuk melakukan pengujian keandalan model persamaan regresi yang telah dibangun. Dalam menentukan kondisi optimal pada peubah bebas agar diketahui kondisi yang maksimal dari peubah tidak bebas maka harus dipenuhi persyaratan sebagai berikut: 1.
Syarat perlu: δ ε / δx1 = 0 ; δ ε / δx2 = 0
2.
Syarat cukup: Determinai minor utama dari matriks Hessian (H) bersifat negatif, dimana matriks H yaitu: H:
2) Menganalisa Model Regresi yang Telah Diperoleh Jika telah diperoleh model regresi yang linear maka kita dapat melakukan analisa sebagai berikut: 1. Untuk menguji model regresi digunakan uji F, dengan hipotesis sebagai berikut : model regresi tidak berarti
: model regresi berarti Dengan alat bantu minitab, diperoleh nilai dapat diperoleh
. Terima
jika
dari Anova, dan dari tabel dan tolak
jika
. 2. Uji Koefisien regresi Untuk menguji koefisien regresi menggunakan uji T, dengan hipotesis sebagai berikut , artinya variabel bebas tidak berpengaruh terhadap variabel terikat. , artinya variabel bebas berpengaruh terhadap variabel terikat. Dengan alat bantu minitab, diperoleh nilai dapat diperoleh
. Terima
jika
dari Anova, dan dari tabel dan tolak
jika
. 3. Uji asumsi analisis regresi a) Normal residual Untuk menguji kenormalan residual kita gunakan alat bantu minitab dan uji Anderson Darling dan mencari nilai P_value, dan dengan hipotesis sebagai berikut: : Residual berdistribusi normal. : Residual tidak berdistribusi normal. Untuk menentukan menolak atau menerima P_value dengan suatu nilai
, dilakukan perbandingan
(taraf kepercayaan) dengan ketentuan
sebagai berikut: , jika data diperoleh dari penelitian di lapangan. , jika data diperoleh dari penelitian di laboratorium. , jika data diperoleh dari penelitian terhadap manusia atau binatang. , dalam bidang kedokteran. Terima Tolak
jika P_value jika P_value
b) Kebebasan residual
, .
Untuk menguji kebebasan residual dilihat dari autokorelasi fungsi untuk residual. Homogenitas residual bersifat homogen atau tidak saling bebas jika ada korelasi antar sisa. c) Homogenitas Untuk mengetahui apakah sisa antara variable terikat dengan variable bebas mempunyai keragaman yang homogen, atau tidak menunjukkan kecenderungan tertentu. Jika standar sisa 95% berada diantara (-2,2) secara merata maka sisa dikatakan berada dalam sebaran sehingga mempunyai keragaman yang tetap. Jika asumsi kehomogenan ini terpenuhi maka secara otomatis asumsi normalitas akan dipenuhi, jika sumsi ini tidak dipenuhi maka dilakukan cara untuk mengatasi salah satunya dengan cara melakukan transformasi terhadap data tersebut.
2.2 Aplikasi Foto Copy “AREMA” menerima foto copy setiap harinya. Tetapi dalam makalah ini, banyaknya foto copy akan kami akumulasikan dalam setiap minggu dari bulan Juni – September 2011. Anggap 1 bulan = 4 minggu. Berikut data yang berhasil diperoleh : X : Minggu ke-n Y : Banyaknya Foto copy/rim
Minggu ke-
Banyaknya Foto
Minggu ke-
Banyaknya Foto
(X)
copy/rim (Y)
(X)
copy/rim (Y)
1
43
9
62
2
49
10
61
3
52
11
56
4
58
12
55
5
62
13
62
6
58
14
63
7
59
15
66
8
62
16
72
Regresi linear Persamaan regresi linear dari data yaitu Y = 49,3 + 1,12 X dengan grafik sebagai berikut:
Keterangan grafik: Dari minitab diperoleh grafik yang menunjukkan taksiran garis regresi yang linier dengan koefisien determinasi (
) sebesar 60.2% dan sisanya sebesar 39.8%. Ini
menunjukkan bahwa keragaman variabel
mempengaruhi
sebesar 60.2%,
sedangkan 39.8% dipengaruhi oleh variabel lain yang tidak masuk dalam model. Regression The regression equation is y = 49,3 + 1,12 x Predictor Constant x S = 4,474
Coef 49,250 1,1176
StDev 2,346 0,2427
R-Sq = 60,2%
T 20,99 4,61
P 0,000 0,000
R-Sq(adj) = 57,4%
Analysis of Variance Source Regression Residual Error Total
DF 1 14 15
SS 424,71 280,29 705,00
MS 424,71 20,02
F 21,21
P 0,000
Dari gambar di atas kita mengetahui bahwa R-Sq=60,2%, sedangkan apabila data tersebut merupakan model liniear seharusnya R-Sq mendekati 95%. Jadi dari uji linear ini kita mengetahui bahwa data yang kita peroleh tidak cocok menggunakan model liniear. Sehingga kita mencoba menguji data yang kita peroleh menggunakan uji kuadratik seperti di bawah ini.
Regresi non-linear berderajat dua (kuadratik) Persamaan regresi linear dari data yaitu Y = 46,6429 + 1,98669X - 5,11E-02X2 dengan grafik sebagai berikut:
Keterangan grafik: Dari minitab diperoleh grafik yang menunjukkan taksiran garis regresi yang linier dengan koefisien determinasi (
) sebesar 62.4% dan sisanya sebesar 37.6%. Ini
menunjukkan bahwa keragaman variabel
mempengaruhi
sebesar 62.4%,
sedangkan 37.6% dipengaruhi oleh variabel lain yang tidak masuk dalam model.
Polynomial Regression Y = 46,6429 + 1,98669X - 5,11E-02X**2 R-Sq = 62,4 % Analysis of Variance SOURCE Regression Error
DF 2 13
SS 439,633 265,367
MS 219,817 20,413
F 10,7685
P 1,74E-03
Total SOURCE Linear Quadratic
15 DF 1 1
705,000
Seq SS 424,706 14,927
F 21,2130 0,731264
P 4,08E-04 0,407958
Dari gambar di atas kita mengetahui bahwa R-Sq=62,4%, sedangkan apabila data tersebut merupakan model non-liniear berderajat dua seharusnya R-Sq mendekati 95%. Jadi dari uji non-linear berderajat dua ini kita mengetahui bahwa data yang kita peroleh tidak cocok menggunakan model non-liniear berderajat dua. Sehingga kita mencoba menguji data yang kita peroleh menggunakan uji kubik seperti di bawah ini.
Regresi non-linear berderajat tiga (kubik) Dari minitab diketahui persamaan regresi non linear yang berbentuk kubik, yaitu Y = 32,8159 + 10,4864X - 1,26401X2 + 4,76E-02X3, dengan grafik sebagai berikut:
Keterangan grafik: Dari minitab diperoleh grafik yang menunjukkan taksiran garis regresi yang non linier dengan koefisien determinasi (
) sebesar 91.5% dan sisanya sebesar 8.5%.
Ini menunjukkan bahwa keragaman variabel
mempengaruhi
sebesar 91.5%,
sedangkan 8.5% dipengaruhi oleh variabel lain yang tidak masuk dalam model.
Polynomial Regression Y = 32,8159 + 10,4864X - 1,26401X**2 + 4,76E-02X**3 R-Sq = 91,5 % Analysis of Variance SOURCE Regression Error Total SOURCE Linear Quadratic Cubic
DF 3 12 15 DF 1 1 1
SS 644,825 60,175 705,000
Seq SS 424,706 14,927 205,192
MS 214,942 5,015
F 21,2130 0,731264 40,9192
F 42,8634
P 1,09E-06
P 4,08E-04 0,407958 3,42E-05
Dari gambar di atas kita mengetahui bahwa R-Sq=91,5% merupakan model nonliniear berderajat tiga yang R-Sq mendekati 95% dibandingkan model linear dan model non-linear berderajat dua. Selain itu garis regresi mengikuti polt data. Jadi dari uji non-linear berderajat tiga ini kita mengetahui bahwa data yang kita peroleh cocok menggunakan model non-liniear berderajat tiga.
Model regresi yang telah diperoleh dapat kita analisis sebagai berikut: 1) Menguji model regresi Model regresi Y = 49,3 + 1,12 X dan Y = 32,8159 + 10,4864X 1,26401X2 + 4,76E-02X3 signifikan, karena: Data di atas dari data lapangan maka α = 0,05 Dari minitab diperoleh ANOVA sebagai berikut:
Polynomial Regression Y = 32,8159 + 10,4864X - 1,26401X**2 + 4,76E-02X**3 R-Sq = 91,5 % Analysis of Variance SOURCE Regression Error
DF 3 12
SS 644,825 60,175
MS 214,942 5,015
F 42,8634
P 1,09E-06
Total
15
SOURCE Linear Quadratic Cubic
DF 1 1 1
705,000
Seq SS 424,706 14,927 205,192
F 21,2130 0,731264 40,9192
P 4,08E-04 0,407958 3,42E-05
Dari ANOVA di atas diperoleh Fhitung Linear = 21,21, Fhitung Kuadratik = 0,73, Fhitung Kubik = 40,91. Untuk menguji model regresi digunakan uji F, dengan hipotesis sebagai berikut: H0 : Model regresi tidak berarti H1 : Model regresi berarti Dari tabel didapat Ftabel=1,0000 Karena Fhitung < Ftabel pada regresi kuadratik maka menerima H0, jadi model regresi tidak berarti dan tidak signifikan. Sedangkan Fhitung > Ftabel pada regresi linear dan kubik maka menolak H0, jadi model regresi berarti sehingga dapat disimpulkan bahwa model regresi signifikan. 2) Menguji koefisien regresi Karena
maka menggunakan uji T untuk menguji koefisian
regresi, dengan hipotesis sebagai berikut: Terima
jika
dan tolak
jika
.
artinya variabel bebas tidak berpengaruh terhadap variabel terikat. artinya variabel bebas berpengaruh terhadap variabel terikat. Dengan alat bantu minitab, diperoleh Regression The regression equation is y = 49,3 + 1,12 x Predictor Constant x S = 4,474
Coef 49,250 1,1176
StDev 2,346 0,2427
R-Sq = 60,2%
Analysis of Variance
T 20,99 4,61
P 0,000 0,000
R-Sq(adj) = 57,4%
Source Regression Residual Error Total
DF 1 14 15
SS 424,71 280,29 705,00
MS 424,71 20,02
F 21,21
P 0,000
Hasil uji koefisien kemiringan garis regresi menunjukkan adanya pengaruh menit ( ) terhadap pengunjung ( ) dengan nilai . Tanpa mencari (
). Karena
, jadi
dapat diketahui dari ( maka menolak
)
dengan kata lain hipotesis
artinya variabel bebas berpengaruh terhadap variabel terikat diterima. Jadi variabel bebas ( ) sangat mempengaruhi variabel tak bebas ( ).
3) Uji asumsi analisis regresi a) Uji Normalitas Residual berdistribusi normal, karena: Dari minitab diperoleh nilai P-value beserta grafiknya sebagai berikut:
Karena p-value = 0.284> 0,05 sehingga terima H0, jadi residual berdistribusi normal. b) Uji Homogenitas Data tersebut bersifat Homogen, karena:
Untuk menguji homogenitas kita gunakan alat bantu minitab sebagai berikut:
Dari grafik di atas dapat dilihat bahwa standart sisa 95% berada di antara (-4, 3). Data sebagian besar menyebar, tidak membentuk lonceng dan merupakan data acak. Jadi data tersebut bersifat Homogen.
c) Uji Kebebasan Ada autokorelasi atau data tidak saling bebas, karena: Untuk menguji kebebasan residual dilihat dari autokorelasi fungsi untuk residual dengan menggunakan alat bantu minitab. Selain itu juga bisa menggunakan individual chart.
Dari I Chart dapat dilihat bahwa tidak ada data yang melebihi garis merah maka tidak ada data pencilan yang harus dihapus. Dari Autocorelation dapat dilihat bahwa ada data yang melebihi garis merah maka dapat disimpulkan bahwa data tidak saling bebas.
BAB III PENUTUP
3.1 Kesimpulan
Regresi dapat dibedakan menjadi dua jenis, yaitu regresi linier dan non linier. Regresi linier merupakan regresi yang datanya membentuk persamaan linier dan grafiknya mendekati garis lurus, sedangkan regresi non linier merupakan regresi yang datanya membentuk persamaan non linier dan kurvanya lengkung. Jika data yang diperoleh membentuk regresi yang non linier maka harus dilinierkan dulu dengan menggunakan transformasi yang sesuai. Untuk regresi non linier model kubik Y =
0X0i
+
1Xi
+
2 2Xi
+
3 3Xi
+ ε.
Pendugaan model tentunya harus memperhatikan teori dari ilmu yang melandasinya atau melatarbelakanginya, apakah pola hubungan tersebut linier maupun non linier. Model regresi polinomial merupakan peningkatan orde yang lebih tinggi dari bentuk linier dan pada umumnya orde tertinggi yang biasa digunakan sampai orde tiga atau bentuk regresi kubik. Konsep pendugaan parameter persamaan garisnya sama dengan regresi linier sederhana yakni menggunakan metode kuadrat terkecil. Dari aplikasi diatas disimpulkan bahwa hasil datanya merupakan model dari regresi non-linear berderajat tiga (kubik) dengan persamaan Y = 32,8159 + 10,4864X - 1,26401X2 + 4,76E-02X3. Persamaan regresi linearnya adalah Y = 49,3 + 1,12 X dan persamaan regresi non-linear berderajat dua (kuadratik) adalah Y = 46,6429 + 1,98669X - 5,11E-02X2. Dari analisis didapat bahwa model signifikan, berdistribusi normal, homogen, tidak saling bebas dan menolak H0 karena P value > 0.05.
Lampiran
Data banyaknya foto copy yang diakumulasikan dalam setiap minggu dari bulan Juni – September 2011 pada Foto Copy “AREMA” yang menerima foto copy setiap harinya.
Bulan
Juni
Juli
Agustus
September
Minggu ke- Banyaknya Foto copy/rim I
43
II
49
III
52
IV
58
I
62
II
58
III
59
IV
62
I
62
II
61
III
56
IV
55
I
62
II
63
III
66
IV
72
Tertanda,