BAB 7. ANALISIS KORELASI DAN REGRESI
P
eneliti sering dihadapkan pada data yang memiliki banyak peubah (misalnya data Nilai ujian nasional, terdiri atas beberapa peubah seperti jenis kelamin, identitas institusi, nilai ujian beberapa mata pelajaran). Dalam hal data mengandung banyak peubah, seseorang peneliti mungkin
tertarik untuk mengetahui (menguji) apakah suatu peubah berhubungan dengan peubah lainnya, baik dengan menghitung sebatas pada derajat asosiasi melalui analisis korelasi, maupun dengan menentukan bentuk fungsi/model hubungannya melalui analisis regresi. Pada bab ini akan dibahas analisis korelasi dan regresi sederhana.
KOMPETENSI Setelah menyelesaikan materi pada bab ini pembaca dapat menghitung korelasi produk momen, memahami maknanya, dapat melakukan analisi regresi baik dengan satu maupun banyak peubah, serta dapat menginterpretasikan hasilnya.
MATERI Korelasi Produk Momen Analisis regresi sederhana Kompetensi
181
Analisis regresi peubah ganda Pengantar analisi regresi modern
7.1 ANALISIS KORELASI Dalam analisis korelasi, kita menghitung derajat asosiasi antara satu peubah dengan peubah lain (misalnya antara berat badan dan tinggi badan, antara berat badan dengan kolesterol, antara nilai IQ dengan perolehan nilai ujian mata pelajaran matematika dan sebagainya). Ada dua jenis ukuran korelasi yang banyak dipakai yaitu: 1. Korelasi produk momen Pearson untuk mengukur derajat asosiasi antara beberapa peubah dengan skala interval atau rasio. 2. Korelasi Spearman untuk mengukur derajat asosiasi antara beberapa peubah dengan skala ordinal (rank).
Koefisien korelasi atau derajat asosiasi
dua peubah
(dinotasikan dengan r)
dihitung dengan rumus pada Pers. 7.1 yang sesungguhnya identik dan merupakan modifikasi dari rumus pada Pers. 3.12.
n
Pers. 7.1
r=
∑ xi yi − 1 i =1
⎛ ⎞ x − 1 ⎜ ∑ xi ⎟ ∑ n i =1 ⎝ i =1 ⎠ n
n
2 i
182
2
n
n
∑ xi ∑ yi
n i =1
i =1
⎛ n ⎞ y − 1 ⎜ ∑ yi ⎟ ∑ n ⎝ i =1 ⎠ i =1 n
2
2 i
ANALISIS KORELASI DAN REGRESI
Besarnya r berkisar antara −1 ≤ r ≤ 1 . Ilustrasi grafik sebaran data dengan berbagai nilai korelasi dapat disajikan dalam bentuk diagram pencar. Bentuk pencaran data terkait dengan besarnya korelasi dapat diilustrasikan seperti pada Gambar 7.1. 1. Korelasi negatif
menunjukan bahwa kedua peubah (X dan Y) memiliki
kecenderungan yang berlawanan (yaitu kenaikan nilai X, diikuti dengan penurunan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan kenaikan nilai Y), seperti pada Gambar 7.1 (a) dan Gambar 7.1 (b). Nilai r = 1 menunjukkan kedua peubah berkorelasi negatif secara sempurna. Sebaran data tepat membentuk garis lurus (hal yang dalam kenyatan jarang terjadi). 2. Korelasi nol (r=0) menunjukan bahwa kedua peubah tidak berkorelasi, yaitu kenaikan atau penurunan nilai peubah X, tidak mempengaruhi nilai peubah Y, seperti pada Gambar 7.1 (c). 3. Korelasi positif menunjukan bahwa kedua peubah memiliki kecenderungan yang sama, yaitu kenaikan nilai X, diikuti dengan kenaikan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan penurunan nilai Y, sebagaimana diilustrasikan pada Gambar
7.1 (d), Gambar
7.1 (e)
dan
Gambar 7.1 (f). Nilai r = 1 menunjukkan kedua peubah berkorelasi positif secara sempurna.
Analisis Korelasi
183
(b) r=-0.75
(c) r=0
45
50
55
1 40
45
50
55
40
45
50
X
X
X
(d) r=0.60
(e) r=0.70
(f) r=0.99
55
100 90
90
80
80 70
70 40
45
50 X
Gambar 7.1
7.1.1
Y
Y
90 100 80
Y
100
120
110
110
120
40
-2
-120
-110
-1
0
Y
-100
Y -100
Y
-90
-90
2
-80
-80
3
(a) r=-0.99
55
40
45
50
55
X
40
45
50
55
X
Diagram pencar data (X,Y) dengan berbagai nilai korelasi
MENGHITUNG KORELASI SECARA MANUAL
Untuk ukuran sampel yang relatif kecil, perhitungan koefisien korelasi secara manual menggunakan persamaan (8.1) masih mungkin dilakukan. Adanya Sebelum komputer atau kalkulator, perhitungan secara manual banyak juga dilakukan dengan mengunakan teknik yang disebut peta korelasi (lihat misalnya Hadi [8]).
184
ANALISIS KORELASI DAN REGRESI
Contoh 7.1
Berikut adalah contoh pasangan data fiktif dengan jumlah pasangan 10 sehinga masih mungkin dihitung secara manual. x 8 10 5 6 7 8 9 5 10 4 72
y 5.00 4.00 3.00 3.00 4.00 4.00 5.00 3.00 5.00 2.00 38
xy 40 40 15 18 28 32 45 15 50 8 291
∑x
∑y
∑ xy
7.2
3.8
29.1
x2 64 100 25 36 49 64 81 25 100 16 560
∑x
∑ x /n ∑ y /n ∑ xy /n ∑ x
2
56 2
/n
y2 25 16 9 9 16 16 25 9 25 4 154
∑y
2
15.4
∑y
2
/n
Hasil perhitugan pada tabel di atas selanjutnya dimasukkan ke dalam rumus pada persamaan 8.1 sehingga diperoleh: r=
291 − 1/10 × 72 × 38 560 − 72 /10 154 − 38 /10 2
2
=
17, 4 = 0,87 19,98
Hasil yang sama diperoleh dengan menghitung mengunakan R.
7.1.2
MENGHITUNG KORELASI DENGAN RCOMMANDER
Ada dua macam korelasi yang dapat dihitung melalui RCommander, yaitu 1. Matriks korelasi yang sekaligus menghitung korelasi beberapa (lebih dari dua) peubah (lihat Gambar 7.2).
Analisis Korelasi
185
2. Uji korelasi untuk menghitung dan menguji korelasi antara dua peubah. Dengan uji ini kita dapat menguji apakah korelasi antara dua peubah signifikan atau dapat diabaikan (Gambar 7.3).
Gambar 7.2 Menu dialog Matriks Korelasi untuk korelasi Pearson dan Spearman
Berikut adalah hasil keluaran matriks korelasi untuk empat peubah. Dalam matriks ini yang dihitung hanya besarnya korelasi tanpa ada uji apakah korelasinya bermakna atau tidak. NFis
NIng
NMat
Pkn
NFis 1.0000000 0.3040950 0.8152343 0.3533408 NIng 0.3040950 1.0000000 0.2653100 0.7178789 NMat 0.8152343 0.2653100 1.0000000 0.4906039 Pkn
186
0.3533408 0.7178789 0.4906039 1.0000000
ANALISIS KORELASI DAN REGRESI
Gambar 7.3 Menu dan Dialog Uji Korelasi Pearson dan Spearman
Salah satu korelasi dari empat peubah (misalnya antara NFis dengan Nmat) di atas dapat diuji lebih jauh melalui uji korelasi. Hasil analisisnya adalah sebagai berikut ini. 1. Pearson's product-moment correlation 2. data:
DataSim$NFis and DataSim$NMat
3. t = 12.4323, df = 78, p-value < 2.2e-16 4. alternative hypothesis: true correlation is not equal to 0 5. 95 percent confidence interval: 0.7254628 0.8777313 6. sample estimates: cor 0.8152343
Keterangan 1. Judul uji yaitu Uji korelas produk momen dari Pearson
Analisis Korelasi
187
2. Nama data dan peubah yang korelasinya diuji, yaitu data “DataSim” varianel “NFis” dan “NMat”. 3. Besarnya nilai t hitung (12,43), derajat kebebasan (78) dan nilai peluang p (<1%, yang berarti sangat signifikan). 4. Rumusan hipotesis alternatif (yaitu korelasi tidak sama dengan 0) 5. Interval keyakinan 95% dari korelasi populasi yaitu [0,73; 0,88]. 6. Korelasi sampel (cor), yaitu 0,82 yang secara manual pada prinsipnya dapat dihitung dengan menggunakan rumus pada persamaan Pers. 7.1. Dari hasil uji dapat disimpulkan bahwa nilai korelasi kedua peubah tersebut adalah 0,82. Hasil ini sangat signifikan (p-value < 2.2e-16). Interval keyakinan 95% korelasi populasi adalah 0,73 ≤ r ≤ 0,88. Koefisien korelasi hanya mengukur derajat asosiasi asosiasi dua peubah acak, yaitu menjelaskan tren umum apakah kenaikan atau penurunan nilai pada salah satu peubah akan diikuti dengan kenaikan atau penurunan pada nilai peubah yang lain. Analisis korelasi belum bisa dijadikan alat untuk memprediksi nilai suatu peubah apabila nilai peubah yang lain diketahui. Jika kepentingannya adalah untuk memprediksi nilai suatu peubah berdasarkan nilai peubah yang lain, maka harus dilakukan uji regresi.
7.2 ANALISIS REGRESI SEDERHANA Jika dalam analisis korelasi peneliti hanya tertarik pada derajat asosiasi atau kecenderungan umum dua buah peubah atau lebih, maka dalam analisis regresi peneliti ingin memperoleh hubungan fungsional antara dua peubah yang dinyatakan dalam bentuk Y = a + bX , yang merupakan penduga dari fungsi yang ada pada populasi yang biasa dinotasikan dengan Y = α + β X , atau Y =β 0 + β1 X ,
atau
untuk
peubah
bebas
lebih
dari
satu
dinyatakan
sebagai
Y =β 0 + β1 X 1 + β 2 X 2 ,... Melalui analisis regresi peneliti ingin menghitung nilai 188
ANALISIS KORELASI DAN REGRESI
penduga untuk β j yang sesuai dengan data. Selain melakukan penghitungan nilai penduga untuk β j juga sekaligus melakukan uji apakah nilainya signifikan atau dapat diabaikan (tidak signifikan). Analisis regresi sederhana hanya terdiri atas satu peubah bebas (peubah penjelas/eksplanatori) X dan satu peubah terikat (respon) Y dengan hubungan linier. Kedua peubah ini merupakan peubah kuantitatif, khusus untuk Y harus dengan skala interval atau rasio. Dengan visualisasi secara geometris (lihat Gambar 7.9) dapat ditafsirkan bahwa dengan analisis regresi kita ingin menduga garis populasi yang sesungguhnya tidak pernah diketahui (garis lurus putus-putus) berdasarkan sampel pasangan data pada sampel. Persoalanvini merupakan persoalan estimasi uji inferensi daam regresi. Garis regresi penduga ini dapat dipergunakan untuk meramal (prediksi) rentang rata-rata nilai Y pada saat nilai X diketahui, demikian juga rentang nilai-nilai Y pada saat nilai tertentu dari X .Persoalan yang terakhirt ini merupakan persoalan prediksi dalam regresi
Analisis Regresi Sederhana
189
0
50
y
100
150
Diagram Pencar & Sabuk Keyakinan
0
5
10
15
20
25
x Gambar 7.4
7.2.1
Ilustrasi Garis regresi populasi, regresi penduga dengan sabuk keyakinannya.
ESTIMASI DAN UJI INFERENSI PARAMETER REGRESI
Pendugan dengan metode statistika selain menghasilkan dugaan (garis lurus langsung),
juga menghasilkan batas
berupa garis
simpangan garis secara
keseluruhan yang membentuk sabuk keyakinan. Secara umum, pendugaan termasuk baik, jika garis populasi masih berada didalam batas sabuk keyakinan yang terbentuk. Secara geometris, kita mencari garis yang menjadi penduga garis regresi populasi, adalah garis yang paling mewakili sebaran data yang kita miliki. 190
ANALISIS KORELASI DAN REGRESI
Garis yang paling mewakili adalah garis lurus sedemikian sehingga simpangan titik-titik data terhadap garis menjadi minimum. Salah satu cara menentukan penduga garis ini adalah dengan metode kuadrat terkecil yang pada dasarnya meminumkan bentuk kuadrat Q = ∑ ei2 = ∑ [ y − ( β 0 + β1 xi ) ] , 2
j=1,2. Dengan kata lain kita mencari β 0 , β1
terhadap parameter β j untuk
sedemikian sehingga Pers. 7.2 memcapai nilai minimum.
(
n
Pers. 7.2
)
see = ∑ ⎡ y − β 0 + β1 xi ⎤ ⎣ ⎦ i =1
2
Penurunan secara matematus menghasilkan Pers. 7.3
)
)
β 0 = y − β1 x , n
Pers. 7.4
)
β1 =
∑x y i
i =1
n
i
n
− 1/ n ∑ xi ∑ yi i =1
i =1
⎛ ⎞ x − 1/ n ⎜ ∑ xi ⎟ ∑ i =1 ⎝ i =1 ⎠ n
n
2
,
2 i
Pers. 7.5
)
β1 =
s xy s xx
,
dengan n
Pers. 7.6
n
n
∑ xi ∑ yi
i =1
n
s xy = ∑ xi yi −
i =1
i =1
⎛ n ⎞ ⎜ ∑ xi ⎟ n 2 , s xx = ∑ xi − ⎝ i =1 ⎠ n i =1
2
Jika rumus pada Pers. 7.4 dikaitkan dengan rumus pada Pers. 8.1, maka dengan pengetahuan matematika yang mencukupi dapat ditunjukkan bahwa Pers. 7.7
)
β1 = rxy
sx , dengan s x = s xx ; s y = s yy sy
Analisis Regresi Sederhana
191
Oleh karena sx dan sy adalah nonnegatif,
maka tanda tanda koefisien regresi
(positif atau negatif) sama dengan koefisien korelasi. Selanjutnya dari Pers. 8.2 dan 8.3 diperoleh hubungan see = s yy − β1s xy , 2
⎛ n ⎞ ⎜ ∑ yi ⎟ n 2 dengan s yy = ∑ yi − ⎝ i =1 ⎠ . n i =1 Selanjutnya penduga ragam populasi
σ 2 = s2 =
Pers. 7.8
see . n−2
Hal ini dijadikan dasar perhitungan kesalahan baku untukpenduga koefisien regresi dengan memperhatikan bahwa: 1. Y adalah peubah acak dengan ragam σ 2 , sementara X bukanlah peubah acak, dan. 2. var( ay + c ) = a 2 var( y ) untuk a dan c konstanta, maka kesalahan baku masingmasing penduga adalah
Pers. 7.9
3. rasio
)
⎛ 1 x2 ⎞ s2 ,dan s β2 0 = s 2 ⎜ + ⎟ s xx ⎝ n s xx ⎠ ) dan β 0 / sβ 0 masing-masing menghasilkan distribusi t dengan
s 2β 1 =
β1 / sβ 1
derajat kebebasan (n-2). 4. Sedangkan uji keseluruhan F =
s xx menghasilkan distribusi F dengan see /( n − 2)
derajat kebebasan (1,n-2). Secara praktis F diperoleh dari tβ2 1
192
ANALISIS KORELASI DAN REGRESI
Selain melalui uji, kemanfaatan garis regresi yang diperoleh juga dilihat dari besarnya koefisien determinasi (kuadrat korelasi). Garis regresi akan semakin baik, jika nilai koefisien determinasinya mendekati 1. Dalam buku ini pembahasan lebih difokuskan pada interpretasi hasil perhitungan dengan menggunakan komputer. Prosedur pengujian analisis regresi sederhana adalah seperti berikut ini. 1. Rumusan Tujuan Untuk menguji apakah ada hubungan atau hubungan linier signifikan antara ) ) ) ) dua peubah yang ditunjukkan oleh Y = a + bX = α + β X = β 0 + β1 X . 2. Asumsi a. Data peubah respons Y bedistribusi Normal dengan ragam konstan b. Sisa (residu), yaitu selisih antara data asli dengan
garis regresi
berdistribusi normal dengan nilai-tengah nol dan ragam konstan. c. Hubungan antara peubah X dan Y bersifat linier. 3. Rumusan Hipotesis untuk masing-masing koefisien a. Hipotesis nihil Ho: semua koefisien koefisien regresi sama dengan 0. b. Ha untuk uji dua arah (two tails test) Ha: Tidak semua semua koefisien regresi sama dengan 0. 4. Rumusan Hipotesis untuk uji keseluruhan a. Hipotesis nihil Garis regresi yang diperoleh tidak signifikan b. Hipotesis alternatif
Analisis Regresi Sederhana
193
Garis regresi yang diperoleh signifikan 5. Rumus Manual (lihat persamaan-persamaan sebelumnya) 6. Kriteria a. Uji masing-masing koefisien dilakukan dengan melihat nilai tmasingmasing koefisien atau berdasarkanb p-value-nya. Berdasarkan nilai kritis
,
tn −2,α / 2
untuk hipotesis dua arah, Ho ditolak jika dan hanya jika
| thitung |≥ tn −2,α / 2 . Sedangkan berdasarkan nilai p (p-value), Ho ditolak dan Ha diterima jika p-value < 5%. Perhatikan bahwa nilai p berubah
sesuai jenis hipotesis alternatif yang dipilih (satu atau dua arah). Kriteria ini yang banyak diimplemantasikan pada paket-paket statistika. b. Uji keseluruhan dengan melihat nilaistatistik F dan menolak Ho Secara grafis, contoh sebaran data asli dan sisa yang ideal memenuhi asumsi dapat dilihat pada Gambar menyebar dengan
7.5. Pada gambar tersebut terlihat bahwa data dan sisa
lebar dari kiri ke kanan relatif sama (ragam konstan) dan
mengikuti garis lurus. Sebaran Data Asli
0 -10
30
-5
40
y
sisa
50
5
60
10
Sisa
10
15
20 x
25
30
30
40
50
60
pred
Gambar 7.5 Diagram Pencar Data Asli (sebelah kiri) dan Sisa (sebelah kanan)
Contoh 7.2
Jika data pada Contoh 7.1 diteruskan dengan perhitungan koefisien regresi maka akan diperoleh 194
ANALISIS KORELASI DAN REGRESI
)
β1 = =
∑x y i
∑
i
− 1/ n ∑ xi ∑ yi
xi2 − 1/ n ( ∑ xi )
2
291 − 1/10 × 72 × 38 17,4 = =0,48 2 41,6 560-72 /10
Sementara itu, )
β 0 = 1/ n ∑ yi −
)
β1
∑ xi n = 3,8 − 0, 42 × 7, 2 = 0,788
Hasil yang sama diperoleh dengan menggunakan RCommander. Dialog analisis regresi sederhana dengan RCommander dapat dilihat pada Gambar 7.6.
Gambar 7.6 Dialog regresi linier sederhana untuk peubah NFis dan NMat
Contoh 7.3
Berikut adalah uji regresi untuk peubah NFis (Y) dan NMat (X) dari DataSim. Dialog untuk peubah ini dapat dilihat pada Gambar 7.6. Keluaran dari program tersebut
adalah seperti berikut ini. Keluaran tersebut diberi nomor untuk
memudahkan penjelasan. 1. Call: Analisis Regresi Sederhana
195
lm(formula = NFis ~ NMat, data = DataSim) 2. Residuals: Min
1Q
Median
3Q
Max
-29.4726
-2.6436
-0.5996
1.0129
34.2166
3. Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept)
8.55473
5.12003
1.671
NMat
0.83811
0.06741
12.432
0.0988 . <2e-16 ***
--4. Signif. codes: ’ 1
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘
5. Residual standard error: 7.175 on 78 degrees of freedom 6. Multiple R-Squared: 0.6646,
Adjusted R-squared: 0.6603
7. F-statistic: 154.6 on 1 and 78 DF,
p-value: < 2.2e-16
Keterangan keluaran 1. Nama fungsi linier model (lm) R yang dipanggil, dengan data dan peubah terkait. Pada contoh di atas data diambil dari DataSim dengan bentuk model NFis=f(NMat), yaitu peubah respons adalah NFis dan peubah penjelas adalah NMat. Dalam konteks ini peneliti ingin memperoleh hubungan fungsional antara Nilai Ujian Fisika dengan Nilai Ujian Matematika. 2. Sebaran (statistik ringkas) dari kesalahan (sisa), yaitu penyimpangan antara dugaan garis regresi dengan data.Sisa ini secara teoritis harus berpusat di 0 simetris dan dengan ragam konstan. 3. Hasil pendugaan koefisien dan uji signifikansinya. Pada contoh di atas diperoleh: 196
ANALISIS KORELASI DAN REGRESI
a. intercept (titk potong/konstanta) a=8,55 dengan nilai p = 0,099. Angka ini menunjukkan bahwa konstanta regresi tidak signifikan. Walaupun nilainya cukup besar
(8,55) tetapi secara statistik dapat diabaikan.
Dengan kata lain model yang lebih tepat adalah model Y=bX. Ini juga menunjukkan bahwa pada saat tingkat nilai X=0, maka Y juga cenderung 0. Namun kusus untuk uji konstanta (intercept), nilai 0,09% dapat dianggap sebagai nilai marjinal (dekat dengan 5%),oleh karena itu konstanta cenderung dibiarkan pada model. b. Koefisien regresi untuk peubah NMat, b,besarnya 0,83 dengan nilai p <2e-16.
Ini menunjukkan bahwa koefisien ini sangat signifikan
(walaupun secara matematis nominalnya jauh lebih kecil dibanding konstanta). Pada perhitungan ini dapat dilihat bahwa c. tβ0 = 1, 67 =
d.
Estimate = 8,55 Std .Error = 5,12
tβ 1 = 12, 43 =
Estimate = 0,83 Std . Error = 0,067
4. Tingkat signifikansi yang diperoleh (0%, 0,1%, 1%, 5%, 10% dan 100%) 5. Kesalahan baku dari sisa dan derajat kebebasannya (besarnya n-2). 6. Koefisien determinasi asli dan koefisien determinasi yang telah disesuaikan. Koefisien determinasi yang baik adalah yang mendekati 1. Semakin mendekati 1, semakin baik. Koefisien determinasi yang rendah menunjukkan banyak data yang pemyebar jauh dari garis regresi. Besarnya koefisien determinasi berbanding terbalik dengan besarnya kesalahan baku sisa. Jika kesalahan baku besar, koefisien determinasi cenderung kecil (Lihat contoh keluaran berikutnya).
Analisis Regresi Sederhana
197
7. Uji signifikansi garis regresi secara keseluruhan yang menggunakan uji F menghasilkan F=154,6 = (12,432)2 = t β21 pada derajat kebebasan (1 dan n-2). Pada contoh ini hasilnya signifikan (p-value: < 2.2e-16). Contoh di atas menunjukkan bahwa secara keseluruhan uji regresi menunjukkan hasil yang signifikan (ada hubungan signifikan antara nilai Fisika dan Matematika), tetapi hubungan yang diperoleh tidak cukup baik dipergunakan untuk prediksi karena koefisien determinasinya relatif rendah (0,66). Ini menunjukkan bahwa banyak nilai yang menyebar jauh dari garis regresi seperti ditunjukkan oleh
70 50
60
NFis
80
90
diagram pencar pada Gambar 7.7.
50
60
70
80
90
NMat
Gambar 7.7
198
Diagram Pencar Data NMat dan Nfis dengan koefisien determinasi relatif rendah
ANALISIS KORELASI DAN REGRESI
Contoh 7.4
Pada contoh berikut ini diberikan ilustrasi hasil analisis regresi antara peubah Y dan X, dengan hasil yang signifikan baik pada koefisien maupun konstantanya serta dengan koefisien determinasi yang lebih tinggi. Residuals: Min
1Q
Median
3Q
Max
-1.927959 -0.797888 -0.003435
0.696098
3.630627
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x
4.93500 -2.00117
1.76506
2.796
0.03575 -55.973
0.00742 ** < 2e-16 ***
--Signif. codes: 1
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’
Residual standard error: 1.083 on 48 degrees of freedom Multiple R-Squared: 0.9849, F-statistic:
Adjusted R-squared: 0.9846
3133 on 1 and 48 DF,
p-value: < 2.2e-16
Hasil di atas menunjukkan bahwa uji regresi sangat
signifikan, baik untuk
konstanta maupun koefisien regresinya (semua nilai-p nya kurang dari 1%) demikian juga uji keseluruhan menggunakan uji F. Model yang diperoleh juga dapat digunakan untuk prediksi dengan baik dengan koefisien determinasi yang besar (0,98) dan kesalahan baku yang relatif kecil (1,08). Ini menunjukkan bahwa hubungan kedua peubah hampir sempurna dan sebaran datanya tidak jauh dari garis regresi, seperti ditunjukkan oleh diagram pencar pada Gambar 7.8.
Analisis Regresi Sederhana
199
-80 -90
y1
-100 -110
40
45
50
55
x
Gambar 7.8 Diagram Pencar X dan Y
7.2.2
PREDIKSI DALAM REGRESI
Setelah mendapat penduga regresi yang signifikan, yang ditunjukkan oleh adanya uji signifikansi secara keseluruhan, selanjutnya kita dapat menggunakan hasik tersebut untuk kepentingan prediksi nilai Y atau rata-rata Y pada saat nilai X tertentu (misalnya x). Sebagaimana telah disebutkan sebelumnya, prediksi ini akan bermanfaat atau lebih akurat apabila koefisien deterministiknya cukup besar (mendekati 1) yang berarti data menyebar secara homogin dekat dengan garis regresi. Secara umum ada dua jenis prediksi yang dapat dilakukan, seperti berikut ini: 1. Prediksi nilai rata-rata Y pada saat nilai X tertentu, misalnya xp. 2. Prediksi nilai Y pada saat nilai X tertentu. Prediksi di atas pada dasarnya adalah penduga interval dengan nilai penduga titik yˆ = β 0 + β1 x . Kesalahan baku dari keduanya adalah sebagai berikut
Pers. 7.10
200
2 ⎡ 1 ( x − x )2 ⎤ xp − x ) ( 1 p ⎥ dan y = yˆ ± tα / 2 s s = see ⎢ + + s xx n s xx ⎢n ⎥ ⎣ ⎦ 2 y
ANALISIS KORELASI DAN REGRESI
2 ⎡ 1 ( x − x )2 ⎤ xp − x ) ( 1 p ⎥ dan y = yˆ ± tα / 2 s 1 + + s = see ⎢1 + + s xx n s xx ⎢ n ⎥ ⎣ ⎦ 2 $y
Pers. 7.11
Kedua prediksi di atas berbeda dalam lebar interval dugaan karena penduga ratarata dan penduga nilai tunggal nilai Y memiliki kasalahan baku yang berbeda.
Dengan
R
seseorang
dapat
menghitung
prediksi
tersebut
sekaligus
mengilustrasikannya dalam bentuk grafik seperti pada Gambar 7.9. Pada gambar tersebut prediksi dilakukan pada saat nilai X sama dengan rata-rata X, yaitu x =12,5. Pada saat itu nilai penduga titiknya adalah 67,66 (10,76 + 4,55x ) dengan
penduga interval 95% untuk rata-rata y |x =12,5 adalah [62,13; 73,18] dan interval
penduga 95% dari y |x =12,5 adalah [28,18; 107,10]
Analisis Regresi Sederhana
201
150
Diagram Pencar & Sabuk Keyakinan
100
Batas interval rata-rata Y
0
50
y
Batas interval Y
0
5
10
15
20
25
x
Gambar 7.9
Ilustrasi Garis regresi populasi, regresi prediksi nilaiY dan ratarata Y pada saat nilai tertentu dari X dengan interval keyakinannya.
7.3 MODEL LINIER: REGRESI PEUBAH GANDA RCommander menyediakan menu untuk analisis regresi dengan model yang lebih kompleks yaitu model dengan lebih dari satu peubah bebas (penjelas) baik berupa peubah kuantitatif maupun faktor (seperti jenis kelamin atau pengelompokan lain dalam populasi). Dialog untuk model linier diberikan pada Gambar 7.10. Dalam dialog itu ada beberapa hal yang harus diperhatikan yaitu:
202
ANALISIS KORELASI DAN REGRESI
1. Nama model yang terisi secara otomatis sesuai jenis regresi yang dipanggil (linier model, GLM dan sebagainya) 2. Nama-nama peubah (dengan jenisnya). Kita bisa mengetahui peubah yang berupa kuantitatif maupun faktor.
Peubah-peubah ini bisa dipilih dengan
meng-klik. 3. Rumusan formula model. Model dalam R dinyatakan dalam bentuk Y=f(X1,X2,...) dengan Y adalah peubah respons dan Xi adalah peubah bebas. Secara umum untuk peubah kuantitatif
penambahan beberapa peubah
kuantitatif dinyatakan dengan tanda “+”, misalnya X1+X2.
Gambar 7.10 Dialog Model Linier
Hasil analisis regresi dengan banyak peubah pada dasarnya sama dengan hasil analisis sebelumnya hanya koefisien yang diestimasi lebih banyak yaitu konstanta dan koefisien masing-masing peubah bebas. Berikut adalah contoh keluaran analisis regresi untuk dua peubah bebas NMat dan NIng terhadap NFis. Misalkan kita ingin menguji hubungan NFis = β 0 + β1 NMat + β 2 NIng . Dalam Formula dituliskan
Model Linier: Regresi Peubah Ganda
203
NFis ~ NMat + NIng Keluaran yang dihasilkan adalah seperti berikut ini. Call: lm(formula = NFis ~ NMat + NIng, data = DataSim)
Residuals: Min
1Q
Median
3Q
Max
-29.0987
-2.9626
-0.4881
1.7663
32.4172
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept)
1.67825
7.07947
0.237
NMat
0.81235
0.06950
11.689
NIng
0.10519
0.07528
1.397
0.813 <2e-16 *** 0.166
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Eksplorasi lebih jauh
1. Aktifkan salah satu data yang ada pada Ratau yang ada pada CD (format excel) 2. Lakukan uji regresi baik dengan 1 atau lebih peubah penjelas. 3. Periksa nilai pengujian masing-masing koefisien 4. Periksa nilai pengujian secara keseluruhan 5. Periksa nilai koefisien determinasinya 6. Jelaskankesimpulan anda terhadaphasil pengujian yang dilakukan. 204
ANALISIS KORELASI DAN REGRESI
7.4 DIAGNOSTIK MODEL MELALUI GRAFIK Pemeriksaan terhadap kecocokan analisis regresi dengan kondisi data yang dianalisis disebut diagnostik model. Salah satu cara mendiagnostik model adalah dengan melihat sebaran sisa (residu). Residu atau sisa adalah selisih antara nilai observasi (observed value) dengan nilai dugaan yang diperoleh melalui garis regresi (predicted value). Residu ini merupakan penduga dari kesalahan atau error. Secara geometris, sebenarnya pencaran residu ini sama dengan pencaran data hanya sumbu X nya ditransformasi berimpit dengan garis regresi. Seperti telah disampaikan sebelumnya bahwa asumsi ideal untuk analisis regresi linier adalah bahwa sisa menyebar normal dengan rata-rata 0 dan ragam konstan. Syarat kekonstanan varians ditunjukkan oleh adanya sebaran merata sehingga lebar sebaran dari kiri ke kanan relatif konstan.
Adanya ketidak konstanan ragam
ditandai dengan lebar sebaran yang tidak sama dari kiri ke kanan. Data yang mempunyai ragam konstan disebut bersifat homoskedastik sebaliknya disebut bersifat heteroskedastik. Pemeriksaan model dengan
RCommander dapat
dilakukan dengan memilih menu model dan opsi grafik pada plot diagnostik dasar seperti terlihat pada Gambar 7.11 Diagnostik grafik ini menampilkan empat grafik dasar seperti berikut ini. 1. Grafik Nilai prediksi dengan sisa. Grafik ini menggambarkan hubungan antara garis regresi yang diperoleh dengan sisa. Secara umum sebaran sisa harus menunjukkan sebaran acak disekitar nilai nol dengan lebar yang relatif sama. Apabila sebaran menunjukkan pola tertentu (misalnya membentuk kurva, lebar tidak konstan), ini mengindikasikan bahwa model yang dipilih kurang baik.
Diagnostik Model Melalui Grafik
205
Gambar 7.11 Menu dan Dialog Diagnostik Grafik
2. QQPlot Normal dari sisa yang telah dibakukan. QQ-Plot Normal pada dasarnya adalah grafik yang mennyajikan sebaran quantil normal teoritis, dengan quantil data. Apabila datanya berdistribusi normal maka sebarannya akan mendekati garis lurus. Penyimpangan yang sangat mencolok pada ujung-ujung grafik menunjukkan datanya menyimpang dari distribusi normal. Untuk data yang tidakmemenuhi distribusi normal dapatdilakukan transformasi ataupun dengan memilih alternatifregresi yang lain. 3. Grafik Nilai Prediksidengan akar Sisa baku. Penafsirannya sama dengan grafik pertama, hanya yang diperiksa sekarang adalah sisa yang telah dibakukan (standarized residual). 4. Grafik leverage terhadap sisa baku. Dalam grafik ini juga digambarkan batas jarak Cook (Cook’s distance) untuk memeriksa adanya pencilan (outlier). Jika ada nilai residu yang berada di luar batas jarak, ini mengindikasikan adanya pencilan. Perlu diadakan pemeriksaan terhadap pencatatan dataapakah ada kesalahan pencatatan atau tidak. Jika pencilan tidak banyak (1-2 observasi), dapat dipertimbangkan mengecualikan observasi tersebut dalam analisis regresi.
206
ANALISIS KORELASI DAN REGRESI
43
30
40
50
2
Normal Q-Q 50
1 -3 -2 -1 0
22
Standardized residuals
2
50
-6 -4 -2 0
Residuals
4
Residuals vs Fitted
60
22 43
-2
40
50
Fitted values
Gambar 7.12
2
60
2
59
1
20
-1 0
1.0
22
0.5 30
1
Residuals vs Leverage
Cook's distance
-3
1.5
43
Standardized residuals
Scale-Location 50
0
Theoretical Quantiles
0.0
Standardized residuals
Fitted values
-1
0.00
0.02
0.04
43
0.06
0.5
0.08
Leverage
Grafik Diagnostik untuk Model Regresi yang relatif memenuhi syarat kenormalan dan bebas dari pencilan.
Diagnostik Model Melalui Grafik
207
20
40
45
50
4 -2
-1
0
1
2
Theoretical Quantiles
Scale-Location
Residuals vs Leverage
0.0
40
45
50
55
3
0 2 4
1.0
20
1 0.5
13
Cook's distance 20
-4
3
Fitted values
Gambar 7.13
20
Fitted values
13
35
2
55
Standardized residuals
2.0
Standardized residuals
35
3
13
0
3
Normal Q-Q
-4
13
-60 -20 20
Residuals
60
Residuals vs Fitted
Standardized residuals
lm(y ~ x)
0.00
0.02
0.04
0.06
0.5 1
0.08
Leverage
Grafik Diagnostik untuk Model Regresi yang kurang memenuhi syarat kenormalan dan mengandung pencilan
Ada beberapa kondisi data yang menyimpang dari asumsi yang menjadi persyaratan analisis regresi seperti berikut ini. 1. Hubungan antara respon dengan peubah penjelas tidak linier. Kondisi ini dapat ditangani dengan melakukan transformasi pada peubah respon maupun pada peubah penjelas,lalu menganalisis data yang telah ditransformasi sehingga model yang dipergunakan tidak lagi sederhana seperti Y = β 0 + β1 X , tetapi
208
ANALISIS KORELASI DAN REGRESI
model
yang
telah
ditransformasi
seperti
log(Y ) = β 0 + β1 X
atau
Y = β 0 + β1 log( X ) dan sejenisnya. 2. Respon tidak menyebar normal, termasuk adanya pencilan maupun hasil pengamatan ekstrim. Terhadap kondisi ini cara sederhana untuk menanganinya adalah dengan mencoba analisis tanpa mengikut sertakan pencilan (terutama kalau pencilannya hanya 1-2 pengamatan). Tentang persyaratan normal, secar emperik telah dibuktikan oleh para praktisi melalui simulasi bahwa dampak akibat penyimpangan terhadap distribusi normal tidak seserius seperti yang dikhawatirkan (Stafsof [22]). 3. Respon menyebar dengan ragam tidak konstan. Jika respon tidak homogen tetapi masih memenuhi distribusi normal, kondisi ini dapat ditangani dengan memberikan pembobotan (dengan invers ragam) pada perhitungan estimasi parameter. Metode ini disebut wighted least square yang secara umum telah diimplementasikan pada paket-paket program statistika. 4. Untuk peubah penjelas lebih dari satu, terjadi korelasi signifikan di antara beberapa peubah penjelas. Kondisi ini sering disebut multi kolinieritas. Hal ini akan berakibat pada kurang akuratnya hasil estimasi parameter, karena dalam perhitungannya akan melibatkan matriks yang mendekati singuler sehingga inversnya sulit dihitung. Cara sederhana menangani kondisi ini adalah dengan memilih hanya salahsatu dari peubah-peubah penjelas yang memiliki korelasi tinggi. Misalnya jika ternyata peubah X1, X3, dan X4 berkorelasi signifikan, maka cukup salah satu saja yang dimasukkan ke dalam model regresi.
Contoh 7.5
Dalam contoh berikut diilustrasikan analisis regresi dengan 1-2 nilai pencilan. Analisis regresi dilakukan dua kali dengan mengikutsertakan seluruh data dan mengecualikan data pencilan. Dapat kita lihat adanya perubahan signifikan dari hasil kedua analisis tersebut.
Diagnostik Model Melalui Grafik
209
Berikut adalah contoh Analisis regresi dengan data yang mengandung satu pencilan. Data dianalisis dua kali msing-masing dengan menyertakan dan mengabaikan pengamatan pencilan tersebut. 1. Analisis data lengkap yang mengandung pencilan Call: lm(formula = y1 ~ x1, data = DataSimReg)
Residuals: Min
1Q
Median
3Q
Max
-17.842
-5.810
-1.492
2.713
86.675
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x1
31.3226
14.0512
2.6286
0.2769
2.229
0.0318 *
9.492 1.43e-11 ***
--Signif. codes: 1
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’
Residual standard error: 15.6 on 38 degrees of freedom Multiple R-Squared: 0.7033, Adjusted R-squared: 0.6955 F-statistic: 90.09 on 1 and 38 DF,
p-value: 1.426e-11
210
ANALISIS KORELASI DAN REGRESI
2. Hasil analisis dengan mengecualikan pengamatan yang menjadi pencilan. Pada analisis ini data pencilan dikeluarkan dari analisis (dianggap munculnya pencilan sebagai akibat kesalahan pencatatan data). Call: lm(formula = y1 ~ x1, data = DataSimReg)
Residuals: Min
1Q
Median
-9.1295 -3.9094
0.5353
3Q
Max
3.4954 10.4447
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept)
6.36779
4.74300
1.343
x1
3.08027
0.09286
33.171
0.188 <2e-16 ***
--Signif. codes: 1
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’
Residual standard error: 5.037 on 37 degrees of freedom (1 observation deleted due to missingness) Multiple R-Squared: 0.9675, Adjusted R-squared: 0.9666 F-statistic:
1100 on 1 and 37 DF,
p-value: < 2.2e-16
Ringkasan keduanya adalah sebagaimana disajikan dalam berikut (Diagram pencar diberikan pada Gambar 7.14) No
Komponen
Diagnostik Model Melalui Grafik
Data Lengkap Mengecualikan
211
Pencilan*)
1
df
2
Koefisien
3
38
37
Konstanta
31,32
6,36
Koefisien X1
2,62
3,08
0,70
0,97
Koef Determinasi
Catatan : *) Dalam analisis ini, Satu observasi diabaikan dan dianggap hilang (yaitu data
y1
160 140
100
100
120
120
140
y1
160
180
180
200
200
220
220
yang merupakan pencilan), sehingga derajat kebebasan berkurang satu.
30
40
50
60
70
x1
Gambar 7.14
30
40
50
60
70
x1
Diagram Pencar untuk Data Lengkap (kiri)dan untuk Data tanpa Pengamatan yang Dianggap Pencilan
Jika model memiliki residu yang menunjukkan adanya penyimpangan dari syarat yang harus dipenuhi, maka sebaiknya 212
dilakukan perbaikan model sehingga ANALISIS KORELASI DAN REGRESI
persyaratan tersebut menjadi relatif terpenuhi. Salah satu yang biasanya dilakukan adalah dengan mentransformasikan data dengan suatu fungsi yang sesuai. Selanjutnya data hasil transformasi ini dianalisis dengan regresi klasik yang menggunakan asumsi distribusi normal dengan hubangan linier.
7.5 ANALISIS REGRESI ALTERNATIF Dalam kenyataannya,tidak semua data yang dihadapi memenuhi asumsi regresi linier dengan baik. Selain melakukan hal-hal praktis seperti dianjurkan sebelumnya (misalnya membuang pengamatan, tidak menyertakan beubah), kita dapat juga melakukan hal lain yang lebih matematis, misalnya mentransformasikan data, atau memilih alternatif regresi yang tergolong dalam regresi modern. 7.5.1
TRANSFORMSI DATA
Jika sebaran residu menunjukkan ketidaklinieran, transformasi yang bisa dilakukan untuk mengatasi ketidak linieran diantaranya adalah seperti berikut ini.
Analisis Regresi Alternatif
213
1. Jika sebaran membentuk kurva naik dan terbuka ke atas maka transformasi dapat dilakukan pada Y dan tranformasi yang bisa dicoba adalah Y1 = log(Y )
3.5
4.0
log(y)
80 20
3.0
40
60
y
100
4.5
120
140
5.0
atau Y1 =√Y atau Y1 =1/Y seperti terlihat pada Gambar 7.15.
5
6
7
8 x
9 10
5
6
7
8
9 10
x
Gambar 7.15 Residu Data Asli dan Residu setelah Ditransformasi Logaritma padaY
214
ANALISIS KORELASI DAN REGRESI
2. Jika sebaran membentuk kurva naik dan terbuka kebawah maka transformasi dilakukan pada X dan transformasi yang bisa dicoba adalah X1 = log(X) atau X1
65 60 55 45
50
y
55 45
50
y
60
65
= √X atau X1 =1/X seperti terlihat pada Gambar 7.16
200
600 x
4.5
5.5
6.5
log(x)
Gambar 7.16 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X
Analisis Regresi Alternatif
215
3. Jika residu menyebar membentuk kurva menurun dan terbuka keatas maka X atau Y dengan salah satu
transformasi dapat dilakukan pada kedua
70 60 40 30 0
400 x
Gambar
50
y
50 30
40
y
60
70
transformasi sebelumnya seperti pada Gambar 7.17.
800
3
4
5
6
7
log(x)
7.17 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X
Selain masalah keliniearan, masalah yang sering muncul dalam analisis regresi
adalah ketidak seragaman sebaran atau ragam data. Untuk menyeragamkan atau menghomoginkan varians, dapat dicoba beberapa transformasi diantaranya Y1 = log(Y), atau Y1 =√Y atau Y1 =1/Y . Gambar 7.18 mengilustrasikan data asli yang
216
ANALISIS KORELASI DAN REGRESI
ragamnya tidakhomogin dan setelah melalui transformasi ragamnya menjadi homogin.
Plot Residu
60 40 20 -40
50
0
Residu
100
Y
150
80
Plot Data Asli
20
30
40
50
40
60
80
X
Y-Prediksi
Plot Data Transformasi
Plot Residu
100
-0.5
0.0
Residu
4.0 3.5
-1.0
3.0
log(Y)
4.5
0.5
5.0
10
10
20
30
40
X
50
3.4
3.6
3.8
4.0
4.2
4.4
4.6
4.8
Y-Prediksi
Gambar 7.18Transformasi untuk Menghomoginkan Ragams
Pada dasarnya transformasi data dilakukan agar data yang tidak memenuhi peryaratan asumsi (kelinieran dan homoginitas varians)menjadi memenuhiasumsi dan dapat dianalisis dengan metode regresi klasik, Namun, ada kalanya transformasi untuk menangasi satu permasalahan (misalnya kelinieran), justru mendatangkan persoalan baru (misalnya ketidak seragaman varians), seperti diilustrasikan pada Gambar 7.19.
Analisis Regresi Alternatif
217
200 20
30
40
50
0
500
1000
1500
Y-Prediksi
Plot Data Transformasi
Plot Residu
2000
0.01
Residu
6.5 5.0
-0.01
5.5
0.0
7.0
7.5
0.02
X
6.0
log(Y)
100
Residu
0 -100
500
Y
Plot Residu
1000 1500 2000 2500
Plot Data Asli
2.6
2.8
3.0
3.2
3.4
3.6
3.8
5.0
5.5
log(X)
6.0
6.5
7.0
7.5
Y-Prediksi
Gambar 7.19 Transformasi kelinieran menyebabkan ketidakhomoginan ragam
7.5.2
PENGANTAR REGRESI ALTERNATIF
Ada beberapa kondisi yang menyimpang atau lebih kompleks dari asumsi yang diperlukan untuk dapat melakukan analisis dengan regresi sederhana diantaranya: 1. Data mengandung peubah faktor/kualitatif dan kita ingin mengetahui apakah faktor tersebut mempengaruhi hubungan antara peubah kuantitatif lainnya. Misalnya apakah hubungan antara jumlah penghasilan dan jumlah pengeluaran konsumtif dipengaruhi oleh jenis kelamin atau pendidikan. Untuk melakukan analisis regresi seperti ini, secara teoritis kita dapat memperkenalkan peubah boneka (dummy variabel) yang dapat dilihat pada Neter etal. [20], Wonnacott & Wonnacott [35]. Aplikasi dengan R dapat dilihat pada Chamber & Hastie [2], Vanables & Ripley [32] 2. Terjadi pencilan yang cukupsignifikan mempengaruhi hasil analisis. Untuk data dengan pencilan yang 218
pencilannya tidak mungkin dibuang begitu saja,ada ANALISIS KORELASI DAN REGRESI
analisis regresi yang disebut regresi tegar (robust regression) yangdapat mengurangi pengaruh adanyapencilan (lihat Venables & Ripley [32] 3. Respon berupa skala interval atau ordinal misalnya jumlah anak, jumlah istri atau jumlah kendaraan roda empat yang dimiliki, lulus-gagal, jenis merek barang yang banyak dipilih dan sejenisnya. Analisis regresi jenis ini termasuk dalam model linier tergeneralisir atau lebih dikenal dengan GLM (Generalized Linear Models). Analisis lain yang termasuk dalamkelompokinidiantaranya adalah Regresi logistik atau analisis Probit/Logit (untuk respon dengan distribusi Binomial atau bersekala nominal) dan log-linier untuk respon dengan distribusi Poison atau bersekala ordinal). Referensi untuk model linier ini diantaranya adalah McCullagh & Nelder [15], Chamber & Hastie [2], Vaeables & Ripley [32]. 4. Respon berupa
peubah ganda, misalnya dalam eksperimen yang diamati
dampak lebih dari satu perlakuan (misalnya satu unit percobaan mendapat tiga atau lebih perlakuan) atau pengaruh satu perlakuan dilihat dalam lebih dari dua kurun waktu. (misalnya hubungan tekanan darah dan kolesterol yang diamati pada pagi, siang, dan sore hari. Percobaan seperti ini sering disebut pengukuran berulang (repeated meassure) atau studi jangka panjang (longoitudinal study). Salah satu analisis regresi atau model linier yang banyak dipakai untuk ini adalah GEE (generalized estimating equations) yang dipelopori oleh Liang & Zeger [13], [36] dan Diggle et al.[3] 5. Terjadi korelasi yang signifikan (multi kolinieritas) diantara peubah penjelas. Multi kolinieritas ini akan berakibat sulitnyamenghitung invers matriks yang diuperlukan dalam menghitung estimasi parameter. Selain menghilangkan dari model peubah yang berkorelasi, kondisi ini dapat juga ditangani melalui beberapa jenis analisi regresi diantaranya adalah regresi gulud (Ridge regression) Neter et al.[20], atau menggabungkan regresi dengan analisis komponen utama
Analisis Regresi Alternatif
219
7.6 RINGKASAN DAN BACAAN LEBIH LANJUT 7.6.1
RINGKASAN
1. Korelasi dan regresi merupakan dua analisis yang saling terkait. Analisis korelasi hanya mempelajari derajat asosiasi antara beberapa peubah sedangkan analisis regresi mempelajari fungsi atau model hubungan antara beberapa peubah yang diperlukan untuk memprediksi nilai suatu peubah bila nilai peubah lain diketahui. 2. Kondisi hubungan dua peubah, secara kasar dapat dilihat melalui diagram pencar. Pada diagram pencar data harus menyebar secara acak dengan kecenderungan membentuk garis lurus. 3. Koefisien determinasi adalah kuadrat dari koefisien korelasi. Model dengan koefisien determinasi tinggi (mendekati 1) menunjukkan data menyebar dekat dengan garis regresi, karenanya model yang diperoleh bermanfaat dalam melakukan prediksi. 7.6.2
BACAAN LEBIH JAUH
Analisis regresi atau modellinier telah berkembang dari analisis yang sederhana sampai berbagai bentuk khusus untuk menangani kondisi data yang kompleks. Pembahasan tentang regresi linier sederhana dapat dijumpai dalam banyak bukubuku teks statistika (Hadi[8], Sujana[23], Mendenhall[16],[17]). Sedangkan untuk regresi khusus (seperti regresi gulud, lihat Neter et al. [20]) dan regresi modern (misalnya GLM, HGLM, regresi tegar), pembaca dapat membaca Statsoft [22], Chamber & Hastie [2], Garson [5], McCullagh & Nelder [15], Vanables & Ripley [32].
220
ANALISIS KORELASI DAN REGRESI
DAFTAR PUSTAKA
[1]
Baird JH.2003. How Statistics Can Lie. Green Section Recoed. [Agustus 2008]
[2]
Chamber JM & Hastie TJ.1993. StatisticalModels in S.Chapman & Hall
[3]
Diggle PJ, Liang K-Y & Zeger SL, 1994. Analysis of Longitudinal Data. Oxford Science Publications.
[4]
Faraway JJ. 2002. Practical Regression and Anova Using R. http://www.stat. Isa.umic.edu/~faraway/book/
[5]
Multivariate
Analysis.
http://StatNote/www2.chass.ncsu.edu\garson/pa765/statnote.htm
[Maret
Garson
DG.
StatNotes:
Topics
in
2008] [6]
Gravetter FJ & Wallnau LB. 2004. Statistics for the Behavioral Sciences. Thomson. International Student Eddition (6th Edition).
[7]
Guilford JP & Fruchter. 1978. Fundamental Statistics in Psychology and Education. International Student Edition(6th Edition). McGraw-Hill.
[8]
Hadi S. 1982. Statistika. Andi Offset, Yogyakarta.
Ringkasan dan Bacaan Lebih Lanjut
221
[9]
Hair JF, Black WC, Babin BC, Anderson RE & Tatham RL. 2006. Multivariate Analysis. Pearson, Prentice Hall.
[10] Hogg RV, McKean JW, Craig AT. 2005. Introduction to Mathematical Statistics. 6-th edt. London: Pearson Education International [11] Kuhnert P & Venables WN. 2005. An Introduction to R: Software for Statistical
Modelling
&
Computing.
http://cran.r-project.org/
doc/contrib/Kuhnert+Venables-R_Course_Notes.zip [12] Lewis P. MODULE: Basic Statistics. http://philosophy.hku.hk/think/stat/ 5 Agustus 2008] [13] Liang K-Y. & Zeger.SL. 1986. Longitudinal data analysis using generalized linear models. Biometrka.73:13-22. [14] Maindonald JH. 2001. Using R for Data Analysis and Graphics An Introduction. http://www.r.project.org. [15] McCullagh P & Nelder JA. 1989. Generalized Linear Models. Chapman & Hall [16] Mendenhall W. 1979. Introduction to Probability and Statistics 5th edt. Massachussets:Duxbury. [17] Mendenhall W. 1993. Beginning Statistics A to Z. Duxbury [18] Murrell, P. 2006. R Graphics. Chapman & Hall/CRC [19] Nelder J.A. & Wedderburn, Generalized Linear Models. J.R.Statist.Soc.57: 359-407. [20] Neter J. Wasserman, Kutner. (1985) Applied Statistical Model. Homewood, Illinois :Irwin. [21] NIST/SEMATECH
e-Handbook
of
Statistical
Methods,
http://www.itl.nist.gov/div898/handbook/, [Januari 2008]
222
DAFTAR PUSTAKA
[22] StatSoft. 2006. Electronic Statistics Textbook. http://www.statsoftinc.com/ textbook/ stathome.html [23] Sudjana. 1996. Metode Statistika. Tarsito, Bandung. [24] Tirta.2005. Potensi dan Prospek Pemanfaatan OSS-R dalam Analisis Data dan Pengajaran Statistika. Pancaran Pendidikan. XVIII (61): 195-208 [25] Tirta, IM.2005. Panduan Program Statistika R. Penerbit Universitas Jember
[26] Tirta IM, Lestari B & Dewi YS. 2006. Estimasi Efek Tetap dan Acak pada Model Multiplikatif
dengan Likelihood Bersama. Jurnal ILMU DASAR.
7:59-66.
[27] Tirta IM. 2007. Analisis Data dengan Respons tidak Saling Bebas dengan paket hglm dan gee pada OSS-R. Makalah disampaikan pada Seminar Nasional Statistika VIII di ITS Surabaya. 3 Nopember 2007. [28] Tirta IM. 2007. Pengembangan Piranti Lunak
Statistika Berbasis OSS-R
(Development of Statistical Software). disajikan dalam seminar Nasional Statistika ke - 8 (SNS VIII) di FMIPA ITS surabaya pada tanggal 3 Nopember 2007
[29] Tirta IM.2007. R.GUI: Mendesain Paket Analisis dan Media Pembelajaran Statistika. Penerbit Universitas Jember
[30] Tirta IM. 2008. Paket RcmdrPlugin.StatDemo. http://r.unej.ac.id [31] Tirta IM. 2008. Paket StatDemo. http://r.unej.ac.id [32] Venables WN & Ripley BD. 1994. Modern Applied Statistics with S-plus. Springer. [33] Vezalini
J.
2002.
Using
R
for
Introductory
Statistics.
http://www.r.project.org. [34] Wackerly, DD., Mendenhall W., Scheafer RL., 1996. Mathematical Statistics with Application. Massachussets:Duxbury.
Ringkasan dan Bacaan Lebih Lanjut
223
[35] Wannacott TH & Wannacott RJ. 1990. Introductory Statisticsfor Business and Economics. Williey International Edition. [36] Zeger SL.& Liang KY. 1986. Longitudinal Data Analysis for Discrete and Continuous Outcomes. Biometrics. 42: 121-130 [37] Zoonekyn
V.
2005.
Statistics
with
R.
http://zoonek2.free.fr/
UNIX/48_R/all.html
224
DAFTAR PUSTAKA
LAMPIRAN MENGUNDUH DAN MENGINSTAL R R adalah program open source yang dapat diunduh dari internet. Berikut diuraikan cara mengunduh dan menginstal R terutama pada sistem opeasi Windows. MENGUNDUH (MEN-DOWNLOAD) R
Ada beberapa cara yang dapat ditempuh untuk memperoleh program R beserta peket-peket pendukung (library)nya diantaranya adalah sebagai berikut. 1. Mengunjungi situs http://www.cran.r-project.org, lalu memilih situs bayangan (mirror) yang paling dekat dengan lokasi kita. Salah satu diantaranya adalah situs yang ada di Australia yaitu http://cran.au.r-project.org. Pengguna dapat mengunduh (download) program secara cuma-cuma. 2. Menghubungi Laboratorium Statistika Jurusan Matematika FMIPA Universitas Jember. Kepada pengguna dikenakan biaya mengunduh (download) dan pengemasan yang tidak mahal; 3. Menghubungi UPT Penerbitann Universitas Jember dan membeli salah satu panduan atau manual tentang R yang berisi paket Program R, diantaranya adalah Tirta [25] [29];
Mengunduh dan Menginstal R
225
4. Mengunjungi situs http://r.unej.ac.id yang menyediakan salah satu versi R yang relatif masih baru. Komponen program yang diperlukan untuk dapat menjalankan R dan RCommander dengan baik adalah: 1. program R untuk windows yang biasanya diberi nama R-Versi-win32.exe; 2. semua paket pendukung/pustaka/library versi windows yang dibutuhkan seperti: aaMI_versi.zip,…, zoo_versi.zip; 3. bagi yang ingin menggunakan R melalui skrip pemrograman diperlukan juga Tinn-R yaitu Tinn-R_versi_setup.exe. 4. Dalam notasi di atas, “versi” menunjukkan angka yang terkait dengan versi program bersangkutan, misalnya 2.5.0; 7.0.1 dan sebagainya.
MENGINSTAL R
Setelah memperoleh file “R-versi-win32.exe”, maka instalasi dilakukan sebagai berikut ini. 1. Klik “R-versi-win32.exe”, lalu akan muncul jendela dialog pemilihan bahasa. Saat ini belum ada dialog berbahasa Indonesia, untuk itu pilih English dan klik OK
Gambar 0.1 Tampilan Pemilihan Bahasa Instalasi 226
LAMPIRAN
2. Selanjutnya akan muncul dialog pembukaan, seperti berikut ini, kita tinggal klik Next, lalu akan muncul dialog tentang informasi Copy Right. Sempatkan membaca ketentuan yang berlaku, selanjutnya klik next.
Gambar 0.2 Tampilan Mulai Instalasi
Gambar 0.3 Tampilan Konfirmasi Lisensi GPL (General Public License)
Mengunduh dan Menginstal R
227
3. Untuk pemilihan direktori sebaiknya ikuti sesuai yang ada pada dialog, misalnya C:\Program Files\R\... Kecuali, untuk yang menggunakan Windows Vista, sebaiknya R diinstal tidak di hardisk C, tetapi di D atau E.
Gambar 0.4 Konfirmasi Direktori
4. Untuk dokumentasi, jika ruang hardisk anda cukup longgar sebaiknya pilih semua dokumentasi terkait. Jika tidak, pilih yang penting diantaranya adalah: HTML files help, Online (pdf) manual, Support files for tcltk, Message Translation, PDF Reference manuals.
228
LAMPIRAN
Gambar 0.5 Tampilan Konfirmasi Komponen R
5. Kustomisasi atau pengaturan Opsi Startup, pilih yes. Dengan pilihan tersebut selanjutnya akan muncul beberapa dialog berikut. Untuk mengatur agar tampilan grafik dan
jendela R terpisah,
pilih SDI.
Untuk dokumentasi
bantuan/help bisa pilih CHM atau HTML. Untuk Startup ikuti pilihan yang telah disiapkan (default) R.
Mengunduh dan Menginstal R
229
Gambar 0.6 Tampilan Pemilihan Pengaturan Startup Aplikasi
Gambar 0.7 Tampilan Pemilihan Jenis Tampilan
230
LAMPIRAN
Gambar 0.8 Tampilan Pemilihan Bahasa Instalasi
Gambar 0.9 Tampilan Pemilihan Folder Startmenu
6. Untuk tugas tambahan (Additional Tasks), minimal bisa dipilih (di klik check), Create desktop icon dan Create a Quick launch
Mengunduh dan Menginstal R
231
Gambar 0.10 Tampilan Pemilihan Task Tambahan
7. Selanjutnya proses instalasi akan dimulai
Gambar 0.11 Tampilan Proses Instalasi
8. Jika selesai akan muncul dialog terakhir berikut. Klik finish untuk menyelesaikan instalasi R 232
LAMPIRAN
Gambar 0.12 Tampilan Akhir Proses Instalasi
MENGAKTIFKAN R DAN MENGINSTAL PAKET TAMBAHAN Untuk memanggil atau mengaktifkan R kita bisa klik icon R yang ada di desktop. Untuk memunculkan menu atau dialog dalam Bahasa Indonesia
lakukan
perubahan pada properties icon ini. Pada baris target ditulis
"C:\Program Files\R\R-2.5.0\bin\Rgui.exe" LANGUAGE=id
Perlu diketahui bahwa, sampai saat ini menu dan dialog dalam Bahasa Indonesia hanya tersedia pada paket RCommander, belum sampai pada menu RGUI (Rconsole). Untuk memulai R, kita dapat mengklik short cut yang ada pada desktop, atau melalui Start Menu. Setelah R dipanggil, kita akan memperoleh tampilan yang disebut Console R dengan RGUInya seperti pada Gambar 0.14 atau Gambar 0.15 tergantung bahasa yang dipilih (Untuk menu RGUI belum ada pilihan Bahasa Indonesia). Mengaktifkan R dan Menginstal Paket Tambahan
233
Gambar 0.13 Mengatur Pilihan Bahasa Menu dan Dialog R
234
LAMPIRAN
Gambar 0.14 Tampilan Rconsole dalam Bahasa Inggris
Gambar 0.15 Tampilan Rconsole Dalam Bahasa Indonesia
Berikut adalah langkah-langkah untuk menginstal paket tambahan.
Mengaktifkan R dan Menginstal Paket Tambahan
235
1. Aktifkan menu Packages sepert terlihat pada Gambar 0.17 Memilih Paket Tambahan Paket-> Menginstal paket dari
Zip lokal.
2. Selanjutnya pilih direktori tempat anda menaruh paket-paket tambahan (library) dari R, seperti pada Error! Reference source not found..
Ada
beberapa paket penting yang harus diinstal untuk dapat mengikuti penjelasan dalam buku ini yaitu: a. Rcmdr beserta paket-paket terkait (car, dsb), merupakan paket RGUI untuk analisis data yang dikembangkan oleh Fox dan dengan kontribusi menu bahasa Indonesia oleh Tirta. b. StatDemo_versi.zip merupakan paket khusus bernahasa Indonesia untuk ilustrasi pembelajaran statistika yang dikembangkan oleh Tirta [31] c. RcmdrPlugin.StatDemo sama dengan statDemo di atas, tetapi menunya bergabung dengan menu RCommander (Tirta [30]) d. RcmdrPlugin.hglm berisi paket hglm dan Menu GEE yang bergabung dengan menu RCommander. Paket hglm ditulis oleh Tirta et al. [26], sedangkan gee merupakan paket yang telah ada pada R, tetapi integrasi menu dalam bahasa Indonesia di RCommander dibuat oleh Tirta[28].
236
LAMPIRAN
Gambar 0.16 Menu Menginstal Paket Tambahan
Gambar 0.17 Memilih Paket Tambahan
Mengaktifkan R dan Menginstal Paket Tambahan
237
STRUKTUR MENU RCOMMANDER Panel-----|-|-|-|-|--
Data set aktif Edit data set Lihat data set Model aktif Submit (Eksekusi)
Menu Data ------|--Data set Baru |--Impor data --------|--Dari Teks |--Dari SPSS |--Dari Minitab |--Data pada R -------|--Daftar data |--Data dari paket aktif Statistika-|--Ringkasan ---------|--Data set aktif |--Numerik |--Matriks korelasi |--Tabel kontingensi -|--Satu arah |--Multi arah |--Analisis dua arah |--Proporsi ----------|--Sampel Tunggal |--Sampel ganda |--Varians ----------|--Uji F beda varians |--Uji Bartlett |--Uji Levene |--Nonparametrik ------|--Uji Wilcoxon sampel tunggal |--Uji Wilcoxon sampel ganda |--Uji Kruskal Walis |--Regresi -----------|--Regresi Sederhana |--Model Linier |--Model Linier Tergeneralisir (GLM) |--Uji Beda ----------|--Uji |--Uji |--Uji |--Uji |--Uji
t sampel tunggal t sampel ganda t sampel berpasangan anava satu faktor anava multi faktor
|--Analisis ---------|--Reliabilitas skala dimensional |--Analisis Komponen Utama (RKU/PCA) |--Analisis faktor |--Analisis klaster Grafik-----|--Grafik indeks
238
LAMPIRAN
|--Histogram |--Boxplot |--QQplot |--Diagram kuantil-kuantil |--Diagram pencar |--Matriks diagram Pencar |--Grafik garis |--Diagram rata-rata |--Grafik batang |--Grafik lingkaran |--Grafik 3D Distribusi-|--Distribusi Kontinu--|--Distribusi |--Distribusi |--Distribusi |--Distribusi |-- ... |--Distribusi
Normal t Chi-kuadrat Seragam Gumbel
-|--Distribusi Diskrit--|--Distribusi Binomial |--Distribusi Poisson |-- ... |--Distribusi Hipergeometrik Alat ------|--Aktifkan paket |--Aktifkan Plug-in |--Pilihan Bantuan ---|--Bantuan Commander |--Pengantar RCommander |--Bantuan data (jika ada) |--Tentang Rcmdr
Struktur Menu RCommander
239
GLOSARIUM Inferensi
pengambilan
kesimpulan
terhadap
sesuatu
berdasarkan sebagian informasi yang ada. Inferensi dapat
berupa
pendugaan
(estimasi)
maupun
pengambilan kesimpulan (uji hipotesis) Subjek (dalam penelitian)
sekumpulan orang atau unit terkecil dalam penelitian yang memiliki karakteristik yang menjadi perhatian.
Pustaka(Library)
direktori
yang
memuat
kumpulan
paket-paket
program yang tersedia untuk R. Library dapat ditambah maupun dikurangi sesuai kebutuhan Skrip
naskah
yang berisi berbagai perintah yang harus
dilaksanakan oleh komputer melalui suatu bahasa atau program tertentu. CLI (Command Line
program yang menjembatani komunikasi antara
Interface)
komputer dengan pengguna dengan menggunakan perintah-perintah yang ditulis dalam baris perintah, tidak menggunakan grafis ataupun maouse. CLI merupakan interface utama dari R.
GUI (Graphical User
program menjembatani komunikasi antara komputer
Interface)
dengan pengguna
dengan menggunakan tampilan
grafis seperti menu atau ikon, yang biasanya siap diklik dengan mouse. Program GUI untuk R biasa disebut RGUI Paket ( package) pada R
kumpulan fungsi-fungsi dalam bahasa R yang dikemas menjadi satu kesatuan
sebagai aplikasi
metode analisis atau teori tetertentu Plugn/Plug-in
240
adalah program yang dapat digabungkan menjadi
LAMPIRAN
bagian dari proram lain yang lebih besar. Dalam buku ini Paket-peket Plug-in R Commander, menunya dapat digabungkan menjadi bagian dari menu R Commander Distribusi kontinu
sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan
interval
(misalnya seluruh bilangan real, bilangan real nonnegatif, a ≤ x ≤ b ) Distribusi diskrit
sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan
titik-titik
yang tercacah (misalnya sebagian himpunan bilangan cacah, sebagian himpunan bilangan asli) Antarmuka
bagian program/alat yang menjembatani komunikasi antara pengguna dengan komputer, antara alat ukur dengan komputer, dan sejenisnya}
Alpha (α)
Taraf signifikansi = peluang kesalahan tipe I, peluang secara keliru menolak hipotesis null yang benar.
AIC (Akaike's Information
salah satu kriteria yang dijadikan patokan memilih
Criterion)
modelyang baik dengan menghitung perimbangan besarnya
maksimum
likelihooddan
banyaknya
peubah yang dipergunakan dalam model, lebih tepatnya
AIC=
-2
log-likelihood
yang
dimaksimumkan + 2 banyaknya parameter dalam model.
Analisis data eksploratori
Sekumpulan teknik untuk menampilkan data secara
(EDA)
visual dan bermakna.
Analisis variansi (ANAVA) Suatu teknik statistika untuk menguji beda nilai-
tengah kelompok lebih dari dua. GLOSARIUM
241
ANAVA Satu arah
Analisis variansi dengan pengelompokan hanya pada satu peubah bebas.
b (Beta)
Peluang kesalahan tipe II, yaitu peluang secara keliru menerima hipotesis nol yang salah.
Bimodal
Distribusi yang memiliki dua puncak atau peluang maksimum.
Boxplot
Presentasi grafik dari posisi median dan sebaran data.
Densitas
Kurva yang menunjukkan niai peluang suatu pengamatan pada interval nilai suatu peubah acak.
Derajat kebebasan (db)
Angka yang mennjukkan banyaknya informasi yang saling
bebas
setelah
mengestimasi
beberapa
parameter. Deviasi baku
Akar kuadrat dari variansi
Dispersi
ukuran yang menyatakan sejauh mana data menyebar terhadap nilai-tengah
Distribusi bersyarat Distribusi Binomial
Distribusi suatu peubah acak (Y) untuk nilai X yang tetap. Distribusi yang menggambarkan peluang munculnya sejumlah
kejadian
pada
percobaan
(misalnya
peluang
munculnya
x
Bernouli
Angka
dari
pelemparan uang logam sebanyak n kali). Distribusi normal baku
Distribusi normal dengan nilai-tengah 0 dan deviasi baku 1, dinotasikan dengan N(0,1).
Distribusi sampling
Distribusi statistik dari pengambilan sampel yang berulang-ulang yang berasal dari populasi tertentu.
Distribusi sampling beda
Distribution beda nilai-tengah dua kelompok sampel
nilai-tengah
dari pengambilan sampel berulang-ulang
Distribusi sampling nilai tengah
242
Distribusi nilai-tengah dari pengambilan sampel yang berulang-ulang yang berasal dari populasi tertentu. LAMPIRAN
Estimasi titik
Nilai tertentu yang merupakan penduga suatu parameter.
Faktor
Istilah lain untuk peubah independen (umumnya berupa peubah kualitatif) pada analisis variansi.
Hipotesis alternatif (HA)
Disebut juga hipotesis kerja yaitu hipotesis yang dirumuskan sesuai dengan hasil kajjian teori yang melandasi penelitian.
Hipotesis nul (H0 )
Disebut juga hipotesis nihil, yaitu hipotesis yang diuji pada prosedur statistika, yang menyatakan kenetralan (tidak ada beda signifikan, tidak ada hubungan signifikan dan sebagainya).
Histogram
Grafik
yang
menggunakan
segiempat
sebagai
representasi frekuensi atau peluang dari observasi pada setiap interval. Homogenitas variansi
Situasi dimana beberapa populasi atau subpopulasi memiliki variansi yang sama.
Hubungan kurvilinier
Situasi yang dapat
diwakili oleh hubungan yang
tidak linier. Intersep/ konstanta
Koefisien dalam regresi yang menyatakan nilai Y, pada saat nilai X sama dengan 0.
Interval keyakinan
Disebut juga estimasi interval,yaitu suatu interval yang memiliki peluang tertentu memuat parameter yang diestimasi.
Jarak Cook Kesalahan baku
Suatu ukuran yang menunjukkan pengaruh suatu nilai pengamatan pada regresi berganda. Deviasi baku dari distribusi sampling.
Kesalahan baku selisih nilai Deviasibaku dari distribusi sampling beda nilaitengah
tengah.
Kesalahan prediksi
Selisih antara nilai observasi dengan nilai prediksi.
Kesalahan sampling
Variabilitas suatu nilai statistik sampelsatu ke sampel
GLOSARIUM
243
lainnya. Kesalahan Tipe II
Kesalahan secara keliru tidak menolak H0 yang salah.
Kesalahan Tipe I
Kesalahan secara keliru menolak H0 yang benar.
Koefisien korelasi
Suatu ukuran yang menunjukkan derajat hubungan atau asosiasi antara beberapa peubah.
Kolinearitas Kombinasi
Kondisi yang dimana peubah penjelas
saling
berkorelasi satu sama lain. Banyaknya cara sejumlah objek dapat dipilih tanpa memperhatikan urutannya.
Kovariansi (sxy or covxy)
Ukuran statistik yang menunjukkan derajat dua peubah berubah bersama-sama.
Leverage Matriks kovariansi (S)
Ukuran yang menunjukkan penyimpangan nilai observasi terhadap nilai prediktor. Suatu matriks yang menunjukkan nilai variansi dan kovariansi antar beberapa peubah. Istilah lain untuk regresi peubah ganda, terdiri atas
Model
model linier, model linier terampat/tegreneralisir, model nonlinier, model linier campuran dan lain-lain Disebut juga model linier terampat, yaitu analisis
Model linier tergeneralisir
Model/regresi untuk data dengan respon yang tidak berdistribusi normal.
Model log-linear
Model untuk menangani data kategori berganda.
Multikolinearitas
Kondisi yang menunjukan adanya korelasi yang tinggi di antara peubah-peubah prediktor.
Nilai kritis
Suatu nilai statistik yang menjadi batas penerimaan atau penolakan Ho .
Nilai-tengah bersyarat Nilai-tengah geometrik
244
Nilai-tengah suatu peubah pada nilai tertentu dari peubah yang lain. Nilai tengah yang diambil dari n objek dengan
LAMPIRAN
menghitung akar pangkat n dari hasil kali (produk) n objek tadi. Outlier/pencilan
Nilai observasi yang terletak jauh dari distribusi kelompoknya.
p level
Peluang kesalahan tipe I, yaitu peluang yang menunjukkan bahwa hasil yang dicapai merupakan hal yang kebetulan jika ternyata Ho benar.
Parameter
Nilai yang menunjukkan pengukuran data populasi.
Peluang bersyarat
Peluang suatu kejadian pada saat diketahui terjadinya suatu kejadian lain.
Percobaan Bernoulli
Percobaan dengan hasil salah satu dari dua kejadian yang saling lepas misalnya lulus-gagal.
Populasi
kumpulan seluruh data yang menjadi perhatian dalam penelitian. Jadi populasi adalah seluruh subjek penelitian beserta karakteristiknya yang menjadi kepentingan
Regresi linier Regresi logistik
Analisis regresi dengan hubungan linier. Analisis regresi untuk data dengan respon bersifat dikotomus (misalnya lulus/gagal).
Regresi multivariat
Analisis degression lebih dari dua peubah bebas.
Residu/sisa
Selisih
antara
nilaiobservasi
Y
dengan
nilai
prediksinya ( Yˆ ). Saling lepas (Mutually
Dua kejadian yang tidak bisa terjadi bersama-sama.
exclusive) Sampling
Prosedur unduk memperoleh sampel yang mewakili populasi dengan baik (baik struktur maupun sifatsifatnya)
Skala Nominal
Angka yang hanya dipakai untuk membedakan objek.
GLOSARIUM
245
Skala ordinal
Angka hanya dipakai untuk menunjukkan urutan objek.
Skala rasio
Skala yang memiliki nilai 0 mutlak dan rasio/ perbandingan memiliki makna.
Kesalahanbaku penduga
Rata-rata deviasi kuadrat terhadap garis regresi
Statistik
Angka-angka yang menunjukkan pengukuran pada data.
Statistik Deskriptif
Statistika
yang
mendeskripsikan
sampel
tanpa
menarik kesimpulan tentang populasi Statistika inferensial
Bagian statistika berkaitan dengan pengambilan keputusan tentang parameter populasi asal asal sampel.
Teorema limit pusat
Teorema yang sifat alami dari sebaran sampel dari nilai tengah. Apapun distribusinya jika sampling dilakukan banyak kali, distribusi nilai tengah akan mendekati distribusi normal
Tingkat Signifikansi
Nilai yang menunjukkan batas maksimum peluang kita secara keliru menolak H0 yang kenyataannya benar.
Uji bebas distribusi
Disebut juga uji nonparametrik, yaitu statistika yang tidak bergantung pada asumsi distribusi atau asumsi distribusi.
Uji Hipothesis
Suatu proses pengambilan keputusan berkaitan dengan nilai parameter populasi yang sebelumnya telah dinyatakan.
Uji nonparametrik
Uji statistik yang tidak bergantung pada estimasi parameter atau asumsi distribusi.
Uji parametrik
Uji
statistika yang
bergantung
pada
estimasi
parameter populasi atau asumsi distribsi populasi Ukuran pemusatan 246
Nilai yang menunjukkan pusat suatu distribusi. LAMPIRAN
Unimodal
Distribusi
yang
memiliki
satu
puncak
atau
maksimum. Peubah (dari data)
karakteristik yang bervariasi antara satu subjek ke subjek lain yang menjadi perhatian dari sampel atau populasi
Peubah dikotomus
Peubah yang hanya memiliki salah satu dai dua nilai yang bebeda.
Peubah independen
Peubah yang dikontrol dalam percobaan.
Peubah tetap
Suatu peubah bebas (eksplanatori) yang nilainya ditentukan peneliti.
Variansi population
Variansi dari populasi yang dalam kenyataannya diestimasi bukan dihitung.
GLOSARIUM
247
DAFTAR PERSAMAAN P( A ∩ B) ......................................................................... 48 P( B )
Pers. 3.1
P( A| B ) =
Pers. 3.2
P ( A ∪ B ) = P( A) + P( B ), untuk A ∩ B = ∅ ...................................... 48
Pers. 3.3
P ( A ∩ B ) = 0, untuk A ∩ B = ∅ ........................................................ 48
Pers. 3.4
A|| B ⇔ P( A) = P( A| B ) ................................................................... 49
Pers. 3.5
A|| B ⇔ P( A ∩ B ) = P( A) × P ( B ) ................................................... 49
Pers. 3.6
P ( A ∪ B ) = P( A) + P( B ) − P ( A ∩ B ), untuk A ∩ B ≠ ∅ ................... 50
Pers. 3.7
⎛n⎞ p ( x ) = ⎜ ⎟ π x (1 − π ) n − x , x = 0,1, 2,..., n ............................................... 55 ⎝ x⎠
Pers. 3.8
x=
1 n ∑ xi .......................................................................................... 57 n i =1
n
Pers. 3.9
s x2 = ∑ i =1
Pers. 3.10
Pers. 4.1
248
r=
(
2
1⎛ n ⎞ 2 x − ∑ ∑ xi i x−x n ⎜⎝ i =1 ⎟⎠ i =1 ................................................ 60 = n −1 n −1
)
n
2
n ⎛ n ⎞⎛ n ⎞ n∑ xi yi − ⎜ ∑ xi ⎟⎜ ∑ yi ⎟ i =1 ⎝ i =1 ⎠⎝ i =1 ⎠ ⎡ n 2 ⎛ n ⎞2 ⎤ ⎡ n 2 ⎛ n ⎞ 2 ⎤ ................................... 61 ⎢ n∑ xi − ⎜ ∑ xi ⎟ ⎥ ⎢ n∑ yi − ⎜ ∑ yi ⎟ ⎥ ⎝ i =1 ⎠ ⎦⎥ ⎣⎢ i =1 ⎝ i =1 ⎠ ⎦⎥ ⎣⎢ i =1
⎡ 1 ⎛ x − μ ⎞2 ⎤ 1 exp ⎢ − ⎜ f ( x) = ⎟ ⎥; σ 2π ⎢⎣ 2 ⎝ σ ⎠ ⎦⎥
− ∞ < x < ∞ .............................. 72
LAMPIRAN
1 − 12 z 2 f ( z) = e ; 2π
Pers. 4.2
Pers. 4.3
Pers. 4.4
Z=
X −μ
− ∞ < z < ∞ .................................... 72
sebaliknya X = μ + σ Z ................................................... 74
σ
n n ⎛ n ⎞ Y = ∑ ai X i berdistribusi N ⎜ μ ∑ ai , σ 2 ∑ ai2 ⎟ ................................ 82 i =1 i =1 ⎝ i =1 ⎠
Pers. 4.5 X =
X −μ 1 n 2 ~ N (0,1) ............................... 82 X i ~ N ( μ , σ n ) atau Z = σ ∑ n i =1 n
Pers. 7.1
μ=x=
1 n ∑ xi ................................................................................ 135 n i =1 n
Pers. 7.2
σ=
∑( x − x)
2
i
i =1
........................................................................ 135
n −1
Pers. 7.3
x − zα / 2 × σ
Pers. 7.4
x − tn −1,α / 2 ×
n
s
< μ < x + zα / 2 × σ n
< μ < x + tn −1,α / 2 × n
Pers. 8.1
∑x y
r=
i =1
n
∑x i =1
2 i
i
−1
n
⎛ ⎞ − 1 ⎜ ∑ xi ⎟ n ⎝ i =1 ⎠
)
s
n
2
i
i =1
n
∑y i =1
................................................ 136
n
x y n∑ ∑ i =1
n
(
n
i
. ................................................ 136
n
2 i
i
⎛ ⎞ − 1 ⎜ ∑ yi ⎟ n ⎝ i =1 ⎠ n
2
............................... 182
2
Pers. 8.2
see = ∑ ⎡ y − β 0 + β1 xi ⎤ ................................................................ 191 ⎣ ⎦ i =1
Pers. 8.3
β 0 = y − β1 x , .................................................................................... 191
)
Daftar Persamaan
)
249
n
Pers. 8.4
)
β1 =
n
n
∑ xi yi − 1/ n ∑ xi ∑ yi i =1
i =1
i =1
⎛ ⎞ x − 1/ n ⎜ ∑ xi ⎟ ∑ i =1 ⎝ i =1 ⎠ n
n
2
, .......................................................... 191
2 i
Pers. 8.5
)
β1 =
s xy s xx
, ........................................................................................... 191
Pers. 8.6
2
⎛ n ⎞ x y ∑ ∑ ⎜ ∑ xi ⎟ i i n n 2 i =1 i =1 , s xx = ∑ xi − ⎝ i =1 ⎠ .............................. 191 s xy = ∑ xi yi − n n i =1 i =1 n
)
n
sx , dengan s x = s xx ; s y = s yy .......................................... 191 sy
Pers. 8.7
β1 = rxy
Pers. 8.8
σ 2 = s2 =
Pers. 8.9
s 2β 1 =
see . ............................................................................... 192 n−2
⎛ 1 x2 ⎞ s2 ,dan s β2 0 = s 2 ⎜ + ⎟ ...................................................... 192 s xx ⎝ n s xx ⎠
Pers. 8.10
2 ⎡ 1 ( x − x )2 ⎤ xp − x ) ( 1 p ⎥ dan y = yˆ ± tα / 2 s .............. 200 s = see ⎢ + + s xx n s xx ⎢n ⎥ ⎣ ⎦
Pers. 8.11
2 ⎡ 1 ( x − x )2 ⎤ xp − x ) ( 1 p ⎥ dan y = yˆ ± tα / 2 s 1 + + .... 201 s = see ⎢1 + + sxx n s xx ⎢ n ⎥ ⎣ ⎦
250
2 y
2 $y
LAMPIRAN
DAFTAR CONTOH Contoh 1.1. ............................................................................................................. 12 Contoh 1.2 .............................................................................................................. 13 Contoh 1.3 .............................................................................................................. 13 Contoh 3.1 .............................................................................................................. 48 Contoh 3.2 .............................................................................................................. 52 Contoh 3.3 .............................................................................................................. 53 Contoh 3.4. ............................................................................................................. 56 Contoh 3.5. ............................................................................................................. 56 Contoh 3.4 .............................................................................................................. 58 Contoh 3.5 .............................................................................................................. 59 Contoh 3.6 .............................................................................................................. 61 Contoh 4.1 .............................................................................................................. 75 Contoh 4.2 .............................................................................................................. 78 Contoh 4.3 .............................................................................................................. 80 Contoh 7.1 ............................................................................................................ 136 Contoh 7.2 ............................................................................................................ 137 Contoh 8.1 ............................................................................................................ 185 Contoh 8.2 ............................................................................................................ 194 Contoh 8.3 ............................................................................................................ 195 Contoh 8.4 ............................................................................................................ 199 Daftar Contoh
251
Contoh 8.5 ............................................................................................................ 209
252
LAMPIRAN
INDEKS
253
INDEKS Alternatif ........................ 13, 200, 235
EDA ......................... 5, 108, 145, 262
Anava ......... xx, 82, 83, 165, 194, 197
Eksponensial ................ 25, 53, 60, 79
Animasi .................................... xv, 44
F 21, 53, 79, 81, 82, 113, 150, 195,
Berpasangan ............. 12, xx, 185, 196 Binomial............................................. 6, 25, 53, 79, 240, 241, 242, 243, 244, 246, 260, 263 Box-plot ......................................... 21 chi-kwadrat..................... 53, 107, 144 CIS ................................................... 9 Derajat .................................... 57, 208 Deskriptif ................... 5, 90, 127, 267 Determinasi .................................. 234
198, 217, 218, 221, 222, 224, 232, 233, 259 Frekuensi............................................ xv, xvii, xviii, 42, 43, 45, 106, 143 GUI.......... iv, 20, 21, 38, 39, 257, 261 HGLM............................................ 84 hipotesis ............................................. 80, 165, 168, 169, 171, 173, 176, 177, 178, 179, 181, 183, 184, 186, 187, 189, 190, 195, 218 Hipotesis............................................. 9, 12, 14, 80, 168, 169, 172, 180,
Deviasi ...............................................
186, 194, 199, 200, 218, 264
........ xv, 57, 63, 168, 195, 263, 264 Histogram........................................... Diagnostik .......................................... .................. xxi, 227, 228, 229, 230 Distribusi ............................................
xvi, xvii, xviii, xix, xx, 21, 78, 109, 110, 123, 146, 147, 160, 260, 264 Inferensial......................................... 6
xiv, xv, xvi, 25, 29, 32, 33, 34, 35, 52, 53, 56, 59, 60, 61, 62, 67, 68, 69, 70, 75, 76, 86, 106, 143, 240, 242, 260, 262, 263, 267
254
Intervalxv, 36, 93, 130, 173, 184, 189, 214, 264 Keyakinan ...................... 7, xv, 36, 37
LAMPIRAN
Korelasi ..............................................
pencar .................................................
xvii, xviii, xxi, 21, 57, 83, 107,
25, 109, 120, 146, 157, 209, 210,
144, 207, 208, 209, 211, 212, 213,
222, 224, 260
214, 254
Pencar.................................................
Kuantil................................................
10, 11, xvii, xviii, xix, xx, xxi, 21,
xvii, xviii, xix, 54, 55, 113, 114,
120, 121, 122, 123, 157, 158, 159,
122, 150, 151, 159
160, 219, 223, 224, 234, 260
kumulatif ............ 59, 60, 73, 243, 248
Pencilan......................... xxi, 233, 234
Library.......................................... 261
Penyebaran ................................. 8, 57
Mean... 21, 32, 33, 36, 54, 56, 63, 195
plugin ............................................. 10
Median ...............................................
Plug-in..................... xiv, 31, 260, 261
xv, 54, 55, 56, 61, 62, 104, 105, 112, 141, 142, 149, 220, 223, 226, 232, 233, 247, 248, 249, 251 Modus........................... xv, 54, 56, 62 Nominal.......................... 92, 129, 266
Populasi.................................. 14, 266 Proporsi .............................................. xxi, 21, 83, 165, 199, 200, 201, 202, 259 p-value................................................
Normal ...............................................
106, 143, 173, 174, 177, 178, 181,
xv, xvi, 6, 21, 25, 32, 33, 34, 35,
184, 185, 187, 188, 189, 190, 195,
42, 52, 53, 55, 56, 60, 67, 68, 69,
201, 203, 213, 214, 218, 221, 222,
71, 73, 75, 76, 78, 79, 83, 87, 88,
224, 232, 233
113, 114, 150, 151, 172, 180, 186, 194, 217, 218, 228, 240, 241, 242, 248, 251, 260
Ragam ............................. xvi, 69, 191 Range ....................................... 54, 57
Ordinal ................................... 92, 129
Rasio................................. 44, 93, 130
Parameter ........... 11, 32, 37, 165, 266
Rcmdr......................... 20, 22, 30, 260
Pemusatan ................ 8, xv, 54, 62, 63 INDEKS
Page 255
RCommander .................................... i
StatDemo............................................
v, v, xiv, xvi, xviii, 10, 19, 20, 21,
iv, v, 7, xiv, 10, 19, 21, 22, 23, 30,
22, 24, 25, 30, 31, 37, 38, 72, 74,
31, 32, 41, 45, 62, 75, 87, 174, 179,
80, 87, 90, 94, 95, 97, 98, 101, 104,
181, 185, 190, 257
108, 109, 113, 127, 131, 132, 134, 135, 138, 141, 145, 146, 150, 165, 171, 179, 186, 193, 211, 219, 225, 227, 259, 260 Regresi7, 12, 13, xv, xxi, 21, 36, 37, 84, 120, 157, 214, 225, 229, 230, 233, 234, 235, 244, 250, 254, 259, 266 Rentang ........................................ 242 Rerata28, 71, 80, 117, 118, 119, 154, 155, 156, 165, 170, 171, 179, 185, 195 Sampel8, 9, 12, xx, xxi, 14, 42, 49, 54, 76, 171, 175, 176, 182, 199, 201, 202, 259 SciViews ........................................ 20 signifikansi34, 35, 108, 145, 168, 222, 243, 246, 262 simetris ............................................... 34, 35, 52, 53, 55, 56, 60, 62, 67, 69, 86, 109, 112, 146, 149, 221, 240
Statistik............................................... vi, 10, 11, xvi, xviii, 4, 15, 104, 141, 266, 267 Statistika............................................. i, iii, iv, vi, 9, xiv, 4, 5, 6, 7, 9, 10, 15, 23, 25, 28, 30, 39, 42, 79, 80, 90, 127, 255, 256, 257, 259, 267 T .......... 33, 34, 81, 82, 168, 181, 182 Tinn-R ............................................ 20 Unimodal...................................... 267 Variansi .............................................. 57, 118, 155, 191, 193, 197, 259, 268 Wilcoxon................................ 21, 259 Z xv, 35, 68, 75, 78, 81, 82, 168, 256