Versi Cetak: Judul: Analisis Regresi dengan R Tahun terbit: 2009 Penerbit: Jember University Press ISBN 979-8176-65-0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
0 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ
J
I
1 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
II
FMIPA-UNEJ
Daftar Isi
Judul
JJ
J
I
2 dari 490
Analisis Regresi dengan R (ANRER)
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
II
I. M. Tirta, (Prof. Drs. M.Sc., Ph.D.)
[email protected];
[email protected] FMIPA-UNEJ
December 3, 2011 Daftar Isi
Judul
JJ J
I II
3 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
4 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
DAFTAR ISI
Daftar Isi
Judul
JJ J
I II
5 dari 490
1 DASAR-DASAR PEMODELAN STOKASTIK 23 1.1 Prinsip Pemodelan . . . . . . . . . . . . . . . . . . . . 27 1.2 Langkah-langkah Penting Dalam Pemodelan . . . . . . . 37 1.2.1 Langkah penting dalam Pemodelan secara Umum 37 1.2.2 Langkah Penting dalam Pemodelan Statistika . . . 39 1.3 Metode Mengestimasi Parameter . . . . . . . . . . . . 45
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.4
1.5 1.6
1.7 1.8 1.9
1.3.1 1.3.2 1.3.3 Model 1.4.1 1.4.2 1.4.3 1.4.4
Metode Kuadrat Terkecil . . . . . . . . . . . . . Metode Likelihood Maksimum . . . . . . . . . . Mencari Maksimum dengan Metode Numerik . . Linier dan Perkembangannya . . . . . . . . . . . Model linier klasik . . . . . . . . . . . . . . . . Model Linier Tercampur . . . . . . . . . . . . . Model Linier Tergeneralisir . . . . . . . . . . . . Model untuk Data Tidak Normal dan Tidak Saling Bebas . . . . . . . . . . . . . . . . . . . . . . . 1.4.5 Pengembangan Lain Model Linier . . . . . . . . Model-model Nonlinier . . . . . . . . . . . . . . . . . . . Tinjauan singkat Program Statistika R . . . . . . . . . . 1.6.1 Aplikasi R untuk Manipulasi Grafik . . . . . . . . 1.6.2 Aplikasi R untuk Model Statistika/ Analisis Regresi 1.6.3 RCommnder RGUI untuk analisis dasar . . . . . . Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . .
45 47 48 52 53 56 60 64 67 70 71 77 88 91 92 94 95
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
6 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2 ALJABAR MATRIKS UNTUK STATISTIKA 2.1 Materi . . . . . . . . . . . . . . . . . . 2.2 Defenisi dan Jenis Matriks . . . . . . . . 2.3 Operasi Matriks dan Sifat-sifatnya . . . 2.3.1 Operasi uner . . . . . . . . . . 2.3.2 Operasi biner . . . . . . . . . . 2.3.3 Determinan dan Invers Matriks . 2.4 Kebergantungan Linier dan Rank Matriks 2.5 Bentuk Kuadrat dan Diferensial Matriks 2.6 Aplikasi R untuk Operasi Matriks . . . . 2.6.1 Mendefinisikan matriks . . . . . . 2.6.2 Operasi Matriks dengan R . . . . 2.7 Bacaan Lebih Lanjut . . . . . . . . . . 2.8 Ringkasan . . . . . . . . . . . . . . . . 2.9 Latihan Soal-soal . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
97 99 100 105 105 106 115 118 123 134 135 139 144 145 147
3 MODEL LINIER KLASIK 151 3.1 Bentuk dan Asumsi . . . . . . . . . . . . . . . . . . . . 154 3.2 Estimasi Parameter . . . . . . . . . . . . . . . . . . . . 156 3.2.1 Estimasi dengan Metode Kuadrat Terkecil . . . . 156
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
7 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.3
3.4
3.5 3.6 3.7
3.8
3.2.2 Estimasi dengan Metode Likelihood Maksimum . Uji Inferensial dari βˆj . . . . . . . . . . . . . . . . . . . 3.3.1 Distribusi βˆj . . . . . . . . . . . . . . . . . . . . 3.3.2 Estimasi selang dari βj . . . . . . . . . . . . . . . 3.3.3 Uji Hipotesis . . . . . . . . . . . . . . . . . . . 3.3.4 Koefisien Determinasi R2 . . . . . . . . . . . . . Penggunaan Matriks untuk Regresi Peubah Ganda . . . . 3.4.1 Perluasan hasil untuk Regresi Peubah Ganda . . . 3.4.2 Pendekatan Matriks Metode Kuadrat Terkecil . . 3.4.3 Pendekatan Matriks untuk Metode Kemungkinan Maksimum . . . . . . . . . . . . . . . . . . . . . Interval Keyakinan µ dan Prediksi Y . . . . . . . . . . . Melaporkan Nilai Probabilitas p . . . . . . . . . . . . . . Model Linier dengan Variabel Kualitatif . . . . . . . . . . 3.7.1 Variabel Boneka dengan Model Berkonstanta . . . 3.7.2 Variabel Boneka dengan Konstanta tidak Eksplisit Ilustrasi Model Linier Normal dengan R . . . . . . . . . . 3.8.1 Simulasi dengan R . . . . . . . . . . . . . . . . . 3.8.2 Menggunakan Fungsi lm() . . . . . . . . . . . .
161 165 165 169 170 172 180 180 183
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
186 191 194 196 197 202 206 206 213
I II
8 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8.3 Model dengan Variabel Kualitatif 3.8.4 Analisis dengan Subset . . . . . . 3.9 Ringkasan . . . . . . . . . . . . . . . . 3.10 Bacaan Lebih Lanjut . . . . . . . . . . . 3.11 Latihan Soal- Soal . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
218 231 233 235 236
FMIPA-UNEJ
Daftar Isi
4 DIAGNOSTIK DAN TRANSFORMASI 4.1 Asumsi Analisis Regresi Klasik . . . . . . . . . 4.2 Memeriksa Sebaran Data melalui Grafik . . . . 4.3 Pemeriksaan Hubungan Peubah melalui Grafik 4.3.1 Diagram pencar data . . . . . . . . . 4.3.2 Diagram Pencar Sisa . . . . . . . . . 4.3.3 Memeriksa Model Melalui Diagram . . 4.4 Uji Statistika Terkait Asumsi . . . . . . . . . 4.5 Memeriksa Model melalui AIC . . . . . . . . . 4.6 Transformasi Data . . . . . . . . . . . . . . . 4.7 Ringkasan . . . . . . . . . . . . . . . . . . . 4.8 Bacaan Lebih Lanjut . . . . . . . . . . . . . . 4.9 Latihan Soal-soal . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
239 242 243 248 248 252 253 260 261 265 270 272 273
Judul
JJ J
I II
9 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5 MODEL LINIER TERGENERALISIR 5.1 Distribusi Keluarga Eksponensial . . . . . . . . . . . . . . 5.1.1 Bentuk umum . . . . . . . . . . . . . . . . . . . 5.1.2 Nilai-tengah dan Ragam dari a(Y ) . . . . . . . . 5.1.3 Beberapa Bentuk Khusus . . . . . . . . . . . . . 5.2 Konsep Dasar Model Linier Tergeneralisir . . . . . . . . 5.2.1 Sisi lain Model Linier Normal . . . . . . . . . . . 5.2.2 Generalisasi Model Linier Klasik ke Model Linier Tergeneralisir . . . . . . . . . . . . . . . . . . . . 5.3 Estimasi pada Model Linier Tergeneralisir . . . . . . . . 5.3.1 Metode Penduga Kuadrat Terkecil . . . . . . . . 5.3.2 Metode Penduga Likelihood Maksimum . . . . . 5.4 Inferensi pada Model Linier Tergeneralisir . . . . . . . . 5.4.1 Distribusi dari Penduga Likelihood Maksimum . . 5.4.2 Kecocokan Model . . . . . . . . . . . . . . . . . 5.5 Model Logit, Probit dan Log-linier . . . . . . . . . . . . . 5.6 dispersi berlebih . . . . . . . . . . . . . . . . . . . . . . 5.7 Ilustrasi GLM dengan R . . . . . . . . . . . . . . . . . . 5.7.1 Data dengan Sebaran Binomial . . . . . . . . . .
275 277 277 278 283 292 292
FMIPA-UNEJ
Daftar Isi
Judul
293 298 301 303 312 314 317 322 325 326 330
JJ J
I II
10 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.7.2 Prediksi pada GLM 5.8 Ringkasan . . . . . . . . . 5.9 Bacaan Lebih Lanjut . . . . 5.10 Latihan Soal-soal . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
343 345 347 348
6 MODEL UNTUK RESPON TIDAK SALING BEBAS 6.1 Model Marjinal . . . . . . . . . . . . . . . . . . . . . . . 6.2 Quasi-Likelihood dan Generalized Estimating Equations (GEE) . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Generalisasi dan Bentuk GEE . . . . . . . . . . . . . . . 6.4 Ilustrasi GEE dengan R . . . . . . . . . . . . . . . . . . 6.5 Gamma-HGLM dan Model Lainnya . . . . . . . . . . . . 6.5.1 Gamma-HGLMs . . . . . . . . . . . . . . . . . . 6.5.2 Likelihood Bersama: Model JGIG . . . . . . . . . 6.5.3 Estimasi Parameter β dan v . . . . . . . . . . . . 6.5.4 Pendugaan parameter dispersi ν dan α . . . . . . 6.5.4.1 Prosedur Pendugaan . . . . . . . . . . . 6.5.5 Analisis HGLM dengan R . . . . . . . . . . . . . 6.6 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 6.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . .
349 355
FMIPA-UNEJ
Daftar Isi
Judul
360 363 368 374 375 378 380 388 390 391 396 397
JJ J
I II
11 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.8
Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . 398
GLOSARIUM
399 FMIPA-UNEJ
A BEBERAPA FUNGSI TERKAIT REGRESI A.1 Fungsi dari Paket stats . . . . . . . . . . . . . . . . . . . A.2 Fungsi dari Paket cars . . . . . . . . . . . . . . . . . . . A.3 Fungsi dari Paket gam . . . . . . . . . . . . . . . . . . . A.4 Fungsi dari Paket graphics . . . . . . . . . . . . . . . . . A.5 Fungsi dari Paket gee . . . . . . . . . . . . . . . . . . . A.6 Fungsi dari Paket lme4 . . . . . . . . . . . . . . . . . . . A.7 Fungsi dari Paket hglm . . . . . . . . . . . . . . . . . . A.8 Fungsi dari Paket glmmML . . . . . . . . . . . . . . . . A.9 Skrip Manipulasi Grafik . . . . . . . . . . . . . . . . . . A.10 Skrip Membangkitkan Data Regresi dengan Peubah Kelompok . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
417 418 419 420 421 422 423 424 425 426
Daftar Isi
Judul
JJ J
I II
12 dari 490
Cari Halaman
428 Kembali
B DATA UNTUK ILUSTRASI 431 B.1 Data dari Paket actuar . . . . . . . . . . . . . . . . . . . 432 B.2 Data dari Paket ade4 . . . . . . . . . . . . . . . . . . . 433
Layar Penuh
Tutup
Keluar
B.3 B.4 B.5 B.6 B.7 B.8 B.9 B.10 B.11 B.12 B.13 B.14
Data Data Data Data Data Data Data Data Data Data Data Data
dari dari dari dari dari dari dari dari dari dari dari dari
Paket Paket Paket Paket Paket Paket Paket Paket Paket Paket Paket Paket
agricolae asuR . . car . . . DAAG . . dataset . demogR . faraway . gam . . . ISwR . . lmtest . . MASS . . UsingR .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
439 441 443 446 452 458 459 466 467 470 471 476
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
13 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
14 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
DAFTAR GAMBAR
Daftar Isi
Judul
JJ J
I II
15 dari 490
1.1 1.2 1.3 1.4 1.5 1.6
Diagram Menunjukkan Langkah-langkah dalam Pemodelan Statistika . . . . . . . . . . . . . . . . . . . . . . Pembagian dan Perkembangan Model Linear . . . . . . Ilustrasi Regresi . . . . . . . . . . . . . . . . . . . . . Contoh Histogram dengan Kurva Densitas . . . . . . . Contoh Diagram Pencar dengan rug dan boxplot . . . . Contoh Gabungan Grafik Besar dengan Grafik Mini . .
42 66 69 83 84 85
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.7 1.8
Contoh Gabungan Grafik dengan Pembagian Layar . . Contoh Gabungan Grafik dengan pembagian layar . . .
86 87
3.1 3.2 3.3
Ilustrasi Garis regresi dan sabuk keyakinan . . . . . . . Sebaran data dengan variabel kualitatif . . . . . . . . . Garis Regresi sejajar dengan selisih konstanta β2 dan gradien sama (β1 ) . . . . . . . . . . . . . . . . . . . . . Garis Regresi berbeda dengan selisih konstanta β2 dan selisih gradien β3 . . . . . . . . . . . . . . . . . . . . . Grafik Penduga βˆ1 = α ˆ dari penarikan sampel 100 kali masing-masing berukuran 60. Nilai parameter sebenarnya adalah α = 3. . . . . . . . . . . . . . . . . . . . Grafik Penduga βˆ1 = α ˆ dari beberapa penarikan sampel dengan ukuran mulai 10 sampai dengan 1000. Nilai parameter sebenarnya adalah α = 3. . . . . . . . . . . Contoh Histogram dengan Kurva Densitas Data Cars . Diagram Pencar X dengan Y yang mengandung kelompok yang dapat digabung . . . . . . . . . . . . . . . . . Diagram Pencar X dengan Y mengandung kelompok yang perlu dipisah . . . . . . . . . . . . . . . . . . . .
193 198
3.4 3.5
3.6
3.7 3.8 3.9
FMIPA-UNEJ
Daftar Isi
201 Judul
203 JJ J
I II
211 16 dari 490
212 216
Cari Halaman
Kembali
221 Layar Penuh
227 Tutup
Keluar
4.1
Grafik Quantile dari Data Berdistribusi Normal (kiri) dan Data Cenderung Tidak Berdistribusi Normal (Kanan)244
4.2
Grafik Sebaran Peluang dari Data Berdistribusi Normal (lebih simetris, warna biru) dan Data Tidak Berdistribusi Normal (tidak siumetris, warna merah) . . . . . 245
4.3
Boxplot respon dengan kelompok . . . . . . . . . . . . 247
4.4
Grafik Pencar Data dengan Hubungan Linear dan Ragam Relatif Konstan . . . . . . . . . . . . . . . . . . . 249
4.5
Grafik Pencar Data dengan hubungan Linear tetapi Ragam Relatif tidak Konstan . . . . . . . . . . . . . . . . 250
4.6
Grafik Pencar Data dengan hubungan lebih cenderung nonlinear . . . . . . . . . . . . . . . . . . . . . . . . . . 251
4.7
Grafik Pencar Data dengan Hubungan Eksponensial . . 252
4.8
Grafik Pencar Sisa Data yang memenuhi syarat homoskedastisitas. . . . . . . . . . . . . . . . . . . . . . . 254
4.9
Grafik Pencar Sisa Data yang tidak memenuhi syarat homoskedastisitas. . . . . . . . . . . . . . . . . . . . . 255
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
17 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.10 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik menunjukkan data relatif memenuhi asumsi Model Linier Normal . . . . . . . . . . . . . . . . . . . 258 FMIPA-UNEJ
4.11 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik menunjukkan data tidak memenuhi asumsi Model Linier Normal, yang ditandai dengan adanya hubungan tidak linier dan pencilan . . . . . . . . . . . . . 259
Daftar Isi
Judul
4.12 Sebaran data asli (naik dan membuka ke atas) dan transformasi yang bisa dilakukan. Beberapa transformasi menghasilkan sebaran yang mengikuti garis lurus tetapi ragam tidak konstan . . . . . . . . . . . . . . . . . . . . . . . . 266
JJ J
I II
18 dari 490
4.13 Sebaran data asli (naik dan terbuka ke bawah) dan transformasi yang bisa dilakukan. Beberapa transformasi menghasilkan sebaran yang mengikuti garis lurus tetapi ragam tidak konstan . . . . . . . . . . . . . . . . . . . . . . . . 268
Cari Halaman
Kembali
4.14 Sebaran data asli (dengan ragam tidak stabil) dan transformasi yang bisa dilakukan. Beberapa transformasi hanya menghasilkan ragam yang sedikit lebih stabil . . . . . . . 269
Layar Penuh
Tutup
Keluar
5.1 5.2 5.3 5.4
Plot Densitas dari sampel dengan berbagai nilai-tengah dengan ukuran sampel 100 . . . . . . . . . . . . . . . . Sebaran Data dengan ukuran sampel 100 dengan distribusi Normal (b) dan Gamma (r) . . . . . . . . . . . Respon dengan Fungsi Hubungan Logit dan Probit . . Diagram Pencar Prediksi dan Data Asli Peluang Keberhasilan Berbagai Kelompok . . . . . . . . . . . . . .
289 290 296
FMIPA-UNEJ
Daftar Isi
335 Judul
JJ J
I II
19 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
20 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
DAFTAR TABEL
Daftar Isi
Judul
JJ J
I II
21 dari 490
1.1 1.2
Tabel jumlah (kg) salak dan anggur dan harga yang dibayar . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
Fungsi dan paket untuk menggambar grafik R . . . . .
79
Cari Halaman
Kembali
2.1
Fungsi R terkait matriks . . . . . . . . . . . . . . . . . 134
3.1
Alternatif Penulisan Model dalam Formula R . . . . . . 225
Layar Penuh
Tutup
Keluar
5.1 5.2 5.3 5.4 5.5 5.6
Rangkuman Distribusi Anggota Keluarga Eksponensial Ciri-ciri khas Distribusi Keluarga Eksponensial . . . . . Jumlah Sukses(S) dan Gagal dalam Berbagai Kelompok Faktor . . . . . . . . . . . . . . . . . . . . . . . . . Distribusi dan Link pada R . . . . . . . . . . . . . . . Jumlah Kelulusan dalam Berbagai Kelompok Perlakuan Format Data R Jumlah Kelulusan dan Kegagalan . . .
288 291
6.1
Respon Pengukuran berulang . . . . . . . . . . . . . . 358
324 329 331 332
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
22 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
BAB
1
Daftar Isi
Judul
DASAR-DASAR PEMODELAN STOKASTIK JJ J
I II
23 dari 490
Cari Halaman
Analisis regresi sering disebut model statistika (statistical model, yaitu barkaitan dengan mempelajari hubungan fungsional (bukan sekedar hubungan asosiasi) dua peubah atau lebih. Dalam analisis ini satu peubah atau lebih (disebut peubah respon) diuji hubungan fungsionalnya dengan beberapa peubah lain (disebut peubah penjelas). Bentuk
Kembali
Layar Penuh
Tutup
Keluar
fungsi yang dihasilkan sering disebut sebagai model matematika atau secara lebih khusus model statistika. Pada bab ini akan dibahas prinsip dasar pemodelan matematika, khususnya pemodelan statistika. FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
24 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi Pembaca diharapkan memahami hakekat pemodelan dalam bidang statistika serta mempunyai gambaran tentang kedudukan dan perkembangan regresi atau model linier dalam uji statistika. Secara lebih khusus diharapkan: 1. dapat menyebutkan hakekat dari pemodelan matematika, khususnya pemodelan statistika; 2. dapat menjelaskan langkah-langkah penyusunan model statistika; 3. dapat menjelaskan langkah-langkah mengestimasi parameter dalam model statistika; 4. dapat menjelaskan perkembangan model statistika penting. 5. dapat menentukan dan mengeksplorasi paket statistika R terkait dengan analisis regresi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
25 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi 1. Prinsip Pemodelan 2. Langkah-langkah PemodelanStatistika 3. Estimasi Parameter dalam Model Statistika
FMIPA-UNEJ
Daftar Isi
4. Perkembangan Model Statistika Judul
5. Tinjauan singkat R JJ J
I II
26 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.1.
Prinsip Pemodelan
Ketika kita menganalisis data dengan menggunakan metode statistika, hampir selalu menekankan asumsi yang dikenakan terhadap data yang dianalisis. Asumsi-asumsi itu dapat meliputi hubungan antara peubah, maupun sebaran dari galat (error). Namun, mungkin tidak semua kita menyadari bahwa saat itu sebenarnya sedang diterapkan suatu pemodelan (dalam hal ini pemodelan statistik) dalam memecahkan persoalan, maupun membuat suatu kesimpulan tentang masalah yang dihadapi. Ketika membicarakan model atau pemodelan dalam bidang matematika atau statistika, mungkin pikiran kita membayangkan materi matematika tingkat lanjut (advanced mathematics) yang membutuhkan pemahaman kalkulus lanjut maupun persamaan diferensial. Pemodelan, baik disadari atau tidak, implisit atau eksplisit, sebenarnya selalu dilakukan pada saat kita menggunakan matematika (atau khususnya statistika) dalam memecahkan masalah kehidupanm riil. Bahkan, sejak di SLTP/SMU penyelesaian soal-soal bentuk cerita (words problem), sebenarnya merupakan aplikasi pemodelan matematika. Demikian juga aplikasi sistim persamaan linier dalam kehidupan sehari-hari, sebagian besar merupakan bentuk aplikasi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
27 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pemodelan matematika. Definisi 1.1 (Prinsip Pemodelan). Model matematika dari suatu masalah adalah rumusan masalah dalam bentuk persamaan matematika Definisi 1.2. Pemodelan matematika adalah proses menerjemahkan masalah dalam bahasa umum(sehari-hari) ke dalam bahasa atau persamaan matematika Sebagai ilustrasi, berikut disampaikan contoh soal penerapan sistim persamaan linier dan langkah- langkah penyelesaian yang dianjurkan.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
28 dari 490
Contoh 1.1. Seorang ibu membeli 3 kilogram salak dan 2 kilogram anggur. Ibu tersebut harus membayar sebesar Rp 17 000,- Sedangkan ibu lain yang membeli 3 kilogram salak dan 5 kilogram anggur harus membayar Rp 29.000,-. Jika pedagang memberlakukan harga tetap terhadap kedua ibu- ibu tadi, berapa harga perkilogram salak dan harga perkilogram anggur? Selanjutnya berapa harga harus dibayar jika seseorang membeli x kg salak dan y kg anggur?
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk menjawab persoalan di atas dianjurkan untuk menempuh langkah- langkah berikut. Hal ini dimungkinkan hanya dilakukan secara implisit. FMIPA-UNEJ
1. Kita misalkan bilangan yang ingin dicari (dalam hal ini harga satu kilogram salak dan harga satu kilogram anggur) masingmasing sebagai a dan b. Kita membuat persamaan matematika dari persoalan dalam bentuk cerita tadi. Dalam hal ini sebenarnya kita sedang membuat model matematika suatu persoalan. Untuk soal di atas model matematika yang diperoleh adalah 3a + 2b = 1700 (1.1) 3a + 5b = 29000 2. Kita menyelesaikan persamaan matematika di atas dengan teori matematika yang kita miliki. Dengan metode eleminasi dan substitusi balik kita memperoleh a = 3000 dan b = 4000.
Daftar Isi
Judul
JJ J
I II
29 dari 490
Cari Halaman
Kembali
3. Mensubsitusikan secara serempak nilai a dan b yang diperoleh ke sistim persamaan yang dimiliki untuk memeriksa apakah hasil yang kita peroleh benar atau tidak.
Layar Penuh
Tutup
Keluar
4. Menyimpulkan bahwa harga satu kilogram salak adalah Rp 3000 dan harga satu kilogram anggur adalah Rp 4000. Jadi harga x kg salak dan y kg anggur adalah
FMIPA-UNEJ
H = 3000x + 4000y Daftar Isi
Jadi dapat dipahami bahwa pemodelan atau menerjemahkan masalah sehari-hari ke persamaan matematika merupakan bagian yang sangat penting dalam menggunakan matematika untuk menyelesaikan persoalan sehari- hari. Pentingnya pemodelan dalam matematika juga dinyatakan oleh Prof. J. Neyman, yang dikutip dari Meyer, sebagai berikut: Whenever we use mathematics in order to study some observational phenomena we must essentially begin by building a mathematical model (deterministic or probabilistic) for these phenomena. Of necessity, the model must simplify matters and certain details must be ignored. The success of the model depends on whether or not the details ignored are really unimportant in the development of the phenomena studied. The solution of mathematical problems may be correct and yet be in considerable disagreement with the observed data simply because the underlying assumptions made are not warranted. It is usually quite difficult to state with certainty, whether or
Judul
JJ J
I II
30 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
not a given mathematical model is adequate before some observational data are obtained. In order to check the validity of the model, we must deduce a number of consequences of our model and then compare these predicted results with observations. [Kapan saja kita menggunakan metematika untuk mempelajari fenomena yang teramati, kita mesti perlu memulai dengan membangun suatu model matematika (deterministik atau probabilistik) untuk fenomena tersebut. Sangat penting, model yang dibuat harus menyederhanakan persoalan dan beberapa rincian mesti diabaikan. Keberhasilan model bergantung pada apakah rincian yang diabaikan benar- benar tidak penting dalam pengembangan fenomena yang dipelajari. Biasanya sangat sulit untuk menyatakan dengan pasti, apakah suatu model matematika adalah tepat atau tidak sebelum diperoleh data pengamatan. Dalam rangka memeriksa validitas model, kita harus menurunkan sejumlah konsekuensi (dalil) dari model kita dan membandingkan hasil dugaan teoritis dengan pengamatan] (Meyer [28]).
Pembuatan model dari suatu persoalan adalah ibarat pembuatan peta suatu wilayah. Dalam proses pembuatan peta, harus ada penyederhanaan, yaitu mengabaikan rincian hal-hal yang tidak menjadi kepentingan. Sangat jelaslah bahwa peta yang baik adalah peta yang sederhana namun memuat secara akurat informasi yang diperlukan. Peta yang terlalu rinci, dalam hal tertentu menjasdi tidak ko-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
31 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
munikatif, karena terlalu banyak terdapat informasi yang tidak diperlukan. Sementara, di lain pihak, peta yang terlalu sederhana yang mengabaikan informasi yang penting, dapat menjerumuskan pembacanya kepada sasaran yang keliru. Demikian juga, dalam menyelesaikan persoalan dengan menggunakan matematika, biasanya kita selalu memulai dengan model yang paling sederhana yang berarti banyak informasi yang diabaikan. Karenanya penyelesaian persoalan secara matematis ini, mungkin benar tapi tidak bermanfaat dan tidak bermakna, karena model yang dibangun tidak sesuai dengan data yang diamati, akibat adanya asumsi penting yang dibuat untuk mendasarinya diabaikan. Itulah sebabnya dalam penyelesaian persoalan secara matematika (atau statistika khususnya), biasanya dimulai dari model yang sederhana kemudian dikembangkan secara berangsur-angsur ke model yang lebih kompleks yang semakin sesuai dengan kondidi riil di lapangan. Pada Contoh 1.1, sebenarnya setelah diperoleh kesimpulan akhir tentang harga barang. Hasil tersebut perlu diperiksa atau dicocokkan dengan keadaan riil dilapangan dengan mengambil beberapa informasi yang lain, apakah temuan tersebut berlaku, menyimpang sedikit atau banyak. Sehingga kita bisa mengambil langkah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
32 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
apakah model yang kita pakai perlu diperbaiki atau tidak. Pada Contoh 1.1, ada asumsi yang dikenakan dalam persoalan tersebut yaitu pedagang diasumsikan mengenakan harga yang tetap kepada semua pembeli. Ini berarti peubah harga dianggap merupakan peubah tetap yang tidak bersifat acak. Dengan demikian mengambil dua pembeli sudah cukup untuk mementukan atau menghitung harga dua komuditas (anggur dan salak). Persoalan akan menjadi lebih kompleks apabila dalam kenyataan di lapangan pedagang mengenakan harga yang berbeda-beda kepada pembeli dan sangat boleh jadi kenyataan inilah yang banyak terjadi di lapangan, terutama di pasar-pasar tradisional. Dalam kondisi ini ada kemungkinan dari beberapa pembeli diperoleh informasi (data) yang berbeda- beda misalnya dari 10 pembeli diperoleh informasi seperti pada Tabel 1.1 yang berupa data fiktif. Kedua sifat alami dari gejala ini menuntut pemodelan yang berbeda. Pemodelan yang pertama yang tidak memperhitungkan adanya sebaran harga disebut pemodelan deterministik (matematika). Dalam pemodelan ini peubah yang diamati dianggap tetap (fixed) dan tidak memiliki sebaran sehingga hubungan yang diperoleh meru-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
33 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 1.1: Tabel jumlah (kg) salak dan anggur dan harga yang dibayar Nomor Pembeli
Jumlah Kg Salak (X1 )
Jumlah Kg Anggur (X2 )
1 2 3 4 5 6 7 8 9 10
2 6 3 4 5 6 3 2 5 6
4 3 2 5 6 3 5 2 6 6
Jumlah Harga dalam Rupiah (H) 20 500 29 000 17 000 31 500 40 000 30 500 29 000 14 500 39 500 41 000
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
34 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pakan hubungan matematika yang bersifat fungsional murni (misalnya, y = f (x)). Pemodelan yang kedua, menganggap peubah harga berubah-ubah dengan sebaran tertentu (misalnya, normal). Pemodelan yang kedua ini disebut pemodelan stokastik (statistika). Hubungan yang diperoleh selain mengandung komponen fungsional, juga mengandung adanya galat yang merupakan peubah acak yang berdistribusi dengan sebaran tertentu. Jadi hubungan yang diperoleh menjadi y = f (x, α, β) + e, dengan e adalah peubah acak/ random yang berdistribusi normal, misalnya. Fungsi f dan sebaran e biasanya bergantung kepada suatu konstanta yang belum diketahui yang disebut parameter. Parameter inilah yang biasanya menjadi fokus kepentingan dalam pemodelan statistika. Dalam contoh di atas X1 , X2 dan Y disebut variabel/ peubah yang diketahui dari data sedangkan α dan β adalah parameter (yang akan dicari nilainya). Dengan demikian, persamaan matematika yang sekarang harus diselesaikan adalah h = β1 x1 + β2 x2 + . Selanjutnya dengan mengenakan beberapa pembatasan atau asumsi pada , akan diperoleh berbagai variasi model. Asumsi yang paling
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
35 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sederhana yang juga menghasilkan model yang paling sederhana adalah bahwa i berdistribusi identik dan independen mengikuti sebaran normal. Model-Statistika Linier membahas berbagai alternatif model serta penyelesaiannya. Dengan prosedur penyelesaian model stokastik, ˆ dihasilkan persamaan berupa dugaan harga (h) ˆ = 3001, 73x1 + 3968, 40x2 h dengan 3001,732 disebut penduga β1 atau βˆ1 yaitu dugaan harga 1 kg salak dan 3968,40 disebut βˆ2 yaitu dugaan harga 1 kg anggur.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
36 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.2.
Langkah-langkah Penting Dalam Pemodelan
1.2.1.
Langkah penting dalam Pemodelan secara Umum FMIPA-UNEJ
Dari uraian pada Contoh 1.1 sebenarnya sudah tergambar langkahlangkah yang penting dalam pemodelan secara umum. Langkah- langkah tersebut dapat diuraikan secara lebih eksplisit seperti berikut ini. 1. Penentuan model. Langkah ini meliputi: (a) menentukan/ mengidentifikasi peubah beserta batas semestanya; (b) menentukan jenis dan derajat fungsi yang dibentuk; Penentuan jenis dan derajat fungsi disesuaikan dengan kondisi, tujuan dan sifat permasalahan yang dihadapi. 2. Menyelesaikan model. Langkah ini meliputi menghitung nilai peubah atau konstanta yang ada pada model dengan menggunakan kaidah- kaidah matematika baik secara analitik maupun numerik.
Daftar Isi
Judul
JJ J
I II
37 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Melakukan verifikasi. Hasil yang diperoleh dari penyelesaian model sebelum disimpulkan atau diinterpretasikan ke dalam persoalan nnyata semestinya diverifikasi apakah sudah sesuai dengan model yang digunakan. Langkah ini penting untuk meyakinkan tidak adanya kesalahan perhitungan, kesalahan pemrograman (kalau menggunakan komputer), maupun kesalahan konsep matematika yang digunakan dalam menyelesaikan model.
FMIPA-UNEJ
Daftar Isi
Judul
4. Menarik kesimpulan. Selanjutnya hasil yang diperoleh diinterpretasikan sesuai dengan persoalan riil yang menjadi dasar pemilihan model. 5. Melakukan uji kecocokan. Karena pada umumnya pemodelan dimulai dari model yang sederhana dengan mengabaikan hal-halyang kompleks, atau menggunakan asumsi- asumsi secara ketat, maka tidak mustahil hasil yang diperoleh tidak terlalu cocok dengan kondisi riil di lapangan. Melalui langkah ini seseorang mendapat gambaran apakah model yang dipilih sesuai atau perlu menggunakan meningkatkan kompleksitas modelnya dengan menambah variabel maupun konstanta dalam model atau
JJ J
I II
38 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mencoba hubungan fungsi yang lebih kompleks.
1.2.2.
Langkah Penting dalam Pemodelan Statistika
Sebenarnya langkah- langkah dalam pemodelan stokastik sudah tergambar langkah- langkah yang penting dalam pemodelan secara umum. Namun ada beberapa langkah yang sifatnya khas yang tidak dilakukan dalam pemodelan umum. Sifat khas ini disebabkan karena dalam pemodelan statistika ada parameter yang menjadi kepentingan dan ada komponen galat yang bersifat acak dan memiliki sebaran tertentu. Langkah-langkah penting yang harus ditempuh dalam pemodelan stokastik dapat diuraikan seperti berikut ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
39 dari 490
1. Penentuan model yang meliputi: Cari Halaman
(a) menentukan/ mengidentifikasi peubah; (b) menentukan parameter yang menjadi kepentingan;
Kembali
(c) menentukan hubungan antara parameter dan peubah serta Layar Penuh
(d) menentukan distribusi komponen acak. Tutup
Keluar
Penentuan hubungan serta distribusi ini disesuaikan dengan kondisi dan sifat permasalahan yang dihadapi. 2. Mengestimasi parameter yang menjadi kepentingan. Langkah ini identik dengan Penyelesaian persamaan matematika yang diperoleh sebagai model matematika dari permasalahan yang dihadapi. Langkah ini meliputi menghitung nilai estimasi titik yang ada pada model dengan menggunakan kaidah- kaidah statistika baik secara analitik maupun numerik. 3. Menarik kesimpulan/ melakukan uji inferensi. Dalam pemodelan stokastik, karena peubah yang dihadapi adalah peubah yang bersifat random/ acak maka nilai estimasi titik yang yang diperoleh masih harus dilanjutkan dengan perhitugan estimasi interval/selang keyakinan atau dilanjutkan dengan uji signifikansi secara statistika: (a) bagaimana besaran kesalahan dari dugaan yang diperoleh, (b) bagaimana sebaran atau rentangan atau interval dari hasil yang diperoleh?
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
40 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(c) apakah hasil yang diperoleh secara statistika signifikan atau tidak. 4. Melakukan uji kecocokan (goodness of fit) atau mengadakan diagnostik model. Hasil yang diperoleh selain diuji signifikansinya, mestinya juga diuji kecocokannya dengan kondisi riil dilapangan. Melalui langkah diagnostik diperiksa
FMIPA-UNEJ
Daftar Isi
Judul
(a) apakah ada kecocokan atau tidak antara asumsi yang dilakukan dengan kondisi riil data; (b) apakah perlu melalukan remidi (mentransformasi data sehingga kondisi yang disyaratkan oleh model terpenuhi) atau
JJ J
I II
41 dari 490
(c) apakah perlu mencari alternatif model yang lebih cocok. Cari Halaman
Uji kecocokan ini biasanya dilakukan pada sisa/residu dari penggunaan model. Itu sebabnya langkah ini kebanyakan dilakukan sesudah model dipilih. Diagram langkah-langkah pemodelan, khususnya untuk model stokastik/ model statistika, dapat dilihat pada Gambar 1.1
Kembali
Layar Penuh
Tutup
Keluar
Menyelesaikan Model/ Model Matematika
Problem Riil
FMIPA-UNEJ
menyelesaikan Persamaan
identifikasi, simplifikasi
Daftar Isi
(Komputasi)
Judul
PEMODELAN MATEMATIKA
JJ J
I II
Verifikasi
42 dari 490 interpretasi, generalisasi Solusi Riil (Kesimpulan)
(Uji Model)
Cari Halaman
Kembali
Gambar 1.1: Diagram Menunjukkan Langkah-langkah dalam Pemodelan Statistika
Layar Penuh
Tutup
Keluar
Dalam hal pengembangan model statistika, para Teorisi statistika, atau statistisi, menurunkan metode umum/ prosedur dalam mengestimasi parameter, menguji dan mendiagnosis, serta meremidi model yang dibuat. Para praktisi berkewajiban menerapkan metode sesuai dengan persyaratan yang ditentukan atau yang dihasilkan oleh para statistisi. Selain itu, tugas para teorisi statistika (statistisi) adalah juga membangun berbagai model alternatif, untuk berbagai kondisi di lapangan. Kemudian, secara deduktif (matematis) menurunkan sifat- sifat dari model tersebut, cara mengestimasi parameter, cara mendiagnosis model serta mengaplikasikan model-model yang diturunkan kedalam suatu paket komputer yang ramah (gampang dipakai dan dipahami) sehingga bisa dipakai oleh para praktisi di lapangan. Lebih tegasnya menurut Mendenhall (1979) dikatakan: The statisticians study various inferential procedures, looking for the best predictor or decicion-making process for a given situation. Even more important, the statistician provides information concerning the goodness of an inferential procedures. [Para statistisi mempelajari berbagai prosedur penarikan kesimpulan, mencari penduga terbaik- atau
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
43 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
proses pengambilan keputusan untuk kondisi tertentu. Bahkan lebih jauh mereka menyediakan informasi berkaitan dengan kecocokan dari suatu prosedur pengambilan keputusan] (Mendenhall [26]). Bagi para analis (praktisi) statistika, tugas pokoknya adalah mempelajari model- model yang ditawarkan beserta persyaratan dan prosedur yang harus ditempuh dalam menerapkan model tersebut. Hal ini sejalan dengan fungsi dan tujuan ilmu statistika itu sendiri sebagaimana digambarkan Wackery et al. [49] bahwa tujuan statistika adalah membuat kesimpulan tentang populasi berdasarkan informasi yang diperoleh pada suatu sampel dan untuk memberikan ukuran derajat kecocokan dari kesimpulan itu.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
44 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.3.
Metode Mengestimasi Parameter
Salah satu langkah pokok dalam pemodelan statistika adalah mengestimasi parameter yang menjadi kepentingan. Dalam analisis regresi, ada dua kelompok parameter yang menjadi kepentingan yaitu yang paling penting adalah parameter efek tetap atau parameter regresi βj (j = 0, 1, 2, ..., k) tergantung pada dimensinya) dan biasanya diperlukan juga mengestimasi parameter dispersi (misalnya, σ, tergantung pada model yang dihadapi). Kadang- kadang parameter dispersi ini diasumsikan diketahui. Ada dua metode yang banyak dipakai dalam mengestimasi parameter efek tetap dalam model linier yaitu: 1. metode kuadrat terkecil (least square method) dan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
45 dari 490
2. metode likelihood maksimum (maximum likelihood method). Cari Halaman
1.3.1.
Metode Kuadrat Terkecil Kembali
Pada dasarnya parameter yang diestimasi adalah parameter dari garis regresi dari model yang mewakili populasi. Hal ini diperoleh berdasarkan informasi atau sebaran sampel yang dimiliki. Metode kuadrat
Layar Penuh
Tutup
Keluar
terkecil (least square), menggunakan pendekatan geometris. Secara geometris, garis yang paling mewakili sebaran sampel adalah garis yang mempunyai simpangan minimum, atau error/galat terkecil dari pencaran data. Untuk memudahkan perhitungan, jarak yang aslinya berupa harga mutlak dari error, |i | diganti dengan kuadrat galat tersebut, yaitu 2i . Langkah langkah dalam mengestimasi parameter dari sampel sebanyak n dengan metode kuadrat terkecil adalah:
FMIPA-UNEJ
Daftar Isi
Judul
1. mengubah persamaan model yi = xi β + i menjadi i = xi β − yi ; 2. mencari bentuk kuadrat dan jumlah kuadrat dari galat, yaitu P Q = ni=1 2i ;
JJ J
I II
46 dari 490
Cari Halaman
3. menghitung penduga parameter dengan mencari minimum dari Q terhadap βj . Dalam statistika, kalau kita membahas maksimum/ minimum suatu fungsi, pada umumnya yang menjadi kepentingan adalah nilai peubah atau paremeter yang menyebabkan fungsi itu mencapai
Kembali
Layar Penuh
Tutup
Keluar
maksimum/ minimum, bukan nilai maksimum/ atau minimum fungsi tersebut. Dalam hal ini yang menjadi kepentingan adalah nilai β, bukan nilai Q. FMIPA-UNEJ
1.3.2.
Metode Likelihood Maksimum Daftar Isi
Kalau metode kuadrat terkecil menggunakan pendekatan geometris, maka metode likelihood maksimum menggunakan pendekatan distribusi. Dari data yang dimiliki serta asumsi distribusi yang diberlakukan pada data tersebut kita memperoleh fungsi likelihood dari data tersebut. Jelasnya langkah tersebut dapat diuraikan sebagai berikut. 1. Tentukan likelihood dari data Y1 , Y2 , · · · , Yn , yang saling bebas dan mempunyai fungsi kepadatan peluang masing- masing, misalnya ψi (θ). Likelihood keseluruhan ini adalah L(θ) =
n Y
Judul
JJ J
I II
47 dari 490
Cari Halaman
ψi (θ)
i=1
Fungsi likelihood tidak lain adalah fungsi kepadatan probabilitas darai Y , hanya saja nilai y dianggap diketahui (dari data), tetapi parameternya (θ) yang tidak diketahui.
Kembali
Layar Penuh
Tutup
Keluar
2. Tentukan maksimum dari L atau log −L terhadap parameter θ. Dalam kenyataannya, orang lebih seringmencari maksimum dari fungsi log-likelihood, log (L) dari pada L. Hal ini bisa dilakukan karena yang dicari adalah penyelesaian (nilai variabel y yang meyebabkan terjadinya nilai L maksimum) bukan nilai maksimum L. Fungsi log adalah fungsi monoton yang tidak mengubah nilai y yangmenyebabkan L maksimum. Selain itu transformasi logaritma juga memberikan beberapa keuntunan dalam perhitungan yaitu menghilangkan exponen dan menyederhanakan produk menjadi jumlah. `(θ) =
n X
Daftar Isi
Judul
JJ J
I II
log (ψ(θ))
i=1
1.3.3.
FMIPA-UNEJ
Mencari Maksimum dengan Metode Numerik
Pada umumnya maksimum suatu fungsi tidak bisa diperoleh secara analitik, oleh karenanya diperlukan pendekatan yang disebut metode numerik. Mencari maksimum/ minimum suatu fungsi F pada dasarnya sama dengan mencari nilai nol atau penyelesaian fungsi f (θ) = F 0 (θ) = dF/dθ. Metode numerik yang biasa dipakai dalam mencari maksimum
48 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
likelihood adalah Metode Newton-Raphson yang merupakan metode iteratif. Langkah- langkah pokok dari metode Newton-Raphson ini dapat diuraikan sebagai berikut: FMIPA-UNEJ
1. menentukan nilai awal b0 2. melakukan iterasi sampai konvergen (sampai kriteria konvergensi terpenuhi)
Daftar Isi
Judul
F 0 (b0 ) b1 = b0 − 00 F (b0 )
(1.2)
f (b0 ) f 0 (b0 )
(1.3)
atau b1 = b0 −
JJ J
I II
49 dari 490
dengan f = F 0 . Apabila peubah atau parameternya berdimensi tinggi, maka fungsi turunan pertamanya berupa vektor (D) sedang turunan keduanya akan berupa matriks yang disebut matriks Hessian (H). Bentuk multivariat dari Newton- Raphson ini adalah
Cari Halaman
Kembali
Layar Penuh
b1 = b0 − D(b0 ) H−1 (b0 ) .
(1.4) Tutup
Keluar
Lebih khusus lagi, dalam statistika matriks Hessian ini kadang kadang lebih sederhana jika diganti dengan negatif dari nilai harapannya yang disebut matriks informasi dan dinotasikan I = −E[H]. Persamaan iterasi yang menggunakan matriks informasi dikenal dengan metode skoring dari Fisher (Fisher’s scoring) yang ditunjukkan oleh persamaan berikut. b1 = b0 + D(b0 ) I −1 (b0 )
(1.5)
Ada tiga hal penting yang harus diperhatikan dalam mengaplikasikan metode numerik (Newton-Raphson maupun skoring dari Fisher) yaitu: (i) algoritma yang dipakai (lengkap atau terpartisi), (ii) nilai awal dan (iii) kriteria konvergensi. Nilai awal untuk b0 ditentukan sedemikian sehingga pada saat itu xb0 = y, sedangkan kriteria konvergensi bisa menggunakan max (|b1 − b0 | < δ,) untuk δ bilangan positif sangat kecil, misalnya 10−3 . Jika parameter yng diestimasi terdiri atas beberapa unsur, maka ada beberapa cara yang ditempuh dalam mengestimasi dengan menggunakan metode Newton-Raphson yaitu seperti berikut ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
50 dari 490
Cari Halaman
Kembali
Layar Penuh
1. Mengestimasi secara serempak dengan memperlakukan paramTutup
Keluar
eteryang diestimasi sebagai sebuah vektor penduga. Cara ini disebut pendekatan algoritma penuh. Cara ini cocok apabila setiap unsur dari vektor parameter mempunyai sifat-sifat (konvergensi) yang relatif sama. 2. Mengelompokkan unsur-unsur parameter yang sejenis. Unsurunsur sejenis lalu diberlakukan sebagai suatu vektor. Dengan demikian akan diperoleh lebih dari satu vektor parameter. Masing - masing vektor parameter yang diestimasi dengan cara multivariate, tetapi pendugaan vektor satu dengan lainnya dilakukan secara selang-seling. Selang seling dapat dilakukan pada setiap iterasi (nested), atau setelah masing- masing konvergen pada kondisi tertentu(zig-zag). Algoritma seperti ini disebut algoritma terpartisi (partitioned algorithm). Pengelompokan biasanya dilakukan berdasarkan parameter regresi (β) dan parameter dispersi (φ) yang biasanya kedua jenis parameter ini mempunyai sifat-sifat yang berbeda terutama dilihat dari kecepatan konvergensinya. Pembahasan kedua algoritma di atas (penuh dan terpartisi) dapat dilihat pada Smyth [33] dan Smyth [34].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
51 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.4.
Model Linier dan Perkembangannya
Perkembangan pemodelan stokastik, terutama model linier, dapat dikatakan dimulai pada abad ke 19 yang didasari oleh teori matematika yang diletakkan diantaranya oleh Gauss, Boole, Cayley dan Sylvester yang terkait dengan teori invarian dalam aljabar. Teori invarian aljabar mempelajari bentuk-bentuk kuantitas yang tidak berubah terhadap suatu transformasi linier. Teori invarian ini yang mendasari perkembangan teori nilai eigen, vektor eigen, matriks determinan, metode dekomposisi dan masih banyak lagi yang lainnya. Salah satu contoh dalam statistika kita tahu bahwa korelasi dua peubah acak tidak berubah walaupun peubah- peubah tersebut mengalami transformasi. Perkembangan model linier dimulai dengan perkembangan analisis regresi pada abad 19 oleh Pearson perkembangan korelasi segera setelah itu. Teori regresi ini yang menjadi dasar perkembangan teori model linier. Perkembangan model linier tidak bisa dilepaskan dengan perkembangan teori matriks atau aljabar linier. Melalui teori matriks (determinan, invers, perkalian matriks) pembahasan model linier dapat didekati secara umum (Lihat Statsoft [35]). Dalam subbab ini
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
52 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
perkembngan model linier lebih dititik beratkan dari dua asumsi dasar yaitu distribusi dan independensi galat. Sebagaimana diuraikan sebelumnya, bahwa pemodelan dimulai dari yang sederhana, yang secara matematis mudah diselesaikan, kemudian berkembang ke arah yang lebih realistik. Hal ini dapat dilakukan, salah satunya dengan menerapkan berbagai asumsi yang berbeda terhadap distribusi galat dalam model yang digunakan. Prinsip seperti ini telah berkembang dari model yang paling sederhana (klasik), ke model hirarkis tergeneralisir yang saat ini merupakan pemodelan yang paling terkini. Dalam sub-bab ini diuraikan secara ringkas perkembangan model linier ditinjau dari segi distribusi dan independensi galatnya.
1.4.1.
Model linier klasik
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
53 dari 490
Cari Halaman
Pemodelan linier memiliki bentuk umum
Kembali
p
yi =
X
xij βj + i
(1.6)
Layar Penuh
j=0 Tutup
Keluar
Untuk i = 1, 2, . . . , n dan j = 1, 2, . . . , p, atau dalam bentuk matriks Y = Xβ +
(1.7)
Dalam hal ini (i) merupakan galat atau error yang diasumsikan merupakan peubah acak yang memenuhi distribusi tertentu, misalnya normal; (ii) peubah x adalah peubah tetap yang tidak bersifat acak dan (iii) β adalah parameter yang menentukan koefisien dari peubah peubah tetap tadi. Dalam ilustrasi pada Contoh 1.1. misalnya, dianggap bahwa sebenarnya ada hubungan yang bersifat tetap yang menentukan harga barang di pasar. Namun, selain itu masih ada lagi faktor lain yang bersifat acak yang menyebabkan harga barang tadi dalam kenyataannya dari pembeli ke pembeli mungkin menyimpang dari fungsi hubungan tadi. Dalam pemodelan statistika/ stokastik, kedua komponen ini dipisahkan yaitu yang bersifat tetap dan fungsional dinotasikan dengan f (x, β), yang bisa disebut sebagai komponen tetap (fixed), sedangkan komponen lainnya, , yang bersifat acak disebut sebagai komponen acak (random component) atau dalam hal ini secara khusus disebut komponen galat (error component). Dari segi fungsi hubungan f , bentuk yang paling sederhana adalah hubungan linier, sehingga dari aspek ini model yang paling sederhana yang kita miliki
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
54 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah model linier. Sedangkan dari segi komponen acaknya, yang paling sederhana adalah asumsi bahwa galatnya berdistribusi normal dan saling independen antara satu respon dengan respon lainnya. Asumsi ini menghasilkan model linier normal sederhana atau normal linear models (NLM). Dari kedua hal tersebut lahirlah yang disebut model normal sederhana atau model linier klasik yang secara formal dapat diuraikan sebagai berikut.
yi =
k X
Daftar Isi
Judul
Definisi 1.3 (Bentuk dan Asumsi Model Linier Klasik). Model:
FMIPA-UNEJ
JJ J
xij βi + i
I II
(1.8)
j=0
atau untuk keseluruhan respon dapat dituliskan dalam bentuk matriks seperti persamaan (1.7),
55 dari 490
Cari Halaman
Y = Xβ + Kembali
Asumsi: xi bukan peubah acak dan diukur tanpa galat dan i independen dengan 0i untuk setiap i 6= i0 dan masing- masing berdistribusi N (0, σ 2 ).
Layar Penuh
Tutup
Keluar
Berdasarkan asumsi di atas diperoleh bahwa secara keseluruhan dapat dianggap berdistribusi multivariat normal (MVN) dengan koefisen variasi konstan, yang dinotasikan dengan ∼ M V N (0, σ 2 I). Model mensyaratkan bahwa respon ke i dan ke i0 adalah saling bebas (independen), yang berarti tidak ada korelasi diantaranya. Beberapa referensi yang membahas model linier normal ini diantaranya adalah Neter et al. [31], Bowerman et al.[3].
FMIPA-UNEJ
Daftar Isi
Judul
1.4.2.
Model Linier Tercampur
Berdasarkan kenyataan di lapangan banyak ditemukan pengamatan yang menghasilkan respon yang tidak saling independen. Misalnya, apabila pada suatu subjek dilakukan pengamatan yang berulang- ulang maka respon yang diperoleh antara satu dengan sebelumnya, atau satu dengan berikutnya, dapat dipastikan akan saling berkorelasi. Dengan demikian, pengamatan yang diperoleh bukan lagi merupakan hasil pengamatan atau respon tunggal, tetapi merupakan vektor respon. Tentu saja respon seperti ini dapat ditangani dengan metode multivariat. Namun ada kekhasan dari pengamatan seperti ini, yaitu korelasi/ hubungan antara respon satu dengan lainnya biasanya berpola,
JJ J
I II
56 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sehingga dianggap kurang pas kalau ditangani dengan metode multivariat biasa. Untuk menangani respon-respon semacam ini model linier klasik di atas lalu dikembangkan menjadi model linier tercampur atau linear mixed models (LMM). Dalam model ini hubungan antara respon yang satu dengan lainnya dianggap berasal dari pengaruh suatu peubah yang tidak kentara atau laten (subjek, misalnya). Untuk itu komponen tetap (f (x)) diuraikan lagi menjadi komponen tetap dan komponen efek acak (random effects). Dengan demikian model ini memiliki dua komponen acak yaitu komponen error () dan komponen efek acak yang biasanya dinotasikan dengan u. Model ini biasa disebut model linier tercampur (linear mixed model) yang dapat didefinisikan sebagai berikut.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
57 dari 490
Definisi 1.4 (Bentuk dan Asumsi Model Linier Tercampur). Cari Halaman
Model: Y = Xβ + Zu +
(1.9)
Asumsi: u ∼ M V N (0, σ12 I) dan ∼ M V N (0, σ22 I). u independen dengan .
Kembali
Layar Penuh
Tutup
Keluar
Sebenarnya ragam u dapat bervariasi sehingga membentuk matriks ragam-koragam dari (Y) yang bervariasi juga. Struktur matriks ragam-koragam ini dapat dibentuk sesuai kondisi respon yang dihadapi. Bentuk yang paling sederhana di atas menghasilkan matriks ragam-koragam yang disebut matriks uniform atau compound symmetry atau seragam. Dengan menggunakan jumlah peubah acak yang berdistribusai normal dan saling independen bisa diperoleh bahwa bentuk ragam-koragam Y , yang identik dengan jenis korelasi uniform, adalah 2 σ1 + σ22 · · · σ12 ··· σ12 σ12 · · · σ12 + σ22 · · · σ12 V= .. .. .. . . . . . . . . . σ12
···
σ12
· · · σ12 + σ22
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
58 dari 490
atau secara umum Cari Halaman
ρ .. . ρ .. . ρ ··· ρ ··· 1
1 ··· .. . . . . V = φ ρ ··· .. . . . .
ρ ··· .. . . . . 1 ··· .. . . . .
Kembali
(1.10) Layar Penuh
Tutup
Keluar
Model ini mengasumsikan bahwa korelasi antara pengamatan satu dan lainnya bersifat konstan (uniform). Struktur lain yang juga banyak diterapkan adalah Auto Regresive 1 (AR1) atau disebut ragamkoragam dengan korelasi serial yaitu: 1 ρ ρ2 · · · ρk . . ρ . . . .. . . . .. 2 (1.11) V = φ ρ ··· 1 ··· ρ .. . . .. . . . . . . ρ k 2 ρ ··· ρ ρ 1 Model ini mengasumsikan bahwa seiring dengan jarak yang makin jauh, maka korelasi/ hubungan antara respon tersebut semakin kecil. Dalam beberapa paket komputer, yang dimodelkan adalah struktur korelasinya, bukan matriks ragam-koragamnya. Model linier tercampur sering juga disebut dengan istilah model linier bertingkat (hierarchical linear model). Istilah bertingkat digunakan karena model ini biasa juga didefinisikan secara bertingkat seperti berikut ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
59 dari 490
Cari Halaman
Kembali
Layar Penuh
Definisi 1.5. Asumsi Model Linier Tercampur/ Bertingkat Tutup
Keluar
1. Ada efek acak ui yang berhubungan dengan strata atau subjek ke i, untuk i = 1, ...n dimana antara satu efek acak dengan lainnya saling independen dan berdistribusi normal dengan nilai-tengah 0; 2. Kondisional terhadap efek acak ke i , respon-respon di dalam strata ini juga saling independen dan berdistribusi normal dengan nilai-tengah dan ragam konstan.
FMIPA-UNEJ
Daftar Isi
Judul
Model linier Campuran banyak diaplikasikan untuk data yang berasal dari pengukuran berulang yang dikenal dengan data longitudinal atau repeated meassurement. Referensi yang bisa dijadikan acuan untuk mempelajari model linier bertingkat ini diantaranya adalah Bab 4 dari Davidian dan Giltinan [9], Diggle et al. [10], Laird dan Ware [19]. Sedangkan untuk model yang lebih umum yaitu termasuk modelmodel non-linier dapat dilihat pada Davidian dan Giltinan [9]
1.4.3.
Model Linier Tergeneralisir
Kondisi lain yang banyak ditemukan di lapangan yang tidak dapat ditangani langsung oleh model linier klasik adalah adanya kenyataan
JJ J
I II
60 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
bahwa, distribusi respon tidak mesti Normal. Sejauh ini, kondisi seperti ini biasanya ditangani dengan melakukan transpormasi pada respon. Transpormasi yang banyak dipakai adalah transpormasi logaritma. Namun, ada beberapa permasalahan yang mungkin timbul sebagai efek dari transpormasi ini misalnya seperti berikut ini. Respon yang sudah ditranspormasi mungkin mendekati distribusi normal, tetapi akibat transpormasi ada kemungkinan syarat yang lain (syarat ketidak-bergantungan) menjadi tidak terpenuhi. Adanya kerancuan dalam menafsirkan hasil penelitian oleh karena efek yang diuji adalah dalam skala logaritma, bukan dalam sekala aslinya. Hal ini menyebabkan kesimpulan terasa janggal misalnya, ”ada hubungan positif antara log-konsentrasi pemupukan dengan log-panen”. Untuk menangani kondisi dimana respon yang ada tidak berdistribusi Normal, tetapi masih saling bebas, maka para statistisi yang dipelopori oleh Nelder dan Wedderburn [30] telah mengembangkan model linier yang dikenal dengan generalized linear model (GLM). Model ini di Indonesai dikenal dengan model linier terampatatau tergeneralisir. Model linier ini menggunakan asumsi bahwa repon memiliki distribusi keluarga ekponensial. Distribusi keluarga eksponensial adalah dis-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
61 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tribusi yang sifatnya lebih umum, dimana distribusi- distribusi yang banyak kita kenal (Normal, Gamma, Poisson) termasuk di dalamnya dan merupakan bentuk- bentuk khusus dari distribusi Keluarga Eksponensial. Definisi distribusi Keluarga Eksponensial ini akan dibahas pada bab selanjutnya. Kalau kita simak model linier klasik, kita menemukan beberapa hal yang sifatnya khas dan istimewa yaitu: 1. ada komponen tetap yang disebut prediktor linier ;
FMIPA-UNEJ
Daftar Isi
Judul
2. respon yi berdistribusi normal dan saling independen dan JJ J
3. nilai-tengah yi adalah µi =
Pk
j=0
I II
xij βj . 62 dari 490
Pada model linier tergeneralisir/terampat, hubungan di atas mengalami perubahan atau generalisasi, sebagaimana dalam definisi berikut: Definisi 1.6 (Asumsi Model Linier Tergeneralisir). Model linier tergeneralisir adalah model yang mengandung tiga hal yaitu:
Cari Halaman
Kembali
Layar Penuh
1. komponen tetap yang disebut prediktor linier ηi =
Pk
j=0 xij βj ; Tutup
Keluar
2. respon yi berdistribusi secara independen dalam keluarga eksponensial; 3. hubungan antara nilai-tengah dengan prediktor linier ditunjukkan fungsi g(.) yang disebut fungsi ’link’ sedemikian sedingga g(µi ) = ηi . Fungsi g() disebut fungsi hubungan (link-function). Ada fungsi hubungan khusus yang disebut fungsi hubungan kanonik atau natural yang berkaitan erat dengan distribusi y. Misalnya, jika distribusinya normal maka g() adalah identitas. Dari hal di atas dikatakan bahwa komponen penting dalam model linier tergeneralisir ada tiga yaitu: (i) adanya prediktor linier,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
63 dari 490
(ii) adanya distribusi keluarga eksponensial dan Cari Halaman
(iii) adanya fungsi-hubungan. Referensi yang umum dijadikan acuan utama mempelajari model linier tergeneralisir ini adalah generalized linear models oleh McCullagh dan Nelder [24], sedangkan sebagai pemula dapat digunakan pengantar yang ditulis oleh Dobson [11].
Kembali
Layar Penuh
Tutup
Keluar
1.4.4.
Model untuk Data Tidak Normal dan Tidak Saling Bebas
Seiring dengan semakin luasnya penggunaan metode statistika dalam menganalisis data, maka data yang dihadapi ada kemungkinan tidak saja tidak berdistribusi Normal tetapi juga tidak saling bebas. Untuk menganalisis data semacam ini ada tiga kelompok metode yang banyak dipakai untuk menyelesaikan model linier tercampur tergeneralisir. GLMM . Model ini merupakan kombinasi antara LMM dan GLM. Pada model ini, walau komponen galat tidak harus berdistribusi Normal, tetapi komponen acaknya masih diasumsikan berdistribusi Normal dan menggunakan bentuk aditif seperti pada model linier tercampur normal. Model linier ini biasa disebut sebagai Model linier tercampur tergeneralisir (GLMM = Generalized Linear Mixed Model) HGLM Model ini menggunakan bentuk multiplikatif dan komponen acaknya tidak dibatasi dengan distribusi Normal. Model linier ini sering juga disebut Model linier hirarkis/ bertingkat tergereralisasir (HGLM=Hierarchical Generalized Linear Model). Mo-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
64 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
del linier ini termasuk model linier yang relatif baru dan masih sedang dikembangkan (lihat misalnya Lee dan Nelder [20] dan Tirta ([37], [39],[38]. FMIPA-UNEJ
GEE Pendekatan yang relatif lebih praktis, Liang & Zeger [21] dan Zeger & Liang [52] memperkenalkan metode yang disebut disebut Generalized Estimating Equations (untuk selanjutnya disingkat GEE) yang merupakan sebuah analogi atau generalisasi multivariat dari quasi-likelihood. Manakala tidak ada fungsi likelihood yang pasti untuk dijadikan acuan, cukup beralasan untuk menduga/ mengestimasi dengan menyelesaikan sebuah analogi multivariat dari metode quasi-score yang diperkenalkan Wedderburn [51] dimana kita hanya perlu menentukan bentuk mean atau nilai-tengah(sebagai momen pertama) dan matriks ragamkoragam (sebagai momen kedua), tanpa perlu mengetahui bentuk pasti likelihoodnya. Pembahasan yang lebih detil dapat dibaca pada Diggle et al. [10] (Lihat juga Yasi et al. Perkembangan dan pembagian model linear dapat diliustrasikan dalam bentuk bagan seperti pada Gambar 1.2.
Daftar Isi
Judul
JJ J
I II
65 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Y = Xβ + ε
Komponen Tetap Univariat?
Multivariat?
Pencilan/Outlier?
Komponen Acak
FMIPA-UNEJ
Tidak Normal?
Normal?
Daftar Isi Independen?
Dependen (Multi kolinieritas)?
Tidak Independen?
Independen?
Judul RKU
Seleksi Variabel
LMM/MLC
NLM/MLK
GLMM/MLCT GEE R. BERTATAR STEPWISE
GLM/MLC
JJ J
I II
66 dari 490
Var.Laten?
REGRESI GULUD (RIDGE)
REGRESI ROBUST
Cari Halaman
SEM
Kembali
Faktor emua
ANOVA/MANOVA
Layar Penuh
Tutup
Keluar
1.4.5.
Pengembangan Lain Model Linier
Selain berkembang akibat variasi asumsi distribusi dari galat, model linier juga berkembang ke arah variasi kondisi peubah bebas atau peubah penjelas X, seperti ditujukkan oleh Gambar 1.2. Asumsi dasar dari peubah X adalah bukan peubah acak (tidak memiliki distribusi) dan merupakan besaran kuantitatif. Dalam perkembangannya, ada kalanya Xj , j = 0, 1, 2, 3, . . . , p − 1 merupakan peubah acak sedangkan Xj dan Xj0 tidak saling bebas untuk suatu j 6= j 0 , dalam kondisi seperti ini, dikatakan terjadi multikolinieritas antara peubah bebas X. Tingginya multikolinieritas dapat menyebabkan adanya estimasi parameter tidak teliti. Secara matematis Xj dan Xj0 yang tidak saling bebas, menunjukkan bahwa salah satu kolom matriks X merupakan kombinasi linier linier dari kolom-kolom lainnya yang menyebabkan X tidak dalam rank penuh, sehingga invers matriks XT X menjadi tidak terdefinisikan. Ada beberapa prosedur atau tehnik untuk menangani masalah multikolinieritas, diantaranya adalah regresi Ridge dan Regresi dengan Komponen Utama (RKU) (lihat Neter et al[31]). Tidak jarang juga kumpulan data yang kita miliki, sesungguh-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
67 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nya merupakan sekumpulan dari berapa kelompok data atau sampel sesungguhnya terdiri atas beberapa subsampel. Persoalan yang dihadapi adalah apakah model (garis regresi) masing- masing kelompok harus berbeda atau dapat digabung dalam satu model yang sama. Dalam hal ini sebagian peubah penjelas Xj akan merupakan peubah kualitatif, atau merupakan indikator kelompok atau grup dari kelompok yang ada pada data, sampel maupun populasi. Analisis model linier yang menangani data semacam ini menggunakan peuban boneka dummy variable dan dapat dilihat pada Neter et al[31].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
68 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
90
● ●
●
FMIPA-UNEJ
● ● ●
● ● ●
80
●
Daftar Isi
● ● ●
●
●●
70
NFis
●
●
●
●
●
●
Judul
●
●
JJ J
● ● ● ●
I II
●
●
60
● ●
●
69 dari 490
●
●
●
50
●
●
●
L P
Cari Halaman
● ●
Kembali 50
60
70
80
90
NMat
Layar Penuh
Gambar 1.3: Ilustrasi Data dengan pencilan dan kelompok. Data ini memerlukan pemisahan model dari subsampel
Tutup
Keluar
1.5.
Model-model Nonlinier
Pada model-model yang telah dibicarakan sebelumnya, ada ciri khas hubungan antara parameter dan peubah prediktornya, yaitu adanya kombinasi linier antara peubah prediktor dengan parameter regresinya P (yaitu ηi = pi=1 xij βj . Sementara itu hubungan antara µi dengan ηi tidak selalu linier (misalnya log, resiprokal dan lain-lain). Ciri-ciri tersebut menyebabkan model yang telah dibicarakan masih termasuk kelompok model linier. Perkembangan lain dari model statistika tidak mewajibkan adanya kombinasi linier (ηi ), tetapi mengadopsi bentuk yang lebih luas P yaitu polinomial atau bentuk aditif, η(x) = α + pj=1 fj (xj ). Termasuk dalam model ini adalah GAM (generalized additive models) (Hastie dalam Chamber & Hastie [5], Hastie & Tibsirani [14]), regresi lokal (Cleveland et al., dalam Chamber & Hastie [5], Venables& Ripley [46]).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
70 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.6.
Tinjauan singkat Program Statistika R
Penggunaan piranti lunak komputer dalam analisis regresi hampir tidak bisa ditunda lagi. Selain untuk mempercepat proses perhitungan, penggunaan piranti lunak memungkinkan peneliti atau analis data dapat melakukan dengan cepat (i) berbagai alternatif model (baik dilihat dari jenis sebaran, jenis hubungan serta jumlah peubah yang dimuat) serta memilih model yang terbaik; (ii) melengkapi hasil analissi data secara numerik dengan visualisasi grafik yang dapat membantu pemahaman dalam menginterpretasi model. Dalam subbab ini akan dibahas secara singkat beberapa kemampuan R terkait pemodelan statistika atau analisis regresi, diantaranya:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
71 dari 490
1. kemampuan umum terkait cara mengaktifkan paket, melihatdokumentasi paket termasuk contoh penggunaannya; 2. kemampuan manipulasi grafik terkait pemeriksaan asumsi model yang dipergunakan dan visualisasi untuk melengkapi hasil analisis secara numerik;
Cari Halaman
Kembali
Layar Penuh
3. paket-paket R yang terkait dengan berbagai bentuk analisis reTutup
Keluar
gresi mulai dari yang paling sederhana (regresi klasik) sampai yang sangat kompleks (respon nonnormal dan tidak saling bebas, hubungan nonlinier). FMIPA-UNEJ
R adalah piranti lunak utuk analisis data dan penyajian grafik yang berbasis Open Sources. Sebagian besar kemampuan R hanya bisa dimanfaatkan melalio pendekatan CLI (command line interface), yaitu dengan mengirim perintah dalam bentuk kumpulan perintah baris atau skrip. Hanya sebagian kecil kemampuan R yang dapat dimafaatkan melaui menu grafis GUI(graphical user interface) Ada dua cara memanfaatkan R melalui CLI. 1. Menulis perintah langsung pada Rconsole. Untuk pertintahperintah singkat yang jarang diulang, biasanya langsung ditulis pada layar Rconsole. 2. Menulis skrip secara terpisah. Untuk perintah yang agak panjang dan sering diulang (misalnya dalam simulasi), perintahperintah R ditulis secara tersendiri pada editor skrip. Kumpulan perintah ini selanjutnya dapat dijalankan sebagian atau secara
Daftar Isi
Judul
JJ J
I II
72 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
keseluruhan sesuai kebutuhan. Untuk mengaktifkan editor skrip pada R dapat dilakukan langkah berikut: (a) Pada menu File pilih New Script atau Open Script
FMIPA-UNEJ
(b) setelah perintah ditulis pada layar editor eksekusinya dapat dilakukan dengan mengaktifkan menu Edit pada Editor, selanjutnya bisa pilih run lines atau run all Hampir semua paket atau Pustaka R yang terkait dengan analisis data tingkat lanjut (advanced statistical analyses), termasuk regresi hanya bisa dimanfaatkan melalui pendekatan perintah baris atau skrip. Hanya sebagian kecil dan yang masih bersifat mendasar yang dapat dimanfaatkan melalui pendekatan menu, misalnya RCommander (lihat Tirta [43]. Untuk itu, pembaca perlu memahami cara memanfaatkan R melalui skrip (Untuk dokumentasi lebih detail dapat dilihat pada Tirta [42]). Secara umum ada beberapa perintah penting yang perlu dikuasai untuk dapat memanfaatkan R dengan baik yaitu:(i) cara mengaktifkan paket, (ii) melihat dokumentasi paket, (iii) menjalankan contoh pada paket.
Daftar Isi
Judul
JJ
J
I
73 dari 490
Cari Halaman
Kembali
Layar Penuh
1. Mengaktifkan paket. Kemampuan R tersusun atas fungsi-fungsi Tutup
Keluar
II
yang dikemas dalam bentuk paket. Paket yang dimiliki R belum bisa dimanfaatkan sampai paket itu diaktifkan. Ada dua cara mengaktifkan suatu paket yaitu. library(nama_paket) require(nama_paket)
FMIPA-UNEJ
Daftar Isi
Misalnya untuk mengaktifkan paket gee, kita dapat memanggil dengan salah satu cara berikut. library(gee) require(gee)
Judul
JJ J
I II
74 dari 490
Jika dilakukan akan muncul pesan
Cari Halaman
Loading require package: gee Kembali
2. Membaca dokumentasi pada paket.Setelah paket diaktifkan, selenjutnya dokukmentasinya dapat dipanggil. Berikut adalah
Layar Penuh
Tutup
Keluar
cara memanggil dokumentasi paket, dengan contoh khusus paket gee. help(nama_paket) ?nama_paket help(gee) ?gee
FMIPA-UNEJ
Daftar Isi
Judul
Setelah perintah tersebut dijalankan, maka akan muncul dokumentasi tentang paket gee, diantaranya berisi (i) cara memanfaatkan paket gee,(ii) jenis dan interpretasi keluaran gee, (iii) referensi terkait gee, serta (iv) contoh penggunaan gee. 3. Menjalankan contoh-contoh pada paket. Satu paket R dapat terdiri atas beberapafungsi analisis. untuk menjalankan contohcontoh fungsi pada paket dapat ditempuh dua cara. (Paket gee secara kebetulanjuga memuat fungsi analissi yang disebut gee).
JJ J
I II
75 dari 490
Cari Halaman
Kembali
Layar Penuh
(a) Dengan melakukan perintah langsung. Tutup
Keluar
example(nama_fungsi) example(gee) (b) Dengan menyalin teks pada contoh; dengan cara ini teks contoh yang ada pada dokumentasi, disalin (copy) lalu ditempelkan (paste) pada Rconsole.
FMIPA-UNEJ
Daftar Isi
4. Menyimpan objek dan memeriksa komponen objek. Hasil perhitungan dengan R biasanya disimpan dalam bentuk objek. Komponen objek dapat dilihat dengan menggunakan perintah names(nama_objek). nama_objek<-fungsi names(nama_objek) Sebagai contoh komponen objek yang dihasilkan oleh analisis model linier dapat ditujnukkan pada tampilan berikut.
JJ
Judul
J
I
76 dari 490
Cari Halaman
lm1<-lm(y~x) names(lm1) "coefficients" "residuals" "effects" "rank" "fitted.values" "assign" "qr" "df.residual" "xlevels" "call" "terms" "model"
Kembali
Layar Penuh
Tutup
Keluar
II
Selanjutnya untuk mencetak sebagian komponen dari objek bersangkutan dilakukan dengan perintah newline print(objek$komponen)). Berikut adalah perintah dan hasil keluaran yang dilakukan pada objek lm1 di atas. > print(lm1$coeff) (Intercept) x -3.317963 3.111967 >print(lm1$call) lm(formula = y ~ x)
1.6.1.
Aplikasi R untuk Manipulasi Grafik
Selain analisis statistik secara numerik, analisis regresi juga perlu dilengkapi dengan visualisasi data melalui grafik. Visualisasi grafik selain bermanfaat untuk mendapatkan gambaran tentang kondisi data terkait dengan asumsi-asumsi sebaran (histogram, QQPlot, Boxplot,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
77 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
diagram pencar sisa), juga bermanfaat dalam memberikan visualisasi model (diagram pencar data yang dilengkapi garis regresi, khususnya untuk dua dimensi). Tabel 1.2 memuat beberapa paket dan fungsi yang terkait dengan penyajian grafik dalam analisis regresi. Visualisai tentang sebaran data baik terkait sebaran univariat, maupun pencaran bivariat dapat disajikan dalam berbagai cara (layout), misalnya menyisipkan grafik kecil dalam grafik besar, atau membagi lay out layar. Informasi lebih lengkap dapat dilihat pada Tirta [42] atau Burns [4]. Berikut adalah beberapa contoh penyajian grafik terkait regresi. 1. Histogram dilengkapi dengan kurva densitas (baik teoritis maupun emperik). Grafik ini memberikan gambaran secara intuitif kesesuaian sebaran data dengan sebaran teoritis yang menjadi asumsi (skrip berikut hasilnya terlihat pada Gambar 1.4). hist(x,freq=FALSE,ylim=c(0,0.45), main="HISTOGRAM DENGAN KURVA DENSITAS") lines(density(x),lty=4) #densitas emperik lines(sort(x),dnorm(sort(x)))#densitas teoritik
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
78 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 1.2: Fungsi dan paket untuk menggambar grafik R Fungsi barplot() hist() boxplot() plot() pairs()
Paket graphics graphics graphics graphics graphics
abline()
graphics
contour() persp() rug()
graphics graphics graphics
qq.plot()
car
reg.line() car scatterplot(), car sp() spm(), car scatterplot.matrix(),
Penggunaan menggambar grafik batang menggambar histogram menggambar boxplot menggambar grafik X-Y menggambar Matriks Diagram Pencar menggambar garis lurus yang diketahui konstanta dan gradiennya menggambar kontur menggambar boxplot menggambar sebaran data pada sumbu menggambar plot perbandingan kuantil menggambar garis regresi menggambar diagram pencar data diagram pencar beberapa pasang peubah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
79 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. Diagram pencar dilengkapi dengan rugplot dan boxplot marjinal (untuk peubah penjelas dan peubah respon). Grafik ini memberikan gambaran secara intuitif kesesuaian sebaran data secara univariate (skrip berikut hasilnya terlihat pada Gambar 1.5) plot(x,y,xlab="X", ylab="Y",col="red", main="DIAGRAM PENCAR DENGAN RUG & BOXPLOT") abline(lm(y~x),col="blue") rug(side=1, jitter(x, 5),col="green" ) rug(side=2, jitter(y, 20),col="green" )
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
par(mar=c(1,2,5,1)) boxplot(y, axes=F) par(mar=c(5,1,1,2)) boxplot(x, horizontal=T, axes=F) 3. Diagram pencar dilengkapi dengan histogram dan qqplot marjinal (untuk peubah penjelas dan peubah respon). Grafik ini memberikan gambaran secara intuitif kesesuaian sebaran data secara univariate. Grafk dapat disajikan dengan menyisipkan histogram dan qqplot di
I II
80 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dalam diagram pencar (lihat Gambar 1.6) atau dengan mengatur lay out tampilan grafik seperti Gambar 1.7dan Gambar 1.8. Berikut adalah skrip untuk Layout c(1,2)-c(2,1), untuk Gambar 1.7, yaitu pertama layar dibagi atas 1 baris dan 2 kolom, selanjutnya layar kolom kedua dibagi menjadi 2 baris 1 kolom.
FMIPA-UNEJ
Daftar Isi
split.screen(c(1,2)) split.screen(c(2,1), screen = 2) screen(1) plot(x,y,main="Diagram Pencar (X,Y)") abline(lm(y~x)) screen(3) hist(y, probability=T, main="Histogram Y") lines(density(y), col="red", lwd=2) screen(4) qq.plot(x,main="QQ.norm X")
Judul
JJ
J
I
81 dari 490
Cari Halaman
Kembali
Skrip berikut adalah untuk Layout c(2,1)-c(1,2), untuk Gambar 1.8, yaitu pertama layar dibagi atas 2 baris dan 1 kolom, selanjutnya layar baris kedua dibagi menjadi 1 baris 2 kolom.
Layar Penuh
Tutup
Keluar
II
split.screen(c(2,1)) split.screen(c(1,2), screen = 2) screen(1) plot(x,y,main="Diagram Pencar (X,Y)") abline(lm(y~x)) screen(3) hist(y, probability=T, main="Histogram Y") lines(density(y), col="red", lwd=2) screen(4) qq.plot(x,main="QQ.norm X")
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
82 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
HISTOGRAM DENGAN KURVA DENSITAS
0.4
FMIPA-UNEJ
Judul 0.2
Density
0.3
Daftar Isi
I II
0.1
JJ J
0.0
83 dari 490
−3
−2
−1
0
1
2
Cari Halaman
x
Gambar 1.4: Contoh Histogram dengan Kurva Densitas.Kurva langsung adalah densitas teoritis, kurva putus-putus adalah densitas emperik data
Kembali
Layar Penuh
Tutup
Keluar
DIAGRAM PENCAR DENGAN RUG & BOXPLOT
180
●
● ● ●
FMIPA-UNEJ
●
170
●
150
160
●
●
140
Y
●
●
● ●
● ●
●
● ● ● ●
● ●
130
● ● ● ●
●
● ● ● ● ●
●
● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
● ● ● ● ● ●
● ●
●
Daftar Isi
● ●
●
●
Judul
● ● ● ● ●
●
●
JJ J
● ● ●
I II
● ● ● ●
120
● ●
84 dari 490
●
40
45
50
55
60
X
Cari Halaman
Kembali
Gambar 1.5: Contoh Diagram Pencar dengan rug dan boxplot(densitas data)
Layar Penuh
Tutup
Keluar
DIAGRAM BESAR DENGAN GRAFIK MINI
180
●
170
● ● ●
150
● ● ●
●
● ● ● ●
●
● ●
●
● ● ●
40
40
●
45
● ●
●
Daftar Isi
●
●
●
Judul
JJ J
QQNorm
● ●
● ● ● ● ● ● ●
● ● ● ●
●
● ●
● ●
50 x
●● ● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●●●●
−2
FMIPA-UNEJ
●
●
● ● ● ●
● ● ● ● ● ●
●
x
130
● ●
● ● ● ● ●
●
● ● ● ● ● ● ● ●
60
●
120
● ●
● ● ● ● ● ● ● ●
50
140
y
160
●
HistY
● ●
●
−1
55
0
1
2
I II
●
85 dari 490
60
Cari Halaman
norm quantiles
Kembali
Gambar 1.6: Contoh Gabungan Grafik Besar (Diagram Pencar) dengan Grafik Mini(Histogram dan QQPlot)
Layar Penuh
Tutup
Keluar
Histogram Y
●
170
● ● ●
130
●
120
●
●
40
45
50 x
55
140
160
180
Judul
QQ.norm X
●● ●● ● ● ● ● ● ● ●● ●●● ● ●
● ●
Daftar Isi
y
● ● ●● ●●
●
FMIPA-UNEJ
120
x
y
140
150
160
● ● ● ●●● ● ● ● ● ●● ● ● ●● ● ● ●● ●● ●● ● ●● ●● ● ●● ●● ● ● ● ● ●● ● ● ● ●● ●
● ●● ● ● ●
60
40 45 50 55 60
●●
Frequency Density
180
●
0.000 0 5 0.010 10 0.020 20
Diagram Pencar (X,Y)
●
JJ J
● ●● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●
−2
−1
0
1
I II
●
2
86 dari 490
Cari Halaman
norm quantiles
Kembali
Gambar 1.7: Contoh Gabungan Grafik dengan pembagian layar (1,2)dan (2,1)
Layar Penuh
Tutup
Keluar
120 140 160 180
y
Diagram Pencar (X,Y) ●
●
● ● ●
●
● ● ● ●
● ● ●
● ● ● ●
40
● ● ●
● ● ● ●
● ● ● ●
● ● ●
● ● ● ● ●
● ● ● ● ●
● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
● ●
● ● ●
● ● ●
● ● ●
● ●
●
FMIPA-UNEJ
Daftar Isi
45
50
55
60
Judul
x
x 120
140
160 y
180
40 45 50 55 60
QQ.norm X
0.000 0.010 0.020
Density
Histogram Y
●
JJ J
● ●● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●
−2
−1
0
1
I II
●
2
87 dari 490
Cari Halaman
norm quantiles
Kembali
Gambar 1.8: Contoh Gabungan Grafik dengan pembagian layar (2,1)dan (1,2)
Layar Penuh
Tutup
Keluar
1.6.2.
Aplikasi R untuk Model Statistika/ Analisis Regresi
Analisis regresi menggunakan R tersebar dalam banyak paket, diantaranya ada yang telah terintegrasi dengan paket minimal R ada pula yang harus diinstal dan dipanggil secara khusus. Berikut adalah fungsi-fungsi yang dipakai menganalisis model linier beserta paket yang memuatnya. Fungsi dan paket
untuk model statistika dalam R
Fungsi Paket lm() stats
Penggunaan regresi/model linier dengan respon berdistribusi Normal. Paket ini telah terintegrasi dengan R dan sudah dapat dimanfaatkan melalui menu RCommander
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
88 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
glm() stats
lme() lme4 *)
...
lmm *)
regresi/model linier dengan respon berdistribusi Keluarga Eksponensial termasuk distribusi Normal denganrespon masih saling bebas. Paket ini telah terintegrasi dengan R dan sudah dapat dimanfaatkan melalui menu RCommander regresi/ model liner tercampur baik untuk respon berdistribusi keluarga eksponensial (termasuk distribusi Normal) Berbagai fungsi untuk menangani data dengan respon berdistribusi normal tetapi tidak saling bebas dengan pendekatan Bayesian dan Markov Chained Monte Carlo
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
89 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
glmmML() glmmML *) lrm() Design *)
gee() gee *)
geese() geepack *)
gam()
nls()
gam, mgcv stats
regresi dengan respon berdistribusi Keluarga Eksponensial denganpendekatan Likelihood Maksimum Khusus untuk data dengan respon berdistribusi Binomial dan fungsi hubungan logit regresi dengan dengan respon berdistribusi Keluarga Eksponensial dan tidak saling bebas regresi linier dengan dengan respon berdistribusi Keluarga Eksponensial dan tidak saling bebas. Hampir sama dengan gee(), tetapi memiliki alternatif pemodelan yang lebih luwes termasuk pemodelan koragamnya regresi atau model statistika dengan hubungan yang lebih luas termasuk noonlinier dan semiparamerik estimasi model nonlinier dengan menggunakan kuadrat terkecil nonlinier terbobot
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
90 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
*) menunjukkan bahwa paket harus diinstal secara khusus
1.6.3.
RCommnder RGUI untuk analisis dasar
Ada RGUI yang disebut RCommander yang telah menyediakan beberapa analisis regresi mendasar melalui menu grafis, diantaranya: 1. regresi linier klasik sederhana (satu peubah bebas dan satu peubah penjelas); 2. model linier klasik dengan beberapa peubah poenjelas termasuk peubah kualitatif; 3. GLM (model linier terampat/ tergeneralisir). Selain kemampuan analisis regresi tersebut di atas, manfaat penggunaan RComander adalah memudahkan pengguna mengimpor data dari berbagaiformat termasuk format excel yang banyak dipakai kalangan peneliti di Indonesia. Penjelasan rinci RCommander dapat dilihat pada Tirta [42] dan [43] .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
91 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.7.
Ringkasan
Hal-hal penting yang perlu dipahami dalam bab ini adalah seperti berikut. 1. Pemodelan stokastik mengandung komponen tetap yang merupakan komponen regresi dan komponen kesalahan yang bersifat acak yang memiliki sebaran tertentu; 2. Kepentingan utama dalam analisis model stokastik (analisis regresi) adalah mengestimasi koefisien komponen tetap (parameter regresi).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
92 dari 490
3. Metode yang biasa dipakai untuk mengestimasi koefisien regresi adalah metode kuadrat terkecil dan metode kecenderungan maksimum.
Cari Halaman
Kembali
4. Analisis model linier (regresi linier) telah berkembang untuk menanganiberbagai kondisi dari komponen acak (bersebaran normal atau tidak, saling bebas atau tidak).
Layar Penuh
Tutup
Keluar
5. Untuk komponen acak yang bersebaran normal dan saling bebas, analisisnya biasa disebut model linier normal. 6. Untuk komponen acak yang tidak bersebaran normal, tetapi masih dalam sebaran keluarga eksponensial dan masih saling bebas, analisisnya biasa disebut model linier tergeneralisir (terampat). 7. Berbagai pendekatan telah dikembangkan untuk komponen acak yang masih bersebaran keluarga eksponensial tetapi tidak saling bebas, diantaranya adalah GEE, GLMM, dan HGLM. 8. Hampir semua analisis di atas telah tersedia pada paket statistika berbasis open source R yang dapat diperoleh secara gratis.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
93 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.8.
Bacaan Lebih Lanjut
Pada dasarnya semua referensi yang dapat dibaca untuk pengembangan materi pemodelan statistika telah diuraikan pada sesi perkembangan model statistika. Berikut adalah kata kunci yang dapat dipakai untuk melacak (searching) materi pengembangan baik diperpustakaan maupun di internet. Bahan bahan ini biasanya dikemas dalam salah satu topik berikut:statistical model, linear model, regression. Untuk model linear tergeneralisir/terampat dapat juga dilacak dengan kata kunci berikut: logit, probit, log-linear.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
94 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.9.
Latihan
1. Jelaskan apa perbedaan penting antara pemodelan matematika secara umum dan pemodelan statistika.
FMIPA-UNEJ
2. Sebutkan langkah-langkah penting pemodelan statistika. Daftar Isi
3. Sebutkan beberapa macam pemodelan statistika linier yang anda kenal dilihat dari asumsi distribusi dan kebergantungannya. 4. Sebutkan beberapa macam pemodelan statistika nonlinier yang anda kenal. 5. Carilah referensi yang terkait dengan pemodelan statistika linier baik di perpustakaan maupun di internet. Sebutkan masing- masing lima referensi yang belum terdaftar dalam Daftar Pustaka dari buku ini. 6. Lakukan eksplorasi pada R (a) buat grafik X-Y (plot(x,y,...) dengan memberi judul utama, label pada sumbu X dan sumbu Y;
Judul
JJ J
I II
95 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(b) buat tampilan jendela grafik dengan berbagai outline. (c) buat histogram dengan dilengkapi judul dan kurva sebaran; (d) buat diagram pencar yang dilengkapi dengan marjin boxplot; (e) bagaimana menggunakan fungsi lm()};
FMIPA-UNEJ
Daftar Isi
(f) sebutkan komponen objek yang dihasilkan dari fungsi lm(); (g) jalankan contoh analisis regresi dengan glm; (h) periksa komponen-komponen objek yang dihasilkan oleh fungsi glm.
Judul
JJ J
I II
7. Lakukan eksplorasi pada RCommander: 96 dari 490
(a) panggil salah satu data dari pustaka yang ada; (b) sebutkan grafik yang dapat dibuat melalui menu RCommander;. (c) aktifkan plugin terkait demo/animasi statistika; (d) analisis salahsatu data dengan analisi regresi sederhana, selanjutnya buat grafik diagnostiknya.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
BAB
2
Daftar Isi
Judul
ALJABAR MATRIKS UNTUK STATISTIKA JJ J
I II
97 dari 490
Analisis data, khususnya estimasi parameter dalam regresi multivariat, banyak melibatkan operasi matriks. Dalam bab ini akan dibahas teori matriks yang banyak terkait dengan statistika.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi Setelah membaca bab ini, pembaca diharapkan memahami aljabar matriks, turunan yang berkaitan dengan matriks serta menggunakannya dalam statistika, khususnya dalam analisis regresi.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
98 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.1.
Materi
1. Definisi dan jenis matriks 2. Operasi matriks 3. Kebergantungan linier
FMIPA-UNEJ
Daftar Isi
4. Bentuk kuadrat dan turunannya Judul
5. Aplikasi R untuk matriks JJ J
I II
99 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.2.
Defenisi dan Jenis Matriks
Definisi 2.1. Matriks adalah kumpulan unsur yang disusun dalam baris dan kolom yang berbentuk persegi panjang. Matriks biasanya dinotasikan dengan huruf besar tebal, misalnya A, B, sedangkan unsur-unsurnya bisa berupa bilangan atau huruf kecil. Banyaknya baris dan kolom matriks disebut ordo matriks matriks. Matriks yang memiliki n baris dan m kolom,dikatakan berordo n × m dan dinotasikan dengan An×m = [aij ]. Dalam hal ini, aij adalah unsur yang berada pada baris ke i dan kolom ke j dengan i = 1, 2, · · · , n dan j = 1, 2, 3, · · · , m. Contoh 2.1. Matriks A berikut adalah matriks yang berordo 4 ×3; A=
3 4 5 1 3 6 7 10 20 5 7 2
Beberapa matriks khusus yang banyak digunakan dalam statistika diantaranya adalah matriks bujur sangkar, matriks diagonal,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
100 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
matriks skalar dan matriks simetrik. Definisi formal masing- masing jenis matriks tersebut dapat dilihat pada buku-buku teks standar yang membahas matriks. Definisi 2.2. Matriks bujur sangkar (square matrix), adalah matriks dengan banyak barisnya sama dengan banyak kolomnya, yaitu n = m.
FMIPA-UNEJ
Daftar Isi
Pada matriks bujur sangkar, unsur unsur yang berada pada baris dan kolom dengan nomor sama disebut diagonal utama (yaitu: aii , i = 1, 2, · · · , n.) Contoh 2.2.
3 14 5 B = 11 3 6 7 10 20 Definisi 2.3. Matriks diagonal adalah matriks yang semua unsurnya, selain unsur-unsur pada diagonal utamanya, adalah nol, yaitu aij = 0 untuk setiap i 6= j.
Judul
JJ J
I II
101 dari 490
Cari Halaman
Kembali
Contoh 2.3.
3 0 0 D= 0 0 0 0 0 2
Layar Penuh
Tutup
Keluar
Definisi 2.4. Matriks skalar adalah matriks diagonal yang semua unsurnya sama, tetapi tidak sama dengan 0. Contoh 2.4.
FMIPA-UNEJ
3 0 0 C= 0 3 0 0 0 3 Definisi 2.5. Matriks identitas I adalah matriks skalar yang semua unsurnya 1
Daftar Isi
Judul
JJ J
Contoh 2.5.
I II
1 0 0 I= 0 1 0 0 0 1 Definisi 2.6. Matriks nol (0) adalah matriks yang semua unsurnya adalah 0.
102 dari 490
Cari Halaman
Kembali
Definisi 2.7. Matriks simetris adalah matriks yang unsur-unsurnya simetris terhadap diagonal utama, yaitu aij = aji untuk setiap i dan j.
Layar Penuh
Tutup
Keluar
Contoh 2.6.
3 1 5 A= 1 2 0 5 0 4
FMIPA-UNEJ
Daftar Isi
Contoh 2.7. Judul
Dalam statistika, matriks simetris yang banyak ditemukan adalah matriks korelasi (R) dan matriks varians-kovarians atau matriks ragamkoragam(V). R=
1 r12 r21 1 .. .. . . rn1 r2n
· · · r1n · · · r2n dan V = .. .. . . ··· 1
σ12 σ12 σ21 σ22 .. .. . . σn1 σ2n
· · · σ1n · · · σ2n . .. . .. · · · σn2
JJ J
I II
103 dari 490
Cari Halaman
Kembali
Selain matriks-matriks umum di atas, dalam statistika ada yang disebut matriks desain X. Matriks ini merupakan matriks yang menghubungkan parameter β dengan peubah- peubah penjelas Xj . Pada
Layar Penuh
Tutup
Keluar
umumnya model yang dipergunakan selalu mengandung konstanta sehingga kolom pertama matriks X biasanya beranggotakan 1. 1 x11 x12 · · · x1p 1 x21 x22 · · · x2p X = . . .. . . . . . . . . 1 xn1 xn2 · · · xnp
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
104 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.3.
Operasi Matriks dan Sifat-sifatnya
Operasi matriks yang penting yang banyak dipergunakan dalam statistika diantaranya adalah operasi uner yaitu: invers dan transpos dan operasi biner yaitu penjumlahan dan perkalian.
FMIPA-UNEJ
Daftar Isi
2.3.1.
Operasi uner
Untuk melakukan operasi uner diperlukan cukup satu matriks. Operasi yang termasuk uner adalah operasi invers baik untuk penjumlahan maupun perkalian dan operasi transpos. Definisi 2.8. Invers penjumlahan suatu matriks A ditulis −A, adalah matriks yang unsur-unsurnya adalah negatif dari unsur-unsur matriks A
Judul
JJ J
I II
105 dari 490
Cari Halaman
Contoh 2.8.
Kembali
3 1 5 −3 −1 −5 Jika A = 1 −2 0 , maka −A = −1 2 0 . 5 0 −4 −5 0 4
Layar Penuh
Tutup
Keluar
Definisi 2.9. Transpos matriks A (berordo m × n) ditulis AT adalah matriks berordo n × m yang diperoleh dengan menukar baris matriks A menjadi kolom dan sebaliknya, yaitu jika B = AT , maka bij = aji . FMIPA-UNEJ
Contoh 2.9. 4 5 4 1 2 T Jika A = 1 7 maka A = 5 7 4 2 4 Hasil 2.1. Jika A adalah matriks simetris, maka A = AT Definisi 2.10. Invers perkalian suatu matriks A ditulis A−1 , adalah matriks yang jika dikalikan dengan A menghasilkan matriks identitas yaitu A.A−1 = A−1 .A = I.
Daftar Isi
Judul
JJ J
I II
106 dari 490
Cari Halaman
2.3.2.
Operasi biner Kembali
Dalam operasi matriks secara simbolik kita akan banyak menggunakan P Q notasi . dan . Untuk itu dalam subbab ini akan dibahas secara sepintas kedua notasi tersebut.
Layar Penuh
Tutup
Keluar
Definisi 2.11. n X
f (xi ) = f (x1 ) + f (x2 ) + · · · + f (xi ) + · · · + f (xn ). FMIPA-UNEJ
i=1
Sifat-sifat operator Sigma diberikan dalam hasil berikut ini.
Daftar Isi
Hasil 2.2. Sifat- sifat operator Sigma adalah 1. Jika k adalah suatu konstanta, maka
n X
Judul
k = nk. JJ J
i=1
2. Jika k adalah suatu konstanta, dan f adalah fungsi dalam xi maka n n X X kf (xi ) = k f (xi ). i=1
i=1
f (xi ) =
n X i=1
x2i
+ k1
107 dari 490
Cari Halaman
i=1
3. Jika k1 , k2 adalah konstanta dan f (xi ) = x2i + k1 xi + k2 , maka n X
I II
n X
+nk2 .
Kembali
Layar Penuh
i=1 Tutup
Keluar
Bukti: 1
Pn
i=1
k
= |k + k + {z· · · + k}
FMIPA-UNEJ
n
= nk. 2
Pn
i=1
kf (xi ) = kf (x1 ) + kf (x2 ) + · · · + kf (xn )
Daftar Isi
= k(f (x1 ) + f (x2 ) + · · · + f (xn )) n X =k f (xi ).
Judul
i=1
3
Pn
i=1
f (xi )
=
n X
JJ J
x2i
+ k1 xi + k2
I II
i=1 = x21 + k1 x1 + k2 + · · · + x2n + k1 xn + k2
108 dari 490
= x21 + · · · + x2n + k1 x1 + · · · + k1 xn + k2 + · · · + k2 {z } |
Cari Halaman
n
= =
n X i=1 n X i=1
x2i +
n X
k1 xi + nk2
Kembali
i=1
x2i
+ k1
n X
xi + nk2 .
Layar Penuh
i=1 Tutup
Keluar
Untuk lebih meringkas notasi, kadang-kadang jumlah untuk seluruh rentangan indeks hanya dinotasikan dengan tanda titik (.) untuk indeks tersebut, misalnya FMIPA-UNEJ
xi. = x.j =
n X j=1 m X
xij Daftar Isi
xij .
Judul
i=1
P Jika operator merupakan penjumlahan yang berulang, maka Q operator untuk perkalian berulang disebut operator yang didefinisikan seperti berikut ini.
JJ J
I II
109 dari 490
Definisi 2.12. n Y
Cari Halaman
f (xi ) = f (x1 ) × f (x2 ) × · · · × f (xi ) × · · · × f (xn ).
i=1
Kembali
Q
Sedangkan sifat-sifat operator dinyatakan dalam hasil berikut. Q Hasil 2.3. Sifat- sifat operator adalah:
Layar Penuh
Tutup
Keluar
jika k adalah suatu konstanta, maka
n Y
k = kn;
i=1
jika k adalah suatu konstanta, dan f adalah fungsi dalam xi maka n n Y Y kf (xi ) = k n f (xi ); i=1
f (xi ) =
i=1
Daftar Isi
i=1
jika k1 , k2 adalah konstanta dan f (xi ) = (x2i )(k1 xi )(k2 ), maka n Y
FMIPA-UNEJ
n Y i=1
x2i
×
k1n
n Y
xi × k2n .
Judul
JJ J
I II
i=1 110 dari 490
Pembuktian hasil P sifat operator .
Q
di atas analog dengan pembuktian sifatCari Halaman
Penjumlahan Matriks Kembali
Matriks yang bisa dijumlahkan (ditambah dan dikurangi) adalah matriks yang berdordo sama. Matriks yang berordo sama disebut Konformabel (conformable) terhadap penjumlahan. Penjumlahan matriks
Layar Penuh
Tutup
Keluar
dilakukan dengan menjumlahkan unsur unsur yang seletak, yaitu unsur unsur yang terletak pada baris dan kolom yang sama atau yang mempunyai indeks yang sama. FMIPA-UNEJ
Definisi 2.13. Jika A = (aij ) dan B = (bij ) i = 1, 2, · · · , m; j = 1, 2, · · · , n maka A + B adalah matriks C yang berordo m × n dengan unsur unsurnya adalah cij = aij + bij .
Daftar Isi
Judul
Contoh 2.10. Jika
3 5 6 8 A = 8 4 dan B = 2 4 , 6 10 3 10 maka 3+6 5+8 9 13 A + B = 8 + 2 4 + 4 = 10 8 . 6 + 3 10 + 10 9 20 Definisi 2.14. Selisih dua matriks didefinisikan sebagai jumlah dengan negatif matriks pengurang, yaitu A − B = A + (−B).
JJ J
I II
111 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 2.4. Sifat- sifat penting dari penjumlahan matriks adalah A+B=B+A komutatif A+0=0+A identitas A + (−A) = 0 invers A + (B + C) = (A + B) + C assosatif (A + B)T = AT + BT distribusi transpus
FMIPA-UNEJ
Daftar Isi
Judul
Perkalian matriks JJ J
Perkalian matriks bisa dilakukan apabila banyaknya kolom matriks terkali sama dengan banyaknya baris matriks pengali. Matriks-matriks yang dapat dikalikan disebut matriks-matriks yang conformable terhadap perkalian. Selain perkalian dengan sesama matriks, matriks juga dapat dikalikan dengan skalar.
I II
112 dari 490
Cari Halaman
Kembali
Definisi 2.15. Hasil kali suatu matriks dengan suatu skalar adalah matriks yang unsur- unsurnya adalah hasil kali setiap unsur matriks dengan skalar tersebut, yaitu kA = (kaij ) .
Layar Penuh
Tutup
Keluar
Contoh 2.11.
3 −2 −6 9 −6 −18 3 1 2 0 = 3 6 0 . −5 0 4 −15 0 12
Definisi 2.16. Hasil kali dua matriks adalah matriks yang berordo sedemikian sehingga barisnya sama dengan baris matriks yang dikalikan dan kolomnya sama dengan kolom matriks pengali. Unsur unsur dari matriks pengali merupakan kombinasi linier dari baris matriks terkali dengan kolom dari matriks pengali. Jadi jika Am×n Bn×p , maka Cm×p = AB dengan cik = ai1 b1k + ai2 b2k + · · · + ain bnk n X = aij bjk .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
113 dari 490
j=1
Cari Halaman
Contoh 2.12. Kembali
Jika A=
3 −2 −6 3 −1 2 dan B = 1 2 0 5 2 0 , −5 0 4 0 2 4
Layar Penuh
Tutup
Keluar
maka AB adalah (3)(3) + (−2)(5) + (−6)(0) (3)(−1) + (−2)(2) + (−6)(2) = (1)(3) + (2)(5) + (0)(0) (1)(−1) + (2)(2) + (0)(2) (−5)(3) + (0)(5) + (4)(0) (−5)(−1) + (0)(2) + (4)(2) (3)(2) + (−2)(0) + (−6)(4) (1)(2) + (2)(0) + (0)(4) (−5)(2) + (0)(0) + (4)(4) −1 −19 −18 = 13 3 2 . −15 13 6 Hasil 2.5. Sifat-sifat operasi perkalian yang penting di antaranya adalah: 1. nonkomutatif, yaitu secara umum AB 6= BA; 2. assosiatif, yaitu (AB)C = A(BC);
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
114 dari 490
Cari Halaman
Kembali
3. distributif perkalian terhadap penjumlahan, yaitu Layar Penuh
A(B + C) = AB + AC. Tutup
Keluar
4. distributif transpos terhadap perkalian, yaitu (AB)T = BT AT .
2.3.3.
Determinan dan Invers Matriks
FMIPA-UNEJ
Definisi 2.17. Determinan dari suatu matriks bujur sangkar A, dinotasikan dengan |A| atau det(A), adalah fungsi skalar yang didefinisikan sedemikian rupa sehingga merupakan jumlah hasil kali unsur- unsur yang sejajar diagonal utama dikurangi jumlah unsur-unsur yang sejajar diagonal lain. Dalam bentuk notasi |A| =
n Y
aii +
i=1
− a11
n Y
i=1 n−1 Y
ai,i+1 + · · · + a1n
n−1 Y i=1
ai+1,i −
n Y
Daftar Isi
Judul
JJ J
I II
an+1−i,i − · · ·
i=1
115 dari 490
an+2−i,i .
i=2
Definisi 2.18. Matriks yang determinannya tidak nol disebut matriks nonsinguler, sedangkan matriks yang determinannya 0 disebut matriks singuler.
Cari Halaman
Kembali
Layar Penuh
Contoh 2.13. Tutup
Keluar
3 4 1 Jika A = 5 7 6 , maka det A adalah 3 2 5 FMIPA-UNEJ
|A| = (3)(7)(5) + (4)(6)(3) + (1)(5)(2) − (3)(7)(1) − (5)(4)(5) − (3)(2)(6)
Daftar Isi
= 105 + 72 + 10 − 21 − 100 − 36 = 187 − 157 = 30 Definisi 2.19. Teras(trace) suatu matriks bujur sangkar adalah jumP lah unsur diagonal utama dari matriks tersebut, yaitu tr(A) = ni=1 aii . Contoh 2.14.
Judul
JJ J
I II
116 dari 490
Dari −1 −19 −18 A = 13 3 2 , −15 13 6
maka tr(A) = −1 + 3 + 6 = 8. Untuk matriks bujur sangkar beordo 2, cara mencari invers adalah sebagai berikut.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
a c Hasil 2.6. Jika A = , maka b d | A |= ac − bd d −c 1 −1 A = |A| −b a
Contoh 2.15. Bertikut adalahcontoh matriks bujur sangkar berordo 2 × 2 dan inversnya 1 2 A= , −1 2
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
maka A
−1
1 = 4
2 −2 1/2 −1/2 = 1 1 1/4 1/4
117 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.4.
Kebergantungan Linier dan Rank Matriks
Dalam statistika pada umumnya kolom-kolom matriks mewakili peubah - peubah acak yang bisa saling bebas atau tidak saling bebas satu sama lain. Kondisi ini akan mempengaruhi apakah matriks yang akan dihasilkan mempunyai rank penuh atau tidak, apakah matriks yang dihasilkan akan mempunyai invers atau tidak. Definisi 2.20. Suatu kolom dari matriks A dikatakan bergantung linier dengan kolom-kolom lainnya jika dia dapat dinyatakan sebagai kombinasi linier dari kolom-kolom lainnya tersebut. Definisi 2.21. Rank suatu matriks adalah bilangan yang menunjukkan banyaknya maksimum kolom yang saling bebas linier. Definisi 2.22. Suatu matriks dikatakan mempunyai rank penuh jika ranknya sama dengan banyaknya kolom
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
118 dari 490
Cari Halaman
Kembali
Hasil 2.7. Suatu matriks bujur sangkar akan nonsingular jika mempunyai rank penuh, sebaliknya akan singular jika tidak mempuyai rank penuh.
Layar Penuh
Tutup
Keluar
Contoh 2.16.
3 4 1 Matriks A = 5 7 6 adalah matriks nonsingular dengan rank 3 2 5 3 4 1 penuh 3. Tetapi B = 18 7 6 tidak mempunyai rank penuh 15 2 5 karena kolom pertama merupakan 3× kolom ketiga dan karenanya B adalah matriks singular dan tidak memiliki invers. Penyelesaian konkrit dari kegergantungan ini dapat dihitung dengan membentuk sistim persamaan homogen antara kolom-kolom matriks dan mencari apakah sistem persamaan homogen tersebut mempunyai atau tidak penyelesaian tidak nol. Hasil 2.8. Jika matriks Anp bukan matriks bujur sangkar (n < p), paling tidak ada (p − n) kolom yang dapat dinyatakan sebagai kombinasi linier dari kolom lainnya. Dengan demikian maka A tidak akan mempunyai rank penuh.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
119 dari 490
Cari Halaman
Kembali
Layar Penuh
Contoh 2.17. Tutup
Keluar
3 4 1 1 Matriks A = 5 7 6 1 mempunyai banyak kolom yang lebih be3 2 5 1 sar dari banyaknya baris, karena itu pasti salah satu dari kolom yang ada dapat dinyatakan sebagai kombinasi linier dari yang lainnya. Secara aljabar hal ini mengandung pengertian bahwa sistim persamaan ak1 + b + k2 + ck3 + dk 4 = 0, dengan kj adalah kolom ke j, mempunyai penyelesaian dimana sekalar a, b, c, d tidak semuanya sama dengan nol. 3a + 4b + c + d = 0 (1)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
5a + 7b + 6c + d = 0 (2) 120 dari 490
3a + 2b + 5c + d = 0 (3) Selanjutnya (1)-(3) dan (2)-(3) akan menghasilkan 2b + −4c = 0 (4)
Cari Halaman
Kembali
2a + 5b + c = 0 (5) Layar Penuh
Tutup
Keluar
Persamaan (4) menghasilkan hubungan b = 2c yang dapat disubstitusikan ke (5) 2a + 10c + c7 = 0
FMIPA-UNEJ
2a + 11c = 0 a=−
11 c (7) 2
Daftar Isi
Judul
Selanjutnya jika (7) disubstitusikan ke persamaan (1) akan menghasilkan −33 c + 8c + c + d = 0 2 33 15 d = c − 9c = c 2 2 Jadi sistim persamaan ini mempunyai penyelesaian yang bersifat parametrik, salah satu diantaranya adalah untuk c = 2, maka diperoleh b = 4, a = −11, d = 15. Dalam statistika, jika X adalah matriks desain yang kolomnya menunjukkan peubah-peubah penjelas dan barisnya merupakan sampel, untuk menjamin agar X mempunyai rank penuh, maka banyaknya
JJ J
I II
121 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sampel selalu diusahakan jauh lebih banyak dari banyaknya peubah penjelas yang menjadi perhatian. FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
122 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.5.
Bentuk Kuadrat dan Diferensial Matriks
Definisi 2.23. Misalkan x1 x 2 x = x3 dan A = ··· xn maka Q = xT Ax =
" n n X X i=1
FMIPA-UNEJ
a11 a12 a21 a22 .. .. . . an1 an2 #
xj aij xi
· · · an1 · · · an2 , . . . .. . · · · ann
! ; merupakan matriks 1 ×1
Daftar Isi
Judul
JJ J
I II
j=1
(skalar) yang disebut matriks bentuk kuadrat. Matriks A pada umumnya merupakan matriks simetrik, misalnya matriks korelasi ataupun matriks ragam - koragamnya. Dalam statistika
123 dari 490
Cari Halaman
Kembali
Definisi 2.24. Matriks bentuk kuadrat Q disebut definit positif apabila Q > 0 untuk setiap x 6= 0 dan Q = 0 jika dan hanya jika x = 0. Selanjutnya matriks A dari Q disebut matriks positif definit.
Layar Penuh
Tutup
Keluar
Definisi 2.25. Matriks bentuk kuadrat Q disebut semi definit positif apabila Q ≥ 0 untuk setiap x 6= 0 dan Q = 0 paling tidak untuk satu x 6= 0. Selanjutnya matriks A dariQ disebut matriks positif semi definit. sering diperlukan turunan suatu matriks terhadap sekelompok peubah dalam satu vektor. Pada dasarnya turunan satu peubah terhadap suatu vektor adalah adalah suatu vektor atau matriks yang unsur-unsurnya adalah turunan peubah pertama terhadap peubah unsur-unsur vektor penurun sedemikain sehingga posisi unsurnya sesuai dengan posisi unsur yang diturukan dan unsur penurun.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
124 dari 490
Definisi 2.26. Misalkan Cari Halaman
x=
x1 x2 x3 .. .
dan g = g(x)
Kembali
Layar Penuh
xn Tutup
Keluar
maka
∂g ∂x1 ∂g ∂x2 ∂g ∂x3
∂g = ∂x .. .
FMIPA-UNEJ
∂g ∂xn
Daftar Isi
dan ∂g = ∂xT
∂g ∂x
T
∂g ∂x1 ∂g ∂x2 ∂g ∂x3
= ··· ∂g ∂xn
Judul
JJ J
I II
125 dari 490
Contoh 2.18. Cari Halaman
Jika g = (2x1 + 5x2 ), dan x = ∂g = ∂x
2 5
x1 , maka x2
Kembali
Layar Penuh
Tutup
Keluar
Contoh 2.19. Jika g=
g1 g2 g3 .. .
, dan x =
gn maka yang dapat dilakukan adalah T
n × p atau
x1 x2 x3 .. .
FMIPA-UNEJ
,
Daftar Isi
xp
Judul
∂g yang menghasilkan matriks ∂xT
∂g yang menghasilkan matriks p × n. ∂x dg1 /dx1 dg1 /dx2 · · · dg1 /dxp dg2 /dx1 dg2 /dx2 · · · dg2 /dxp ∂g = dg3 /dx1 dg3 /dx2 · · · dg3 /dxp T ∂x .. .. .. .. . . . . dgn /dx1 dgn /dx2 · · · dgn /dxp
JJ J
I II
126 dari 490
Cari Halaman
Kembali
Layar Penuh
Contoh 2.20. Tutup
Keluar
x1 1 2 Misalkan x = dan A = maka x2 2 1 FMIPA-UNEJ
1. Ax =
Daftar Isi
x1 + 2x2 ; 2x1 + x2
Judul
JJ J
2. xT Ax = x1 (x1 + 2x2 ) + x2 (2x1 + x2 ) = x21 + 4x1 x2 + x22 yang merupakan bentuk kuadrat;
I II
127 dari 490
Cari Halaman
∂(x1 + 2x2 ) ∂Ax ∂x1 3. = ∂(2x1 + x2 ) ∂xT ∂x1
∂(x1 + 2x2 ) 1 2 ∂x2 = = A; ∂(2x1 + x2 ) 2 1 ∂x2
Kembali
Layar Penuh
Tutup
Keluar
4. Turunan xT Ax terhadap x adalah
FMIPA-UNEJ
∂(x21 + 4x1 x2 + x22 ) ∂x Ax ∂x1 = 2 2 ∂(x + 4x x + x ) ∂x 1 2 1 2 ∂x2 2x1 + 4x2 = 4x1 + 2x2 1 2 x1 =2 2 1 x2
T
Daftar Isi
Judul
JJ J
I II
128 dari 490
= 2Ax; Cari Halaman
Kembali
Layar Penuh
5. Karena xT Ax pada dasarnya adalah suatu skalar, maka dapat Tutup
Keluar
juga diturunkan terhadap xT . ∂xT Ax ∂(x21 + 4x1 x2 + x22 ) ∂(x21 + 4x1 x2 + x22 ) = ∂xT ∂x1 ∂x2 = 2x1 + 4x2 4x1 + 2x2 1 2 = 2 x1 x2 2 1 = 2xT A; 6. berdasarkan hasil butir 3 dan 4 di atas maka, maka diperoleh ∂ 2 xT Ax ∂ 2 xT Ax = = 2A. ∂xT ∂x ∂x∂xT Hasil 2.9. Misalkan A adalah matriks simetrik berordo n × n dan x adalah vektor baris berordo n, maka 1.
∂xT A ∂Ax = =A ∂x ∂xT
2.
∂xT Ax = 2Ax ∂x
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
129 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
∂ 2 xT Ax 3. = 2A ∂xT ∂x Contoh 2.21.
FMIPA-UNEJ
2 1 x1 Misalkan A = , x = , sedangkan x1 = 2t1 + 3t2 1 3 x2 2 3 dan x2 = 3t1 + t2 , jika t = , maka: 3 1 ∂x = B; ∂tT ∂Ax 2x1 + x2 2(2t1 + 3t2 ) + 3t1 + t2 2. Ax = = = , sehingga x1 + 3x2 2t1 + 3t2 + 3(3t1 + t2) ∂xT A dan ∂Ax ∂Ax ∂x 7 7 2 1 2 3 3. = = = AB = . 11 6 1 3 3 1 ∂tT ∂xT ∂tT 1. x = Bt dan
Hasil di atas dapat diperluas pada hasil berikut. Bukti umum dari hasil berikut tidak dibahas dalam buku ini.
Daftar Isi
Judul
JJ J
I II
130 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 2.10. Misalkan y adalah vektor peubah yang merupakan fungsi dari x, yaitu merupakan hasil perkalian antara x dengan suatu matriks simetrik dan F adalah matriks peubah yang merupakan fungsi dari y, yaitu hasil kali y dengan suatu matriks simetrik, maka berlaku sifat turunan rantai sebagai berikut: ∂F ∂F ∂y ∂F ∂F ∂yT = atau = ∂x ∂yT ∂x ∂x ∂y ∂x Contoh 2.22. Misalkan X, Y dan β adalah matriks-matriks sedemikian sehingga Q = (Y − Xβ)T (Y − Xβ)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
adalah suatu bentuk kuadrat (matriks 1 × 1). Tentukan 131 dari 490
1. ∂Q/∂β 2. ∂ 2 Q/ (∂β T ∂β)
Cari Halaman
Jawab: Q = (Y − Xβ)T (Y − Xβ) = YT − β T XT (Y − Xβ) = Y T Y − β T XT Y − β T XT Y
Kembali
T
+ β T XT Xβ
Layar Penuh
Tutup
Keluar
mengingat β T XT Y adalah matriks 1×1, maka identik dengan trasposnya dan persamaan di atas menjadi Q = YT Y − 2β T XT Y + β T XT Xβ. Maka
FMIPA-UNEJ
Daftar Isi
∂Q = 0 − 2XT Y + 2XT Xβ ∂β = 2 XT Xβ − XT Y = −2 XT Y − XT Xβ
Judul
JJ J
I II
= −2XT (Y − Xβ) , dan ∂ 2Q = 2XT X. ∂β T ∂β
132 dari 490
Cari Halaman
Contoh 2.23. Misalkan X, Y dan β adalah matriks-matriks sedemikian sehingga Q = (Y − Xβ)T V−1 (Y − Xβ) adalah suatu bentuk kuadrat (matriks 1×1), dengan V adalah matriks simetrik.
Kembali
Layar Penuh
Tutup
Keluar
Tunjukkan bahwa ∂Q = −2XT V−1 (Y − Xβ) , dan ∂β ∂ 2Q = 2XT V−1 X. T ∂β ∂β
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
133 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 2.1: Fungsi R terkait matriks No perintah R Keterangan 1 matrix(c,b,k) menyusun matriks berordo b × k 2 diag(M) menyusun matriks diagonal, atau mengambildiagonal dari matriks bujur sangkar 3 t(M) transpos matriks M 4 A*B perkalian unsur-unsur pada baris dan kolom yang bersesuaian 5 A%*%B perkalian dua matriks yang konformabel 6 solve(M) menghitung inverse matriks M
2.6.
Aplikasi R untuk Operasi Matriks
Untuk aplikasi R tentang matriks dan operasinya, selain menggunakan beberapa fungsi yang telah didefinisikan secara internal, pembaca dapat juga mencari paket/library yang berkaitan dengan matriks. Beberapafungsi R terkait matriks diberikan pada Tabel 2.1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
134 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.6.1.
Mendefinisikan matriks
Matriks dapat didefinisikan dengan beberapa cara yaitu: FMIPA-UNEJ
1. memberikan data elemen matriks (c(a11, a21, a31, ..., a21, a22, ...) yang selanjutnya disusun dalam bentuk baris dan kolom. Ingat bahwa R akan melengkapi seluruh baris kolom 1 baru melengkapi kolom 2 dan seterusnya.
Daftar Isi
Judul
>x<-seq(1,10,1) >xmat<-matrix(x,2,5) >ymat<-matrix(x,5,2) >xmat [,1] [,2] [,3] [,4] [,5] [1,] 1 3 5 7 9 [2,] 2 4 6 8 10 > ymat [,1] [,2] [1,] 1 6 [2,] 2 7
JJ
J
I
135 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
II
[3,] [4,] [5,]
3 8 4 9 5 10 FMIPA-UNEJ
2. menjadikan matriks data yang sudah tersusun dalam bentuk baris dan kolom dengan perintah as.matrix(). Untuk matriks berukuran besar, mungkin tidak praktis mencetak seluruh elemennya, tetapi kita bisa memeriksa dimensi/ordonya dengan dim(). Pada contoh berikut data kecepatan dan jarak tempuh mobil yang berupa tabel dengan 50 baris dan 2 kolom didefinisikan menjadi matriks berordo 50 ×2. >data(cars) >x<-as.matrix(cars) >dim(x) [1] 50 2 >amat<-x%*%t(x) >bmat<-t(x)%*%x
Daftar Isi
Judul
JJ J
I II
136 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
>dim(amat) [1] 50 50 >dim(bmat) [1] 2 2 3. beberapa matriks didefinisikan secara khusus diantaranya adalah (a) matriks dengan elemen yang sama, misalnya k dengan ordo m × n. >matrix(0,2,3) [,1] [,2] [,3] [1,] 0 0 0 [2,] 0 0 0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
137 dari 490
Cari Halaman
>matrix(1,2,3) [,1] [,2] [,3] [1,] 1 1 1 [2,] 1 1 1
Kembali
Layar Penuh
Tutup
Keluar
>matrix(5,2,3) [,1] [,2] [,3] [1,] 5 5 5 [2,] 5 5 5
FMIPA-UNEJ
Daftar Isi
(b) matriks diagonal atau matriks identitas. Judul
> diag(1,3) [,1] [,2] [,3] [1,] 1 0 0 [2,] 0 1 0 [3,] 0 0 1 > diag(2,3) [,1] [,2] [,3] [1,] 2 0 0 [2,] 0 2 0 [3,] 0 0 2 >diag(c(1,2,3,4,5))
JJ J
I II
138 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[,1] [,2] [,3] [1,] 1 0 0 0 [2,] 0 2 0 0 [3,] 0 0 3 0 [4,] 0 0 0 4 [5,] 0 0 0 0
[,4] [,5] 0 0 0 0 5
FMIPA-UNEJ
Daftar Isi
Sebaliknya jika diag() dilakukan pada matrik bujur sangkar, maka fungsi ini akan mengekstrak diagonal matriks tersebut. > diag(bmat) speed dist 13228 124903
2.6.2.
Operasi Matriks dengan R
Beberapa operasi matriks yang dapat dilakukan yang terkait dengan kebutuhan statistika diantaranya adalah perkalian matriks, determinan ((det()) invers dan transpose matriks.
Judul
JJ
J
I
139 dari 490
Cari Halaman
Kembali
Layar Penuh
xmat%*%ymat Tutup
Keluar
II
[,1] [,2] [1,] 95 220 [2,] 110 260 FMIPA-UNEJ
> ymat%*%xmat [,1] [,2] [,3] [,4] [,5] [1,] 13 27 41 55 69 [2,] 16 34 52 70 88 [3,] 19 41 63 85 107 [4,] 22 48 74 100 126 [5,] 25 55 85 115 145 >det(xmat%*%ymat) [1] 500
Daftar Isi
Judul
JJ J
I II
140 dari 490
Cari Halaman
> solve(xmat%*%ymat) [,1] [,2] [1,] 0.52 -0.44 [2,] -0.22 0.19
Kembali
Layar Penuh
Tutup
Keluar
> det(ymat%*%xmat) [1] 0 FMIPA-UNEJ
> solve(ymat%*%xmat) #tes walau kita tahu det=0. Error in ... system is exactly singular
Daftar Isi
Untukmatriks yang berordo sama, ada kalanya diperlukan hasil perkalian dari unsur-unsur seletak. Pada R perkalian ini dinotasikan dengan A*B. Berikut adalah contoh perkalian tersebut. > A.mat<-matrix(c(2,3,4,1),2,2) > B.mat<-matrix(c(1,3,2,5),2,2) > A.mat [,1] [,2] [1,] 2 4 [2,] 3 1 > B.mat [,1] [,2] [1,] 1 2 [2,] 3 5
Judul
JJ
J
I
141 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
II
> A.mat*B.mat [,1] [,2] [1,] 2 8 [2,] 9 5
FMIPA-UNEJ
Daftar Isi
> B.mat*A.mat [,1] [,2] [1,] 2 8 [2,] 9 5
Judul
JJ
Jadi perkalian tersebut di atas bersifat komutatif (A* B=B*A). Akan tetapi, tidak demikian halnya dengan perkalian umum matriks, seperti pada contoh berikut, yang pada umumnya A%*% B 6= B%*% A
J
I
142 dari 490
Cari Halaman
> B.mat%*%A.mat [,1] [,2] [1,] 8 6 [2,] 21 17
Kembali
Layar Penuh
Tutup
Keluar
II
> A.mat%*%B.mat [,1] [,2] [1,] 14 24 [2,] 6 11 Berikut adalah matriks pada Contoh 2.15 yang dihitung dengan
FMIPA-UNEJ
Daftar Isi
R. Judul
> A<-matrix(c(1,-1,2,2),2,2) JJ J
> print(A) [,1] [,2] [1,] 1 2 [2,] -1 2
I II
143 dari 490
Cari Halaman
> solve(A) [,1] [,2] [1,] 0.50 -0.50 [2,] 0.25 0.25
Kembali
Layar Penuh
Tutup
Keluar
2.7.
Bacaan Lebih Lanjut
Referensi umum mengenai matriks dapat dijumpai pada buku-buku teks tentang matriks atau aljabar linier. Namun tidak banyak referensi yang membahas turunan matriks/ vektor terutama yang terkait dengan statistika. Pembahasan dalam bab ini, terutama mengenai aplikasi matriks dalam statistika, dapat dijumpai pada Timm [36, Bab 1], Searle [32], Harville [13], dan Neter et al. [31].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
144 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.8.
Ringkasan
Beberapa halpenting terkait matriks perlu dipahamidenganbaik diantaraya seperti berikut ini. 1. Matriks adalah kumpulan unsur yang disusun dalam baris dan kolum sehingga membentuk persegi panjang.
FMIPA-UNEJ
Daftar Isi
Judul
2. Operasi matriks ada yang bersifat uner (negatif dan transpos) dan bersifat biner(penjumlahan dan perkalian). 3. Matriks yang dapat dilakukan operasi tertentu dikatakan konformabel untuk operasi tersebut. 4. Operasi penjumlahan bersifat asosiatif, memiliki identitas 0, memiliki invers, dan komutatif.
JJ J
I II
145 dari 490
Cari Halaman
Kembali
5. Operasi perkalian secara umum memehuhi sifat asosiatif, matriks bujur sangkar memiliki identitas, beberapa diantaranya memiliki invers.
Layar Penuh
Tutup
Keluar
6. Suatu kolom dari matriks A dikatakan bergantung linier dengan kolom-kolom lainnya jika dia dapat dinyatakan sebagai kombinasi linier dari kolom-kolom lainnya tersebut. FMIPA-UNEJ
7. suatu matriks bujur sangkar dikatakan memiliki rank penuh jika semua kolomnya bebas(tidak bergantung) linier dengan kolom lainnya. 8. Matriks bujursangkar yang memiliki invers disebut matriks nonsinguler, matriks ini memiliki rank penuh dan determinan tidak nol. 9. Bentuk yT Ay dengan y matriks peubah, dan A matriks konstanta, disebut matriks bentuk kuadrat.
Daftar Isi
Judul
JJ J
I II
146 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.9.
Latihan Soal-soal
Kerjakan soal-soal berikut secara sendiri atau berkelompok. 1. Sebutkan definisi matriks berikut dan beri masing- masing satu (1) contoh.
FMIPA-UNEJ
Daftar Isi
(a) Matriks diagonal (b) Matriks skalar
Judul
(c) Matriks simetrik (d) Matriks nonsinguler. 2. Buatlah dua buah matriks (A, B), masing- masing berordo 2 × 2 , selanjutnya hitung (a) AB
JJ J
I II
147 dari 490
Cari Halaman
(b) BA (c) A−1 3. Selidiki apakah matriks-matriks berikut mempunyai rank kolom lengkap atau tidak.
Kembali
Layar Penuh
Tutup
Keluar
1 3 (a) A = 2 5 6 1 5 (b) B = 2 6 3 3 1 (c) C = 5 6 2
2 4 3 6 4 1 5 3 2 −1
FMIPA-UNEJ
2 4 1 5 3 0 4 1 2 2 −1 −4 3 6 0 3 6 3 2 4 1 5 3 0 2 −1 4 4 1 2
3 1 0 3 5
Daftar Isi
Judul
JJ J
−1 1 1 5 10
I II
148 dari 490
Cari Halaman
Kembali
4. Diketahui
1 2 4 A = 2 3 6 4 6 1
Layar Penuh
Tutup
Keluar
dan x x = y z
FMIPA-UNEJ
Tentukan Daftar Isi
(a) Q = XT AX ∂Q (b) ∂x ∂ 2Q (c) ∂xT ∂x
Judul
JJ J
baik dengan cara menurunkan unsur-unsurnya maupun dengan cara keseluruhan dengan cara matriks. 5. Diketahui 3 2 4 A = 2 3 5 . 4 6 1
I II
149 dari 490
Cari Halaman
Kembali
Definisikan A pada R, selanjutnya tentukan: Layar Penuh
(a) AT Tutup
Keluar
(b) AT A (c) AAT (d) AAT
−1
(e) AT A
−1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
150 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
BAB
3
Daftar Isi
Judul
MODEL LINIER KLASIK JJ J
I II
151 dari 490
Regresi linier dengan respon bersifat kontinu merupakan bentuk pemodelan statistika yang paling sederhana dan model ini telah dipergunakan selama beberapa dekade. Pada bab ini akan dibahas pemodelan statistika dengan respon kontinu berdistribusi normal.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi Pembaca diharapkan memahami prinsip model linier normal atau model linier klasik, merumuskan model, mengestimasi parameter dan melakukan uji inferensi, terutama dengan menggunakan paket Statistika R.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
152 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi 1. Bentuk dan Asumsi 2. Estimasi parameter 3. Uji inferensial
FMIPA-UNEJ
Daftar Isi
4. Pendekatan matriks untuk model linier peubah ganda Judul
5. Model linier dengan peubah kualitatif 6. Ilustrasi dengan R
JJ J
I II
153 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.1.
Bentuk dan Asumsi
Misalkan hubungan antara peubah respon (Yi ) dengan peubah tetap (Xi ) untuk subjek i = 1, 2, ...n, ditentukan oleh Y1 = β0 + β1 X1 + 1 .. .. .. . . . (3.1) Yi = β0 + β1 Xi + i .. .. .. . . . Yn = β0 + β1 Xn + n
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
dengan: 1. Xi adalah peubah tetap yang tidak bersifat acak (lebih lanjut diasumsikan Xi diukur tanpa kesalahan); 2. i , yaitu komponen kesalahannya, adalah berdistribusi identik dan independen normal dengan nilai-tengah 0 dan varian konstan (misalnya σ 2 ); 3. kesalahan individu satu dengan lainnya saling bebas, yaitu untuk i 6= i0 , maka i ||i0 atau korelasi i dengan i0 adalah 0.
154 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dari asumsi dapat ditentukan bahwa ekspektasi dari setiap respon adalah E [Yi ] = β0 + β1 Xi (3.2) FMIPA-UNEJ
yang merupakan sebuah garis lurus yang kita sebut garis regresi Populasi. Sedangkan sebaran setiap pasangan (Xi , Yi ) akan berada pada atau sekitar garis tersebut sesuai dengan besarnya i .
Daftar Isi
Judul
JJ J
I II
155 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.2.
Estimasi Parameter
Dalam kenyataan, kita hanya memiliki pasangan-pasangan data (Xi , Yi ) untuk i = 1, 2, · · · , n. Dari data yang kita miliki kita ingin mengestimasi regesi populasi maupun simpangan sebaran datanya. Maka parameter yang menjadi kepentingan utama dalam regresi sederhana β0 di atas adalah komponen dari koefisien regresi β = . Parameter β1 lain yang juga perlu diestimasi adalah komponen ragam σ 2 . Sebagaimana telah disebutkan sebelumnya ada dua metode yang akan digunakan dalam mengestimasi parameter yaitu metode kuadrat terkecil dan metode kecenderungan (likelihood) maksimum.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
156 dari 490
3.2.1.
Estimasi dengan Metode Kuadrat Terkecil
Seperti telah diuraikan pada Bab 1, bahwa dengan metode kuadrat terkecil, secara geometris kita mencari garis sedemikian sehingga kesalahan (selisih ordinat titik terhadap garis) menjadi minimum. Untuk mengakomodasi tanda positif dan negatif, maka yang diminimumkan adalah jumlah kuadrat selisih ordinat tadi. Untuk mengestimasi pa-
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
rameter dengan menggunakan metode kuadrat terkecil maka ditempun langkah-langkah berikut ini. 1. Karena yang akan diminimumkan adalah kuadrat galat, maka langkah pertama yang harus dilakukan adalah mengubah model linier menjadi eksplisit terhadap galat. Dari bentuk model pada persamaan (3.1), diperoleh rumusan galat i = Yi − (β0 + β1 Xi )
(3.3)
2. Mengkuadratkan kesalahan yang diperoleh serta menjumlahkannya untuk seluruh pasangan data. Dari bentuk tersebut diperoleh bentuk jumlah kuadrat kesalahan sebagai berikut " #2 n n n 1 X X X X Q= 2i = [Yi − (β0 + β1 Xi )]2 = Yi − βj Xij i=1
i]1
i=1
j=0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
157 dari 490
Cari Halaman
(3.4) Dalam hal ini Xi0 = 1 dan Xi1 = Xi . Kembali
3. Menurunkan bentuk kuadrat yang diperoleh terhadap parameter yang menjadi kepentingan. Estimasi dengan metode kuadrat terkecil diproses dengan mencari minimum Q terhadap βj .
Layar Penuh
Tutup
Keluar
Minimum dari Q terhadap diperoleh dengan mencari turunan pertama maupun ke dua FMIPA-UNEJ
n
X ∂Q = −2 [Yi − (β0 + β1 Xi )] ∂β0 i=1 ∂Q = −2 ∂β1
n X
Daftar Isi
[Yi − (β0 + β1 Xi )] Xi Judul
i=1
JJ J
4. Menyusun persamaan normal yang diperoleh dari sistem persamaan ∂Q/∂βj = 0. Dari hasil sebelumnya diperoleh persamaan normal
I II
158 dari 490
Cari Halaman
Pn [Yi − (β0 + β1 Xi )] =0 i=1 Pn . i=1 [Yi − (β0 + β1 Xi )] Xi = 0
(3.5) Kembali
Layar Penuh
Persamaan normal di atas selanjutnya dapat disederhanakan Tutup
Keluar
menjadi
n X
Yi − nβ0 − β1
i=1 n X i=1
Xi Yi − β0
n X
Xi − β1
i=1
n X i=1 n X
FMIPA-UNEJ
Xi = 0
(3.6a) Daftar Isi
Xi2
=0
(3.6b)
i=1 Judul
JJ J
I II
5. Dari persamaan normal (3.6a) di atas diperoleh 159 dari 490
n
n
1X 1X Yi − β1 Xi βˆ0 = n i=1 n i=1 ¯ = Y¯ − β1 X
(3.7a) (3.7b)
Cari Halaman
Kembali
Layar Penuh
Hasil persamaan (3.7) ini selanjutnya disubstitusikan pada perTutup
Keluar
samaan normal (3.6b) sehingga diperoleh: P P P Xi Yi X Y − i i n βˆ1 = P P 2 Xi2 − ( nXi ) P P P n ni=1 Xi Yi − ( ni=1 Xi ) ( ni=1 Yi ) = P P n Xi2 − ( Xi )2 P ¯ P Yi X i Yi − X = P . ¯ 2 X2 − n X
(3.8a) FMIPA-UNEJ
(3.8b) (3.8c)
Daftar Isi
Judul
i
Mengingat bahwa ¯ 2 , maka nX
P
¯ Xi − X
¯ Yi (Xi − X) βˆ1 = P 2 ¯ Xi − X
2
=
P
Xi2 −
P ¯2 P 2 X = Xi −
JJ J
I II
160 dari 490
P
(3.8d)
Sebagaimana telah disampaikan bahwa metode kuadrat terkecil belum memanfaatkan informasi distribusi dari i . Oleh karena itu apabila σ 2 tidak diketahui, tidak ada cara khusus dengan metode kuadrat terkecil untuk mengestimasi σ 2 . Namun, σ 2 biasa diestimasi dari
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
rata-rata kuadrat deviasi data terhadap garis regresi yang diperoleh dari βˆj . Dalam hal ini derajat kebebasan yang dimiliki oleh deviasi ini adalah n − k dengan k adalah banyaknya penduga βj . Jadi untuk model dengan dua parameter β0 dan β1 , maka
FMIPA-UNEJ
n
σb2 = s2e =
i2 1 Xh Yi − (βˆ0 + βˆ1 Xi ) n − 2 i=1
(3.9)
Daftar Isi
Judul
3.2.2.
Estimasi dengan Metode Likelihood Maksimum
Sesuai dengan prinsip model linier normal, maka setiap peubah respon Yi merupakan sampel dari peubah acak yang berdistribusi normal dan saling independen dengan nilai-tengah E(Yi ) = β0 + β1 Xi dan ragam σ 2 , yaitu Yi ∼ N (E(Yi ), σ 2 ). Dengan demikian kita peroleh seperti berikut ini. 1. Likelihood Yi adalah
JJ J
I II
161 dari 490
Cari Halaman
Kembali
"
1 1 Li = √ exp − 2 σ 2π
Yi − β0 − β1 Xi σ
2 # .
Layar Penuh
Tutup
Keluar
2. Likelihood dari Y = (Y1 , Y2 , · · · , Yi , · · · , Yn )T yang komponennya saling bebas adalah FMIPA-UNEJ
L=
n Y
Li
Daftar Isi
i=1
1 = √ σ 2π
n
"
n
1X exp − 2 i=1
Yi − β0 − β1 Xi σ
2 # .
Judul
JJ J
Log-likelihood l = e log L = ln L, selanjutnya dalam banyak buku teks statistika hanya ditulis log L, adalah
I II
162 dari 490
Cari Halaman
√ 1 l = −n log σ 2π − 2
n X i=1 n X
n 1 = − log 2πσ 2 − 2 2 2σ
Yi − β0 − β1 Xi σ
2
(Yi − β0 − β1 Xi )2 .
Kembali
Layar Penuh
i=1 Tutup
Keluar
Selanjutnya turunan l terhadap β0 , β1 dan σ 2 diperoleh sebagai berikut n
X ∂l 1 = − 2 (2)(−1) (Yi − β0 − β1 Xi ) ∂β0 2σ i=1 n 1 X = 2 (Yi − β0 − β1 Xi ) σ i=1 n
X ∂l 1 = − 2 (2)(−1) (Yi − β0 − β1 Xi ) Xi ∂β1 2σ i=1 n 1 X ∂l = 2 (Yi − β0 − β1 Xi ) Xi ∂β1 σ i=1 n ∂l n 1 X =− 2 + 4 (Yi − β0 − β1 Xi )2 . 2 ∂σ 2σ 2σ i=1
Dari persamaan di atas diperoleh persamaan normal untuk β0 dan β1 identik dengan persamaan normal (3.5). Selanjutnya dari ∂l/∂σ 2 = 0 diperoleh n X 2 −nσ + (Yi − β0 − β1 Xi )2 = 0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
163 dari 490
Cari Halaman
Kembali
Layar Penuh
i=1 Tutup
Keluar
sehingga penduga kemungkinan maksimum untuk σ 2 adalah n
1X σb2 = (Yi − β0 − β1 Xi )2 . n i=1
FMIPA-UNEJ
Sebenarnya estimasi σ 2 di atas berlaku untuk kondisi β0 , β1 atau µ yang diketahui. Jika tidak diketahui, maka penduga di atas akan menjadi bias. Untuk menghilangkan bias maka pembaginya (derajat kebebasannya) harus dikurangi sebesar banyaknya parameter yang harus diestimasi sebelumnya. Dalam kasus model sederhana yang kita bahas, banyaknya parameter ada 2 yaitu (β0 , β1 ). Dengan demikian derajat kebebasannya menjadi n − 2 dan bentuk penduga σ untuk penduga llikelihood seteleh disesuaikan manjadi
Daftar Isi
Judul
JJ J
I II
164 dari 490
n
σb2 =
2 1 X Yi − βˆ0 − βˆ1 Xi n − 2 i=1
(3.10)
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.3.
Uji Inferensial dari βˆj
Sebagaimana dijelaskan dalam langkah-langkah pemodelan stokastik, bahwa besaran yang diperoleh dari penyelesaian model, yang berupa penduga, harus diuji secara statistik. Untuk keperluan ini, perlu diketahui distribusi dari penduga yang diperoleh.
FMIPA-UNEJ
Daftar Isi
Judul
3.3.1.
Distribusi βˆj JJ J
Setelah memperoleh estimasi dari parameter βj , maka selanjutya kita perlu memperoleh sifat sebaran dari penduga- penduga tersebut. Dapat ditunjukkan (dianjurkan untuk membuktikan sendiri) bahwa pendugapenduga yang diperoleh adalah penduga tak bias dalam arti h i h i E βˆ0 = β0 dan E βˆ1 = β1 . Sedangkan untuk ragam βj diperoleh hasil yang berbeda untuk kasus σ 2 diketahui dan σ 2 tidak diketahui.
I II
165 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Distribusi βˆj bila σ 2 diketahui Ragam dari penduga-penduga βˆj dapat diturunkan dengan menggunakan prinsip bahwa: 1. untuk suatu konstanta c, maka Var(cY ) = c2 Var (Y ); P 2. Bahwa Yi dan Yi0 adalah saling bebas karenanya Var[ Yi ]] = P [Var(Yi )] ; 3. Var(Yi ) = σ 2 , sedang komponen yang lain berfungsi sebagai peubah tidak acak sehingga tidak memiliki ragam dan dalam konteks ini dapat diaggap sebagai konstanta c. Dari bentuk penduga βˆ0 , seperti pada persamaan (3.7) dan βˆ1 pada persamaan (3.8), dapat lihat bahwa βˆj merupakan kombinasi linier dari Yi yang mempunyai ragam σ 2 . Dari kenyataan ini dapat dihitung ragam βˆj seperti berikut ini. Hasil 3.1. Jika σ 2 diketahui, maka ragam dari penduga βˆ0 dan βˆ1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
166 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
masing masing adalah: ¯2 1 X 2 ˆ Var(β0 ) = +P ¯ 2 σ n (Xi − X) σ2 Var(βˆ1 ) = P ¯ 2 (Xi − X)
(3.11) FMIPA-UNEJ
(3.12)
Kita lihat bahwa sesungguhnya penduga βˆj merupakan kombinasi linier dari Yi yang berdistribusi normal. Oleh karena itu jika σ 2 diketahui maka masing-masing penduga βj berdistribusi normal dengan ragam seperti pada Hasil 3.1. Dengan demikian bisa kita simpulkan hasil-hasil berikut Hasil 3.2. Jika σ 2 diketahui dan var (βˆj ) dihitung seperti pada Hasil 3.1, maka βˆ − βj qj ∼ N (0, 1) (3.13) var(βˆj )
Daftar Isi
Judul
JJ J
I II
167 dari 490
Cari Halaman
Kembali
Layar Penuh
dengan N (0, 1) adalah distribusi Normal Baku. Tutup
Keluar
Distribusi βˆj bila σ 2 tidak diketahui Dalam kenyataannya, σ 2 lebih sering tidak diketahui dan harus diestimasi dari data yang ada seperti yang telah dilakukan sebelumnya yaitu n 2 1 X 2 2 b Yi − βˆ0 − βˆ1 Xi se = σ = n − 2 i=1 Hasil 3.3. Apabila σ 2 tidak lagi diketahui tetapi diganti dengan σˆ2 = s2e , maka var(βˆj ) dinotasikan dengan s2 (βˆj ); j = 0, 1 menjadi ¯2 1 X 2 ˆ 2 s (β0 ) = (3.14a) +P ¯ 2 se n (Xi − X) " # P 1 (1/n Xi )2 2 (3.14b) +P 2 = P 2 se , n Xi − 1/n ( Xi )
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
168 dari 490
Cari Halaman
dan s2e ¯ 2 (Xi − X) s2e =P 2 . P Xi − 1/n ( Xi )2
s2 (βˆ1 ) = P
(3.15a)
Kembali
(3.15b)
Layar Penuh
Tutup
Keluar
Hasil 3.4. Apabila σ 2 tidak lagi diketahui tetapi diganti dengan σˆ2 = s2e , dan var(βˆj ) diganti dengan s2 (βˆj ); j = 0, 1, terutatama jika ukuran sampel tidak cukup besar, maka βˆ − βj βˆj − βj qj = ∼ tn−2 , s(βˆj ) s2 (βˆj )
FMIPA-UNEJ
(3.16)
Hasil di atas dapat diperluas untuk banyaknya parameter lebih dari dua misalnya k. Jika ukuran sampel cukup besar, maka sesuai sifat distribusi t, distribusi t akan mendekati N(0,1). Dengan demikian distribusinya identik dengan sebelumnya, ketika σ 2 diketahui.
3.3.2.
Estimasi selang dari βj
Sesuai dengan distribusi dari βˆj , maka estimasi selang diperoleh dengan melihat nilai t atau z yang membatasi prosentase atau luas daerah dari kurva fungsi kepadatannya. Pada umumnya kita menghitung estimasi selang yang simetrik. Hasil 3.5. Penduga selang βj untuk tarap kepercayaan (1 − α) × 100% atau tarap signifikansi α×100%, jika σ diketahui atau n cukup besar
Daftar Isi
Judul
JJ J
I II
169 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah βˆj − zα/2
q q ˆ ˆ var(βj ) ≤ βj ≤ βj + zα/2 var(βˆj )
(3.17)
Hasil 3.6. Penduga selang βj untuk tarap kepercayaan (1−α)×100%) atau tarap signifikansi α × 100%, dinotasikan I.K (1 − α) × 100% jika σ tidak diketahui dan n kecil adalah βˆj − tα/2,n−2 s(βˆj ) ≤ βj ≤ βˆj + tα/2,n−2 s(βˆj )
FMIPA-UNEJ
Daftar Isi
(3.18) Judul
3.3.3.
Uji Hipotesis
Selain menghitung penduga interval (estimasi interval/selang keyakinan) dari parameter regresi βj , sering juga dilakukan uji hipotesis untuk mengetahui apakah koefisien regresi populasi dianggap signifikan atau tidak. Dalam statistika dua macam hipotesis yang biasanya diuji, yaitu hipotesis nul (H0 ) dan hipotesis alternatif (HA ), untuk parameter βj , dengan j = 0, 1, 2, · · · , p. H0 : βj = 0; yaitu βj tidak signifikan HA : βj 6= 0; yaitu βj signifikan Adapun kriteria penerimaan atau penolakan H0 dapat dilakukan dengan beberapa cara yaitu
JJ J
I II
170 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. melihat I.K (1 − α) × 100% dari βj yaitu 0 ∈ I.K. : 0 6∈ I.K. :
H0 diterima H0 ditolak
FMIPA-UNEJ
2. dengan membandingkan nilai statistik yang diperoleh, yaitu th =
βˆj dengan tα/2,n−k s(βˆj )
Daftar Isi
Judul
dan dengan kriteria th < tα/2,n−k th ≥ tα/2,n−k
: H0 diterima : H0 ditolak
3. Dengan menghitung nilai probabilitas p, atau Nilai p yang didefinisikan sebagai p = 2P (T > th ); dengan catatan T ∼ tn−k Selanjutnya kriteria penerimaan hipotesis adalah p > 5% 1% < p ≤ 5% p ≤ 1%
: H0 diterima atau βj tidak signifikan : H0 ditolak dengan βj signifikan : H0 ditolak dengan βj sangat signifikan
JJ J
I II
171 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jika βj tidak signifikan atau dapat dianggap 0, berarti tidak ada hubungan atau pengaruh signifikan Xj terhadap Y . Dengan kata lain, tidak ada kontribusi signifikan dari peubah Xj terhadap model yang diperiksa.
3.3.4.
Koefisien Determinasi R2
Daftar Isi
Selain dengan melihat signifikan tidaknya koefisien regresi, baik tidaknya model dapat juga dilihat dari koefisien determinasi, R2 , yang didefinisikan dengan N X
R2 =
(yi − y¯)2 −
i=1
N X
(yi − yˆ)2
i=1 N X
FMIPA-UNEJ
Judul
JJ J
I II
172 dari 490
.
(yi − y¯)2
Cari Halaman
i=1
(Lihat Mendenhall [27]). Jadi R2 ekuivalen dengan rasio penurunan jumlah kuadrat dari model yang digunakan terhadap jumlah kuadrat deviasi terhadap rata-rata yˆ. Semakin besar R2 berarti semakin kecil simpangan data terhadap garis regresi model. Secara ekstrim R2 = 1
Kembali
Layar Penuh
Tutup
Keluar
menunjukkan bahwa simpangan nilai observasi dengan nilai estimasi sama dengan 0 dan model menjadi sempurna yaitu tidak ada data yang menyimpang dari (berada di luar) garis regresi. Dengan kata lain semakin besar R2 , semakin kecil selisih nilai observasi dengan nilai rata-rata regresi yang berarti semakin besar manfaat garis regresi dalam menjelaskan hubungan antara prediktor dan respon. Contoh 3.1. Misalkan data untuk 10 pasangan (X, Y ) ditunjukkan oleh tabel berikut. No X Y 1 10 15 2 12 18 3 10 20 4 15 25 5 13 20 6 10 12 7 14 25 8 11 20 9 12 22 10 10 15
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
173 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dari data di atas kita akan melakukan hal-hal sebagai berikut: 1. menghitung koefisien regresi, beserta standar kesalahannya, antara X dan Y dengan menggunakan metode kuadrat terkecil atau maksimum laikelihood;
FMIPA-UNEJ
Daftar Isi
2. menentukan penduga selang dari koefisien regresi yang diperoleh; 3. menguji hipotesis
Judul
JJ J
ˆ Estimasi parameter regresi β Untuk persoalan ini, karena hanya ada satu macam peubah penjelas X, maka model yang akan kita pakai adalah
I II
174 dari 490
Cari Halaman
Y = β0 + β1 X +
Kembali
Untuk menghitung bj = βˆj secara manual, maka kita perlu melengkapi tabel di atas sebagai berikut:
Layar Penuh
Tutup
Keluar
No 1 2 3 4 5 6 7 8 9 10 Total
X 10 12 10 15 13 10 14 11 12 10 117
Y 15 18 20 25 20 12 25 20 22 15 192
X2 100 144 100 225 169 100 196 121 144 100 1399
XY 150 216 200 375 260 120 350 220 264 150 2305
Y − βˆ0 + βˆ1 X 0,8100 3,2400 16,8100 0,4225 3,0625 15,2100 1,6900 4,6225 4,8400 0,8100 51,5175
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
175 dari 490
Cari Halaman
Kembali
Kolom terakhir sesungguhnya baru diisi setelah kita memperoleh βˆ0 dan βˆ1 . Isianini diperlukan guna menghitung σˆ2 .
Layar Penuh
Tutup
Keluar
Dengan demikian Pn Pn Pn X ) ( X Y − ( n i i i i=1 Yi ) i=1 βˆ1 = P 2 i=1 P 2 n Xi − ( Xi ) 10 × 2305 − 117 × 192 = 10 × 1399 − 1172 = 1, 95. Nilai βˆ1 selanjutnya digunakan untuk menghitung a, yaitu n
FMIPA-UNEJ
Daftar Isi
Judul
n
1X 1X Yi − β1 Xi βˆ0 = n i=1 n i=1 = 192/10 − 1, 95 × 117/10 = 3, 60.
JJ J
I II
176 dari 490
Untuk penduga ragam diperoleh σˆ2 = 51, 5175/8 = 6, 44 atau σ ˆ = 2, 54. Karena rumus akhir yang diperoleh dengan metode likelihood maksimum dan de-ngan metode kuadrat terkecil adalah ekuivalen, maka apabila perhitungan dikerjakan dengan metode likelihood maksimum, akan diperoleh penduga yang sama.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Selanjutnya kita bisa menghitung standar kesalahan dari pendugapenduga di atas. " # P 2 1 (1/n X ) i s2 (βˆ0 ) = +P 2 s2e P n Xi − 1/n ( Xi )2 (1/10‘ × 117)2 = 1/10 + × 6, 44 1399 − 1/10 × 1172 136, 89 = 1/10 + × 6, 44 = 29, 30 1399 − 1368, 9 s(βˆ0 ) = 5, 41. s2 (βˆ1 ) = P
s2e
P Xi2 − 1/n ( Xi )2 6, 44 = = 0, 2140 1399 − 1368, 9 s(βˆ1 ) = 0, 46.
ˆ Penduga selang dari β Setelah mendapat standar kesalahan masing-masing penduga, maka selanjutnya kita dapat menghitung penduga selang dari masing-masing
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
177 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
penduga tersebut untuk selang kepercayaan yang ditentukan, misalnya 95% atau taraf signifikansi (α) 5%. Karena ukuran sampel, 10, tidak cukup besar dan σ 2 tidak diketahui maka kita menggunakan distribusi t8 sebagai distribusi penduga yang kita dapat. Untuk selang simetrik, secara manual kita peroleh nilai t95%/2,8 adalah 2,31. Selang kepercayaan 95% masing-masing penduga kita peroleh sebagai berikut. βˆj − t5%/2,8 × s βˆj ≤ βj ≤ βˆj + t5%/2,8 × s βˆj Setelah memasukkan angka-angka yang didapat sebelumnya maka diperoleh 1. untuk j = 0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
178 dari 490
(3, 60 − 2, 31 × 5, 41) ≤ β0 ≤ (3, 60 + 2, 31 × 5, 41) −8, 90 ≤ β0 ≤ 16, 10 2. Untuk j = 1
Cari Halaman
Kembali
(1, 95 − 2, 31 × 0, 46) ≤ β1 ≤ (3, 60 + 1, 95 × 0, 46) 0.89 ≤ β1 ≤ 3, 01
Layar Penuh
Tutup
Keluar
ˆ Uji hipotesis dari β Untuk uji hipotesis kita menggunakan statistik t0βj
βbj − 0 = √ s/ n 3, 61 − 0 = = 0, 665 5, 41 1, 95 − 0 = 4, 239 = 0, 46
FMIPA-UNEJ
Daftar Isi
untuk βb0 dan untuk βb1
Niilai p untuk masing-masing penduga adalah: p = 0, 26 untuk βb0 dan p = 0, 001 untuk βˆ1 oleh karena itu koefisien regresi signifikan (sangat signifikan) tetapi konstanta tidak signifikan. Hal tersebut sesuai juga dengan kenyataan bahwa 0 ∈ IKβˆ0 tetapi 0 6∈ IKβˆ1 . Analisis dengan R menghasilkan keluaran sebagai berikut (perbedaan pada beberapa desimal disebabkan adanya pembulatan pada perhitungan manual).
Judul
JJ J
I II
179 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.4.
Penggunaan Matriks untuk Regresi Peubah Ganda FMIPA-UNEJ
3.4.1.
Perluasan hasil untuk Regresi Peubah Ganda
Apabila pada model linier ada lebih dari dua koefisien regresi, misalnya βj , j = 0, 1, 2, . . . , p dengan k = (p + 1) > 2, maka model linier (regresi) tersebut disebut regresi berganda. Hasil-hasil yang telah diperoleh sebelumnya dapat digeneralisir dengan mudah untuk kasus berganda(dengan peubah ganda), diantaranya adalah seperti berikut ini.
Judul
JJ J
I II
180 dari 490
1. Penduga σ 2 adalah n k−1 X 1 X 2 2 ˆ se = σ = Yi − βˆj Xij n − k i=1 j=0
2. Kesalahan penduga adalah s(βˆj ) = s2e (XT X)−1
Daftar Isi
√
!2
vjj dengan v ∈ V dan V =
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Distribusi penduga βˆj adalah βˆj − βj ∼ tn−k , s(βˆj ) 4. Selang kepercayaan (1 − α) × 100% untuk βj adalah
FMIPA-UNEJ
Daftar Isi
βˆj − tα/2,n−k s(βˆj ) ≤ βj ≤ βˆj + tα/2,n−k s(βˆj ) Judul
Secara umum, terutama jika parameternya lebih dari 2, maka estimasi parameter lebih praktis dilakukan dengan menggunakan pendekatan matriks. Hubungan peubah pada persamaan (3.1) dapat juga dituliskan dalam bentuk matriks dengan mendefinisikan matriks- matriks berikut Y1 β0 1 Y2 β1 2 1 x12 · · · x1p .. .. .. . 1 x · · · x 22 2p . ; X = . . ; = . Y= ; β = . . Yi βj i .. .. .. .. .. .. .. 1 xn2 · · · xnp . . . Yn βp n
JJ J
I II
181 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Sistim persamaan (3.1) selanjutnya dapat dinyatakan dalam bentuk matriks seperti berikut: Y = Xβ +
(3.19)
FMIPA-UNEJ
dengan dapat dianggap berdistribusi multivariat normal, M V N (Xβ, V). Ketidak saling bergantungan antara komponen dalam vektor kesalahan digambarkan oleh bentuk matriks ragam-koragamnya yang berbentuk matriks skalar seperti pada persamaan (3.20) 2 σ 0 ··· 0 0 σ2 · · · 0 2 V=σ I=. (3.20) .. . . .. . . . . . 0
0
· · · σ2
Apabila data yang dianalisis memiliki ragam seperti di atas, maka datanya disebut berfifat homoskedastik, sebaliknya jika tidak, maka disebut heteroskedastik. Bentuk matriks ragam yang bersifat heteroskedastisitsa dapat dilihat pada persamaan (3.21). Estimasi bentuk matriks juga dapat dilakukan dengan metode kuadrat terkecil dan
Daftar Isi
Judul
JJ J
I II
182 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
kemungkinan maksimum. σ12 0 0 σ2 2 V=. .. .. . 0 0
··· ··· .. .
0 0 .. .
FMIPA-UNEJ
(3.21)
· · · σn2
Daftar Isi
Judul
3.4.2.
Pendekatan Matriks Metode Kuadrat Terkecil
Penggunaan matriks dalam menganalisis model linier dapat dilakukan dengan melihat bentuk umum matriks, selanjutnya menurunkan bentuk matriks yang diperoleh dengan menggunakan prinsip-prinsip diferensial matriks. Langkah-langkah yang ditempuh dalam menurunkan penduga βˆ dengan kuadrat terkecil adalah seperti berikut ini.
JJ J
I II
183 dari 490
Cari Halaman
Kembali
1. mengubah model menjadi eksplisit terhadap matriks kesalahan, yaitu = Y − Xβ
Layar Penuh
Tutup
Keluar
2. membentuk matriks bentuk kuadrat Q = T = (Y − Xβ)T (Y − Xβ) T
T
T
FMIPA-UNEJ
T
T
= Y Y − 2β X Y + β X Xβ
(3.22)
3. mencari turunan pertama dan kedua Q terhadap β (lihat Contoh 2.22 halaman 131). ∂Q = −2XT Y + 2XT Xβ ∂β = −2 XT Y − XT Xβ ∂ 2Q = 2XT X. ∂β T ∂β
Daftar Isi
Judul
(3.23) (3.24)
4. menentukan persamaan iterasi Newton-Raphson atau skoring ˆ = b0 Fisher untuk β, dengan mengambil nilai awal untuk β yaitu −1 T ˆ − XT Y b1 = b0 − XT X X Xβ −1 T b1 = b0 + XT X X (Y − Xb0 ) (3.25)
JJ J
I II
184 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Apabila datanya bersifat heteroskedastik, maka bentuk kuadrat harus dibobot dengan invers matriks ragam-koragam. Metode kuadrat terkecil yang telah dibobot disebut Weighted Least Square-WLS atau Generalized Least Square-GLS. Dengan menggunakan hasil pada Contoh 2.23 halaman 132, maka kita memperoleh persamaan berikut. Q = (Y − Xβ)T V−1 (Y − Xβ) −1 T −1 b1 = b0 + XT V−1 X X V (Y − Xb0 )
(3.26) (3.27)
Untuk distribusi normal sesungguhnya solusi langsung tanpa menggunakan iterasi Newton-Raphson dapat diperoleh dengan mencari solusi −2 XT Y − XT Xβ = 0 atau − 2 XT V−1 Y − XT V−1 Xβ = 0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
185 dari 490
yang menghasilkan ˆ = XT X β
−1
XT Y
(3.28)
XT V−1 Y
(3.29)
Cari Halaman
untuk kondisi homoskedastik dan ˆ = XT V−1 X β
−1
untuk kondisi heteroskedastik. Sebenarnya penyelesaian untuk kasus distribusi normal dapat dilakukan langsung tanpa iterasi. Namun
Kembali
Layar Penuh
Tutup
Keluar
penurunan iterasi diberikan sebagai pendekatan yang berlaku umum. Tanpa iterasi rumus yang diperoleh adalah ˆ = (XT X)−1 XT Yuntuk kasus homoskedastik atau β T
= (X V
−1
−1
TX)
T
X V
−1
Y
(3.30) (3.31)
untuk kasus heteroskedastik.
3.4.3.
FMIPA-UNEJ
Pendekatan Matriks untuk Metode Kemungkinan Maksimum
Hasil yang diperoleh pada sub di atas dapat, khususnya turunan likelihood terhadap β, dapat juga dilakukan secara serempak dengan mengggunakan pendekatan ’multivariat’, dalam arti semua data respon dapat dianggap merupakan satu kesatuan vektor respon dengan multivariat normal dengan nilai-tengah µ = Xβ dan matriks ragamkoragam V = σ 2 I. Fungsi kepadatan probabilitas dari Y yang berdistribusi multivariat normal (MVN) adalah 1 1 T −1 f (Y, µ) = p exp − (Y − µ) V (Y − µ) (3.32) 2 (2π)n |V|
Daftar Isi
Judul
JJ J
I II
186 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk menerapkan metode kemungkinan maksimum dengan pendekatan matriks maka dapat ditempuh langkah-langkah berikut: 1. menganggap Y berdistribusi MVN (Xβ, V) sehingga mempunyai bentuk likelihood 1 1 T −1 L= p exp − (Y − Xβ) V (Y − Xβ) 2 (2π)n |V|
FMIPA-UNEJ
Daftar Isi
Judul
2. menentukan fungsi log-likelihood inti l(β), yaitu JJ J
1 1 l(β) = − (Y − Xβ)T V−1 (Y − Xβ) = − Q 2 2 3. menentukan turunan pertama dan kedua likelihood inti terhadap β, yaitu ∂l(β) 1 ∂Q =− ∂β 2 ∂β ∂ 2 l(β) 1 ∂Q = − 2 ∂β T ∂β ∂β T ∂β
I II
187 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. Sekali pun bentuk turunan pertama dan keduanya sedikit berbeda dengan hasil dari metode kuadrat terkecil, karena perkalian dengan konstanta − 21 , namun bentuk akhir dari persamaan iterasi Newton-Raphsonnya adalah identik, karena invers atau kebalikannya akan saling meniadakan, yaitu −1 1 ∂Q 1 ∂Q b1 = b0 − − − 2 ∂β T ∂β 2 ∂β −1 ∂Q ∂Q = b0 − . T ∂β ∂β ∂β Dengan demikian persamaan di atas akan menghasilkan bentuk iterasi Newton-Raphson yang identik dengan metode kuadrat terkecil, yaitu −1 T −1 b1 = b0 + XT V−1 X X V (Y − Xb0 ) Hasil 3.7. Untuk model linier sederhana dengan V = σ 2 I, jika σ dikeˆ = σ 2 (XT X)−1 . Jadi secara umum dapat dikatakan tahui, maka var(β) bahwa jika σ 2 diketahui, maka ˆ ∼ M V N β, σ 2 XT X −1 β (3.33)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
188 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ˆ meruDari bentuk estimasi di sebelumnya dapat dilihat bahwa β pakan hasil transformasi dari peubah acak Y, dalam hal ini dapat dianggap bahwa ˆ = XT V−1 X −1 XT V−1 (Y) + B. β Dengan menggunakan hasil bahwa var(AY + B) = AVAT , maka h −1 T −1 i h T −1 −1 T −1 iT T −1 ˆ Var(β) = X V X X V V X V X X V h i h −1 T −1 −1 i V V−1 X XT V−1 X = XT V−1 X X V −1 −1 = XT V−1 X = σ 2 XT X . Hasil 3.8. Jika σ 2 tidak diketahui, maka diganti dengan i 1 h T ˆ TY Y Y − βX σˆ2 = s2e = n−k
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
189 dari 490
(3.34) Cari Halaman
Bukti: 1 n−k 1 = n−k
s2e =
h
ˆ T (Y − Xβ) ˆ (Y − Xβ)
h
ˆ T XT Y − Y T Xβ ˆ+β ˆ T XT Xβ ˆ YT Y − β
Kembali
i i
Layar Penuh
Tutup
Keluar
ˆ = XT X Dengan menggunakan hasil bahwa β ˆ T XT Y = YT Xβ, ˆ maka diperoleh taan bahwa β s2e
i 1 h T T ˆ Y Y − βX Y . = n−k
−1
XT Y dan kenya-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
190 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.5.
Interval Keyakinan µ dan Prediksi Y
Ada dua macam prediksi yang bisa dibuat yaitu estimasi nilai-tengah µ ˆ dan prediksi untuk nilai tunggal yˆ pada suatu kombinasi nilai prediktor misalnya xo = (1, x1 , x2 , · · · , xp )T . Perhatikan bahwa y =µ+ ˆ dan var() = σ 2 . Dengan demikian kita memiliki dengan µˆi = x0 T β dua macam ragam yaitu ragam untuk estimasi µ ˆ dan ragam untuk prediksi yˆ yang besarnya dapat ditentukan sebagai berikut: 1. Ragam µ ˆ pada titik x = x0 adalah Vµˆ = σˆ2 x0 T (XT X)−1 x0 2. Ragam yˆi pada titik x = x0 adalah h i −1 Vyˆ = σˆ2 1 + x0 T XT X x0 Selanjutnya interval keyakinan (1−α)×100% pada suatu nilai prediktor x = x0 masing-masing adalah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
191 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ˆ ± tn−k,α/2 µ = x0 T β
p Vµi
untuk prediksi µ dan
FMIPA-UNEJ
ˆ ± tn−k,α/2 y = x0 T β
p V yi
untuk prediksi nilai y. Dengan demikian interval prediksi y selalu lebih lebar dari interval keyakinan nilai-tengah pada setiap kombinasi nilai prediktor. Untuk regresi linier sederhana dengan satu prediktor X, untuk suatu nilai prediktor x0 < x < x1 , interval-interval ini akan membentuk sabuk keyakinan (confident belt) seperti pada Gambar 3.1.
Daftar Isi
Judul
JJ J
I II
192 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
200
Sabuk Keyakinan 95% Prediksi Y dan Mu ●
FMIPA-UNEJ ● ● ●
●
●
●
195
●
Daftar Isi
●
● ●
●
●
● ●
●
y 190
● ●
● ●
JJ J
●
I II
●
● ●
●
193 dari 490
● ●
●
185
●
●
●
●
●
●
●
Y=a+bX
● ●
Judul
●
●
Cari Halaman ●
38.0
38.5
39.0
39.5
40.0
Kembali x
Gambar 3.1: Ilustrasi Garis regresi dan sabuk keyakinan nilai-tengah µ ˆ dan sabuk prediksi yˆ
Layar Penuh
Tutup
Keluar
3.6.
Melaporkan Nilai Probabilitas p
Selain menghitung estimasi interval maupun melakukan uji hipotesis dengan distribusi t maupun z, paket- paket statistik biasa melaporkan nilai probabilitas yang disebut nilai p yaitu luas daerah yang berada dibagian ujung yang dibatasi oleh statistik t∗ . Dengan kata lain p adalah peluang bahwa kesimpulan yang kita peroleh keliru. Untuk hipotesis β = 0, nilai p dapat dihitug dengan p = P (tn−1
βˆ − β ≥ |t∗ |) dengan t∗ = . ˆ S(β)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
Untuk hipotesis β = 0 dan uji dua arah yang simetris maka p = 1 − P (−t∗ ≤ tn−1 ≤ t∗ ) = 2P (tn−1 < −|t∗ |) Dengan demikian semakin kecil nilai p akan semakin signifikan hasilnya dan semakin kuat penolakan H0. Dalam bahasa R perhitungan p dapat dilakukan dengan p<-2*(1-pt(abs(t),df)) p<-2*(pt(-abs(t),df))
atau
194 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 3.9. Penolakan Hipotesis nol (Ho) dengan menggunakan p adalah sebagai berikut: Ho ditolak pada taraf signifikansi alpha(α)(α × 100%) jika dan hanya jika p ≤ (α × 100%) FMIPA-UNEJ
Secara individu, uji signifikansi koefisien βˆj dengan menggunakan nilai p dapat dilakukan sebagai berikut:
Daftar Isi
1. βˆj sangat signifikan jika p ≤ 1%; Judul
2. βˆj signifikan jika 1% < p ≤ 5%; 3. βˆj tidak signifikan jika p > 5%;
JJ J
I II
195 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.7.
Model Linier dengan Variabel Kualitatif
Misalkan beberapa peubah penjelas dalam model linier merupakan peubah kualitatif (kelompok) dengan dua tingkat (misalnya L=Lakilaki dan P=perempuan). Pertanyaan mendasar dari data seperti ini adalah, apakah penyebaran data antara kelompok yang satu (L) berbeda dengan kelompok yang lain (P). Apakah garis regresi penduga data cukup diwakili satu garis atau dua garis yang berbeda. Empat kemungkinan sebaran data jika dipisahkan berdasarkan kelompok diilustrasikan dengan Gambar 3.2. Pada gambar diilustrasikan ada 4 kemungkinan penyebaran datanya yaitu: 1. kedua kelompok menyebar sama sehingga tidak perlu dibedakan antara kelompok satu dengan yang lain sehingga cenderung membentuk satu garis lurus; 2. kedua kelompok menyebar berbeda dengan kecenderungan memiliki kemiringan yang sama tetapi konstanta berbeda sehingga membentuk dua garis lurus sejajar;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
196 dari 490
Cari Halaman
Kembali
Layar Penuh
3. kedua kelompok menyebar berbeda dengan kecenderungan memiTutup
Keluar
liki kemiringan yang berbeda tetapi konstanta sama sehingga membentuk dua berkas garis; 4. kedua kelompok menyebar berbeda dengan kecenderungan memiliki kemiringan maupun konstanta yang berbeda sehingga membentuk dua garis lurus berbeda;
3.7.1.
FMIPA-UNEJ
Daftar Isi
Judul
Variabel Boneka dengan Model Berkonstanta
Untuk menangani data dengan variabel kualitatif, kita dapat menanganinya dengan memperkenalkan varibel boneka (dummy variable). Misalkan g adalah variabel kualitatif dengan gi = L atau gi = P . Kita dapat mendefinisikan vektor D dengan 1 jika gi = L Di = (3.35) 0 untuk yang lain Dengan demikian bentuk model antara Yi dengan variabel-variabel lainnya dapat dituliskan sebagai
JJ J
I II
197 dari 490
Cari Halaman
Kembali
Layar Penuh
Yi = β0 + β1 X1 + β2 Di + i
(3.36) Tutup
Keluar
50 30 10 0
10
15
2
6
8
10
data (x,y) 60
data (x,y)
50 40 20 10 0
o o * o o** * o o o o * * ** ** o
o o * o * ** * * * *
5
10 X
15
o* o* o* ** o* * * * * o o o * o o o o 0
FMIPA-UNEJ
Daftar Isi
Judul 4
X
o o o o o o * o * * * ** *
** * * o o
** * * ** o ** o o o * o* o * o o o * o o* o o
X
o o o o o o
0
* * * * o o * o o o o 0
Y
10 20 30 40 50 60 70
5
30
o
o* o* o*
o* o o o * o * * * o* o o o o*** * o o o * *
Y
40 10
20
30
Y
50
60
o o o* ** o o o* o* o o * *
0*
Y
data (x,y) 70
70
data (x,y)
5
12
14
JJ J
o o o o o o o o ** o o o * * * ** *o * * * *
I II
198 dari 490
Cari Halaman
Kembali
10
15
Layar Penuh
X
Tutup
Gambar 3.2: Sebaran data dilihat dari adanya kelompok atau peubah kualitatif. Pada gambar terlihat empat model penyebaran data untuk satu variabel kualitatif dengan dua kategori (L,P).
Keluar
Jika diteliti lebih jauh, maka model untuk kelompok L dan kelompok P , masing masing adalah: FMIPA-UNEJ
L : Yi = β0 + β1 Xi + β2 + i = (β0 + β2 ) + β1 X1 P : Yi = β0 + β1 X1 + i
(3.37)
Daftar Isi
(3.38)
Dengan demikian pengenalan variabel boneka D di atas menunjukkan: 1. model yang diperiksa adalah model linier paralel yaitu model dengan konstanta berbeda (β0 dan β0 + β2 ) tetapi gradien sama (β1 );
Judul
JJ J
I II
199 dari 490
2. β2 adalah parameter yang menentukan apakah model untuk kedua kelompok perlu dibedakan konstantanya
Cari Halaman
Secara formal uji hipotesis β2 adalah H0 : β2 =0 (menunjukkan model untuk kedua kelompok sama) HA : β2 6= 0 (menunjukkan model untuk kedua kelompok berbeda)
Kembali
Layar Penuh
Tutup
Keluar
Secara geometris model yang dihasilkan jika β2 signifikan dapat diilustrasikan dengan Gambar 3.3. Apabila kita ingin memeriksa apakah selain konstantanya gradiennya juga berbeda, kita perlu memperkenalkan peubah boneka lain yang mewakili adanya interaksi antara peubah X dengan g. Misalkan kita definisikan vektor Dx dengan Dxi = Di ∗ Xi
(3.39)
Dengan demikian bentuk model antara Yi dengan variabel-variabel lainnya dapat dituliskan sebagai Yi = β0 + β1 X1 + β2 Di + β3 Dxi + i
(3.40)
Jika diteliti lebih jauh, maka sekarang model untuk kelompok L dan kelompok P , masing masing adalah:
P : Yi = β0 + β1 X1 + i
Daftar Isi
Judul
JJ J
I II
200 dari 490
Cari Halaman
Kembali
L : Yi = β0 + β1 Xi + β2 + β3 Xi + i = (β0 + β2 ) + (β1 + β3 )X1
FMIPA-UNEJ
(3.41) (3.42)
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
β1 Judul
β1 β2
JJ J
I II
201 dari 490
Cari Halaman
Gambar 3.3: Garis Regresi sejajar dengan selisih konstanta β2 dan gradien sama (β1 )
Kembali
Layar Penuh
Tutup
Keluar
Jadi signifikan tidaknya β2 menentukan perlu tidaknya model dengan konstanta berbeda, sedangkan signifikan tidaknya β3 menentukan perlu tidaknya model dengan gradien berbeda untuk kedua kelompok yang ada. Secara geometris model yang dihasilkan jika β2 signifikan dapat diilustrasikan dengan Gambar 3.4. Di =
1 0
jika gi = L untuk yang lain
(3.43)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
3.7.2.
I II
Variabel Boneka dengan Konstanta tidak Eksplisit
Dalam hal tertentu, kita merlukan model dengan konstanta implisit. Paling tidak ada dua kondisi kenapa model ini bermanfaat yaitu:
202 dari 490
Cari Halaman
1. secara teoritik pada saat nilai peubah penjelas nol, nilai respon juga nol; 2. untuk model dengan peubah kualitatif (kelompok), model ini memudahkan interpretasi konstanta masing- masing kelompok.
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
β1+β3 Judul
β2
β1
JJ J
I II
203 dari 490
Cari Halaman
Gambar 3.4: Garis Regresi berbeda dengan selisih konstanta β2 dan selisih gradien β3
Kembali
Layar Penuh
Tutup
Keluar
Untuk model dengan variebel kualitatif dengan konstanta implisit, definisi peubah boneka harus dibuat secara terpisah untuk masingmasing kelompok seperti berikut: 1. diperlukan k variabel boneka untuk satu peubah kualitatif dengan tingkat kelompok sebanyak k;
FMIPA-UNEJ
Daftar Isi
2. untuk peubah kualitatif g dengan dua tingkat P, L, maka perlu didefinisikan dua peubah boneka misalnya DL dan DP dengan 1 jika gi = L DLi = 0 untuk yang lain 1 jika gi = P DP i = 0 untuk yang lain
Judul
JJ J
I II
204 dari 490
Sedangkan bentuk modelnya akan menjadi Yi = β1 X1 + β2 DLi + +β2 DP i + i
(3.44)
Jika diteliti lebih jauh, maka model untuk kelompok L dan kelompok P , masing- masing adalah:
Cari Halaman
Kembali
L : Yi = β2 + β1 Xi + i P : Yi = β3 + β1 X1 + i
Layar Penuh
Tutup
Keluar
Jadi konstanta untuk kelompok L adalah β2 dan konstanta untuk kelompok P adalah β3 . FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
205 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8.
Ilustrasi Model Linier Normal dengan R
3.8.1.
Simulasi dengan R FMIPA-UNEJ
Untuk lebih memahami konsep-konsep statistika, ilustrasi program komputer dengan meggunakan data simulasi sangat bermanfaat. Untuk keperluan memeriksa sifat-sifat prosedur analisis data yang telah dibicarakan, maka ada beberapa hal yang harus diimplementasikan dalam komputer diantaranya: 1. mensimulasi data yang memenuhi asumsi sebagaimana diharapkan, misalnya Y ∼ N (Xβ, σ 2 ). Ini berarti untuk mensimulasi data kita harus menetapkan X dan β;
Daftar Isi
Judul
JJ J
I II
206 dari 490
ˆ dari data Y baik dengan cara langsung 2. mengestimasi balik β mapun dengan melalui iterasi numerik Newton-Raphson; 3. mengulang-ulang proses 1. dan 2. untuk melihat sifat-sifat penduga βˆ secara umum; 4. mengimplementasikan program yang dibuat untuk data riil. Implementasi data riil dalam buku ini selanjutnya dilakukan de-
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ngan menggunakan library dan dataset yang sudah ada yaitu lm(). Contoh 3.2. Misalkan kita akan mensimulasi data sederhana dengan ukuran n = 60 dan X ∼ N (50, 25) (ingat bahwa berbeda dengan Y , tidak ada keharusan X untuk mengikuti distribusi tertentu). Misalkan pula β = (3, 5)T dan varian kesalahan σ 2 adalah 16, artinya Y ∼ N (µ, σ 2 ) dan µ = Xβ dan kita akan memeriksa model Yi = 3 + 5xi + i
FMIPA-UNEJ
Daftar Isi
Judul
i = 1, . . . , 60 JJ J
I II
Untuk membangkitkan data Y, ada dua cara yang bisa ditempuh.
207 dari 490
1. Sesuai dengan sifat bahwa, jika X ∼ (0, σ 2 ), maka X + C ∼ N (C, σ 2 ). Jadi kita perlu membangkitkan ∼ N (0, σ 2 ) lalu mendefisikan Y = µ +
Cari Halaman
Kembali
n<-60 x<-rnorm(60,50,5) sgm<-4
Layar Penuh
Tutup
Keluar
x<- rnorm(n,0,sgm) eps<-rnorm(0,sgm) mu<-3+5*x ydat<-mu+eps
FMIPA-UNEJ
2. membangkitkan langsung Y ∼ N (µ, σ 2 ) Daftar Isi
ydat<-rnorm(n,mu,sgm) Judul
Selanjutnya dari data yang ada (ydat), kita dapat mengestimasi ˆ Untuk model dengan distribusi normal kita dapat menghibalik β. tungnya dengan dua cara yaitu dengan cara langsung melalui ˆ = XT X −1 XT Y β atau secara umum (yang berlaku untuk semua distribusi) dengan iterasi Newton-Raphson −1 b1 = b0 + XT X (Y − Xb0 )
JJ J
I II
208 dari 490
Cari Halaman
Kembali
Ragam estimator/penduga, untuk kasus σ yang diketahui, dapat dihitung dengan ˆ = σ 2 XT X −1 V ar(β)
Layar Penuh
Tutup
Keluar
Jika σ tidak diketahui, dapat diganti dengan penduganya yaitu: s σ ˆ=
ˆ T (Y − Xβ) ˆ (Y − Xβ) N −k
FMIPA-UNEJ
Daftar Isi
x.mat<-as.matrix(cbin(1,x)) b.hat<-solve(t(x.mat)%*%xmat)%*%t(x.mat)%*%ydat print(b.hat) Keluaran yang diperoleh dari program diatas adalah >print(b.hat) [,1] 2.831853 x 4.760870 print(sgm^2*solve(t(x.mat)%*%x.mat)) x 0.269456174 0.008044395 x 0.008044395 0.023198465
Judul
JJ J
I II
209 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Proses di atas dapat dilakukan berulang-ulang, misalnya 100 kali, selanjutnya dihitung nilai-tengah dan ragam estimator. Hasilya sangat dekat dengan ragam yang diperoleh melalui pendugaan di atas. Dalam contoh berikut hasil estimasi dari 100 kali pendugaan disimpan dalam matriks mh. >var(mh) # varian dari 100 kali pendugaan [,1] [,2] [1,] 0.301722464 0.006733643 [2,] 0.006733643 0.019071798 >mean(mh[,1]) [1] 2.963071 >mean(mh[,2]) [1] 4.985726 Jika diperlukan kita juga dapat membuat grafik penduga dari 100 ulangan simulasi yang masing-masing mengambil sampel berukuran 60 (Gambar 3.5). Pengulangan juga dapat divariasi dengan meningkatkan ukuran sampel pada setiap simulasi. Simulasi ini sangat baik untuk mengilustrasikan hunbungan antara ukuran sampel dan ketelitian pendugaan. Gambaran grafik yang diperoleh apabila dalam setiap
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
210 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pengambilan sampel dilakukan penambahan jumlah sampel seperti pada Gambar 3.6. Pada gambar tersebut terlihat bahwa semakin besar ukuran sampel pendugaan semakin teliti, karena ragam pendugaan semakin mengecil.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
211 dari 490
Cari Halaman
Gambar 3.5: Grafik Penduga βˆ1 = α ˆ dari penarikan sampel 100 kali masing-masing berukuran 60. Nilai parameter sebenarnya adalah α = 3.
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
212 dari 490
Gambar 3.6: Grafik Penduga βˆ1 = α ˆ dari beberapa penarikan sampel dengan ukuran mulai 10 sampai dengan 1000. Nilai parameter sebenarnya adalah α = 3.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8.2.
Menggunakan Fungsi lm()
lm() adalah fungsi yang ada pada R untuk menganalisis data dengan model linier normal. Format perintahnya adalah: lm(formula, data,...) Komponen parameter fungsi lm() dapat djelaskan sebagai berikut ini. 1. formula adalah peubah respon dan peubah- peubah penjelas yang dinyatakan dalam bentuk y~x1+x2+. . .. Jika ingin menggunakan persamaan regresi tanpa konstanta maka pada formula ditulis y~x1+x2-1 atau y~0+x1+x2. Pada bagian ini juga dapat dimasukkan data yang telah ditansformasi misalnya log(y)~x1+x2 dan sejenisnya. 2. data adalah nama data yang akan dianalisis, yaitu yang memuat nama-mana peubah yang dimasukkan pada formula Dari hasil analisis menggunakan fungsi lm(), ada beberapa informasi yang dapat diekstrak dari objek yang dihasilkan diantaranya: ˆ 1. coef(objek) untuk mengekstrak koefisien regresi β.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
213 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. deviance(objek) untuk mengekstrak jumlah kuadrat sisa. 3. formula(objek) untuk mengekstrak rumusan model yang dipergunakan 4. plot(objek) untuk menghasilkan grafik yaitu seperti grafik sisa, grafik fitted value dan beberapa disgnostik. 5. print(objek) untuk mencetak hasil singkat analisis. 6. step(objek) untuk memeriksa model yang paling cocok dengan cara melihat angka (Akaike’s Information Criterion) yang paling kecil(lihat sesi 4.5.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
214 dari 490
7. summary(objek)untuk mencetak lengkap hasil analisis. Untuk mengetahui lebih jauh komponen-komponen yang tersedia dari suatu objek dapat dilakukan dengan >names(objek) Contoh 3.3. Misalkan kita ingin mencari persamaan regresi (model linier) dari peubah kecepatan/speed dan jarak tempuh distance kenda-
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
raan pada data cars.Perintah dan hasil keluaran untuk mengetahui ringkasan data adalah: > data(cars) > summary(cars) speed dist Min. : 4.0 Min. : 2.00 1st Qu.:12.0 1st Qu.: 26.00 Median :15.0 Median : 36.00 Mean :15.4 Mean : 42.98 3rd Qu.:19.0 3rd Qu.: 56.00 Max. :25.0 Max. :120.00
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
215 dari 490
Setelah diketahui nama peubah- peubahnya, selanjutnya kita dapat menggambar diagram pencar (Gambar 3.7) serta menulis perintah model linier seperti berikut: >contoh.lm<-lm(dist~speed,data=cars) >print(summary(contoh.lm)) Call: lm(formula = dist ~ speed, data = cars)
Cari Halaman
Kembali
Layar Penuh
Residuals: Tutup
Keluar
120
DIAGRAM PENCAR SPEED VS. DISTANCE ●
FMIPA-UNEJ
100
●
● ●
80
Daftar Isi ●
● ● ● ● ●
60
dist
●
Judul
● ● ●
●
●
● ● ● ●
●
●
40
● ●
●
●
●
● ●
JJ J
●
● ●
●
I II
●
●
●
●
●
●
20
● ● ● ●
●
● ●
●
216 dari 490
● ●
0
●
5
10
15
20
25
speed
Gambar 3.7: Histogram dengan Kurva Densitas untuk peubah Speed dan Distance pada Data Cars
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Min 1Q Median 3Q Max -29.069 -9.525 -2.272 9.215
43.201
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -17.5791 6.7584 -2.601 0.0123* speed 3.9324 0.4155 9.464 1.49e-12 *** --Signif.codes:0`***'0.001`**'0.01`*'0.05 `.' 0.1` ' 1 Residual standard error: 15.38 on 48 degrees of freedom Multiple R-Squared: 0.6511, Adjusted R-squared: 0.6438 F-statistic: 89.57 on 1 and 48 DF, p-value:1.490e-12
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
217 dari 490
Cari Halaman
Dari hasil yang diperoleh dapat disimpulkan bahwa konstanta α = β0 adalah signifikan (1% < p < 5%) dan koefisien speed adalah sangat signifikan (p < 1%). Untuk mengetahui komponen-komponen yang dapat diekstrak dari objek contoh.lm dapat dilakukan dengan perintah berikut. Se-
Kembali
Layar Penuh
Tutup
Keluar
dangkan untuk memanggil salah satu komponen objek dilakukan dengan NamaObjek$komponen. >names(contoh.lm) [1] "coefficients" "residuals" "effects" "rank" [5] "fitted.values" "assign" "qr" "df.residual" [9] "xlevels" "call" "terms" "model" >contoh.lm$coeff (Intercept) speed -17.579095 3.932409
3.8.3.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
Model dengan Variabel Kualitatif 218 dari 490
Andaikan selain variabel penjelas X data juga mengandung variabel kualitatif G, maka variabel kualitatif ini pun perlu diperiksa apakah berpengaruh pada hubungan variabel X dan Y . Untuk menghadapi data yang mengandung peubah kualitatif, secara umum dapat dilakukan lengkah-langkah berikut ini. 1. Lakukan eksplorasi secara grafis dengan menggambar Diagram Pencar (Scattergram) data, untuk melihat secara intuitif apakah
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
regresi perlu dipisah atau dapat digabung. 2. Analisis data dengan memasukkan peubah kualitatif sesuai dengan indikasi yang ditunjukkan oleh diagram pencar. 3. Lakukan uji signifikansi baik untuk peubah kualitatif maupun kuantitatif Ada beberapa cara (yang biasa disebut formula) untuk memasukkan variabel kualitatif (misalnya grup) pada R seperti diuraikan berikut ini. 1. Y ∼ X ∗ G. Dengan formula ini kita mencoba model paling lengkap yaitu memeriksa kemungkinan bahwa setiap kelompok memiliki model yang berbeda. 2. Y ∼ X + G. Formula ini adalah untuk memeriksa kemungkinan model regresi sejajar (dengan gradien sama tetapi kemungkinan konstanta berbeda). 3. Y ∼ G/X. Formula ini adalah untuk memeriksa signifikansi model masing-masing kelompok dengan memaksa model dengan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
219 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gradien berbeda. Berbeda dengan pendekatan pertama yang lebih melihat perlu tidaknya model dipisah, dengan formula terakhir ini, kita memaksa untuk menggunakan model terpisah dan selanjutnya melihat signifikansi masing, masing model. Model dari ketiga kelompok bisa sama-sama signifikan, tetapi mungkin saja ketiganya dapat digabung menjadi satu. Berikut adalah beberapa contoh dengan berbagai kondisi peubah kualitatif Contoh 3.4. Suatu data yang mengandung peubah kuantitatif X, Y dan peubah kualitatif g sebarannya ditunjukkan oleh Gambar 3.8. Pada Gambar terlihat bahwa data mengandung variabel kualitatif g tetapi kedua subkelompok data terlihat cukup membaur dan tidak perlu dibedakan antara kedua sub kelompok datatersebut. Call: lm(formula = y ~ g * x, data = sim.data.reg) Coefficients: Estimate Std. Error t value Pr(>|t|)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
220 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
g
DIAGRAM PENCAR
L P
220
●
FMIPA-UNEJ
● ●
●
200
●
● ●
180
●
● ●
●
Daftar Isi
●
●
Judul
160
Y
● ● ● ● ●
●
● ●
● ● ●
JJ J
●
140
● ●
●
120
● ●
35
I II
221 dari 490
●
40
45
50
55
60
65
70
Cari Halaman
X
Kembali
Gambar 3.8: Diagram Pencar X dengan Y yang mengandung kelompok yang dapat digabung
Layar Penuh
Tutup
Keluar
(Intercept) 6.10606 0.79364 7.694 2.47e-10 *** g[T.P] -0.34794 1.12238 -0.310 0.758 x 3.88663 0.08370 46.433 < 2e-16 *** g[T.P]:x 0.01706 0.11837 0.144 0.886 --Signif.codes: 0'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Dengan formula di atas (Y ∼ G ∗ X) kita ingin mendapat gambaran perlu tidaknya memisahkan konstanta dan gradien garis regresi masing-masing kelompok. Dari hasil di atas diperoleh: 1. koefisien g[T.P] tidak signifikan, berarti selisih konstanta dua kelompok tidak signifikan;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
222 dari 490
2. koefisien g[T.P]:x tidak signifikan, berarti selisih gradien dua kelompok tidak signifikan. Jadi untuk data ini tidak perlu dipisahkan model atau garis regresi dari masing-masing kelompok. Call: lm(formula = y ~ g + x, data = sim.data.reg)
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.03583 0.62101 9.719 1.06e-13 *** g[T.P] -0.20747 0.55184 -0.376 0.708 x 3.89516 0.05868 66.383 < 2e-16 *** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dengan formula ini (Y ∼ G + X) kita memaksa untuk menggunakan gradien yang sama (regresi sejajar), tetapi hanya melihat kemungkinan perlu tidaknya memisahkan konstantanya. Hasil di atas menunjukkan kita tidak perlu memisahkan konstanta dari masing-masing kelompok.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
223 dari 490
Call: lm(formula = y ~ g/x, data = sim.data.reg) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.1061 0.7936 7.694 2.47e-10 *** g[T.P] -0.3479 1.1224 -0.310 0.758 gL:x 3.8866 0.0837 46.433 < 2e-16 ***
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gP:x 3.9037 0.0837 46.637 < 2e-16 *** --Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1 FMIPA-UNEJ
Dengan formula ini (Y ∼ G/X) kita memaksa memeriksa model atau regressi terpisah untuk masing-masing kelompok. Hasil menunjukkan bahwa regresi masing-masing kelompok sama-sama signifikan, tetapi tidak ada informasi apakah kedua model atau garis regresi itu dapat digabung atau tidak. Karena model menggunakan model dengan konstanta, kita masih bisa melihat bahwa selisih konstanta dari kelompok L dan kelompok P tidak signifikan. Secara keseluruhan bentuk model yang dapat dimasukan dalam formula R dapat dirangkum dalam Tabel 3.1 (lihat juga Kuhnert & Venables [18]). Pada notasi tersebut x menunjukkan variabel kuantitatif sedangkan G menunjukan variabel kualitatif (faktor), sedangkan y dapat berupa kualitatif atau faktor (pada regresi logistik yang akan dibahas kemudian). Pada model G/(x1+x2) kelompok yang ada dipaksa memiliki regresi yang berbeda, sedangkan pada y~G*(x1+x2) kelompok dilihat semua kemungkinannya apakah perlu regresi ber-
Daftar Isi
Judul
JJ J
I II
224 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
beda, sejajar atau bergabung (satu). Tabel 3.1: Alternatif Penulisan Model dalam Formula R FMIPA-UNEJ
No 1 2 3 4 5 6 7 8
Bentuk y~x y~x-1 log(y)~x y~log(x) y~x1+x2+... y~G+x1+x2 y~G/(x1+x2) y~G*(x1+x2)
Arti regresi regresi regresi regresi regresi regresi regresi regresi
sederhana tanpa konstanta dengan transformasi pada Y dengan transformasi pada X multivariat paralel berbeda dengan interaksi
Daftar Isi
Judul
JJ J
I II
225 dari 490
Cari Halaman
Contoh 3.5. Data berikut mengandung peubah kuantitatif X, Y dan peubah kualitatif G dengan kategori (L, P ), sebarannya ditunjukkan oleh Gambar 3.9. Pada Gambar terlihat bahwa data mengandung variabel kualitatif g dan kedua subkelompok data terlihat memiliki ke-
Kembali
Layar Penuh
Tutup
Keluar
cenderungan yang berbeda. Kita akan melakukan eksplorasi model dan memilih model yang terbaik dengan mencoba (i) mengabaikan adanya kelompok, (ii) mencoba model paralel, dan (ii) mencoba model terpisah.. 1. Analisis dengan mengabaikan kelompok. Jika analisis regresi dilakukan dengan mengabaikan kelompok, (Y ∼ X), maka gabungan kedua kelompok akan saling meniadakan kecenderungan masingmasing sehingga menghasilkan hubungan yang tidak signifikan. Call: lm(formula = y ~ x, data = DataSimReg) Residuals: Min 1Q Median 3Q Max -11.2012 -2.1944 0.1407 2.9430
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
226 dari 490
11.2207
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -8.73271 3.53350 -2.471 0.0164 * x 0.07325 0.06855 1.068 0.2897 ---
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
g ●
DIAGRAM PENCARDENGAN KELOMPOK
L P
● ●
5
FMIPA-UNEJ
Daftar Isi ●
0
● ● ● ● ●
● ● ●
Y
Judul
●
●
−5
●
●
●
● ●
●
● ●
●
●
−10
●
JJ J ●
●
I II
● ● ● ●
227 dari 490 −15
●
●
35
40
45
50
55
60
65
70
Cari Halaman
X
Kembali
Gambar 3.9: Diagram Pencar X dengan Y mengandung kelompok yang perlu dipisah
Layar Penuh
Tutup
Keluar
Signif. codes:
0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Residual standard error: 4.682 on 58 degrees of freedom Multiple R-squared: 0.0193,Adjusted R-squared: 0.002394 F-statistic: 1.142 on 1 and 58 DF, p-value: 0.2897
FMIPA-UNEJ
Daftar Isi
Terlihat bahwa gradien atau koefisien regresi(koefisien X)tidak signifikan dan koefisien determinasinya juga sangat kecil (0,02). 2. Model paralel. Model berikutnya yang banyak umum dicoba orang adalah model regresi paralel, (Y ∼ X + G), dengan model ini kita memberi ruang perbedaan konstanta tetapi tidak pada gradien regresi. Call: lm(formula = y ~ x + g, data = DataSimReg) Residuals: Min 1Q Median -10.55982 -2.81816
Judul
JJ J
I II
228 dari 490
Cari Halaman
Kembali
3Q Max -0.09043 2.73765
10.66159
Layar Penuh
Tutup
Keluar
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -9.21175 3.56600 -2.583 0.0124 * x 0.07079 0.06860 1.032 0.3065 g[T.P] 1.20796 1.20967 0.999 0.3222 --Signif. codes:0'***'0.001'**'0.01'*'0.05 '.'0.1 ''1 Residual standard error: 4.682 on 57 degrees of freedom Multiple R-squared: 0.03616,Adjusted R-squared: 0.002345 F-statistic: 1.069 on 2 and 57 DF, p-value: 0.35 Dari hasil terlihat bahwa gradien masih tetap tidak signifikan, demikian juga selisih konstanta (g[T.P]) tidak signifikan, dan koefisien determinasi hanya membaik sedikit menjadi 0,04.
FMIPA-UNEJ
Daftar Isi
Judul
JJ
J
I
229 dari 490
Cari Halaman
3. Model terpisah. Diagram pencar mengindikasikan kelompok memiliki kecenderungan berbeda, karena itu sebenarnya yang paling masuk akal adalah mencoba regresi berbeda dan sekaligus memisahkan konstanta secara eksplisit, Y ∼ X/G − 1.
II
Kembali
Layar Penuh
Tutup
Keluar
lm(formula = y ~ g/x - 1, data = DataSimReg) Residuals: Min 1Q Median 3Q Max -4.91870 -1.46909 -0.06663 1.31627
FMIPA-UNEJ
4.12724
Coefficients: Estimate Std. Error t value Pr(>|t|) gL 15.39683 2.07712 7.413 7.20e-10 *** gP -31.43454 2.04057 -15.405 < 2e-16 *** gL:x -0.41683 0.04056 -10.276 1.69e-14 *** gP:x 0.52931 0.03933 13.457 < 2e-16 *** --Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1''1 Residual standard error: 1.927 on 56 degrees of freedom Multiple R-squared: 0.9258,Adjusted R-squared: 0.9205 F-statistic: 174.7 on 4 and 56 DF, p-value: < 2.2e-16 Hasil menunjukkan bahwa baik konstanta maupun gradien untuk masing-masing kelompok semuanya signifikan. Sementara itu koe-
Daftar Isi
Judul
JJ J
I II
230 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
fisien determinasi yang dihasilkan jauh lebih baik dari sebelumnya yaitu 0,93.
Ilustrasi di atas menunjukkan bahwa jika data mengandung peubah kualitatif, sangat perlu dilakukan eksplorasi data (dengan menggambar grafik diagram pencarnya), selanjutnya memilih model yang terbaik melibatkan peubah kualitatif tadi. Jika tidak, akan diperoleh hasil yang tidak sesuai dengan kondisi sebenarnya.
FMIPA-UNEJ
Daftar Isi
Judul
3.8.4.
Analisis dengan Subset JJ J
Untuk data yang terdiri atas beberapa kelompok (mengandung peubah kualitatif), analisis dapat dilakukan pada seluruh atau sebagian data tersebut melalui pemanfaatan parameter subset, dengan subset=nama.var.kualitatif=="simbol.sub.kelompok" Pada Contoh 3.5, kita dapat juga menganalisis secara terpisah data untuk masing-masing kelompok L dan P .
I II
231 dari 490
Cari Halaman
Kembali
lm(formula = y ~ x, data = DataSimReg, subset = g == "P") Layar Penuh
Residuals: Tutup
Keluar
Min 1Q Median 3Q Max -4.91870 -1.19517 -0.04871 0.97073
4.12724
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -31.43454 2.04449 -15.38 3.51e-15 *** x 0.52931 0.03941 13.43 9.99e-14 *** --Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''1 Residual standard error: 1.931 on 28 degrees of freedom Multiple R-squared: 0.8656,Adjusted R-squared: 0.8608 F-statistic: 180.4 on 1 and 28 DF, p-value: 9.99e-14
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
232 dari 490
Ternyata hasilnya identik dengan hasil sebelumnya yaitu: 1. Intersept (konstanta) = koefisien gP = - 31,43; 2. Koefisien X = koefisien gP:x= 0,53 Dengan cara yang sama kita dapatmelakukan analisis untuk subkelompok L dengan membuat subset = g == "L". Hasilnya identik dengan konstanta dan koefisien untuk g.L.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.9.
Ringkasan
1. Untuk analisis regresi klasik, respon atau galat harus berdistribusi normal dengan ragam konstan dan satu sama lain saling bebas.
FMIPA-UNEJ
2. Peubah penjelas Xj , dapat berupa peubah kualitatif maupun kuantitatif bersifat tetap,diukur tanpa sebaran.
Daftar Isi
3. Estimasi parameter regresi dapat dilakukan dengan metode kuadtar terkecil dan metode likelihood maksimum, dan untuk regresi klasik, keduanya identik. 4. sebelum melakukan analisis sebaiknya dilakukan eksplorasi data secara grafis, terutama jika mengandung peubah kualitatif/faktor.
Judul
JJ J
I II
233 dari 490
5. Untuk mengakomodasi peubah kualitatif, R memiliki beberapa alternatif formula sesuai kondisi data (misalnya apakah regresi paralel ataukah regresi terpisah). 6. R dapat menganalisis sebagian data dengan memanfaatkan parameter subset sesuai kebutuhan. 7. Dalam mengeksplorasi model-model regresi, selain memeriksa signifikan tidaknya koefisien regresi,perlu diperhatikan nilai koefisien
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
determinasinya.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
234 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.10.
Bacaan Lebih Lanjut
Pembahasan mengenai Model Linier Normal dapat dilihat pada Bowerman et al.[3] dan Neter et al. [31]. Aplikasi R untuk Regresi yang cukup intensif dapat dilihat pada Faraway [12]. Pembaca dapat juga membaca buku teks untuk S-Plus oleh Crawley [8] dan Venables & Ripley [47].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
235 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.11.
Latihan Soal- Soal
1. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Skoring Fisher untuk mengestimasi parameter regresi pada model linier sederhana dengan metode kuadrat terkecil 2. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Skoring Fisher untuk mengestimasi parameter regresi pada model linier sederhana dengan metode likelihood maksimum 3. Jelaskan distribusi penduga likelihood, baik untuk sampel besar maupun untuk sampel kecil. 4. Eksplorasi beberapa data pada R, lakukan beberapa alternatif analisis regresi, selanjutnya tentukan model terbaik menurut anda. dengan 5. Diketahui keluaran hasil analsis regresi dengan dua peubah kuantitatif X, Y dan satu peubah faktor g = (L, P ) sebagai berikut. Selidiki apakah masih mungkin dilakukan perbaikan model dan model mana yang dianjurkan? Jelaskan jawaban anda. Coefficients: Estimate Std. Error t value Pr(>|t|)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
236 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(Intercept) 13.14713 2.14083 6.141 8.95e-08 *** x1 3.03882 0.04181 72.686 < 2e-16 *** g[T.P] -1.85228 3.00107 -0.617 0.540 x1:g[T.P] -0.05652 0.05824 -0.971 0.336 --Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''1 Residual standard error: 1.986 on 56 degrees of freedom Multiple R-squared: 0.9948,Adjusted R-squared: 0.9945 F-statistic: 3575 on 3 and 56 DF, p-value: < 2.2e-16
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
6. Diketahui keluaran hasil analsis regresi dengan dua peubah kuantitatif X, Y dan satu peubah faktor g = (L, P ) sebagai berikut. Selidiki apakah masih mungkin dilakukan perbaikan model dan model mana yang dianjurkan? Jelaskan jawaban anda.
I II
237 dari 490
Cari Halaman
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 52.84661 2.33328 22.649 <2e-16 *** x 2.94982 0.04557 64.737 <2e-16 *** g[T.P] -67.23481 3.27086 -20.556 <2e-16 *** x:g[T.P] 0.03452 0.06347 0.544 0.589
Kembali
Layar Penuh
Tutup
Keluar
--Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.'0.1 ''1 Residual standard error: 2.165 on 56 degrees of freedom Multiple R-squared: 0.9974,Adjusted R-squared: 0.9973 F-statistic: 7233 on 3 and 56 DF, p-value: < 2.2e-16
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
238 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
BAB
4
Daftar Isi
DIAGNOSTIK DAN TRANSFORMASI
Judul
JJ J
I II
239 dari 490
Dalam analisis regresi, sebagaimana telah dibahas padaawal buku ini, selain perlu mengestimasi dan menguji koefisien regresi, perlu juga dilakukan uji kecocokan model serta prosedur untuk memilih model yang lebih baik. Dalam bab ini akan dibahas beberapa hal dan prosedur terkait dengan pemeriksaan dan pemilihan model.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi Diharapkan agar pembaca memahami teknik dan prosedur untuk memeriksa kecocokan model serta dapat melakukan penanganan jika model yang telah dipilih kurang sesuai sehingga menghasilkanmodel yang lebih baik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
240 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi 1. Asumsi analisis regresi klasik 2. Memeriksa sebaran data melalui grafik 3. Memeriksa hubungan peubah melalui grafik
FMIPA-UNEJ
Daftar Isi
4. Beberapa uji terkait asumsi 5. Memeriksa model melalui AIC 6. Transformasi data
Judul
JJ J
I II
241 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.1.
Asumsi Analisis Regresi Klasik
Sebagaimana telah disebutkan pada bab sebelumnya bahwa bentuk model linear dapat dituliskan dengan dengan Y = f (X, β) + . Ada beberapa asumsi mendasar dari model linier ini diantaranya: (i) fungsi f adalah fungsi linier;
FMIPA-UNEJ
Daftar Isi
(ii) nilai-tengah dari kesalahan i yaitu E(i ) adalah 0 (iii) ragam kesalahan adalah konstan, yaitu σ 2 dan (iv) distribusi kesalahan adalah normal. Pemeriksaan terhadap asumsi di atas dapat dilakukan baik melalui uji statistika maupun secara intuitif menggunakan grafik. Dalam buku ini hanya dibahas pemeriksaan asumsi secara intuitif menggunakan grafik/ diagram. Pada prinsipnya kegiatan ini hampir sama dengan eksplorasi data. Bedanya adalah eksplorasi data dilakukan sebeum melakukan analisis, sedangkan diagnostik dilakukan setelah melakukan analisis. Dengan demikian, jika sebelum melakukan analisis telah dilakukan eksplorasi data pekerjaan mendiagnostik model menjadi lebih sederhana. Berikut adalah beberapa tampilan grafik yang dapat dimanfaatkan untuk memeriksa asumsi yang diperlukan dan memperoleh gambaran kasar secera intuitif.
Judul
JJ J
I II
242 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.2.
Memeriksa Sebaran Data melalui Grafik
Untuk memeriksa distribusi data, secara grafis dapat dilakukan dengan membuat beberapa grafik dianrananya: grafik QQNorm, grafik densitas dan Grafik Boxplot. QQNorm pada dasarnya adalah grafik yang menyajikan sebaran quantil normal teoritis, dengan quantil data. Apabila datanya berdistribusi normal maka sebarannya akan mendekati garis lurus. Penyimpangan yang sangat mencolok pada ujung-ujung grafik menunjukkan datanya menyimpang dari distribusi normal. Pada Gambar 4.1 diberikan grafik QQNorm dari data yang berdistribusi normal dan yang tidak berdistribusi normal. Pada grafik untuk data ke dua, selain terlihat menyimpang dari garis lurus di bagian ujung atas, yang berarti datanya cenderung tidak simetris ke kanan. Penafsiran yang lebih rinci dari bentuk-bentuk grafik QQ-Norm dapat dilihat pada Tirta [43]. Simetris tidaknya sebaran data juga dapat dilihat melalui plot densitas. Gambar 4.2 menunjukkan grafik sebaran peluang dari masing-masing data yang sebelumnya digambar dengan QQNorm. Dari grafik ini juga terlihat data ke dua cenderung lebih tidak simetris. Grafik Boxplot dapat digunakan untuk memperoleh gambaran sebaran data terutama kesimetrisannya.Selain itu dengan boxlot dapat juga dilacak adanya pencilan (outlier). Deskripsi komponen grafik boxplot
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
243 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
244 dari 490
Cari Halaman
Gambar 4.1:
Grafik Quantile dari Data Berdistribusi Normal (kiri) dan Data Cenderung Tidak Berdistribusi Normal (Kanan)
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
245 dari 490
Cari Halaman
Gambar 4.2: Grafik Sebaran Peluang dari Data Berdistribusi Normal (lebih simetris, warna biru) dan Data Tidak Berdistribusi Normal (tidak siumetris, warna merah)
Kembali
Layar Penuh
Tutup
Keluar
dapat dilihat pada Faraway [12]dan Tirta [43]. Jika data mengandung peubah kualitatif/ kelompok, boxplot dapat juga dibuat perkelompok, seperti pada Gambar 4.3. FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
246 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
250
BOXPLOT Y
FMIPA-UNEJ
200
Daftar Isi
150
JJ J 100
Y
Judul
I II
247 dari 490
50
Cari Halaman
●
Kembali
L
P g
Gambar 4.3: Boxplot respon dengan kelompok. Terindikasi salah satu kelompok (P) mengandung pencilan
Layar Penuh
Tutup
Keluar
4.3.
Pemeriksaan Hubungan Peubah melalui Grafik FMIPA-UNEJ
4.3.1.
Diagram pencar data
Pemeriksaan terhadap asumsi kelineran dalam fungsi f dapat dilakukan secara kasar dengan menggambar diagram percar dari data maupun residu/ sisa. Dari pencaran data akan dapat diperoleh gambaran secara kasar apakah hubungan antara X dan Y mengikuti hubungan linear atau hubungan kuadratik atau yang lainnya. Diagram pencar data, khususnya untuk satu peubah penjelas, dengan berbagai jenis fungsi dan distribusi dapat dilihat pada berbagai gambar berikut: 1. Gambar 4.4 dan Gambar 4.5 adalah grafik dari data dengan hubungan Y = f (X, β) = β0 + β1 X yang berupa fungsi linier. Dari gambar-gamber tersebut terlihat bahwa pencaran data terletak pada suatu garis lurus. Dekat tidaknya pencaran data dengan suatu garis sangat bergantung pada besarnya ragam semakin besar ragamnya semakin jauh datanya dari garis sehingga semakin
Daftar Isi
Judul
JJ J
I II
248 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tidak kelihatan kalau data tersebut membentuk suatu garis lurus. Namun kedua grafk tersebut mempunyai perbedaan dari kekonstanan ragam yang terkait dengan jenis distribusi datanya. FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
249 dari 490
Cari Halaman
Gambar 4.4: Grafik Pencar Data dengan Hubungan Linear dan Ragam Relatif Konstan
Kembali
Layar Penuh
2. Gambar 4.6 adalah grafik dari data dengan hubungan Y = Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
250 dari 490
Cari Halaman
Gambar 4.5: Grafik Pencar Data dengan hubungan Linear tetapi Ragam Relatif tidak Konstan
Kembali
Layar Penuh
Tutup
Keluar
f (X, β) = β0 + β1 X 2 . dari Gambar terlihat bahwa pecaran dadatnya berbetuk parabola yang mengindikasikan bahwa hubungannya adalah hubungan kuadratik. FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
251 dari 490
Cari Halaman
Gambar 4.6: Grafik Pencar Data dengan hubungan lebih cenderung nonlinear 3. Gambar 4.7 adalah grafik dari data dengan hubungan Y = f (X, β) = β0 e(β1 X) . Dari diagram pencar terlihat sebaran data
Kembali
Layar Penuh
Tutup
Keluar
mengikuti grafik eksponensial.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
252 dari 490
Gambar 4.7: Grafik Pencar Data dengan Hubungan Eksponensial
4.3.2.
Diagram Pencar Sisa
Sisa atau residu adalah selisih antara nilai observasi (observed value) dengan nilai yang diperoleh melalui pengepasan garis regresi (fitted
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
value). Residu ini merupakan penduga dari kesalahan atau error. Syarat kekonstanan ragam ditunjukkan oleh adanya sebaran merata sehingga lebar sebaran dari kiri ke kanan relatif konstant (Gambar 4.8). Adanya ketidak konstanan ragam ditandai dengan lebar sebaran yang tidak konstan dari kiri ke kanan (Gambar 4.9). Data yang mempunyai ragam konstan disebut bersifat homoskedastik sebaliknya jika ragam tidak konstan disebut bersifat heteroskedastik.
FMIPA-UNEJ
Daftar Isi
Judul
4.3.3.
Memeriksa Model Melalui Diagram
Pada dasarnya model statistika dikembangkan untuk mengakomodasi jenis data dengan kondisi tertentu, misalnya adanya hubungan linier, saling independen dan bersifat random. Cara yang paling sederhana untuk memeriksa kondisi linieritas, dan kekonstanan koefisien variasi adalah dengan menggunakan pendekatan intuitif melalui pemeriksaan pencaran residu (sisa). Dari sifat residu sebagai penduga dari kesalahan, maka dapat disimpulkan bahwa secara geometris pencaran residu harus memenuhi beberapa sifat yaitu:
JJ J
I II
253 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
●
Daftar Isi 5
●
●
●
● ● ●
● ●
● ●
●
●
0
Sisa
●
●●
● ●
●
● ● ●
●
●●
●
● ● ● ● ●
●
●
●
● ●
●
●
●
●
●
●
●
−5
●
Judul ●●
●
●●
●
●
●● ●
●● ●
●
●
●
● ●
● ● ●●●●● ●● ●
●
● ●
●
●
JJ J
I II
● ●
●
100
254 dari 490 150
200
250
300
Nilai Pengepasan
Cari Halaman
Gambar 4.8: Grafik Pencar Sisa Data yang memenuhi syarat homoskedastisitas.
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
●
4
●
●
Daftar Isi ●
● ● ●
●
2
●
●
● ●
●
Sisa
● ● ●
●
0
●
●
●●
● ●
●
●
●
● ● ●
● ●
●
● ● ●
●
● ●
●
●
●
● ●
● ●
Judul
●
● ●
● ● ● ● ●
● ●
● ●
●
●
●
● ●
●
●
● ●
●●
● ●
JJ J
●
● ●
−2
●●
I II
● ●
● ● ●
100
150
200
250
255 dari 490
300
Nilai Pengepasan
Cari Halaman
Gambar 4.9: Grafik Pencar Sisa Data yang tidak memenuhi syarat homoskedastisitas.
Kembali
Layar Penuh
Tutup
Keluar
1. sebaran mengikuti pola garis lurus; 2. menyebar secara acak dan seimbang di sekitar 0; FMIPA-UNEJ
3. lebar sebaran dari kiri ke kanan relatif konstan. Sebaran data dapat diperiksa dengan menggunakan grafik QQNorm dengan ciri-ciri:
Daftar Isi
Judul
1. sebaran titik mengikuti garis lurus, 2. penyimpangan kentara terhadap garis lurus menunjukkan data menyimpang dari sebaran normal dan salah satunya ditunjukkan adanya ketidak simetrisan sebaran. Paket/library lm() secara automatis menyediakan 4 macam grafik yang dapat dipergunakan untuk mendiagnostik model diantaranya: 1. grafik QQNorm untuk memeriksa sebaran data; 2. grafik sisa untuk melihat kelinieran dan juga kekonstannan ragam;
JJ J
I II
256 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. grafik residual baku dan nilai ekspektasi; 4. grafik Jarak Cook (Cook’s Distance) untuk memeriksa adanya pencilan (Outlier/pencilan). Lihat Faraway [12, Bab 7] untuk pembahasan dan diagnostik berhubungan dengan pencilan. Berikut adalah contoh keluaran grafik yang digabung menjadi satu tampilan yang dapat dibuat dengan perintah plot(NamaObjek).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
257 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
258 dari 490
Cari Halaman
Kembali
Gambar 4.10: Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik menunjukkan data relatif memenuhi asumsi Model Linier Normal
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
259 dari 490
Cari Halaman
Kembali
Gambar 4.11: Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi lm(). Grafik menunjukkan data tidak memenuhi asumsi Model Linier Normal, yang ditandai dengan adanya hubungan tidak linier dan pencilan
Layar Penuh
Tutup
Keluar
4.4.
Uji Statistika Terkait Asumsi
Pemeriksaan melalui grafik cukup memberikan gambaran secara intuitif apakah data yang dimiliki memenuhi asumsi atau tidak. Pemeriksaan yang lebih teliti (lebih eksak) dapat dilakukan melalui uji statistika di antaranya adalah:
FMIPA-UNEJ
Daftar Isi
1. uji kenormalan shapiro-wilk; Judul
2. uji homogenitas ragam Bartlett dan Levenge. Dari Gambar 3.7 terlihat bahwa sebaran data tidak memiliki variansi konstan, yang mengindikasikan tidak adanya homoskedastisitas atau data tidak menyebar secara normal. Ternyata hasil uji statistika (dengan Shapiro-Wilk)juga menunjukan bahwa data menyebar tidak mengikuti sebaran normal, ditunjukkan oleh nilai p < 5%.
JJ J
I II
260 dari 490
Cari Halaman
Shapiro-Wilk normality test Kembali
data: cars$dist W = 0.9514, p-value = 0.0391
Layar Penuh
Tutup
Keluar
4.5.
Memeriksa Model melalui AIC
Pemeriksaan dapat juga dilakukan dengan menggunakan kriteria informasi Akaike (AIC, Akaike’s Information Criterion) yang menghitung perimbangan antara besarnya likelihood dengan banyaknya variabel dalam model. Besarnya AIC dihitung melalui rumus berikut ˆ + 2q, AIC = −2l(θ)
FMIPA-UNEJ
Daftar Isi
(4.1)
ˆ adalah nilai likelihood dari model yang dihadapi dan q dengan l(θ) adalah banyaknya parameter dalam model. Secara umum, semakin kecil nilai AIC model yang dipakai semakin cocok. Model yang dianggap terbaik adalah model dengan nilai AIC minimum. Namun demikian, dengan pertimbangan aspek lain, perbedaan AIC yang tidak terlalu besar mungkin dapat diabaikan. Untuk pembahasan lebih mendalam tentang AIC dapat dilihat pada Akaike [1], Chamber & Hastie [5] dan Venables & Ripley [47] serta Hjorth [15]. Pada R, model terbaik menggunakan AIC diperoleh dengan memberikan perintah step(objel.lm). Pada contoh berikut ditunjukkan bahwa pada regresi
Judul
JJ J
I II
261 dari 490
Cari Halaman
Kembali
Layar Penuh
Y = β0 + β1 X1 + β2 X2 + β3 X3 + β4 X4 Tutup
Keluar
diperoleh hanya satu koefisien yang signifikan. Kita dapat saja langsung memilih model hanya menyertakan satu variabel penjelas ini. Melalui perintah step() dapat diketahui kombinasi yang terbaik diantara tiga variabel tadi.
FMIPA-UNEJ
lm(formula = y ~ x1 + x2 + x3 + x4) Daftar Isi
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.98333 9.91166 0.200 0.8434 x1 1.97890 0.09044 21.881 1.93e-15 *** x2 0.02657 0.08598 0.309 0.7605 x3 2.97230 0.07208 41.236 < 2e-16 *** x4 0.13376 0.07710 1.735 0.0981 . --Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.098 on 20 degrees of freedom Multiple R-Squared: 0.9919, Adjusted R-squared: 0.9903 F-statistic: 613.9 on 4 and 20 DF, p-value: < 2.2e-16
Judul
JJ J
I II
262 dari 490
Cari Halaman
Kembali
Nilai AIC dari model lengkap ini dapat diperoleh dengan perintah AIC(model). Untuk model ini diperoleh AIC=114,42. Langkah selanjutnya adalah menelusuri model terbaik atau yang lebih baik
Layar Penuh
Tutup
Keluar
melalui perintah step(lm1). Start: AIC= 41.47 y ~ x1 + x2 + x3 + x4 Df Sum of Sq RSS AIC - x2 1 0.4 88.5 39.6 <none> 88.0 41.5 - x4 1 13.2 101.3 43.0 - x1 1 2107.4 2195.5 119.9 - x3 1 7484.7 7572.7 150.8 Step: AIC= 39.59 y ~ x1 + x3 + x4
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
Df Sum of Sq RSS AIC <none> 88.5 39.6 - x4 1 13.2 101.6 41.1 - x1 1 2205.1 2293.5 119.0 - x3 1 7494.7 7583.2 148.9 Call: lm(formula = y ~ x1 + x3 + x4)
I II
263 dari 490
Cari Halaman
Kembali
Model yang disarankan adalah Layar Penuh
Y = β0 + β1 X1 + β3 X3 + β4 X4 Tutup
Keluar
yang dianggap sudah cukup baik dengan nilai AIC = 39,59. Selain menyediakan fasilitas pemeriksaan AIC, R melalui menu RCommander juga menyediakan beberapa uji untuk mendiagnostik model diantaranya: diantaranya FIV (Faktor Inflansi Variansi/Ragam) untuk memeriksa adanya multi kolinieritas, Uji heteroskedastisitas Brues Pagan, Uji autokorelasi Durbin-Watson, Uji Pencilan Berferroni. Namun konsep yang mendasari masih diluar lingkup pembahasan buku ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
264 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.6.
Transformasi Data
Untuk data yang distribusinya, atau distribusi residunya menunjukkan adanya penyimpangan dari syarat yang harus dipenuhi bagi penggunaan regresi linier klasik, maka harus dilakukan remidi sehingga persyaratan tersebut menjadi relatif terpenuhi. Remidi yang dilakukan biasanya adalah dengan mentransformasikan data dengan suatu fungsi yang sesuai. Selanjutnya data hasil transformasi ini yang dianalisis dengan regresi klasik. Bentuk grafik dan transformasi yang mungkin dilakukan untuk mengatasi ketidak linieran diantaranya adalah seperti berikut ini. 1. Kurva naik dengan terbuka ke atas maka transformasi dilakukan pada Y dan √ tranformasi yang bisa dicoba adalah Y1 = log(Y ) atau Y1 = Y atau Y1 = 1/Y seperti terlihat pada Gambar 4.12 2. Kurva naik dan terbuka kebawah maka transformasi dilakukan pada X dan√trandformasi yang bisa dicoba adalah X1 = log(X) atau X1 = X atau X1 = 1/X seperti terlihat pada Gambar 4.13
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
265 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
266 dari 490
Cari Halaman
Kembali
Gambar 4.12: Sebaran data asli (naik dan membuka ke atas) dan transformasi yang bisa dilakukan. Beberapa transformasi menghasilkan sebaran yang mengikuti garis lurus tetapi ragam tidak konstan
Layar Penuh
Tutup
Keluar
3. Kurva menurun dan terbuka keatas maka transformasi dapat dilakukan pada X atau Y dengan salah satu transformasi sebelumnya. FMIPA-UNEJ
Untuk menstabilkan ragam √ dapat dicoba beberapa transformasi diantaranya Y1 = log(Y ), Y1 Y atau Y1 = 1/Y . Pada Gambar 4.14 terlihat bahwa transformasi tidak selalu dapat menstabilkan ragam.
Daftar Isi
Judul
JJ J
I II
267 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
268 dari 490
Cari Halaman
Kembali
Gambar 4.13: Sebaran data asli (naik dan terbuka ke bawah) dan transformasi yang bisa dilakukan. Beberapa transformasi menghasilkan sebaran yang mengikuti garis lurus tetapi ragam tidak konstan
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
269 dari 490
Cari Halaman
Kembali
Gambar 4.14: Sebaran data asli (dengan ragam tidak stabil) dan transformasi yang bisa dilakukan. Beberapa transformasi hanya menghasilkan ragam yang sedikit lebih stabil
Layar Penuh
Tutup
Keluar
4.7.
Ringkasan
1. Sebelum dan sesudah melakukan analisis regresi sangat perlu diadakan pemeriksaan terkait sebaran data dan sisa untuk memperoleh gambaran terpenuhi tidaknya asumsi yang diperlukan; pemeriksaan sebaran sisa sering disebut sebagai langkah mendiagnostik model; 2. diagnostik model dapat dilakukan secara intuitif melalui grafik (misalnya untuk melihat sebaran dapat digunakan Normal-Plot, Boxplot, atau plot densitas); 3. pemeriksaan sebaran dapat juga dilakukanj melalui uji statistika (uji normalitas, atau uji homogenitas); 4. untuk data yang mengandung peubah kualitatif/faktor selain grafik secara keseluruhan, perlu juga diperiksa grafik perkelompok; 5. jika tidak terpenuhi asumsi yang diperlukan, dapat dicoba transformasi yang sesuai sehingga asumsi yang diperlukan terpenuhi;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
270 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6. pemilihan modeldapat dilakukan dengan melihat nilai AIC atau nilai koefisien determinasi. Makin kecil nilai AICnya, model makin baik, sementara itu semakin besar nilai koefisien determinasinya, model semakin baik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
271 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.8.
Bacaan Lebih Lanjut
Pembahasan mengenai Analisis Sisa pada Model Linier Normal dapat dilihat pada Bowerman et al. [3] dan Neter et al. [31]. Referensi terkait R dapat dilihat pada Crawley [8] dan Kuhnert & Venables [18]. Khusus eksplorasi grafik dari R dapat dilihat pada Maindonald [23], Vezalini [48], Zoonekyn [55], dan Murrel [29].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
272 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.9.
Latihan Soal-soal
1. Jelaskan penggunaan (qqplot() dan plot(density())) untuk memeriksa distribusi data 2. Jelaskan ciri-ciri ideal sebaran sisa/residu yang memenuhi asumsi model linier normal 3. sebutkan uji statistika yang dapatdigunakan untuk menguji normalitas data. 4. Sebutkan transformasi yang dapat dilakukan berdasarkan ciriciri sebarab sisa maupun data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
273 dari 490
5. Sebutkan kriteria pemilihan model dengan menggunakan AIC 6. Suatu data mengandung peubah kualitatif/faktor dengan dua kategori. Dari pemeriksaan grafik respon secara keseluruhan diperoleh gambaran bahwa data memiliki dua puncak (bimodal). Apakah ini berarti data tidak memenuhi sebaran normal, langkah apa yang perlu dilakukan?
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
274 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
BAB
5
Daftar Isi
Judul
MODEL LINIER TERGENERALISIR JJ J
I II
275 dari 490
Cari Halaman
Model Linier telah digunakan selama bertahun-tahun dalam analisis statistika, khususnya untuk menganalisis data kontinu (data dengan distribusi kontinu). Tehnik ini berdasarkan pada asuumsi pada distribusi normal pada komponen acaknya dan adanya hubungan linier antara nilai-tengah dengan komponen sistematik (peubah eksplana-
Kembali
Layar Penuh
Tutup
Keluar
torinya). Model linier ini selanjutnya mengalami perkembangan dengan memberikan asumsi yang lebih longgar baik pada distribusinya maupun pada hubungan antara nilai-tengah dengan komponen sistimetiknya. Distribusi data tidak lagi terbatas pada distribusi normal tetapi merupakan anggota dari distribusi Keluarga Eksponensial. Pada bab ini akan dibicarakan distribusi keluarga eksponensial dengan sifat-sifatnya serta beberapa distribusi penting, baik distribusi diskrit maupun distribusi kontinu, yang termasuk dalam kelompok keluarga eksponensial. Selanjutnya akan dibahas perluasan model (regresi) linier berdasarkan distribusi keluarga eksponensial, yang dikenal dengan sebutan Generalized Linear Model (GLM).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
276 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.1. 5.1.1.
Distribusi Keluarga Eksponensial Bentuk umum FMIPA-UNEJ
Kita mulai dengan definisi formal dari distribusi keluarga eksponensial. Ada beberapa variasi mendefinisikan distribusi keluarga ekspoensial dan dalam buku ini dipilih yag paling sederhana. Definisi 5.1. Suatu peubah acak Y dengan fungsi kepadatan probabilitas (f.k.p.) f dan parameter θ dikatakan menjadi anggota distribusi keluarga eksponensial, jika f dapat dinyatakan sebagai: f (y; θ) = exp[a(y)b(θ) + c(θ) + d(y)].
Daftar Isi
Judul
JJ J
I II
(5.1) 277 dari 490
Pada (5.1) s(y) = exp(d(y)); t(θ) = exp(c(θ)). Dalam beberapa kasus fungsi a, b, c dan d mungkin mengandung parameter lain yang disebut parameter nuisan/ gangguan Dobson [11, pages 22-23] yang pada tidak menjadi perhatian utama dan sering dianggap sebagai parameter yang telah diketahui (tidak perlu diestimasi). 1 1
McCullagh dan Nelder dalam [24] mendefinisikan distribusi keluarga eksponensial dengan parameter gangguan yang eksplisit, φ.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dalam keadaan khusus a(y) = y, maka(5.1) menjadi: f (y) = exp[yb(θ) + c(θ) + d(y)]
(5.2) FMIPA-UNEJ
dan (5.2) disebut bentuk kanonik dari distribusi keluarga eksponensial dan b(θ) disebut parameter natural dari distribusinya.
5.1.2.
Nilai-tengah dan Ragam dari a(Y )
Judul
Fungsi Skor [U] E[U ] danVar[U ]
JJ J
Dobson [11, halaman 23-24] mendefinisikan fungsi skor dari f (y) terhadap θ sebagai U = dl(y)/dθ, dengan l(y) = log f (y) = ln f (y). Perhitungan E[U ] dan Var[U ] dibutuhkan untuk menurunkan nilaitengah dan ragam Y atau dalam bentuk yang lebih umum, E[a(Y )] dan Var[a(Y )]. d l(y) , dθ 1 d f (y) = . f (y) d θ
U =
Daftar Isi
I II
278 dari 490
Cari Halaman
Kembali
(5.3) (5.4)
Layar Penuh
Tutup
Keluar
Dengan demikian
FMIPA-UNEJ
Z
1 d f (y) f (y) dy, E[U ] = f (y) d θ Z d f (y) = dy, dθ Z d = f (y) dy, dθ d1 , = dθ = 0.
Daftar Isi
Judul
JJ J
(5.5)
I II
279 dari 490
Cari Halaman
Persamaan (5.3) dan (5.4) juga menghasilkan: Kembali
d l(y) d f (y) = f (y) . dθ dθ
Layar Penuh
(5.6) Tutup
Keluar
Selanjutnya kita perlu menunjukkan bahwa E[U 0 ] + E[U 2 ] = 0. dU 0 E[U ] = E , dθ d E[U ], (5.7) = dθ d0 = , dθ = 0. (5.8) R Tetapi dari (5.6), ruas kanan dari (5.7) menjadi ddθ d dl(y) f (y) dy. θ Jadi, bersama dengan (5.6), menghasilkan: Z d d l(y) 0 = f (y) dy, dθ dθ Z 2 Z d l(y) d l(y) d f (y) = f (y) dy + dy, 2 dθ dθ dθ 2 Z 2 Z d l(y) d l(y) = f (y) dy + f (y) dy, d θ2 dθ Z Z 0 = U f (y) dy + U 2 f (y) dy
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
280 dari 490
Cari Halaman
Kembali
Layar Penuh
= E[U 0 ] + E[U 2 ]. Tutup
Keluar
Jadi, E[−U 0 ] = E[U 2 ], dan
FMIPA-UNEJ
0
Var[U ] = E[−U ].
(5.9)
Untuk persamaan(5.1), U dan U 0 terhadap θ adalah: d [a(y)b(θ) + c(θ) + d(y)], dθ = a(y)b0 (θ) + c0 (θ),
Daftar Isi
U =
Judul
(5.10) JJ J
I II
dan U 0 = a(y)b00 (θ) + c00 (θ).
(5.11)
Nilai-tengah dan ragam distribusi keluarga eksponensial diberikan dalam hasil berikut ini. Hasil 5.1. Nilai-tengah dan ragam a(Y ) yang didefinisikan seperti pada Definisi 5.1 mempunyai nilai-tengah dan ragam, masing-masing E[a(Y )] = −
c0 (θ) . b0 (θ)
(5.12)
281 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Var[a(Y )] =
b00 (θ)c0 (θ) − c00 (θ)b0 (θ) . [b0 (θ)]3
(5.13)
Nilai-tengah dan ragam dari a(Y ) diturunkan seperti berikut ini. Dari persamaan (5.5) dan persamaan (5.10), diperoleh bahwa E[a(Y ))b0 (θ) + c0 (θ)] = 0, karenanya
FMIPA-UNEJ
Daftar Isi
0
E[a(Y )] = −
c (θ) . b0 (θ)
Judul
Dari persamaan (5.9) dan persamaan (5.11), dan menerapkan persamaan (5.12), diperoleh bahwa Var[U ] = E[−U 0 ],
JJ J
I II
282 dari 490
00
00
= E [−a(Y )b (θ) − c (θ)] , = −E[a(Y )]b00 (θ) − c00 (θ), c0 (θ) = − 0 b00 (θ) − c00 (θ). b (θ)
Cari Halaman
(5.14) Kembali
Tetapi dengan persamaan (5.10), Layar Penuh
Var[U ] = [b0 (θ)]2 Var[a(Y )].
(5.15) Tutup
Keluar
Akibatnya, persamaan (5.14) dan persamaan (5.15) menghasilkan
FMIPA-UNEJ
Var[a(Y )] =
b00 (θ)c0 (θ) − c00 (θ)b0 (θ) . [b0 (θ)]3
Daftar Isi
Judul
JJ J
I II
283 dari 490
5.1.3.
Beberapa Bentuk Khusus
Cari Halaman
Kembali
Berikut ini adalah beberapa distribusi yang menjadi anggota keluarga eksponensial.
Layar Penuh
Tutup
Keluar
Distribusi Binomial dengan Parameter n, p Distribusi Binomial juga termasuk anggota keluarga eksponensial. Distribusi Binomial dengan parameter n, p mempunyai fungsi kepadatan n y f (y) = p (1 − p)n−y ; y = 0, 1, 2, . . . , n y n = exp y log p + (n − y) log(1 − p) + log y p n = exp y log + n log(1 − p) + log 1−p y n = exp ylogit p + n log(1 − p) + log y
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
284 dari 490
Dengan logit p = log
p 1−p
Jadi b(θ) = logit p; c(θ) = n log(1 − p). Dengan mencari turunan pertama dan kedua masing-masing b(θ) dan c(θ) diperoleh
Cari Halaman
Kembali
Layar Penuh
E(Y ) = np dan V ar(Y ) = np(1 − p) Tutup
Keluar
Dalam prakteknya distribusi Binomial (n, p) sering dimodifikasi menjadi distribusi Binomial (1, µ) dengan mentransformasi x = y/n; x = 0, . . . , 1 sehingga mempunyai nilai-tengah µX = µ dan ragam Var(X) = 2 = µ(1 − µ). σX
FMIPA-UNEJ
Daftar Isi
Distribusi Poisson dengan Parameter θ.
Judul
Peubah acak Y yang berdistribusi Poisson mempunyai fungsi kepadatan probabilitas
JJ J
I II
285 dari 490
θy e−θ , y = 0, 1, 2, 3, · · · y! = exp[y log θ − θ − log y!].
f (y) =
Cari Halaman
(5.16) Kembali
Pada persamaan (5.16) b(θ) = log θ, c(θ) = −θ, d(y) = − log y. Dengan demikian E[Y ] = θ dan Var[Y ] = θ.
Layar Penuh
Tutup
Keluar
Distribusi Normal dengan Parameter θ dan σ Bentuk fungsi kepadatan probabilitas dari peubah acak Y yang berdistribusi Normal adalah 2 ! 1 1 y−θ f (y) = √ exp − , −∞ < y < ∞, 2 σ 2πσ yθ θ2 1 y2 2 (5.17) = exp − 2 + 2 − 2 − log(2πσ ) . 2σ σ 2σ 2 Pada persamaan (5.17) b(θ) = θ/σ 2 , d(y) = y 2 /(2σ 2 ) dan c(θ) = −θ2 /(2σ 2 ) − 21 log(2πσ 2 ). Di sini σ adalah parameter nuisan. Jadi, E[Y ] = θ dan Var[Y ] = σ 2 .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
286 dari 490
Distribusi Gamma dengan parameters θ dan skala φ. Cari Halaman
Peubah acak Y yang berdistribusi Gamma mempunyai fungsi kepadatan probabilitas Kembali
θ(yθ)φ−1 e−yθ f (y) = , y > 0, Γ(φ) = exp[−yθ + (φ − 1) log y + φ log θ − log Γ(φ)]. (5.18)
Layar Penuh
Tutup
Keluar
Padapersamaan (5.18) b(θ) = −θ, a(y) = y, c(θ) = φ log θ−log Γ(φ), d(y) = (φ − 1) log y. Maka, E[Y ] = φ/θ, Var[Y ] = φ/θ2 . Di sini φ adalah parameter nuisan. FMIPA-UNEJ
Distribusi lainnya Beberapa distribusi lainnya yang termasuk keluarga eksponensial adalah: Distribusi Pareto Distribusi Eksponensial Distribusi Binomial Negatif
Daftar Isi
Judul
JJ J
I II
287 dari 490
Distribusi Invers Gauss [24, page 22] dan [11, page 34]
Rangkuman beberapa distribusi khusus diberikan pada Tabel 5.1. Karakteristik lain masing-masing distribusi anggota keluarga eksponensial yang penting dapat diragkum pada Tabel 5.2. Sebagai ilustrasi pada Gambar 5.1 ditunjukkan densitas data dengan distribusi Normal Standar dan Gamma Standar dengan berbagai nilai-tengah/mean. Gambar menunjukkan bahwa untuk distribusi
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.1: Rangkuman Distribusi Anggota Keluarga Eksponensial
Notasi φ b(θ) µ(θ) = E(Y ; θ) link kanonik
Binomial
Normal
Poisson
Gamma
Bin(1, µ) 1 logit µ θ logit θ = η = logit µ
N (µ, σ 2 ) σ2 θ2 /2 exp(θ) identitas θ=η=µ
P (µ) 1 exp(θ) −1/θ log θ = η = log µ
G(µ, ν) ν −1 − log(−θ)
FMIPA-UNEJ
resiprokal θ = η = 1/µ
Daftar Isi
Judul
JJ J
Gamma seiring dengan kenaikan nilai-tengah, ragam ikut meningkat, sedangkan untuk distribusi normal, ragamnya konstan. Pada Gambar 5.2 ditunjukkan sebaran data dengan hubungan antara X dan Y yang sama tetapi yang satu berdistribusi Normal yang satu berdistribusi Gamma. Terlihat untuk sebaran data Gamma, selain sebarannya lebih lebar dari sebaran normal, semakin ke kanan semakin lebar sebaran data.
I II
288 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
289 dari 490
Cari Halaman
Gambar 5.1: Plot Densitas dari sampel dengan berbagai nilai-tengah dengan ukuran sampel 100
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
290 dari 490
Cari Halaman
Gambar 5.2: Sebaran Data dengan ukuran sampel 100 dengan distribusi Normal (b) dan Gamma (r)
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Tabel 5.2: Ciri-ciri khas Distribusi Keluarga Eksponensial No Nama
Jenis
Ruang Rentang
0, 1, 2, · · · , n 0, 1, 2, · · ·
Hubungan Ragam dan Nilaitengah linier linier
1 2
Binomial Poisson
diskrit diskrit
3
Gamma
kontinue 0 < x < ∞
kuadratik
4
Normal
kontinue −∞ < x < ∞
bebas
Daftar Isi
lainlain Judul
simetrik tidak simetrk tidak simetrik simetrik
JJ J
I II
291 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.2.
Konsep Dasar Model Linier Tergeneralisir
5.2.1.
Sisi lain Model Linier Normal FMIPA-UNEJ
Selama bertahun- tahun, model linier berikut telah digunakan secara luas dalam analisis statistika terutama untuk data kontinu: Y = Xβ + e
Daftar Isi
(5.19) Judul
T
T
dengan Y = (Y1 , · · · , Yi , · · · , Yn ) , e = (e1 , · · · , en ) , X = suatu N × p matriks peubah eksplanatori atau sering disebut matriks desain dan β = (β1 , · · · , βp )T . Lihat Dobson [11, subbab 3.1] dan McCullagh & Nelder [24, hal. 7]. Asumsi yang mendasari model ini adalah: ei ∼ NID(0,σ 2 ), dan karenanya Y ∼ N(E[Xβ], Iσ 2 ). Asumsi-asumsi ini dapat diuraikan secara lebih terinci seperti berikut ini. (i) Yi berdistribusi normal dan saling bebas dengan ragam konstan, yaitu Yi ∼ NID ( xi T β, σ 2 ), dengan xi T adalah peubah eksplanatori untuk Yi dan sama dengan baris ke-i dari matriks X.
JJ J
I II
292 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(ii) Ada suatu fungsi (misalkan η) dari peubah eksplanatori yang disebut prediktor linier dari peubah respon Y . Pada kasus di atas fungsi ini adalah ηi = xT i β. FMIPA-UNEJ
(iii) Ada hubungan antara prediktor (ηi ) dan komponen acak (µi ). Dalam kasus di atas ηi = µi (yaitu hubungan identitas). Model linier persamaan (5.19) dengan asumsi di atas sering disebut Model Linier Klasik. Model ini telah dibahas pada bab sebelumnya.
Daftar Isi
Judul
JJ J
5.2.2.
Generalisasi Model Linier Klasik ke Model Linier Tergeneralisir
Dalam Model Linier Tergeneralisir (MLT) atau Generalized Linear Models (GLM), asumsi model lebih longgar dan digeneralisasikan dengan cara berikut:
I II
293 dari 490
Cari Halaman
Kembali
(i) Asumsi (i) diperluas untuk memungkinkan Yi mempunyai distribusi yang sama dan saling bebas dari distribusi keluarga eksponensial.
Layar Penuh
Tutup
Keluar
(ii) Pada asumsi (iii) hubungan antara komponen prediktor (η) dan komponen acak (µ) tidak mesti identitas, tetapi diperluas untuk suatu fungsi monoton dan diferensiabel, g, yaitu ηi = g(µi ). Fungsi g disebut fungsi link. atau link function. Jadi dalam model linier tergeneralisir ada tiga komponen yang penting yaitu: 1. komponen distribusi, yaitu y berdistribusi keluarga eksponensial; 2. komponen prediktor linier, yaitu η = xT β; 3. fungsi link yaitu fungsi monoton dan diferensiabel g sehingga g(µ) = η. Adanya fungsi link memungkinkan prediktor linier memiliki daerah rentang seluruh bilangan riil (−∞ < x < ∞) tetapi respon y memiliki rentang tertentu (misalnya 0 < y < 1 untuk binomial; dan bilangan cacah untuk respon hasil pencacahan (count data). Diantara fungsi- fungsi link yang dapat digunakan, ada yang disebut fungsi link kanonik yaitu fungsi hubungan yang terjadi pada
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
294 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
P saat b(θ) = η = pj=0 βj xj . Untuk distribusi binomial, misalnya fungsi yang bisa dipakai adalah: (i) fungsi logit, yang nerupakan fungsi link kanonik yaitu η = log
µ 1−µ
FMIPA-UNEJ
;
Daftar Isi
Judul
(ii) fungsi probit, yaitu η = Φ−1 (µ);
JJ J
I II
dimana Φ adalah fungsi kumulatif dari distribusi Normal, yaitu Z
x
Φ(x) = −∞
295 dari 490
1 1 2 √ exp − z dz; 2 2π
Cari Halaman
dan Kembali
(iii) komplementari ln-ln, yaitu η = log[− log(1 − µ)].
Layar Penuh
Tutup
Keluar
1.0
Logit/Probit
0.8
FMIPA-UNEJ
0.6
Daftar Isi
0.4
Peluang
Judul
I II
0.2
JJ J
0.0
296 dari 490
−6
−4
−2
0
2
4
6
Cari Halaman
prediktor
Kembali
Gambar 5.3: Respon dengan Fungsi Hubungan Logit (kurva langsung) dan Probit (kurva putus-putus).
Layar Penuh
Tutup
Keluar
Grafik respon mengunakan fungsi hubungan probit dan logit dapat dilihat pada Gambar 5.3. Dalam prakteknya fungsi hubungan logit lebih banyak dipilih dibanding dengan fungsi probit maupun komplementer. Penelusuran penurunan rumus fungsi logit jauh lebih mudah dibanding fungsi probit. Untuk distribusi Normal dan Poisson masing- masing mempunyai link kanonik identitas dan log. Rangkuman distribusi keluarga eksponensial termasuk fungsi link kanonik untuk tiap-tiap distribusi dapat dilihat pada Tabel 5.1 pada buku ini (Lihat juga McCullagh & Nelder [24, hal. 23]). Rangkuman distribusi dan fungsi link kanonik dan link lain yang dapat dipergunakan, pada program R akan dibahas pada seksi 5.7 pada halaman 326.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
297 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.3.
Estimasi pada Model Linier Tergeneralisir
Ada dua metode yang biasa digunakan untuk mengestimasi parameter pada model linier. Metode tersebut adalah dan metode kuadrat terkecil dan metode likelihood maksimum.
FMIPA-UNEJ
Daftar Isi
1. Metode kuadrat terkecil dalam mengestimasi parameter berkaitan dengan mencari nilai yang sedekat mungkin dengan nilai harapannya[2, section 4.9]. Hal ini biasanya dilakukan dengan meminimalkan jumlah kuadrat kesalahan (galat). Metode ini sering disebut metode kuadrat terkecil. Sebagai contoh, misalkan mencari penduga dari parameter β dari model persamaan (5.19), dari Model Linier Normal. Langkah-langkah yang bisa ditempuh, secara umum adalah
Judul
JJ J
I II
298 dari 490
Cari Halaman
(a) Mula-mula model persamaan (5.19) disusun seperti Kembali
e = y − Xβ. Layar Penuh
(b) Bentuk kuadrat dari kuadrat kesalahan didefinisikan sebaTutup
Keluar
gai Q=
n X
e2i = eT e = (y − Xβ)T (y − Xβ).
i=1
Dalam bentuk ini informasi tentang distribusi ei sama sekali belum diperhitungkan dalam perhitungan estimasi parameter. (c) Biasanya Q dibobot dengan invers dari matriks ragam - koragam (misalkan V ). Penduga kuadrat terkecil terbobot b dari β selanjutnya diperoleh dengan meminimalkan
Daftar Isi
Judul
JJ J
Qw = (y − Xβ)T V−1 (y − Xβ) terhadap parameter β, yaitu, menyelesaikan persamaan (untuk model linier klasik) ∂Qw = −2XT V−1 (y − Xβ) = O, ∂β
FMIPA-UNEJ
(5.20)
atau ekuivalen dengan menyelesaikan Persamaan Normal XT V−1 Xb = XT V−1 y.
I II
299 dari 490
Cari Halaman
Kembali
Layar Penuh
(Lihat juga [32, subbab 12.8]). Tutup
Keluar
Dengan metode kuadrat terkecil terbobot, maka sebagian informasi tentang distribusi ei , yaitu ragamnya, telah diperhitungkan dalam menghitung penduga parameter. FMIPA-UNEJ
2. Metode likelihood maksimum likelihood digunakan khususnya jika distribusi peubah acaknya diasumsian diketahui [6, Subbab 9.2]. Penduga likelihood maksimum (p.l.m.) dari suatu parameter θ biasanya dinotasikan dengan θˆ dan didefinisikan sebagai nilai dari ruang rentang parameter (misalnya Ω) yang memaksimumkan fungsi likelihood L(y, θ), yaitu:
Daftar Isi
Judul
JJ J
I II
ˆ ≥ L(θ), ∀ θ ∈ Ω. θˆ ∈ Ω adalah p.l.m jika dan hanya jika L(θ) 300 dari 490
Penghitungan θˆ dapat dilakukan dalam beberapa langkah berikut: (i) Langkah pertama adalah menentukan fungsi dari data y. Ini merupakan fungsi kepadatan bersama dari y, hanya saja dalam hal ini yang menjadi peubah yang tidak diketahui adalah parameter θ, sedangkan y adalah data yang dike-
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tahui. Jika datanya saling bebas maka L(y, θ) =
N Y
f (yi , θ)
FMIPA-UNEJ
i=1
(ii) Langkah berikutnya adalah mencari maksimum dari l(y, θ) = log L(y, θ) terhadap θ. Ini merupakan maksimum lokal dari fungsi l terhadap θ. Maka θˆ adalah: 2
Daftar Isi
Judul
2
a. nilai θ sedemikian sehinga dl/dθ = 0 dan d l/dθ < 0; atau
JJ J
I II
b. Nilai batas dari ruang parameter jika Ω terbatas. Persamaan dl/dθ = 0, umumnya tidak dapat diselesaikan secara aljabar ata analitik, oleh karenanya metode iterasi, seperti metode Newton-Raphson, sering diaplikasikan.
5.3.1.
Metode Penduga Kuadrat Terkecil
Sebagaimana pada model linier klasik, metode kuadrat terkecil mencari penduga yang menyebban terjadinya kesalahan minimum. Untuk
301 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
itu persamaan (5.19) perlu diubah sehingga bentuk e menjadi eksplisit selanjutnya diturunkan minimum dari eT e, seperti pada persamaan (5.20). Tambahan komplikasi terjadi karena dalam MLT hubungan antara prediktor linier dan komponen acak tidak mesti beupa identitas, tetapi melalui suatu fungsi yang disebut fungsi link, g(). Dengan demikian
T ∂µ ∂Qw ∂η ∂µ T ∂µ = −2 XT V−1 (y − µ), ∂η
∂Qw = ∂β
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
302 dari 490
= 0, Cari Halaman
dimana
∂µ ∂η
adalah matrik diagonal berordo N dengan unsur di ∂µi agonal ke-i adalah yang nilainya bergantung pada fungsi link ∂ηi yang digunakan. Untuk mengaplikasikan metode iterasi Newton-Raphson,
Kembali
Layar Penuh
Tutup
Keluar
diperluka bentuk turuann kedua yang dapat dinyatakan dengan ∂ 2 Qw ∂µ ∂Qw = T ∂β ∂β ∂η ∂µ T ∂µ ∂µ T −1 =2 X V X . ∂η ∂η Dengan demikian bentuk lengkap iterasi Newton Raphson dengan Metode Kuadrat Terkecil Terbobot Weighted Least Square adalah " # #−1 " T T ∂µ ∂µ ∂µ b1 = b0 + XT V−1 X XT V−1 (y − µ) , ∂η ∂η ∂η (5.21) dengan g(µ) = Xβ.
5.3.2.
Metode Penduga Likelihood Maksimum
l(y) =
i=1
yi b(θi ) +
n X i=1
c(θi ) +
n X i=1
c(θi ) +
n X
d(yi ),
Daftar Isi
Judul
JJ J
I II
303 dari 490
Cari Halaman
Penduga likelihood maksimum untuk model linier tergeneralisir dapat diturunkan sebagai berikut (lihat [11, Lampiran 1]): n X
FMIPA-UNEJ
(5.22)
Kembali
Layar Penuh
i=1 Tutup
Keluar
dengan E[Yi ] = µi = −
c0 (θi ) berdasarkan persamaan (5.12), b0 (θi )
(5.23)
and g(µi ) = xT i β =
p X
FMIPA-UNEJ
Daftar Isi
xij βj = ηi .
(5.24) Judul
j=1
ˆ kita gunakan persamaan: Untuk memperoleh β,
JJ J
n X ∂li , Uj = ∂βj i=1
I II
304 dari 490
Cari Halaman
dengan li = yi b(θi ) + c(θi ) + d(yi )
(5.25) Kembali
dan ∂li ∂li ∂θi ∂µi = . ∂βj ∂θi ∂µi ∂βj
Layar Penuh
Tutup
Keluar
Dari persamaan (5.25) kita peroleh ∂li = yi b0 (θi ) + c0 (θi ), ∂θi c0 (θi ) 0 = b (θi ) yi + 0 b (θi ) 0 = b (θi )(yi − µi ) by persamaan (5.12).
FMIPA-UNEJ
(5.26)
Dari persamaan (5.23), kita peroleh 00 c (θi )b0 (θi ) − b00 (θi )c0 (θi ) ∂µi = , ∂θi [b0 (θi )]2 = b0 (θi )Var[Yi ] berdasar persamaan (5.13).
Judul
JJ J
Oleh karena itu, 1 ∂θi = 0 . ∂µi b (θi ) Var[Yi ]
Daftar Isi
I II
305 dari 490
(5.27) Cari Halaman
Sekarang ∂µi ∂µi ∂ηi = , ∂βj ∂ηi ∂βj dan dari persamaan (5.24) kita peroleh ∂ηi = xij , ∂βj
Kembali
Layar Penuh
Tutup
Keluar
dan
∂µi = xij ∂βj
∂µi ∂ηi
.
(5.28)
Oleh karena itu ∂li ∂βj
dan
FMIPA-UNEJ
b0 (θi )(yi − µi ) ∂µi = xij berdasar (5.26),(5.27),(5.28), b0 (θi ) Var[Yi ] ∂ηi (yi − µi )xij ∂µi = , (5.29) Var(Yi ) ∂ηi n n X X ∂µi (yi − µi )xij ∂li = Uj = ∂βj Var(Yi ) ∂ηi i=1 i=1
(5.30)
for j = 1, 2, 3, · · · , p. Umumnya, metode iterasi seperti metode NewtonRaphson , digunakan untuk menyelesaikan sistim persamaan U = O. Pendekatan iterasi ke- m-th dari f (x) = 0 dengan Newton-Raphson adalah: f (x(m−1) ) (m) (m−1) x =x − , f 0 (x(m−1) ) dengan x(m−1) adalah nilai pendekatan dari x setelah iterasi ke-(m−1). Dengan cara yang sama untuk persamaan U = O, rumus iterasinya
Daftar Isi
Judul
JJ J
I II
306 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah:
h i−1 (m−1) b(m) = b(m−1) − U0 U(m−1)
(5.31)
dengan U(m−1) adalah vektor U yang dinilai pada β = b(m−1) dan (m−1) ∂ 2l 0 (m−1) U = (5.32) ∂βj ∂βk adalah matriks turunan kedua dari fungsi likelihood l yang dinilai pada β = b(m−1) . Pada prakteknya digunakan metode alternatif disebut metode skoring. Dalam metode skoring ini matriks persamaan (5.32) diganti dengan suatu matriks nilai harapan ∂ 2l E . ∂βj ∂βk Matriks di atas sama dengan negatif dari mariks ragam - koragam atau matriks informasidari Uj ’s, I = E[UUT ] dengan unsur ke − (j, k) adalah ∂l ∂l Ijk = E , ∂βj ∂βk ∂ 2l (5.33) = −E ∂βj ∂βk
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
307 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
untuk j, k = 1, 2, 3, · · · , p (lihat [11, Lampiran A] dan [32, hal.341]). Oleh karena itu persamaan (5.31) menjadi b(m) = b(m−1) + [I (m−1) ]−1 U(m−1) .
FMIPA-UNEJ
Dengan mengalikan (perkalian kiri) kedua ruas dengan I (m−1) akan menghasilkan
Daftar Isi
I (m−1) b(m) = I (m−1) b(m−1) + U(m−1) .
(5.34) Judul
Dari persamaan (5.30) dan persamaan (5.33) dan mengetahui bahwa E[Yi − µi ]2 = Var[Yi ], dapat dilihat bahwa unsur (j, k) dari I adalah 2 n X xij xik ∂µi Ijk = . (5.35) Var[Yi ] ∂ηi i=1 Persamaan persamaan (5.35) menunjukkan bahwa I dapat dinyatakan sebagai I = XT W,
JJ J
I II
308 dari 490
Cari Halaman
Kembali
dengan W adalah matriks diagonal N × N dengan unsur-unsur: 2 1 ∂µi wii = . (5.36) Var[Yi ] ∂ηi
Layar Penuh
Tutup
Keluar
Dengan menggunakan “bobot” yang sama, matriks W, persamaan (5.30) dapat dinyatakan dalam bentuk matriks seperti ∂l ∂η T =X W (y − µ) (5.37) ∂β ∂µ ∂η is suatu matriks diagonal N ×N dengan unsur diagonal dengan ∂µ ∂ηi ke-i adalah . ∂µi Oleh karena itu bentuk umum dari persamaan penduga dengan menggunakan iterasi Newton Raphson adalah ∂η −1 T (m) (m−1) T (5.38a) b =b + X WX X W ∂µ atau dalam bentuknya yang asli b
(m)
=b
T
∂µ ∂η
Daftar Isi
Judul
JJ J
I II
309 dari 490
Cari Halaman
T 1 ∂µ + X X var(Y) ∂η 1 ∂µ T X (Y − µ) var(Y) ∂η
(m−1)
FMIPA-UNEJ
!−1 Kembali
(5.38b)
Layar Penuh
Tutup
Keluar
Dapat ditunjukkan bahwa persamaan (5.38) identik dengan (5.21) sehingga dikatakan penduga maksimum likelihood untuk GLM identik dengan metode kuadrat terkecil terbobot. Ada bentuk lain yang juga biasa dipakai dalam merumuskan bentuk iterasi Newton-Raphson untuk GLM yang dapat diturunkan seperti berikut ini. Berdasar persamaan (5.30) dan persamaan (5.35) dapat diunjukkan bahwa ruas kanan dari persamaan persamaan (5.34) adalah suatu vektor dengan unsur-unsur berbentuk: 2 p n n X X X xij xik ∂µi (yi − µi )xij ∂µi (m−1) bk + . Var[Y ] ∂η Var[Y ] ∂η i i i i i=1 k=1 i=1 yang sama dengan p n X X i=1 k=1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
310 dari 490
(m−1)
xij wii xik bk
+
n X i=1
xij wii (yi − µi )
∂µi ∂ηi
−1 .
Ini berarti bahwa id dapat dinyatakan sebagai XT Wz dengan unsurunsur vektor z adalah berbentuk: −1 p X ∂µi (m−1) zi = xik bk + (yi − µi ) , ∂η i k=1
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dimana i = 1, 2, 3, · · · , N , dan, µi dan ∂µi / ∂ηi dinilsi pada β = b(m−1) . Persamaan persamaan (5.34) menjadi XT WXb
(m)
= XT Wz.
(5.39)
Selanjutnya βˆ diambil sama dengan b(m) untuk m yang terakhir. Persamaan (5.39) menunjukkan bahwa penduga likelihood maksimum ekuivalen dengan penduga kuadrat terkecil terbobot [11, hal. 41].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
311 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.4.
Inferensi pada Model Linier Tergeneralisir
Jika penduga θˆ konsisten, maka dia juga secara asimptotik tak bias, yaitu ˆ = θ. lim E[θ]
FMIPA-UNEJ
N →∞
Daftar Isi
Hal- hal berikut merupakan konsekuensi. (i) Untuk N besar, berdasar Teorema limit pusat:
Judul
θˆ − θ q ≈ N (0, 1). ˆ Var[θ]
JJ J
I II
312 dari 490
(ii) Sama dengan(i), (θˆ − θ)2 ≈ χ21 . ˆ Var[θ]
Cari Halaman
Dalam bentuk matriks dapat dinyatakan sebagai Kembali
ˆ − θ) V (θ ˆ − θ) ≈ (θ T
−
χ2q .
(5.40) Layar Penuh
Dengan q adalah rank matriks V, dan V− adalah: Tutup
Keluar
– invers tergeneralisir dari matriks ragam - koragam V jika V singular, atau – invers dari matriks ragam - koragam V jika V adalah nonsingular.
FMIPA-UNEJ
Daftar Isi
Untuk MLT dengan p parameter dan skore terhadap βj = U , maka kita memiliki: Uj =
∂l j = 1, 2, 3, · · · , p, ∂βj
Judul
JJ J
I II
313 dari 490
E[Uj ] = 0 [lihat persamaan (5.5)], dengan matriks ragam - koragam I=E[UUT ]. Jadi analog dengan persamaan (5.40) setidaknya secara asimtotik:
Cari Halaman
Kembali
U ∼ N (0, I) or UT I −1 U ∼ χ2p ,
(5.41) Layar Penuh
dengan asumsi I adalah nonsingular Dobson [11]. Tutup
Keluar
5.4.1.
Distribusi dari Penduga Likelihood Maksimum
Pendekatan Taylor tingkat ke-n untuk fungsi f pada x = a adalah: 1 1 f (x) = f (a) + f 0 (a)(x − a) + f 00 (a)(x − a)2 + · · · + f n (a)(x − a)n . 2 n! Dengan mengambil pendekatan Taylor tingkat pertama pada fungsi skor U(β) pada β = b (sebagai penduga), kita peroleh: U(β) ≈ U (b) + H(b)(β − b),
(5.42)
FMIPA-UNEJ
Daftar Isi
Judul
dengan U(b) =
U1 U2 .. . Up
and H(b) =
∂l ∂β1 ∂l ∂β2
JJ J
= .. . ∂l ∂βp
∂2l
∂2l
∂β12 ∂2l ∂β2 ∂β1
∂β1 ∂β2 ∂2l ∂β22
∂2l ∂βp ∂β1
∂2l ∂βp ∂β2
.. .
.. .
··· ··· .. . ···
,
314 dari 490
βj =bj ∂2l ∂β1 ∂βp ∂2l ∂β2 ∂βp
.. .
∂2l ∂βp2
I II
Cari Halaman
Kembali
. Layar Penuh
βj =bj Tutup
Keluar
Secara asimptotik H = E[H]. Berdasar persamaan (5.33) maka −I=E[H](Dobson [11]. Oleh karena itu persamaan (5.42) menjadi: U(β) ≈ U (b) − I(β − b).
(5.43)
FMIPA-UNEJ
Tetapi, b adalah maksimum dari l, akibatnya U (b)=0. Oleh karena itu persamaan (5.43) menjadi
Daftar Isi
U(β) ≈ −I(β − b)
Judul
dan b−β ≈I
−1
JJ J
U(β).
I II
(5.44)
Dengan mengambil nilai harapan dari kedua ruas persamaan (5.44), lalu menerapkan bahwa E[U]=0, dapat disimpilkan bahwa E[b] = β. Akibatnya secara asimtotik b adalah takbias. Lebih lanjut, matriks ragam - koragam dari b − β (sebut saja, V ) dapat dihitung sebagai berikut:
315 dari 490
Cari Halaman
Kembali
E[(b − β)(b − β)T ] = E[I −1 U(I −1 U)T ], = E[I −1 UUT I −1 ],
Layar Penuh
Tutup
Keluar
Karena I adalah konstan dan simetrik, maka E[(b − β)(b − β)T ] = I −1 E[UUT ]I −1 = I −1 II −1 = I −1 .
(5.45)
Oleh karena itu
FMIPA-UNEJ
Daftar Isi
(b − β)T I(b − β) ≈ χ2p .
(5.46)
Statistik persamaan (5.46) disebut statistik Wald. Statistik ini ekuivalen dengan (b − β) ∼ N (0, I −1 ), yang membawa konsekuensi bahwa, secara asimtotik, untuk N besar: (i) standar kesalahan (s.k.) dari penduga masing-masing bj adalah s.k.(bj ) =
√ vjj ,
dengan vjj adalah unsur ke-(j, j) dari I −1 ;
Judul
JJ J
I II
316 dari 490
Cari Halaman
Kembali
(ii) interval keyakinan dua sisi (1 − α) × 100% untuk βj adalah √ bj ± zα/2 vjj ,
Layar Penuh
Tutup
Keluar
dalam prakteknya, jika N kecil digunakan pendekatan distribusi t, yaitu √ bj ± tN −p,α/2 vjj ; FMIPA-UNEJ
dengan p menunjukkann banyaknya parameter βj yang akan diduga. Daftar Isi
(iii) korelasi antara penduga adalah: corr(bj bk ) = √
vjk √ . vjj vkk
Judul
JJ J
5.4.2.
I II
Kecocokan Model
Kecocokan model ditentukan dengan membandingkan model yang diajukan dengan model lengkap atau model maksimal maximal model/ saturated model. Model maksimal didefinisikan sebagai: (i) GLM/LMT yang mempunyai distribusi yang sama dengan model yang diajukan; (ii) model menggunakan fungsi link yang sama dengan model yang diajukan; dan
317 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(iii) model yang mempunyai jumlah parameter sama dengan banyaknya pengamatan. Dengan kata lain “ia menyediakan informasi lengkap dari data” (Lihat Dobson [11, hal. 56]). FMIPA-UNEJ
Untuk menguji kecocokan model, dipergunakan statistik perbandingan likelihood: L(bmax ; y) λ= , L(b; y)
Daftar Isi
Judul
atau log λ = l(bmax ; y) − l(b; y).
(5.47) JJ J
Distribusi dari persamaan (5.47) dapat diturunkan dengan menggunakan pendekatan Taylor ordo dua dari likelihood l ada titik penduga βˆ = b. l(β; y) = l(b; y) + (β − b)U(b) + 21 (β − b)T H(b)(β − b).
(5.48)
Dengan argumen analog dengan persamaan (5.43), persamaan (5.48) dapat disederhanakan menjadi: 1 l(b; y) − l(β; y) = (b − β)T I(b − β). 2
I II
318 dari 490
Cari Halaman
Kembali
Layar Penuh
(5.49) Tutup
Keluar
Ini berarti 2[l(b; y) − l(β; y)] ≈ χ2p ,
(5.50)
dengan syarat I matriks dengan rank penuh atau matriks nonsingular. notasi χ2p menunjukkan sebaran chi-kuadrat dengan derajat kebebasan p.
FMIPA-UNEJ
Daftar Isi
Devian dan Distribusinya Judul
Statistik pada persamaan (5.47) dapat dimodifikasi dengan cara berikut sehingga pendekatan distribusinya dapat dikenali. D = 2 log λ = 2[l(bmax ; y) − l(b; y)].
I II
(5.51)
D disebut devian (the deviance). Persamaan persamaan (5.51) dapat disusun lagi menjadi: D = 2[l(bmax ; y) − l(βmax ; y)
JJ J
(5.52a)
−(l(b; y) − l(β; y))
(5.52b)
+(l(βmax ; y) − l(β; y))].
(5.52c)
Berdasar persamaan (5.50), bagian pertama dari ruas kanan, persamaan, (5.52a) berdistribusi χ2n karena memiliki N parameter.
319 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Bagian ketiga, (5.52c) mendekati 0 jika model yang ditentukan dengan jumlah parameter p sama baiknya dengan model maksimal. Bagian kedua, berdistribusi χ2p . Oleh karena itu jika bagian pertama saling bebas dengan bagian kedua, D mendekati berdistribusi χ2N −p (lihat juga [16, page 154]). Statistik persamaan (5.51) dapat juga dipergunakan untuk menguji apakah suatu model sama baiknya dengan model yang lainnya (yang memiliki parameter berbeda, lihat [11, hal. 60-64]). Misalnya, untuk menentukan apakah model dengan jumlah parameter p secara signifikan lebih baik dari model dengan jumlah parameter q (dengan q < p), kita menggunakan statistik berikut: 4D = Dq − Dp
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
(5.53a)
= 2[l(bmax ; y) − l(bq ; y)]
(5.53b)
− 2[l(bmax ; y) − l(bp ; y)]
(5.53c)
= 2[l(bp ; y) − l(bq ; y)].
(5.53d)
Berdasar persamaan (5.51) bagian pertama dari persamaan (5.53b) adalah ∼ χ2N −q dan bagian kedua, (5.53c) adalah ∼ χ2N −p . Oleh karena itu sepanjang kedua bagian ini saling bebas, maka persamaan (5.53d) adalah ∼ χ2p−q .
320 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Cara lain untuk memeriksa kecocokan model dan assumsinya adalah dengan menggunakan kriteria AIC (seperti pada persamaan (4.1)) dan analisis grafik dari sisa/residu. Penggunaan dari kedua teknik ini telah diilustrasikan pada bab sebelumnya. Uraian detil dapat dilihat pada Dobson [11, Bab 5] dan Neter et al. [31, Bab 2 ].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
321 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.5.
Model Logit, Probit dan Log-linier
Secara matematis, GLM menggabungkan analisis untuk beberapa jenis distribusi (diantaranya Normal, Binomial dan Poisson). Model Linier dengan distribusi Binomial dan fungsi fungsi hubungan probit dan logit biasa disebut regresi logistik atau lebih spesifik regresi probit dan logit. Yang termasuk dalam regresi ini adalah regresi biner (dengan respon Y hanya dua kategori, misalnya 0-1, lulus-tidak lulus, sukses(S)-gagal(G) dan sebagainya; atau respon dengan k kategori). Untuk respon biner yang diukur adalah rasio peluang sukses dan tidak sukses, yang biasa disebut odd. Log odd ini dianggap bergantung secara linier pada beberapa veriabel penjelas.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
322 dari 490
P (Yi = S) P (Yi = G)
logit(Yi = S) = log
p
=
atau −1
P robit(Yi = S) = Φ
(Yi = S) =
X
βj Xij
j=0 p X
βj Xij
Cari Halaman
Kembali
j=0
p Odd = 1−p
Layar Penuh
Tutup
Keluar
Ada dua jenis data utama yang dapat dianalissi dengan model logit yaitu data yang berasal dari tabel kontingensi dan dari data yang langsung memiliki respon biner. Karena pada dasarya model logit menggunakan data dalam bentuk persen, maka harus diketahui dengan jelas jumlah sukses dan gagal pada tiap-tiap kelompok, terutama jika jumlah subjek tiap-tiap kelompok tidak sama. (Lihat model Tabel 5.32 ). Apabila respon bukan merupakan respon biner, tetapi merupakan respon hasil pencacahan (count data), dengan jumlah maksimum yang tidak bisa ditentukan, maka distribusi yang paling cocok dengan respon ini adalah distribusi Poisson dengan fungsi hubungan log. Model ini lebih dikenal dengan model atau regresi Log-linier.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
323 dari 490
Cari Halaman
Kembali
2
Banyaknya Total maupun G tidak perlu ditulis eksplisit dalam tabel jika total masing-masing kelompok sama
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Tabel 5.3: Jumlah Sukses(S) dan Gagal dalam Berbagai Kelompok Faktor Perlakuan Faktor Kategori (Biner) P1 ... Pk F1 S n11 ... n1p Total N11 ... N1p F2 S n21 ... n2p Total N21 ... N2p F3 S n31 ... n3p Total N31 ... N3p
Daftar Isi
Judul
JJ J
I II
324 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.6.
dispersi berlebih
Sebagaimana telah dibahas sebelumnya bahwa sebaran anggota keluarga eksponensial memiliki fungsi variansi yang menggambarkan kewajaran hubungan antara rerata dengan variansinya. Sebagai contoh (i) untuk sebaran Poisson, secara umum besarnya rerata dan variansi dari sebaran Poisson adalah sama, sedangkan (ii) untuk sebaran Binomial, besarnya variansi dinyatakan dengan np(1 − p). Sering terjadi kita menghadapi data dengan besarnya dispersi jauh melebihi besarnya rerata. Kondisi ini disebut dispersi berlebih overdispersion. Salah satu indikasi adanya dispersi berlebih ini adalah besarnya sisaan deviansi jauh melebihi besarnya derajat kebebasannya [8].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
325 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.7.
Ilustrasi GLM dengan R
Analisis GLM pada R dapat dimanfaatkan melalui dua cara yaitu langsung memanggil fungsi glm() atau melalui menu dengan memanggil paket RCommander. Pemeriksaan asumsi dapat dilihat dari grafik diagnostik mendasar sedangkan pemilihan model terbaik dapat dilakukan dengan memeriksa nilai AIC dari model yang dicoba. Pengaktifan menu glm pada RCommander dilakukan dengan
FMIPA-UNEJ
Daftar Isi
Judul
statistics => models => Generalized Linear Model JJ J
Sedangkan dengan menggunakan skrip, fungsi glm() dapat dipangil dengan mengunakan format berikut: glm(formula, family = (link=), data, x = FALSE, y = TRUE, contrasts =, ...) 1. formula. Seperti umumnya pada model linier, formula berbentuk y x1+x2 ....Pada dasarnya penulisan yang berlaku pada fungsi lm(), misalnya penulisan formula untuk peubah faktor (kualitatif), juga berlaku pada fungsi glm ().
I II
326 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. family. Pilihan family yang tersedia adalah dengan link kanoniknya. binomial(link = "logit") gaussian(link ="identity") Gamma(link = "inverse") inverse.gaussian(link = "1/mu^2") poisson(link = "log") quasi(link = "identity", variance = "constant") quasibinomial(link = "logit") quasipoisson(link = "log") 3. Objek glm. ADa beberapainformasi yang dapat diekstrak terkait dengan objek yang dihasilkan melalui analisis glm, di antaranya:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
327 dari 490
ˆ (a) coef(objek) untuk mengekstrak koefisien regresi β. Cari Halaman
(b) deviance(objek) untuk mengekstrak jumlah kuadrat sisa. (c) formula(objek) untuk mengekstrak rumusan model yang dipergunakan (d) plot(objek) untuk menghasilkan grafik yaitu seperti grafik sisa, grafik fitted value dan beberapa disgnostik.
Kembali
Layar Penuh
Tutup
Keluar
(e) print(objek) untuk mencetak hasil singkat analisis. (f) step(objek) untuk memeriksa model yang paling cocok dengan cara melihat angka (Akaike’s Information Criterion) yang paling besar. (g) summary(objek)untuk mencetak lengkap hasil analisis. Selain itu, objek glm memuat beberapa komponen penting diantaranya: [1] [4] [7] [10] [13] [16] [19] [22] [25] [28]
"coefficients" "residuals" "fitted.values" "effects" "R" "rank" "qr" "family" "linear.predictors" "deviance" "aic" "null.deviance" "iter" "weights" "prior.weights" "df.residual" "df.null" "y" "converged" "boundary" "model" "call" "formula" "terms" "data" "offset" "control" "method" "contrasts" "xlevels"
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
328 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Rangkuman distribusi (family) dan link yang dapat dipilih diberikan pada Tabel 5.4. Tanda K menunjukkan link kanonik yang sekaligus merupakan default link dari glm() pada R. FMIPA-UNEJ
Tabel 5.4: Distribusi dan Link pada R Daftar Isi
family(link) logit probit cloglog identity log inverse
binomial K X X × × ×
Poisson × × × X K X
normal × × × K X X
Gamma × × × X X K
Judul
JJ J
I II
329 dari 490
Cari Halaman
Keterangan K: fungsi hubungan kanonik; X: fungsi yang dimungkinkan; × fungsi yang tidak bisa dilakukan.
Regresi logistik, selain dapat diakses melalui fungsi glm() dengan pilihan distribusi dan link yang sesuai, pada R juga dapat diak-
Kembali
Layar Penuh
Tutup
Keluar
ses secara khusus melalui fungsi multinom() dan polr() pada paket MASS (Lihat Venable & Ripley [47]). Ketiga metode cara mengakses regresi logistik ini telah juga diakomodasi dalam menu RCommander untuk R versi 2.1 ke atas.
5.7.1.
Data dengan Sebaran Binomial
Analisis model linier tergereralisir dengan sebaran Binomial dapat dilakukan dengan dua macam pendekatan, yaitu 1. Data dalam bentuk tabel kontingensi yang menunjukkan banyaknya subjek dalam Sukses dan Gagal.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
330 dari 490
2. Data dengan respon yang langsung terkategori Sukses atau Gagal. Cari Halaman
Contoh 5.1. Berikut adalah contoh data fiktif yang dimodifikasi dari Venables & Ripley [47]. Ada tujuh perlakuan yang dibedakan untuk jenis kelamin laki-laki dan perempuan. Tiap tiap kelompok ada 30 subjek. Jumlah yang dicatat adalah jumlah subjek yang dinyatakan lulus dari masing-masing kelompok. Data asli diberikan pada
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.5, sedangkan format data yang akan dianalisis dengan R diberikan dalam Tabel 5.6. Walaupun data yang tercatat merupakan hasil pencacahan jumlah yang sukses, tetapi hasil pencacahan ini lebih menggambarkan relatif terhadap jumlah individu dalam kelompok yang berhingga dan diketahui. Oleh karena itu secara tidak langsung data ini menggambarkan persentase keberhasilan dalam tiap kelompok.
FMIPA-UNEJ
Daftar Isi
Judul
Tabel 5.5: Jumlah Kelulusan dalam Berbagai Kelompok Perlakuan J. Kelamin L P
P1 1 0
P2 4 2
Perlakuan P3 P4 P5 9 13 18 6 10 12
JJ J
P6 20 16
P7 24 18
P8 27 20
I II
331 dari 490
Cari Halaman
Jumlah peserta masing-masing kelompok adalah 30. Selanjutnya data kelulusan dan kegagalan dikelompokkan menjadi 1 matriks respon berordo 16× 2 (cbind(Lulus, Gagal). Analisis data selanjutnya dilakukan dengan
Kembali
Layar Penuh
resp<-cbind(Lulus, Gagal) Tutup
Keluar
FMIPA-UNEJ
Tabel 5.6: Format Data R Jumlah Kelulusan dan Kegagalan Daftar Isi
J. Kelamin L L L ... L P P ... P
Perlakuan P1 P2 P3 ... P8 P1 P2 ... P8
Lulus 1 4 9 ... 27 0 2 ... 20
Gagal 29 26 21 ... 3 30 8 ... 10
Judul
JJ J
I II
332 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
logit1<-glm(resp~J.Kelamin*Perlakuan, family=binomial) summary(logit1) Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -3.07944 0.41892 -7.351 1.97e-13 *** J.Kelamin[T.P] -0.13465 0.60694 -0.222 0.824 Perlakuan 0.66177 0.08431 7.850 4.17e-15 *** J.Kelamin[T.P]:Perl -0.13109 0.11526 -1.137 0.255 --Significant code `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 170.5715 Residual deviance: 9.3193 AIC: 68.881
on 15 on 12
degrees of freedom degrees of freedom
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
333 dari 490
Cari Halaman
Kembali
Sepintas tidak begitu nampak signifikan adanya pengaruh jenis kelamin, tetapi ada baiknya jika grafik diagram pencar dipisahkan
Layar Penuh
Tutup
Keluar
antara L dan P. Grafik diagram pencar prediksi dengan data asli diberikan pada Gambar 5.4. Dari diagram pencar masih dapat dibedakan antara respon untuk kelompok L dan P pada berbagai kelompok perlakuan. Dari grafik tersebut dapat diperkirakan prosentase keberhasilan pada perlakuan P5 adalah sekitar 36% untuk kelompok P dan sekitar 56% untuk kelompok L. Pada analisis ini tidak ada indikasi dispersi berlebih karena besarnya Residual devians= 9,13 lebih kecil dari derajat kebebasdannya (12). Ada kalanya kita dihadapkan pada data yang setiap subjeknya sudah dikategorikan sebagai kondisi Sukses atau Gagal. Misalnya muncul tidaknya gejala suatu penyakit pada individu. Dalam jenis data ini respon sudah dalam kategori biner, misalnya Sukses atau Gagal, ada atau tidak tidak ada gejala. Berikut adalah Contoh dari data klasik yang ada pada R yaitu kyphosis. Data ini berisi tentang muncul tidaknya penyakit kyphosis pada anak yang pernah mengalami operasi. Untuk mengaktifkan data tersebut dapat dilakukan perintah berikut: library(gam) data(kyphosis) print(summary(kyphosis))
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
334 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Prediksi dengan Logit
0.8
L
FMIPA-UNEJ
L Daftar Isi
0.6
L L
P Judul
P
Prob
P
JJ J
I II
0.4
L P 335 dari 490
P L 0.2
Cari Halaman
P L
Kembali
P L P 1
2
3
4
5
6
7
8
Layar Penuh
Perlakuan Tutup
Gambar 5.4: Diagram Pencar Prediksi dan Data Asli Peluang Keberhasilan Berbagai Kelompok
Keluar
Ringkasan data tersebut menunjukkan ada empat peubah satu diantaranya merupakan kategori biner. Kita dapat memeriksa apakah muncul tidaknya penyakit kyphosis ada hubungannya dengan peubah yang lainnya (Age, Number dan Start).Hal ini dapat dilakukan melalui GLM dengan memilih sebaran Binomial. Kyphosis absent :64 present:17
Age Min. : 1.00 1st Qu.: 26.00 Median : 87.00 Mean : 83.65 3rd Qu.:130.00 Max. :206.00
Number Min. : 2.000 1st Qu.: 3.000 Median : 4.000 Mean : 4.049 3rd Qu.: 5.000 Max. :10.000
Start Min. : 1.00 1st Qu.: 9.00 Median :13.00 Mean :11.49 3rd Qu.:16.00 Max. :18.00
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
336 dari 490
Cari Halaman
call: glm(formula = Kyphosis ~ Age + Number + Start, family = binomial(logit), Kembali data = kyphosis) Deviance Residuals: Min 1Q Median
Layar Penuh
3Q
Max Tutup
Keluar
-2.3124
-0.5484
-0.3632
-0.1659
2.1613
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.036934 1.449575 -1.405 0.15996 Age 0.010930 0.006446 1.696 0.08996 . Number 0.410601 0.224861 1.826 0.06785 . Start -0.206510 0.067699 -3.050 0.00229 ** --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
(Dispersion parameter for binomial family taken to be 1) 337 dari 490
Null deviance: 83.234 Residual deviance: 61.380 AIC: 69.38
on 80 on 77
degrees of freedom degrees of freedom
Cari Halaman
Kembali
Number of Fisher Scoring iterations: 5 Layar Penuh
Tutup
Keluar
Data dengan sebaran Poisson Contoh 5.2. Contoh berikut diambil dari data warpbreaks pada database R. Data ini adalah tentang banyaknya kerusakan yang terjadi pada dua jenis wool (A dan B) yang diberi tiga macam tekanan (rendah menengah dan tinggi). Karena data merupakan hasil pencacahan maka distribusi yang paling cocok adalah Poisson dengan pilihan alternatif fungsi hubungan log atau identitas (linier). Kita akan mencoba kedua model dan memeriksa mana yang lebih baik dengan menggunakan kriteria AIC.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
Dengan model ini semua koefisien regresi signifikan yang berarti ada beda signifikan dari jumlah kerusakan dilihat baik dari jenis wool maupun tingkat tekanan. Model ini mempunyai nilai AIC 497,36 glm(formula = breaks ~ wool + tension, family = poisson(link = identity), data = warpbreaks)
I II
338 dari 490
Cari Halaman
Kembali
Deviance Residuals: Min 1Q Median 3Q Max -3.8266 -1.5822 -0.4776 1.1656 4.5603
Layar Penuh
Tutup
Keluar
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 38.440 1.600 24.025 < 2e-16 *** woolB -4.877 1.413 -3.452 0.000557 *** tensionM -9.173 1.863 -4.925 8.44e-07 *** tensionH -14.385 1.783 -8.070 7.03e-16 *** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for poisson family taken to be 1) Null deviance: 297.37 on 53 degrees of freedom Residual deviance: 214.70 on 50 degrees of freedom AIC: 497.36
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
339 dari 490
Cari Halaman
Distribusi Poisson dengan hubungan log Kembali
Model ini juga menunjukkan beda signifikan antara jumlah kerusakan dilihat dari jenis wool dan tingkattekanan, tetapi model ini memiliki AIC yang sedikit lebih rendah 493,06. Ini berarti model dengan
Layar Penuh
Tutup
Keluar
hubungan log sedikit lebih baik dari pada model dengan hubungan identitas. glm(formula = breaks ~ wool + tension, family = poisson(link = log), data = warpbreaks)
FMIPA-UNEJ
Daftar Isi
Deviance Residuals: Min 1Q Median 3Q Max -3.6871 -1.6503 -0.4269 1.1902 4.2616 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 3.69196 0.04541 81.302 < 2e-16 *** woolB -0.20599 0.05157 -3.994 6.49e-05 *** tensionM -0.32132 0.06027 -5.332 9.73e-08 *** tensionH -0.51849 0.06396 -8.107 5.21e-16 *** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Dispersion parameter for poisson family taken to be 1)
Judul
JJ J
I II
340 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Null deviance: 297.37 on 53 degrees of freedom Residual deviance: 210.39 on 50 degrees of freedom AIC: 493.06 FMIPA-UNEJ
Contoh 5.3. Data berikut diambil dari data kyphosis dari data base R pada paket gam tentang hasil operasi anak terkait dengan muncul tidaknya penyakit paska operasi yang disebut khyposis. Data ini merekam muncul tidaknya penyakit yang tersebut, dihubungkan dengan usia anak (Age) dalam bulan, tingkat operasi mulai (Start) Lihat Chamber & Hastie[5].
Daftar Isi
Judul
JJ J
Respon muncul tidaknya Khyposis merupakan data biner yang berdistribusi binomial. Kita dapat menggunakan Khyposis sebagai respon dan variabel lainnya sebagai veriabel penjelas dengan menggunakan fungsi hubungan logit. Kita dapat mulai dengan model yang agak lengkap dan selanjutnya memerintahkan R untuk menghitung model terbaik dengan kriteria AIC.
I II
341 dari 490
Cari Halaman
Kembali
glm(formula = Kyphosis ~ Age + Number + Start, family = binomial(link = logit), data = kyphosis)
Layar Penuh
Tutup
Keluar
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.036934 1.449575 -1.405 0.15996 Age 0.010930 0.006446 1.696 0.08996 . Number 0.410601 0.224861 1.826 0.06785 . Start -0.206510 0.067699 -3.050 0.00229 ** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
FMIPA-UNEJ
Daftar Isi
Judul
(Dispersion parameter for binomial family taken to be 1) JJ J
Null deviance: 83.234 on 80 degrees of freedom Residual deviance: 61.380 on 77 degrees of freedom AIC: 69.38
Model ini memiliki AIC 69,38 tetapi dari koefisien regresinya terlihat hanya ada satu koefisienyang signifikan. Untuk itu kita akan lakukan penelusuran alternatif model dengan menggunakan perintah step(). Ternyata dari segi nilai AIC, alternatif model- model yang lain tidak menyebabkan adanya oenurunan AIC yang berarti dan dianggap model lengkap ini sudah cukup baik.
I II
342 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.7.2.
Prediksi pada GLM
Setelah model yang dianggap baik diperoleh, selanjutnya model tersebut dapat dipakai untuk mempredikasi baik nilai link (kombinasi linier) maupun responnya. predict(object, newdata = NULL, type = c("link", "response", "terms"), se.fit = FALSE, dispersion = NULL, terms = NULL, na.action = na.pass, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
Tipe yang merupakan default adalah ”link”, yaitu R menghiP tung hasil kombinasi linier xij βˆj . Pada contoh di atas diperoleh βˆj masing-masing adalah (-2,036934, 0,010930; 0.410601;-0,206510), sehingga untuk x1 = 70, x2 = 3, x3 = 10 diperoleh η = −2, 105097. Untuk prediksi respon yang ditafsirkan sebagai peluang munculnya kyphosis ketika Age=70, Number=3, Start=10, diperoleh dengan memilih type=”response” yang menghasilkan 0,1086024. > predict(glm2,data.frame(Age=70,Number=3,Start=10) [1] -2.105097
I II
343 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
> predict(glm2,data.frame(Age=70,Number=3,Start=10), type="link") [1] -2.105097 > predict(glm2,data.frame(Age=70,Number=3,Start=10), type="response") [1] 0.1086024
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
344 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.8.
Ringkasan
1. Distribusi/ Sebaran keluarga eksponensial menggabungkan distribusi - distribusi yang telah banyak dikenal (misalnya Binomial, Poisson, Normal, Gamma) menjadi satu kesatuan distribusi. 2. Masing-masing sebaran anggota keluarga eksponensial memiliki ciri khas dilihat dari ruang rentang (diskrit kontinu, terbatas tak terbatas), dan hubungan nilai-tengah dengan ragamnya (bebas, linier atau kuadratik).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
3. Ada tida komponen penting model linier tergeneralisir yaitu: (i) komponen respon dengan sebaranpada anggota keluarga eksponensial, (ii) ada komponen kombinasi linier antara peubah penjelas dengan parameter regresi, dan (iii) ada fungsi (kontinu dan diferensiabel) yang menghubungkan antara nilai tengah dengan kombinasi linier tadi.
I II
345 dari 490
Cari Halaman
Kembali
4. Beberapa bentuk khusus regresi yang termasuk model liniertergeneralisir diantaranya adalah regresi logistik (logit, probit dengan respon bersebaran Binomial), regresi log-linier (dengan re-
Layar Penuh
Tutup
Keluar
spon bersebaran Poisson). 5. Pemilihan model terbaik dapat dilakukan dengan melihat nilai AIC.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
346 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.9.
Bacaan Lebih Lanjut
Referensi yang biasa dijadikan acuan utama mempelajari model linier tergeneralisir ini adalah McCullagh dan Nelder [24], sedangkan sebagai pemula dapat menggunakan pengantar yang ditulis oleh Dobson [11]. Khusus hubungannya dengan paket Splus atau R dapat dibaca referensi Chamber & Hastie [5], Ripley & Venables [47]
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
347 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.10.
Latihan Soal-soal
1. Tuliskan bentuk umum sebaran keluarga eksponensial. Jelaskan kaitannya dengan beberapa bentuk khusus seperti Binomial, Poisson, Normal dan Gamma. 2. Sebutkan ciri-ciri khas dari sebaran Binomial,Poisson, Normal dan Gamma dilihat dari ruang rentang, fungsi ragam dan link kanonik. 3. Jelaskan manfaatdan fungsi dari fungsi link pada model linier tergeneralisir (kaitkan dengan skala peubah penjelas dan peubah respon).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
348 dari 490
4. Jelaskan apa yang dimaksud dengan regresi logistik dan loglinier. 5. Suatu data dianalisis dengan model linier tergeneralisir dengan sebaran Poisson dan fungsi link log. Dari hasil analisi diperoleh βˆ0 , βˆ1 dan βˆ2 . Tuliskan bentuk model (persamaan regresi) yang diperoleh.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
BAB
6
Daftar Isi
Judul
MODEL UNTUK RESPON TIDAK SALING BEBAS
JJ J
I II
349 dari 490
Cari Halaman
Pada Bab 5 telah didiskusikan perluasan model linier untuk data yang berdistribusi Keluarga Eksponensial dimana distribusi Normal merupakan salah satu bentuk khususnya. Dalam perluasan tersebut distribusi galat (error) masih saling bebas, hanya saja tidak harus
Kembali
Layar Penuh
Tutup
Keluar
berdistribusi Normal. Dalam eksperimen yang melibatkan pengukuran berulang (repeated measurement) atau pengamatan waktu panjang (longitudinal) umumnya respon yang dihasilkan adalah berupa vektor data yang kemungkinan besar tidak saling bebas. Ada beberapa kondisi eksperimen yang menghasilkan data yang tidak saling bebas diantaranya seperti berikut ini. 1. subjek penelitian mendapat beberapa perlakuan yang berbeda atau memiliki beberapa respon yang berbeda, misalnya: (i) subjek (sekelompok siswa) diberi beberapa tes (ujian) yang berbeda dan skor untuk semua ujian dipeljari secara simultan; (ii) jenis benih tertentu diberi berbagai tingkat pemupukan atau perlakuan lainnya. 2. subjek diberi satu perlakuan tetapi respon diamati pada interval waktu berbeda, misalnya respon terhadap suatu perlakuan diamati setiap 6 jam selama 24 jam;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
350 dari 490
Cari Halaman
Kembali
Respon yang dihasilkan dapat berupa: (i) hasil pengukuran yang biasanya bersekala interval seperti skor tes, produksi pertanian; (ii) hasil pencacahan (misalnya banyaknya salah sambung pada hubungan
Layar Penuh
Tutup
Keluar
tilpun, banyaknya kejadian pada tempat dan interval waktu tertentu) atau (iii) berupa respon biner (misalnya banyaknya prosentase sukses pada setiap interval waktu tertentu). FMIPA-UNEJ
Ada dua pendekatan yang dipergunakan untuk menganalisis data sejenis ini. Kedua pendekatan ini relatif baru yang diperkenalkan satu-dua dekade lalu. Pendekatan pertama adalah model marjinal yang diperkenalkan oleh Liang & Zeger tahun 1986, yang lebih dikenal dengan pendekatan GEE (Generalized Estimating Equation). Pendekatan ini tidak didasarkan atas bentuk likelihood lengkap dari respon, tetapi hanya berdasarkan hubungan antara nilai-tengah (momen pertama) dan ragamnya (momen kedua) serta bentuk matriks korelasinya. Pendekatan kedua adalah pendekatan Model Linier Tergeneralisir Hirarkis yang dipelopori oleh Lee & Nelder tahun 1996. Model ini selain menggunakan likelihood lengkap, juga menggabungkan pendekatan multiplikatif dan pendekatan aditif. Walau sudah diperkenalkan dua dekade lalu, pendekatan GEE belum banyak diimplemantasikan pada paket komputer. R sebagai open source termasuk salah satu diantara sedikit paket yang telah mengimplementasikannya. Ada dua paket fungsi yang mengimple-
Daftar Isi
Judul
JJ J
I II
351 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mentasikan GEE pada R yaitu gee dan geePackages. Namun kedua paket fungsi ini belum bisa diakses melalui menu. Dalam bab ini akan dibahas perluasan model (regresi) linier untuk data yang mungkin selain tidak berdistribusi Normal juga tidak saling bebas.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
352 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi Setelah menyimak materi pada bab ini, pembaca diharapkan: 1. dapat membedakan data dengan respon saling bebas dan data dengan respon tidak saling bebas;
FMIPA-UNEJ
Daftar Isi
2. dapat menjelaskan beda dan generalisasi dari model linier klasik, tergeneralisir (GLM), dan GEE; 3. dapat menganaisis dan menginterpretasikan hasil menggunakan GEE
Judul
JJ J
I II
353 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi 1. Model marjinal 2. Quasi-likelihood dan GEE 3. Generalisasi dan bentuk GEE
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
354 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.1.
Model Marjinal
Perhatikan bahwa model linier mempunyai bentuk umum yang telah diuraikan pada bab sebelumnnya yaitu: Y = Xβ +
FMIPA-UNEJ
(6.1)
Dalam perkembangannya di lapangan, ada kemungkinan baik maupun Y tidak lagi berdistribusi normal. Apabila data yang tidak berdistribusi normal ini masih saling bebas, maka model linier yang mempelajari hubungan peubah untuk jenis data ini disebut model linier tergeneralisir (Generalized Linear Models, untuk selanjutnya disingkat GLM). Pembahasan tentang GLM telah dibahas pada Bab 5.1 dan Bab 5. Referensi yang membahas secara komprehensif tentang GLM diberikan oleh McCullagh & Nelder [24]. Jika Yi tidak berdistribusi normal, maka pada persamaan di atas terjadi perubahan asumsi yaitu: 1. hubungan yang ada antara ekspektasi/rataan dan prediktor linier adalah g(µ) = η dengan g(.) adalah fungsi monoton dan diferensiabel yang disebut fungsi link;
Daftar Isi
Judul
JJ J
I II
355 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. sedangkan ragamnya menjadi V ar(Y ) = ψv(µ), dengan ψ adalah parameter skala yang bukan menjadi perhatian utama sehingga sering diasumsikan diketahui. Fungsi v() disebut fungsi ragam yang bentuk khususnya bergantung pada jenis distribusinya, misalnya untuk distribusi Poisson, secara umum berlaku v(µ) = ψµ, yaitu berlaku hubungan linier antara nilaitengah dan ragam pada distribusi Poisson. Apabila data yang tidak berdistribusi normal tersebut juga tidak saling bebas, dengan kata lain Yi bukanlah respon tunggal tetapi merupakan vektor respon, yi = (Yi1 , Yi2 , Yij Yit )T . Diggle et al. [10] menguraikan beberapa metode analisis utuk jenis respon ini, salah satu diantaranya, yang banyak digunakan adalah model marjinal. Dalam sebuah model marjinal, regresi dari respon terhadap peubah eksplanatori dimodelkan secara terpisah dengan korelasi dalam unit/subjeknya. Dalam regresi tersebut, ekspektasi marjinal E(Yij ) dimodel sebagai fungsi dari peubah bebas atau peubah eksplanatori (X). Ekspektasi marjinal adalah rata- rata respon dari subpopulasi yang memiliki pe-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
356 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ubah eksplanatori yang sama. Model marjinal secara khusus memiliki asumsi berikut. 1. Ekspektasi marjinal, E(Yij ) = µij , bergantung pada vektor peubah eksplanatori xij dengan hubungan g(µij ) = xij β, dengan g(.) adalah fungsi link yang diketahui seperti misalnya logit untuk respon binomial, dan β adalah vektor parameter yang akan diduga; 2. Ragam marjinal tergantung pada rataan atau ekspektasi marjinal menurut hubungan V ar(Yij ) = φv(µij ), dengan v(.) adalah fungsi ragam yang diketahui dan φ adalah parameter skala yang mungkin perlu diduga juga 3. Korelasi antara Yij dan Yik adalah sebuah fungsi dari rataan marjinal dan mungkin juga parameter - parameter tambahan , yaitu Corr(Yij , Yik ) = ψ(µij ; µik ; α) dimana ψ(.) adalah sebuah fungsi yang disumsikan diketahui (Diggle et al. [10]). Dalam kedua kasus di atas, menganalisis data asli (dalam bentuk multivariat) dianggap lebih memberikan gambaran yang benar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
357 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 6.1: Respon Pengukuran berulang Pengulangan Variabel Penjelas No. Subjek T1 T2 ... Tt X ... 1 S1 y11 y12 ... y1t x1 2 S2 y21 y22 ... y2t x2 ... ... ... ... ... ... ... n Sn yn1 yn2 ... ynt xn
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
358 dari 490
dibandingkan dengan menganalis rata-rata respon. Dengan kata lain menganalisis profil lebih tepat dari pada menganalisis rata-rata. Subjek mungkin memiliki rata-rata saa tetapi profilnya berbeda. Secara keseluruhan respon Y bukanlah sekedar vektor data tetapi matriks data. Pada matriks data tersebut yj menunjukkan vektor data untuk pengamatan ke-j. Sedangkan yij menunjukkan respon untuk subjek ke-i pada pengamatan ke-jMasing-masing subjek penelitian memiliki
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
respon multivariate berupa vektor dengan panjang p. Y11 Y12 · · · Y1t y1 T T Y21 Y22 · · · Y2t y Y= 2 = . .. . . .. . · · · . . . . yN P Yn1 Yn2 · · · Ynt
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
359 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.2.
Quasi-Likelihood dan Generalized Estimating Equations (GEE) FMIPA-UNEJ
Dalam model linier yang peubah responnya masih saling bebas, meskipun tidak berdistribusi normal, fungsi likelihoodnya relatif mudah dievaluasi dan dimaksimumkan. Metode yang menganalisis data yang tidak berdistribusi normal tetapi masih saling bebas disebut GLM. Untuk data yang tidak saling bebas, dengan model marjinal, kita hanya menentukan bentuk nilai-tengah (sebagai momen pertama) dan matriks ragam - koragam (sebagai momen kedua). Untuk distribusi normal, kedua momen ini telah cukup menentukan fungsi likelihoodnya, namun tidak demikian halnya dengan distribusi lainnya seperti distribusi binomial, poisson dan gamma, misalnya. Untuk mengetahui keseluruhan likelihood diperlukan asumsi-asumsi lainnya. Meskipun dengan asumsi-asumsi tambahan, likelihood seringkali tetap sulit ditentukan dan melibatkan banyak paremeter gangguan (nuisance) selain parameter regresi (β) dan parameter korelasi (misalnya,α) yang harus diduga. Untuk alasan ini, pendekatan yang relatif mudah dipahami dan masuk akal dalam mengatasi kesulitan ini adalah dengan
Daftar Isi
Judul
JJ J
I II
360 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
menggunakan Generalized Estimating Equations (untuk selanjutnya disingkat GEE) yang pertama diperkenalkan oleh Liang dan Zeger (yaitu Liang & Zeger [21], Zeger & Liang [52],[53], Liang et al. [22], Zeger et al. [54]). GEE merupakan sebuah analogi atau generalisasi multivariat dari quasi-likelihood untuk respon saling bebas(Diggle, et al. [10]). Manakala tidak ada fungsi likelihood yang pasti untuk dijadikan acuan, cukup beralasan untuk menduga/ mengestimasi dengan menyelesaikan sebuah analogi multivariat dari metode quasiscore yang diperkenalkan Wedderburn [51], yaitu: T n X ∂µi V ar (Yi )−1 (Yi − µi ) = 0 (6.2) S(β) = ∂β i=1 Karena secara umum berlaku g(µij ) = xi β , maka melalui fungsi hungungan (link function) akan langsung dapat dicari turunan g(.) terhadap η dan karenanya persamaan (6.2) dapat dimodifikasi menjadi T n X ∂µi T S(β) = Xi V ar (Yi )−1 (Yi − µi ) = 0 (6.3) ∂η i i=1 dimana, Yi, µi dan ηi adalah vektor dan V ar(Yi ) merupakan matrik simetris. Dalam kasus multivariat, ada tambahan komplikasi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
361 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
seperti Sβ yang sesungguhnya juga tergantung pada parameter β maupun α, karena V ar(Yi ) = φV ar(Yi ; β; α). Pada bab ini akan dibahas analisis model linier untuk respon yang tidak saja berdistribusi tidak normal tetapi juga respon tersebut tidak saling bebas. Respon seperti ini dihasilkan oleh pengamatan berulang (repeated meassurement/longitudinal data), misalnya pengamatan yang dilakukan pada tiap interval waktu tertentu. Tentu saja akan lebih baik jika data yang dihasilkan oleh beberapa pengamatan ini diuji secara serempak, tidak satu-persatu maupun diwakili oleh rata-ratanya.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
362 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.3.
Generalisasi dan Bentuk GEE
Dibandingkan dengan persamaan untuk memperoleh penduga pada model linier normal (NLM) seperti pada persamaan (3.1) pada halaman 154 dan pada model linier tergenaralisasi (GLM), GEE ini mengalami generalisasi atau perbedaan dalam beberapa hal yaitu: 1. Dalam NLM dan GLM respon Yi , ekspektasi E(Yi ) = µi merupakan variabel univariat, sedangkan dalam GEE mereka berupa vektor yang berhubungan dengan subjek ke-i, sebagai konsekuensinya maka model (3.1) harus digeneralisasi dengan mempertimbangkan jumlah untuk seluruh individu/subjek Y;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
363 dari 490
∂µi adalah 1, pada GLM nilainya be∂ηi rantung pada fungsi link g(.); sedangkan dalam GEE, karena ekspektasi dan prediktor linier dua-duanya merupakan vektor berukuran t, maka merupakan ia matrik diagonal berukuran t×t ∂µij dengan unsur diagonalnya adalah yang nilainya riilnya ∂ηij juga masih bergantung pada fungsi link g(.) yang digunakan;
2. Dalam NLM, nilai
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Dalam NLM ragam dari respon, var(Yi ) = φv(µi ) adalah konstan yaitu σ 2 , dalam GLM dia adalah tidak konstan tetapi berupa matriks diagonal, sedangkan dalam GEE dia berupa matriks ragam - koragam yang bersifat umum (simetris) yang tidak saja bergantung pada µ atau β tetapi juga pada φ dan α, yang dapat dinyatakan dalam bentuk
FMIPA-UNEJ
Daftar Isi
Judul
p p vi = φ v(µi R(α) v(µi
JJ J
I II
364 dari 490
dengan R(α) adalah matriks korelasi yang diasumsikan, misalnya struktur korelasi seragam yang biasa disebut exchageable/uniform, model rangkaian waktu AR-1, dan lain- lain (Kenward & Smith [17]). Dengan demikian secara keseluruhan V ar(Y) untuk NLM adalah σ 2 I, untuk GLM adalah matriks diagonal dengan unsur diagonal V ar(Yi ), sedangan pada GEE dia adalah matriks diagonal blok dengan blok ke-i adalah Vi . Untuk struk-
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tur korelasi seragam bentuknya matriks korelasinya adalah
1 α ··· α α 1 · · · α R = . . . .. . . . . . . . . α α ··· 1 Sedangkan model korelasi AR-1 yang biasa juga disebut model korelasi serial adalah: R=
1 α .. .
α 1 .. .
α2 α .. .
αp−1 αp−2 αp−3
· · · αp−1 · · · αp−2 .. . .. . . ··· 1
Dengan mencari turunan, terhadap β, dari ruas kiri pada persamaan (6.3), maka diperoleh persamaan dalam bentuk iterasi Fisher Scoring, untuk penduga β dapat dinyatakan dengan persamaan berikut
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
365 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
#−1 ∂µ ∂µ i i =b(0) + Xi T [var(Yi )]−1 Xi ∂η ∂η i i # " i=1 n X ∂µ i [var(Yi )]−1 (Yi − µi ) (6.4) Xi T ∂η i i=1 "
b(1)
n X
Dalam bentuk iterasi seperti persamaan (6.4), maka ragam ”biasa” b, yang biasa disebut ragam naive dapat ditentukan dengan " n #−1 X ∂µ ∂µ i i Vn = Xi T [var(Yi )]−1 Xi (6.5) ∂η ∂η i i i=1 sedangkan ragam yang lebih tegar, biasa disebut sandwich/ robust variance diperoleh dengan menerapkan hukum bahwa untuk matriks konstanta A, maka var(AY ) = AT var(Y )A dengan A=
" n X i=1 " n X i=1
Xi Xi
T
T
∂µi ∂ηi ∂µi ∂ηi
−1
[var(Yi )]
∂µi ∂ηi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
366 dari 490
Cari Halaman
#−1
Xi
Kembali
# [var(Yi )]−1
Layar Penuh
Tutup
Keluar
Jika perkalian dengan invers dinotasikan dengan ’pecahan’ seperti notasi art:KenwardSmith95, maka A dapat dinotasikan dengan: FMIPA-UNEJ
"
n X
#
∂µi Xi [var(Yi )]−1 ∂η i i=1 A= " n # X ∂µ ∂µ i i −1 Xi T [var(Yi )] Xi ∂ηi ∂ηi i=1 T
Daftar Isi
Judul
JJ J
I II
367 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.4.
Ilustrasi GEE dengan R
Fasilitas GEE hanya dapat dimanfaatkan melalui skrip dengan mengaktifkan paket gee. Format fungsi gee() adalah: gee(formula, id, data, subset, na.action, R = NA, b = NA, tol = 0.001, maxiter = 25, family = gaussian, corstr = "independence", Mv = 1, silent = TRUE, contrasts = NULL, scale.fix = FALSE, scale.value = 1, v4.4compat = FALSE)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
368 dari 490
id adalah variabel yang menunjukkan terjadinya pengukuran berulang. Selain alternatif family dan link seperti pada glm(), dengan gee() juga tersedia beberapa alternatif model korelasi di antaranya adalah: 1. "independence" yang berarti kita mengasumsikan respon saling bebas. Jadi model ini identik dengan model glm()
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. "exchangeable" yang berarti kita mengasumsikan adanya korelasi seragam atau yang lebih dikenal dengan compound symmetry, FMIPA-UNEJ
3. "AR-M" jika kita mengasumsikan model deret waktu Auto Regressive orde M, 4. "unstructured" untuk model korelasi tanpa struktur. Model ini juga disebut model multivariate penuh. Contoh 6.1. Pada data warpbreaks apabila dianggap bahwa faktor wool yang sama mendapat tiga macam perlakuan tekanan, atau faktor wool dianggap sebagai faktor acak, maka data tersebut dapat dianalisis melalui gee() dengan wool sebagai id. Berikut adalah hasil yang diperoleh dengan menggunakan model korelasi seragam dan deret waktu AR-1 dengan distribusi Poisson Model: Link: Logarithm Variance to Mean Relation: Poisson Correlation Structure: Exchangeable
Daftar Isi
Judul
JJ J
I II
369 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Call: gee(formula = breaks ~ tension, id = wool, data = warpbreaks, family = poisson(link = log), corstr = "exchangeable") FMIPA-UNEJ
Coefficients: Estimate Naive S.E. Naive z Robust S.E. Robust z (Intercept)3.5942635 0.09055356 39.692126 0.15869419 22.648992 tensionM -0.3213204 0.12808197 -2.508709 0.22270597 -1.442801 tensionH -0.5184885 0.13619100 -3.807069 0.06441329 -8.049403
Daftar Isi
Judul
JJ J
Estimated Scale Parameter: Number of Iterations: 1
I II
4.601903
Koefisien korelasi model di atas adalah r = 0, 02088982. Untuk korelasi dengan asumsi AR-1 diperileh hasil berikut: Model: Link: Logarithm Variance to Mean Relation: Poisson Correlation Structure: AR-M , M = 1
370 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Call: gee(formula = breaks ~ tension, id = wool, data = warpbreaks, family = poisson(link = log), corstr = "AR-M", Mv = 1) Summary of Residuals: Min 1Q Median -22.415091 -8.095630
3Q Max -2.695504 6.304496
FMIPA-UNEJ
Daftar Isi
33.584909 Judul
Coefficients: Estimate Naive S.E. Naive z Robust S.E. Robust z (Intercept)3.5949833 0.08689454 41.371797 0.15918021 22.584360 tensionM -0.3245601 0.13381637 -2.425414 0.22496947 -1.442685 tensionH -0.5178782 0.14221001 -3.641644 0.06567149 -7.885892
JJ J
I II
371 dari 490
Cari Halaman
Estimated Scale Parameter: Number of Iterations: 2 Working Correlation [,1] [,2] [,3]
4.601424 Kembali
[,4]
Layar Penuh
Tutup
Keluar
[1,] 1.000000e+00 4.125981e-02 1.702372e-03 7.023956e-05 [2,] 4.125981e-02 1.000000e+
Contoh 6.2. Data Orange merupakan data tentang usia dan keliling batang pohon jeruk untuk berbagai jenis pohon jeruk. Dapat dianggap bahwa satu jenis pohon jeruk diamati secara berulang untuk tingkat umur yang berbeda. Dalam konteks model marjinal, jenis pohon menjadi pertimbangan dalam estimasi hubungan antara usia dan keliling pohon, tetapi tidak secara eksplisit masuk kedalam model. Karena pengamatan berulangnya berdasarkan waktu, maka model korelasi yang dianggap lebih cocok adalah model AR-1, bukan seragam. Model: Link: Logarithm Variance to Mean Relation: Gamma Correlation Structure: AR-M , M = 1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
372 dari 490
Cari Halaman
Kembali
Call: gee(formula = circumference ~ age, id = Tree, data = Orange, family = Gamma(link = log), corstr = "AR-M", Mv = 1)
Layar Penuh
Tutup
Keluar
Summary of Residuals: Min 1Q Median 3Q Max -55.95909 -3.67571 10.05171 24.64189
69.23206
FMIPA-UNEJ
Daftar Isi
Coefficients: Estimate Naive S.E. Naive z Robust S.E. Robust z (Intercept)3.374827865 0.14418605 23.40606 2.215775e-02 152.3092 age 0.001202957 0.00010245 11.74185 3.813379e-05 31.5457
Judul
JJ J
Estimated Scale Parameter: 0.095224 Correlation parameter = 0.8461830
I II
373 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.
Gamma-HGLM dan Model Lainnya
Pada bagian ini diuraikan secara ringkas bentuk Model Linier Tergeneralisir Bertingkat (HGLM=Hierarchical Generalized Linear Model), khususnya Gamma-HGLM yang menggunakan asumsi distribusi Gamma. Pada bab ini juga diuraikan hasil-hasil matematika yang dapat diturunkan berkaitan dengan estimasi parameter untuk model sekawan (Gamma-InverseGamma) melalui pendekatan likelihood bersama (joint likelihood) yang biasa juga disebut dengan pendekatan khusus subjek (Subject Specific Model). Secara khusus model likelihood bersama untuk model sekawan, dalam buku ini disebut JGIG. Model yang dibahas termasuk model bertingkat/hierarkis, yaitu Hierarchical Generalized Linear Models dengan distribusi Gamma, yang selanjutnya disebut JGIG. Model ini termasuk perkembangan model terbaru dari model linier yang mulai diperkenalkan oleh Lee & Nelder [20] (kurang lebih satu dekade setelah diperkenalkannya GEE). Sampai saat ini, model ini belum terimplementasi ke dalam paket komputer yang banyak beredar (termasuk R). Program terbatas telah ditulis dan tersedia bagi yang berminat. Gamma-HGLM yang dibahas baru terbatas pada pendekatan likelihood bersama yang merupakan akumulasi riset penulis sejak tahun 1999.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
374 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.1.
Gamma-HGLMs
Model yang dibahas termasuk bagian dari HGLM. Bersama dengan fungsi hubungan yang dipilih, HGLM, mempersatukan pendekatan model aditif dan multiplikatif yang sekaligus juga memperluas distribusi efek acak yang dimungkinkan memiliki distribusi tidak normal. Model ini dapat dianggap sebagai pengembangan dari model GLMM (Generalized Linear Mixed Models, yaitu Model Linier Tergeneralisasi Campuran yang mensyaratkan efek acak harus berdistribusi normal. Dalam HGLM, nilai-tengah bersyarat yij |Ui didefinisikan sebagai fungsi dari efek tetap µi atau β, dan efek acak Ui , yaitu E(yi |Ui ) = ψ(µi , Ui ). Untuk meminimalkan bias, nilai-tengah efek acak U disyaratkan sedemikian sehingga nilai-tengah tak bersyarat E(yij ) sama dengan µij . Jadi, jika menggunakan model aditif (misalnya pada GLMM) syaratnya E(yi |Ui ) = µi + Zi Ui = µi ,yaitu syaratnya E(Ui )=0. Jika menggunakan model multiplicatif syaratnya E(yi |Ui ) = µi Ui = µi , yaitu E(Ui )=1. Pada model Gamma-HGLM yi |Ui diasumsikan berdistribusi Gamma sedangkan Ui berdistribusi Inverse-Gamma, untuk model sekawan (lihat Tirta [40]) atau Lognormal, untuk model taksekawan lihat Tirta [41]) dengan nilai-tengah satu. Model Gamma-Inverse-Gamma dapat dirangkum sebagai berikut ini. Misalkan bahwa, untuk individu atau strata kei dari
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
375 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
jumlah m, sebanyak ni respon teramati,sedemikain sehingga secara keseluP ruhan ada respon sebanyak N = m i=1 ni . Misalkan yi = [yi1 , · · · , yij , · · · , yini ]T
FMIPA-UNEJ
merupakan vektor data berukuran ni untuk individu atau strata ke i dengan i = 1, . . . , m. Definisi Gamma Inverse Gamma Model (GIGM), mengikuti HGLMs (Lee & Nelder [20]), seperti berikut. 1. Untuk i = 1, . . . , m, ada efek acak γi , berkaitan dengan individu atau strata ke i yang saling bebas dan berdistribusi inverse gamma dengan likelihood (α − 1)α −(α+1) α−1 f2 (γi , α) = γ exp − , (6.6) Γ(α) γi
Daftar Isi
Judul
JJ J
I II
376 dari 490
dan E(γi ) = µγ = 1, var(γi ) = σγ2 =
1 , α−2
dengan α > 2.
(6.7)
Selanjutnya ini dinotasikan γi ∼ IG(1, α). 2. Bersyarat dengan efek acak γi , respon yij , untuk i = 1, . . . , m and j = 1, . . . , ni , mengikuti GLMs dengan distribusi gamma dan memiliki nilai-tengah µ0ij = µij γi dan parameter bentuk ν, yang berarti:
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(a) untuk j = 1, . . . , ni , yij |γi , berdistribusi gamma dan saling bebas, G(µij γi , ν), dengan densitas νyij ν −1 νyij 1 f1 (yij , µij , ν|γi ) = yij exp − , (6.8) Γ(ν) µij γi µij γi yang memiliki nilai-tengah bersyarat E(yij |γi ) = µ0ij = µij γi ,
FMIPA-UNEJ
Daftar Isi
(6.9a) Judul
dan bersyarat var(yij |γi ) =
µ0ij2 µ2ij γi2 = ; ν ν
JJ J
I II
(6.9b)
(b) untuk matriks desain xij dan parameter regresi yang diketahui β hubungan berikut berlaku
377 dari 490
Cari Halaman
g(µ0ij )
=η
0
dengan g adalah fungsi-link. Secara khusus, untuk hubunganlog (log-link)
Kembali
Layar Penuh
log(µ0ij ) = η 0 = xij T β + ln(γi ),
(6.10) Tutup
Keluar
dan hubungan antara matriks desain, efek tetap dan efek acak dapat dinyatakan dalam bentuk matriks seperti: yi = g −1 (Xi β + Zi vi ) + i ,
(6.11)
FMIPA-UNEJ
dengan g(x) = ln(x) and vi = ln(γi ). Daftar Isi
Dapat ditunjukkan (Tirta [40]) dan Tirta [41]) bahwa model HGLM yang diajukan mempunyai korelasi berbentuk seragam. Jadi dengan model GIG yang diajukan, tidak ada kebebasan memilih bentuk korelasi.
6.5.2.
Likelihood Bersama: Model JGIG
Model sekawan Gamma-Inverse Gamma Model (selanjutnya disingkat Model GIG) telah didefinisikan pada Tirta [38]. Distribusi bersama merupakan hasil kali distribusi bersyarat y|γ dengan distribusi efek acak γ. Sedangkan log-likelihood bersama merupakan jumlah log-likelihood bersyarat dengan log-likelihood dari efek acak. Data dimodel dalam bentuk efek tetap (β) dan log dari efek acak log(U) = v, dengan y = g −1 (Xβ + Zv) + , dengan g(x), adalah fungsi hubungan. Matriks y adalah matriks data dan X matrix desain. Matriks T T T ZT = [ZT 1 Z2 . . . Zi . . . Zm ], dengan Zi adalah matriks ni × m dengan
Judul
JJ J
I II
378 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
unsur 0 dan 1 mengindikasikan setiap efek acak yang diaplikasikan. Unsur zij,k , (yaitu baris ke j dan kolom ke k dari matriks Zi) untuk i, k = 1, . . . , m dan j = 1, . . . , ni , dengan z(ij,k) = 1 untuk i = k, dan 0 untuk i 6= k. Likelihood bersama antara y dan efek acak γ adalah:
ni Y
ni X ν yit −ni ν f (y, γ) = γi exp − ν Γ(ν) µij µ t=1 it i=1 j=1 (α − 1)α −(α+1) α−1 × γi exp − . Γ(α) γi m Y
(
ν−1 yij
)
ν !
(
FMIPA-UNEJ
)
!
γi−1 (6.12)
Sedangkan log-Likelihood inti dari y dan v = log(γ) untuk y ∼ GIG(µ, ν, α), adalah:
Daftar Isi
Judul
JJ J
I II
379 dari 490
h(µ,v, ν, α) =
ni m X X i=1 j=1
l1 (yij , µij , ν|vi ) +
m X
l2 (vi , α)
(6.13)
i=1
Cari Halaman
Dalam persamaan di atas, l1 (yij , µij , ν|vi ) adalah log-likelihood untuk y|γ yaitu
Kembali
νyij l1 (yij , µij , ν|γi ) = − ln Γ(ν) + ν{ln(νyij ) − ln(µ0ij )} − ln(yij ) − 0 , µij
Layar Penuh
Tutup
Keluar
dengan µ0ij = µij exp(vi ). Sedangkan l2 (vi , α) adalah log-likelihood dari log effect acak, v = ln(γ), yaitu α−1 l2 (vi , α) = α ln(α − 1) − ln Γ(α) − vi α + . exp(vi )
(6.14)
Bentuk likelihood bersama ini selanjutnya dijadikan dasar untuk mengestimasi parameter (β, v, ν dan α) dengan menggunakan pendekatan likelihood maksimum.
6.5.3.
Estimasi Parameter β dan v
Estimasi Parameter β dan v dapat dilakukan dengan dua cara yaitu dengan cara bergantian (alternate algorithm) dan secara simultan (simultaneous/multivariate algorithm)
Estimasi Bergantian β dan v Dengan cara ini, β dan v diestimasi secara bergantian sampai syarat konvergensi secara keseluruhan terpenuhi.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
380 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Turunan dan Persamaan score β Turunan fungsi log-likelihood bersama seperti persamaan (6.13), terhadap β dan v, dicari dengan memperhatikan bahwa: 1. bersyarat terhadap random effect v, respon yij adalah saling independen dengan nilai-tengah µ0ij = µij ui . Ui adalah random efek/efek acak dan bila berdistribusi inverse gama biasa dinotasikann dengan γi ;
FMIPA-UNEJ
Daftar Isi
Judul
2. distribusi yij adalah gamma dengan rataan µ0ij . JJ J
3. β hanya ada pada bagian likelihood bersyarat, jadi estimasi β|v atau β|u dapat mengikuti atau prosedur GLM yang dapat dirumuskan secara umum !−1 ( m ) m X X 0 . bs = bs−1 + XT XT i Wi Xi i Wi ∆i (yi −µi ) i=1 i=1
I II
381 dari 490
Cari Halaman
s−1
(6.15)
Kembali
dengan (a) ∆i =adalah matriks diagonal dengan
∂η0 ij µ0ij
Layar Penuh
yang bergantung Tutup
Keluar
pada fungsi hubungan/link yang dipakai. Untuk link-log, ∆i = FMIPA-UNEJ
diag µ10 ij
Daftar Isi
(b) Wi adalah matriks diagonal dengan unsur diberikan oleh:
wij =
∂µ0ij 0 ∂ηij
!2
Judul
1 . V (µ0ij )
(6.16)
V (.) adalah fungsi ragam yang bergantung pada jenis distribusi 2 yang dipakai. Untuk distribusi gamma V (µ0ij = µ0ij sehingga menghasilkan Wi = In . Untuk distribusi lain misalnya Poisson dengan link-log, maka V (µ0ij = µ0ij sehingga Wi =diag µ0ij (lihat pada Dobson [11] dan McCullagh & Nelder [24]).
JJ J
I II
382 dari 490
Cari Halaman
Kembali
Dengan demikian hasil yang diperoleh untuk Gamma-HGLM dapat diperluas untuk distribusi lainnya dengan sedikit melakukan modifikasi pada fungsi link dan fungsi ragamnya.
Layar Penuh
Tutup
Keluar
Turunan log-likelihood terhadap v Turunan pertama h(y, µ, v) terhadap v bersyarat β adalah Dv =
∂h(y, µ, v) , ∂v
FMIPA-UNEJ
Dv adalah vektor dengan ukuran m dengan unsur ke i, di , di =
Daftar Isi
∂h(y, µ, v) ∂l1 (y, µ|v) ∂l2 (v, α) = + . ∂vi ∂vi ∂vi
Judul
Untuk i 6= i0 , vi dan vi0 adalah saling independen, maka
JJ J
∂h(y, µ, v) ∂l1 (y, µ|vi ) ∂l2 (vi , α) = + ∂vi ∂vi ∂vi n 0 i X ∂l1 (yij , µij |vi ) ∂l2 (vi , α) = + . ∂vi ∂vi j=1 ! ni X νyij α−1 ∂h(y, µ, v) −ν −α+ φ = 0 ∂vi µij exp(vi ) j=1 ni X
=ν
j=1
yij α−1 − ni ν − α + . µij exp(vi ) exp(vi )
I II
383 dari 490
Cari Halaman
Kembali
(6.17)
Layar Penuh
Tutup
Keluar
Persamaan di atas kebetulan memiliki penyelesaian analitik sehingga unsur ˆ , vi , dapat dihitung langsung tanpa iterasi dengan ke-i dari v Pn yij i ν j=1 +α−1 µˆij vˆi = ln(γˆi ) = ln (6.18) . ni ν + α
FMIPA-UNEJ
Daftar Isi
Algorithma estimasi bergantian dari β dan v adalah: 1. tentukan nilai awal untuk |beta, v dan parameter dispersinya;
Judul
2. ulangi langkahberikut sampai konvergen ˆ dengan prpsedur GLM; (a) hitung nilai β
JJ J
I II
ˆ dengan persamaan (6.18). (b) perbarui nilai v 384 dari 490
Mengingat kita bisa memanfaatkan pustaka GLM yang talah ada, implementasi algoritma ini ke program komputer sangat sederhana (strightforward).
Estimasi Simultan β dan v Pendugaan β and v dilakukan dengan metode Newton-Raphson. Untuk itu dibutuhkan turunan fungsi log-likelihood terhadap β dan v yang dapat
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dirangkum seperti berikut ini. m
X ∂l(µ|v) =φ−1 ∂β
i=1
∂ηi0 ∂β
∂ηi0 ∂β
Si Vi−1 (yi − µi 0 ),
(6.19) FMIPA-UNEJ
atau m
X ∂l(µ|v) =φ−1 ∂β
i=1
Daftar Isi
0
Wi ∆i (yi − µi ),
(6.20) Judul
dengan Si
−1
∂ηi0 = diag =∆i = ∂µi 0
0 ∂ηij ∂µ0ij
JJ J
! .
I II
(6.21) 385 dari 490
Si Vi−1 Si
−1 −1 ∆−1 i Vi ∆i
Pada persamaan di atas Wi = diag(wij ) = = yaitu −1 Wi ∆i = Si Vi , dengan Vi matriks diagonal yang unsurnya adalah fungsi . Turunan pertama dari likelihood bersama terhadap v, diturunkan dari (6.13) yang menghasilkan bentuk matriks (m ) X ∂h(µ, v) −1 T 0 Zi Wi ∆i (yi −µi ) + d , (6.22) =φ ∂v
Cari Halaman
Kembali
Layar Penuh
i=1
Tutup
Keluar
dengan d = ∂l(v, α)/∂v adalah vektor dengan panjang m dan unsur ke i ∂l(v, α) adalah di = φ , i = 1, 2, . . . , m. ∂vi FMIPA-UNEJ
Matriks informasi bersama antara β dan v Daftar Isi
Nilai harapan turunan kedua dari fungsi likelihood bersama terhadap v adalah
E
∂ 2 h(µ, v) ∂v ∂vT
= −φ−1
m X i=1
∂d ZT i Wi Zi − ∂vT
!
Judul
JJ J
.
I II
386 dari 490
Jadi Iv = φ
−1
m X
! ZT i Wi Zi
+U
(6.23)
Cari Halaman
i=1 Kembali
∂ 2 l(α, v) diag −φ ∂vi2
untuk U =
= diag
α−1 ν exp(vi )
;
i ∈ {1, 2, . . . , m}.
Layar Penuh
Tutup
Keluar
Turunan silang 2 m X ∂ h(µ, v) −1 −E =φ XT i Wi Zi , dan ∂β ∂vT i=1 2 m X ∂ h(µ, v) −1 −E =φ ZT i Wi Xi . ∂v ∂β T i=1
FMIPA-UNEJ
Daftar Isi
Jadi, matriks informasi bersama terhadap β dan v adalah I = φ−1 H , dengan # " P P T XT W X X W Z i i i i i P Ti . H= P T Zi Wi Zi + U Zi W i X i
Persamaan Skor untuk pendugaan β dan v
s−1
JJ J
I II
387 dari 490
Langkah ke s dari persamaan skor untuk pendugaan β dan v pada suatu nilai ν dan α, adalah " # " # " P # b b XT Wi ∆i (yi − µ0 ) −1 i P T , (6.24) = +H v v Zi Wi ∆i (yi − µ0 ) + d s
Judul
Cari Halaman
Kembali
s−1
dengan subskrip (s − 1) berarti rumus tersebut dinilai menggunakan hasil pada langkah ke(s − 1).
Layar Penuh
Tutup
Keluar
6.5.4.
Pendugaan parameter dispersi ν dan α
Pendugaan parameter dispersi menggunakan likelihood yang disesuaikan seperti disarankan oleh Cox & Reid [7], McCullagh & Tibshirani [25] dan Lee & Nelder [20]. Penyesuaian menghasilkan h-log-likelihood yang disesu1 aikan untuk pendugaan ν and α pada HGLMs hA = h − ln |2πφH| = 2 1 −1 h + ln 2πφH , dengan h adalah log-likelihood bersama (6.13) dan 2 −1 φH adalah matriks informasi untuk (β, v)T . Pendugaan parameter dispersi dilakukan menggunakan metode itˆs = θ ˆ s−1 − H−1 Dθ |s−1 , dengan θ = (ν, α)T erasi Newton-Raphson, yaitu θ θθ dan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
388 dari 490
∂ 2 hA ∂hA ∂ν 2 ∂ν ; H = Dθ = T θθ 2 ∂h ∂ hA A ∂α ∂ν∂α
∂ 2 hA ∂α∂ν . 2 ∂ hA ∂α2
Cari Halaman
Kembali
Layar Penuh
Unsur-unsur matriks adalah sebagai berikut ini. Tutup
Keluar
( ) m ni νyij yij ∂ha X X = digamma(nu) + ln 0 − 0 + 1 + ∂ν µij µij i=1 j=1 1 m + rank(X) ˙ν − + trace KU . (6.25) 2 ν ! m ∂ ln Γ(α) α 1 ∂hA X − = + + ln(α − 1) − vi − ∂α ∂α α−1 exp(vi ) i=1 1 ˙α . − trace KU (6.26) 2 ∞ X ∂ 2 hA 1 m + rank(X) 1 N + = −N + 2 2 ∂ν (ν + r − 1) ν 2 ν2 r=1 ¨ ν,ν ) + trace (KU ˙ ν )(KU ˙ ν) . −trace K(U (6.27) ( ) m ∞ X 1 α 2 ∂ 2 hA X = − − + ∂α2 (α + r − 1)2 (α − 1)2 α − 1 r=1 i=1 1 ˙ α )(KU ˙ α) . (6.28) + trace (KU 2 o ∂ 2 hA 1n ¨ ν,α ) − trace(KU ˙ ν )(KU ˙ α) = − trace(KU (6.29) ∂ν ∂α 2
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
389 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.4.1.
Prosedur Pendugaan
Model yang diperoleh memiliki banyak parameter. Beberapa diantaranya lebih mudah diduga dibanding yang lainnya. Jadi pendugaan secara serempak menggunakan model multivariat penuh akan tidak efisien. Smyth ([33] dan [34]) menyarankan untuk mengelompokkan parameter sesuai dengan kemudahan pendugaannya dan selanjutnya memanfaatkan algoritma partissi. Salah satu algoritma yang diajukan disebut prosedur coupled. Prosedur ini terdiri atas dua kelompok putaran yaitu putaran dalam dan putaran luar. Pada putaran dalam beberapa parameter yang sejenis diestimasi dengan metode Newton-Raphson atau metode Skor Fisher. Kriteria konvergensi secara keseluruhan dilakukan secara global yaitu apabila kriteria pada masing-masing putaran dalam telah tepenuhi. Secara ringkas prosedur tersebut dapat dirumuskan sebagai berikut. 1. Tentukan nilai awal β0 , v0 , α0 , ν0 .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
390 dari 490
Cari Halaman
2. Kondisional terhadap α0 , ν0 lakukan pendugaan β dan v. 3. Kondisional terhadap nilai baru β dan v lakukan pendugaan terhadap (α, ν).
Kembali
Layar Penuh
4. Ulangi prosedur di atas sampai konvergensi global terpenuhi. Tutup
Keluar
6.5.5.
Analisis HGLM dengan R
Sebagaimana disebutkan sebelumnya, secara umum metode HGLM belum terimplemantasikan ke paket komputer yang banyak beredar. Namun, khusus untuk metode JGIG, paket analisis telah dirintis. Penggunaannya adalah sebagai berikut
FMIPA-UNEJ
Daftar Isi
hglm(formula, distribusi = Gamma(link=log), data, cluster, subset=NULL, na.action, offset, start.coef = NULL, start.sigma = NULL, control = glm.control(epsilon = 1e-08, maxit = 100, trace = FALSE), n.points = 16)
Judul
JJ J
I II
391 dari 490
formula : deskripsi simbolik dari model yang dicoba (dinyatakan dalam bentuk y~x1+x2...) distribusi : jenis distribusi dan fungsi link yang diasumsikan untuk respon. Untuk sementara distribusi yang berlaku hanya distribusi Gamma dengan fungsi link=Log. Distribusi dan link ini sekaligus menjadi nilai default. data : data frame yang memuat variabel yang dipanggil
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dalam formula. klaster : variabel yang berfungsi sebagai klaster yang diperlakukan sebagai efek acak offset : dapat dipergunakan untuk menentukan nilai komponen yang telah diketahui yang mau diikutsertakan dalam prediktor. Komponen ini dimodelkan dengan koefisien1 (opsional) Pada contoh berikut data adalah data tentang pohon jeruk (Orange) yang berisi umur phon (age), lingkaran pohon (circumference) untuk berbagai jenis pohon (Tree). Dalam konteks HGLM dapat dianggap bahwa pengukuran dihasilkan dari beberapa jenis pohon (Tree) yang dimati untuk beberapa tingkat usia dan diukur besar lingkaran bantangnya. Dalam hal ini Tree dapat diperlakukan sebagai peubah yang menunjukkan adanya pengukuran berulang. data(Orange) attach(Orange) hglm(circumference~age, distribusi=Gamma(link=log), klaster=Tree,data=Orange) Hasil yang diperoleh adalah sebagai berikut. Estimator dan SE parameter tetap dengan memperhitungkan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
392 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
efek acak Komponen
Penduga Kesalahan Nilai_t Nilai_P baku (Intercept) 3.542547344 8.607523e-02 41.15641 0.000000e+00 age 0.001174635 8.262093e-05 14.21716 1.232348e-14
FMIPA-UNEJ
Daftar Isi
Besarnya Parameter Dispersi Respon = 0.05615005 Judul
Besarnya Parameter Dispersi Efek Acak = 2.082785 JJ J
Banyaknya klaster sebagai efek acak 5 dengan frekwensi dari 7 sampai 7 Penduga efek acak dengan asumsi inverse gamma Min. 1st Qu. Median Mean 3rd Qu. Max. 0.8187 0.8764 0.9243 0.9845 1.1440 1.1590 Sebagai perbandingan, jika analisis menggunakan gee() dengan struktur korelasi seragam, diperoleh hasil yang hampir sama, yaitu: Model: Link: Logarithm
I II
393 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Variance to Mean Relation: Gamma Correlation Structure: Exchangeable Call: gee(formula = circumference ~ age, id = Tree, data = Orange, family = Gamma(link = log), corstr = "exchangeable") Summary of Residuals: Min 1Q Median -81.517777 -10.244679
3Q Max -3.616427
FMIPA-UNEJ
Daftar Isi
Judul
12.901823
55.383573 JJ J
Coefficients: Estimate Naive S.E. Naive z Robust S.E. Robust z (Intercept)3.5244517 9.203927e-02 38.29291 4.409318e-02 79.93190 age 0.0011859 7.020315e-05 16.89202 4.072747e-05 29.11728 Estimated Scale Parameter: Number of Iterations: 1
0.05615
I II
394 dari 490
Cari Halaman
Kembali
Layar Penuh
Perbedaan antara gee() dengan JGIG yang diajukan di atas adalah: Tutup
Keluar
1. gee() hanya didasarkan hubungan bentuk momen, Gamma-HGLM, khususnya JGIG, menggunakan likelihood penuh, untuk JGIG dipergunakan likelihood bersama (joint likelihood); FMIPA-UNEJ
2. dengan gee() kita dapat memilih alternatif struktur korelasi, tetapi dengan Gamma-HGLM hanya menggunakan struktur korelasi seragam; 3. dengan gee() model yang diperoleh adalah model rata-rata populasi (marjinal), tetapi dengan JGIG model yang diperoleh adalah model individu (efek acak diestimasi secara eksplisit, sehingga prediksi individu lebih akurat).
Daftar Isi
Judul
JJ J
I II
395 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.6.
Bacaan Lebih Lanjut
Referensi model linier dengan pendekatan GEE dalam bentuk buku teks masih sangat jarang, diantaranya adalah Diggle et al. [10]. Sedangkan dalam bentuk jurnal cukup banyak diantarnya adalah yang ditulis langsung oleh Liang dengan kawan-kawannya seperti: Liang & Zeger [21], Zeger & Liang [52], Waclawiw & Liang [50], Liang et al. [22], Zeger & Liang [53], dan Zeger et al. [54]. Model linier dengan pendekatann HGLM termasuk model linier yang relatif baru dan masih sedang dikembangkan (lihat misalnya Lee dan Nelder [20] dan Tirta [37]). Publikasi HGLM terkait dengan aplikasi program R dapat dibaca pada Tirta et.al [45] dan Tirta et.al [44].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
396 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.7.
Ringkasan
1. Analisis regresi dengan data yang mengandung respon multivariat, misalnya data yang dikukur secara berulang baik diukur dengan kurun waktu berbeda maupun dengan perlakuan berbeda, dapat dilakukan dengan beberapa alternatif seperti GEE, GLMM, dan HGLM.
FMIPA-UNEJ
Daftar Isi
2. GEE tidak menggunakan metodelekelihood lengkap, tetapi menggunakan pendekatan marjinal dengan menetapkan bentuk momen pertama (nilai tengah) dan momen keduanya (ragam-koragam). 3. Paket GEE pada R menyediakan berbagai alernatif bentuk distribusi seperti halnyapada GLM dan berbagai bentuk korelasi (seperti seragam, AR-M, saling bebas). 4. HGLM menggunakan pendekatan likelihood murni dengan model bertingkat sehingga menghasilkan bentuk likelihood marjinal yang dapat dilacak, atau menggunakan pendekatan lain (misalnya Lapplace dan Markov Chained Monte Carlo). Dalam buku ini hanya dibatasi pada bentuk sekawan yaitu Gamma-Inverse-Gamma dan Poisson-Gamma. Model ini menghasilkan bentuk korelasi seragam.
Judul
JJ J
I II
397 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.8.
Latihan Soal-soal
1. Berikan tiga contoh pengamatan yang menghasilkan data dengan respon multivariat.
FMIPA-UNEJ
2. Secara teoritis, jelaskan bilamana penggunaan model korelasi exchangeable sesuai.
Daftar Isi
3. Secara teoritis, jelaskan bilamana penggunaan model korelasi serial/auto regressive-1 sesuai. 4. Dalam menggunakan paket gee,apa yang sesungguhnya dilakukan apabila kita memilih alternatif berikut: (a) bentuk korelasi="independence", dengan berbagai bentuk distribusi/ family dan link. (b) bentuk korelasi="independence", dengan bentuk bentuk distribusi/ family=="gaussian" dan link="identity". 5. Lakukan eksplorasi pada fungsi geese pada paket geepack. Bandingkan struktur dan hasilnya dengan paket gee.
Judul
JJ J
I II
398 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
GLOSARIUM
Daftar Isi
Judul
JJ J
I II
399 dari 490
A Cari Halaman
AIC
Akaike’s Information Criterion adalah salah satu kriteria yang dijadikan patokan memilih model yang baik dengan menghitung perimbangan besarnya maksimum likelihood dan banyaknya variabel yang dipergunakan dalam model.
Kembali
Layar Penuh
alpha(α)
Taraf signifikansi = peluang kesalahan tipe I, peluang secara Tutup
Keluar
keliru menolak hipotesis null yang benar.
B Boxplot
FMIPA-UNEJ
tampilah grafis dari kuantil data yang dinyatakan dalam bentuk kotak. Pada Boxplot digambarkan posisi median (Q2), kuantil 1(Q1) dan kuantil 3(Q3). Boxplot juga memberi gambaran ada tidaknya pencilan (outlier).
Daftar Isi
Judul
C CLI
JJ J
Command Line Interface adalah program yang menjembatani komunikasi antara komputer dengan pengguna dengan menggunakan perintah-perintah yang ditulis dalam baris perintah, tidak menggunakan grafis ataupun maouse. CLI merupakan interface utama dari R.
D derajat kebebasan Angka yang menunjukkan banyaknya informasi yang saling bebas setelah mengestimasi beberapa parameter.
I II
400 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Diagram Pencar (Scattergram) Diagram pencar adalah representasi grafik dari distribusi dua peubah acak yang disajikan dalam bentuk titik-titik dengan koordinat ditentukan oleh nilai observasi pasangan peubah acak tadi. distribusi diskrit sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan titik-titik yang tercacah (misalnya sebagian himpunan bilangan cacah, sebagian himpunan bilangan asli). distribusi kontinu sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan interval (misalnya seluruh bilangan real, bilangan real nonnegatif, a < x < b.).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
401 dari 490
distribusi Normal Baku Distribusi Normal dengan nilai-tengah 0 dan ragam 1.
E estimasi interval/selang keyakinan Interval/Selang Keyakinan adalah selang yang diyakini memuat nilai parameter populasi dengan
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tingkat peluang tertentu. Tingkat peluang yang banyak dipakai adalah 95% dan 99%. estimasi titik
Nilai tertentu yang merupakan penduga suatu parameter.
FMIPA-UNEJ
Daftar Isi
G GLM
GLM Generalized Linear Models atau Model Linear Tergeneralisir/ Terampat adalah analisis regresi untuk respon-respon yang tidak harus berdistribusi normal, tetapi masih dalam distribusi keluarga eksponensial (misalnya Poisson, Binomial, Gamma). Dalam GLM hubungan antara mean/ nilai-tengah respon dan peubah penjelas bisa berupa fungsi log, resiprokal atau fungsi lainnya.
Judul
JJ J
I II
402 dari 490
Cari Halaman
GUI
Graphical User Interface adalah program yang menjembatani komunikasi antara komputer dengan pengguna dengan menggunakan tampilan grafis seperti menu atau ikon, yang biasanya siap diklik dengan mouse. Program GUI untuk R biasa disebut RGUI.
Kembali
Layar Penuh
Tutup
Keluar
H hipotesis alternatif Disebut juga hipotesis kerja yaitu hipotesis yang dirumuskan sesuai dengan hasil kajjian teori yang melandasi penelitian. hipotesis nul Disebut juga hipotesis nihil, yaitu hipotesis yang diuji pada prosedur statistika, yang menyatakan kenetralan (tidak ada beda signifikan, tidak ada hubungan signifikan dan sebagainya). histogram Grafik yang menggunakan segiempat sebagai representasi frekuensi atau peluang dari observasi pada setiap interval.
J Jarak Cook Suatu ukuran yang menunjukkan pengaruh suatu nilai pengamatan pada regresi berganda.
K Keluarga Eksponensial Keluarga Eksponensial adalah distribusi yang merupakan kesatuan (unifikasi) distribusi-distribusi penting yang
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
403 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
banyak dipakai seperti antara lain Normal, Gamma, Binomial, Poisson dalam satu bentuk distribusi. kolinieritas
Kondisi yang ditunjukkan oleh adanya peubah penjelas saling berkorelasi satu sama lain.
Konformabel Dua matrik dikatakan komformabel apabila kepada keduanya dapat dilakukan operasi matriks biner. Untuk operasi penjumlahan disebut konformabel terhadap penjumlahan. Matriks yang komformabel terhadap penjumlahan berordo sama. Untuk operasi perkalian disebut konformabel terhadap perkalian. Matriks yang konformabel terhadap perkalian adalah sedemikain hingga banyaknya kolom matriks terkali sama dengan banyaknya baris matriks pengali.
M
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
404 dari 490
Cari Halaman
matriks bentuk kuadrat quadratic form adalah matrika yang berbentuk y T Ay dengan vektor peubah, dan A matriks simetrik. Pada dasarnya matriks ini berordo 1 × 1.
Kembali
Layar Penuh
Matriks Diagram Pencar
Matriks Diagram Pencar (Scatter Plot Matrix) Tutup
Keluar
adalah matriks yang menggambarkan diagram pencar lebih dari dua variabel. Pada diagonal biasanya disajikan densitas, histogram atau diagram kuantil, sedangkan pada off diagonal disajikan diagram pencar masing-masing pasangan variabel. matriks ragam-koragam adalah matriks simetris yang unsur diagonalutamanya merupakan ragam dari peubah-peubah, sedangkan unsur di luar diagonal utama merupakan koragam dari peubah yang bersesuaian, misalnya mii = σi2 , mij = σij .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
model
Istilah lain untuk regresi peubah ganda, terdiri atas model linier, model linier terampat/tegreneralisir, model nonlinier, model linier campuran dan lain-lain.
I II
405 dari 490
Cari Halaman
N Kembali
Nilai p
Termasuk peluang kesalahan tipe I, yaitu peluang yang menunjukkan bahwa hasil yang dicapai merupakan hal yang kebetulan jika ternyata Ho benar.
Layar Penuh
Tutup
Keluar
O Open Sources Open Source adalah program komputer yang dikembangkan dengan kode (source code) terbuka yang dapat diakses dan dimodifikasi orang lain. ordo matriks adalah bilangan yang menunjukkan banyaknya baris dan banyaknya kolom suatu matriks Am×n menunjukkan matriks terdiri atas m baris n kolom.
FMIPA-UNEJ
Daftar Isi
Judul
Outlier/pencilan Pencilan adalah data yang besarnya menyimpang dari kelompoknya melebihi batas kewajaran distribusi data.
JJ J
I II
P 406 dari 490
Parameter Parameter (statistika) adalah ukuran deskriptif numerik dari populasi. Cari Halaman
Populasi
Pustaka
Populasi adalah kumpulan seluruh data yang menjadi perhatian dalam penelitian. Jadi populasi adalah seluruh subjek penelitian beserta karakteristiknya yang menjadi kepentingan. Pustaka (library), khususnya dalam program S-Plus dan R, adalah kumpulan paket- paket program yang dibuat khusus
Kembali
Layar Penuh
Tutup
Keluar
untuk keperluan tertentu yang merupakan pengayaan dari program utama/inti R atau SPlus. FMIPA-UNEJ
Q QQPlot
QQplot atau Plot Kuantil adalah diagram yang menggambarkan hubungan antara quantil teoritis suatu distribusi dengan kuantil riil suatu data. Khusus untuk distribusi normal grafiknya disebut QQnorm.
S sampel
Judul
JJ J
Sampel adalah sebagian dari populasi yang secara representatif mewakili populasi.
sisa/residu Selisih antara nilai observasi Y dengan nilai prediksinya ( Yˆ ). skrip
Daftar Isi
Skrip adalah naskah yang berisi berbagai perintah yang harus dilaksanakan oleh komputer melalui suatu bahasa atau program tertentu.
I II
407 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
408 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
DAFTAR PUSTAKA Judul
JJ J
I II
409 dari 490
[1] H. Akaike. Information theory and extension of maximum likelihood theory. In B.N. Petrov and F. Csahi, editors, 2nd Symposium on Information Theory, pages 267–281. Buddapest, 1972.
Cari Halaman
Kembali
[2] G.P. Beaumont. Intermediate Mathematical Statistics. Chapman and Hall, London, 1st edition, 1980.
Layar Penuh
Tutup
Keluar
[3] Bowerman,B.L. R.T. Cornell and D.A. Dickey. Linear Statistical Models, an Appplied Approach. Duxbury Press, Boston, 1986. [4] P.J. Burns. S Poetry. http://www.r-project.org, 1998.
FMIPA-UNEJ
[5] J.M. Chamber and T.J. Hastie. Statistical Model in S. Chapman and Hall, London, 1992.
Daftar Isi
[6] D.R. Cox and D.V. Hinkley. Theoretical Statistics. Chapman and Hall, London, 1st edition, 1974.
Judul
[7] D.R. Cox and N. Reid. Parameter orthogonality and approximate conditional inference. J. R. Statist. Soc., 49:1–39, 1987. [8] Crawley. Statistical Computing: An Introduction to Data Analysis using S-Plus. Wiley, England, 2004. [9] M. Davidian and D.M. Giltinan. Nonlinear Models for Repeated Measurement Data. Chapman and Hall, London, 1995. [10] Diggle P.J., K-Y. Liang and S.L. Zeger. Analysis of Longitudinal Data. Oxford Science Publications, London, 1st edition, 1994. [11] A.J. Dobson. An Introduction to Generalized Linear Models. Chapman and Hall, London, 1990.
JJ J
I II
410 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[12] J.J. Faraway. Practical Regression and Anova http://www.stat. Isa.umic.edu/∼faraway/book/, 2002.
Using
R.
[13] D.A. Harville. Matrix Algebra From a Statistician’s Perspective. Springer, New York, 1997. [14] T.J. Hastie & R.J. Tibshirani. Generalized Additive Models. Chapman & Hall, London, 5th edition, 1990. [15] J.S.U. Hjortn. Computer Intensive Statistical Methods: Validation, Model Selection and Bootstap. Chapman & Hall, London, 1994.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
[16] R.V. Hogg and A.T. Craig. Introduction to Mathematical Statistics. Prentice-Hall, Englewood Cliffs, 5th edition, 1995. 411 dari 490
[17] M.G. Kenward and D.M. Smith. Computing the generalized estimating equation for repeated measurements. Genstat Newsletter, 32:50–62, 1995. [18] P. Kuhnert and B. Venables. An Introduction to R: Software for Statistical Modelling & Computing. CSIRO, http://cran.rproject.org/doc/contrib/Kuhnert+Venables-R Course Notes.zip, 2005. [17 April 2006].
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[19] N.M. Laird and J.H. Ware. Random effects models for longitudinal data. Biometrics, 38:963–974, 1982. [20] Y. Lee and J.A. Nelder. Hierarchical generalized linear models. J.R. Statist. Soc., 58:619–678, 1996. [21] K-Y Liang and S.L. Zeger. Longitudinal data analysis using generalized linear models. Biometrika, 73:13–22, 1986. [22] Liang,K-Y, S.L. Zeger and B. Qaqish. Multivariate regression analyses for categorical data (with discussion). J.R. Statist. Soc., 54:3–40, 1992.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
[23] J.H. Maindonald. Using R for Data Analysis and Graphics An Introduction. ANU-Australia, June 2001. [24] P. McCullagh and J.A. Nelder. Generalized Linear Models. Chapman and Hall, London, 2nd edition, 1989. [25] P. McCullagh and R. Tibshirani. A simple method for the adjustment of profile likelihoods. J. R. Statist. Soc., 52:325–344, 1990. [26] W. Mendenhall. Introduction to Probability and Statistics. Duxbury, Belmont USA, 5th edition, 1979.
I II
412 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[27] W. Mendenhall. Beginning Statistics A to Z. Duxbury, Belmont USA, 1993. [28] P.L. Meyer. Introductory Probability and Statistical Applications. Addison-Wisley Pub. Co., Massachusets, 2nd edition, 1970. [29] P Murrell. R Graphics. Chapman& Hall/CRC, 2006. [30] J.A. Nelder and R.W.M. Wedderburn. Generalized linear models. J.R.Statist.Soc., 57:359–407, 1972. [31] Neter J., W. Wasserman and M.H. Kutner. Applied Linear Statistical Models. Irwin, Illinois, 2nd edition, 1985. [32] S.R. Searle. Matrix Algebra Useful for Statistics. John Wiley and Sons, New York, 1st edition, 1982. [33] G.K. Smyth. Generalized linear models with varying dispersion. J.R. Statist. Soc, 51:47–60, 1989. [34] G.K. Smyth. Partitioned algorithms for maximum likelihood and other nonlinear estimation. Statistics and Computing, 6:201–216, 1996. [35] StatSoft. Electronic Statistics Textbook. http://www.statsoftinc.com/ textbook/ stathome.html, 2006.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
413 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[36] N.H. Timm. Multivariate Analysis with Applications in Education and Psychology. Brooks/Cole, California, 1975. [37] I M. Tirta. Analysis of Gamma Data with Random Effects. PhD thesis, Department of Mathematics Statistics and Computing Sciences, The University of New England, Armidale, NSW Australia, 1999.
FMIPA-UNEJ
Daftar Isi
[38] I M. Tirta. The conjugate model for gamma data with random effects. A paper submitted for MIHMI (Majalah Ilmiah Himpunan Matematika Indonesia), 1999. [39] I M. Tirta. Marginal likelihood appraoch in Gamma-Inverse-Gamma model. Proceeding of The SEAMS (South East Asian Mathematical Society)-GMU(Gadjah Mada University, 26-29 July 1999, pages 454– 462, 1999. [40] I M. Tirta. The conjugate model in Gamma data with random effetcs. MIHMI (Journal of Indonesian Mathematical Society), 6(1):57– 78, 2000.
Judul
JJ J
I II
414 dari 490
Cari Halaman
Kembali
[41] I M. Tirta. A nonconjugate model for Gamma data with random effects. Jurnal Ilmu Dasar (Journal of Basic Sciences), 1(1):46–58, 2000.
Layar Penuh
Tutup
Keluar
[42] I M. Tirta. Buku Panduan Program Statistika R. Penerbit Universitas Jember, Jember, 2005. ISBN 979-8176-37-5. [43] I M. Tirta. Analisis Data dengan Aplikasi R. Andi Offset, Yogya, 2008. Naskah Buku Teks disetujui DIKTI dan sedang diajukan ke Percetakan Andi Offset.
FMIPA-UNEJ
Daftar Isi
[44] Tirta I M. Lestari B. & Dewi Y. S. Estimasi efek tetap dan acak pada model multiplikatif dengan likelihood bersama. Jurnal Ilmu Dasar, 7(1), 2006. [45] Tirta I M. Lestari B. & Dewi Y. S. Estimasi efek tetap dan efek acak pada model multiplikatif dengan aplikasi open source software (oss)-r. Jurnal Teknologi. ACADEMIA ISTA, 11(2):195–202, 2007. [46] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus. Springer, New York, 1994. [47] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus. Springer, New York, 3rd edition, 1996. [48] J. Vezalini. Using R for Introductory Statistics. project.org, 2002.
http://www.r-
Judul
JJ J
I II
415 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[49] Wackerly D.D., Mendenhall W. &Scheafer R. L. . Mathematical Statistics with Application. Duxbury, Belmont USA, 5th edition, 1996. [50] M.A. Waclawiw and K-Y Liang. Prediction of random effects in the generalized linear model. J. Amer. Statist. Assoc., 88:171–178, 1993. [51] R.W.M. Wedderburn. Quasi-likelihood functions, generalized linear models, and the Gauss-Newton method. Biometrika, 61:439–447, 1974. [52] S.L. Zeger and K-Y. Liang. Longitudinal data analysis for discrete and continuous outcomes. Biometrics, 42:121–130, 1986. [53] S.L. Zeger and K-Y. Liang. An overview of methods for the analysis of longitudinal data. Statistics in Medicine, 11:1825–1839, 1992.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
416 dari 490
[54] S.L. Zeger, K-Y. Liang and P.S. Albert. Models for longitudinal data: A generalized estimating equation approach. Biometrics, 44:1049– 1060, 1988. [55] V. Zoonekyn. Statistics with UNIX/48 R/all.html, 2005.
R.
http://zoonek2.free.fr/
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
LAMPIRAN
A
BEBERAPA FUNGSI TERKAIT REGRESI
Daftar Isi
Judul
JJ J
I II
417 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.1.
Fungsi dari Paket stats
AIC(object, ..., k = 2) FMIPA-UNEJ
glm(formula, family = gaussian, data, weights, subset, na.action, start = NULL, etastart, mustart, offset, control = glm.control(...), model = TRUE, method = "glm.fit", x = FALSE, y = TRUE, contrasts =
Daftar Isi
NULL, ...)
lm(formula, data, subset, weights, na.action, method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE, contrasts = NULL, offset, ...) nlm(f, p, ..., hessian = FALSE, typsize = rep(1, length(p)), fscale = 1, print.level = 0, ndigit = 12, gradtol = 1e-6, stepmax = max(1000 * sqrt(sum((p/typsize)^2)), 1000), steptol = 1e-6, iterlim = 100, check.analyticals = TRUE) predict (object, ...)
Judul
JJ J
I II
418 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.2.
Fungsi dari Paket cars
qq.plot(x, ...) scatterplot(x, ...) scatterplot.matrix(x, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
419 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.3.
Fungsi dari Paket gam
gam(formula, family = gaussian, data, weights, subset, na.action, start, etastart, mustart, control = gam.control(...),model=FALSE, method, x=FALSE, y=TRUE, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
420 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.4.
Fungsi dari Paket graphics
boxplot(x, ...) contour(x, ...) abline(a, b, untf = FALSE, ...) abline(h=, untf = FALSE, ...) abline(v=, untf = FALSE, ...) abline(coef=, untf = FALSE, ...) abline(reg=, untf = FALSE, ...) hist(x, ...) persp(x, ...) plot(x, y, ...) segments(x0, y0, x1, y1, col = par("fg"), lty = par("lty"), lwd =
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
par("lwd"), ...)
I II
421 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.5.
Fungsi dari Paket gee
gee(formula, id, data, subset, na.action, R = NULL, b = NULL, tol = 0.001, maxiter = 25, family = gaussian, corstr = "independence", Mv = 1, silent = TRUE, contrasts = NULL, scale.fix = FALSE, scale.value = 1, v4.4compat
FMIPA-UNEJ
Daftar Isi
= FALSE)
Judul
JJ J
I II
422 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.6.
Fungsi dari Paket lme4
lmer(formula, data, family, method, control, start, subset, weights, na.action, offset, contrasts, model, ...) nlmer(formula, data, control, start, verbose, subset, weights, na.action, contrasts, model, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
423 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.7.
Fungsi dari Paket hglm
hglm(formula, distribusi = Gamma(link=log), data, klaster, subset=NULL, na.action, offset, start.coef = NULL, start.sigma = NULL, control = glm.control(epsilon = 1e-08, maxit = 100, trace = FALSE), n.points = 16, gee=FALSE, plot=FALSE)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
424 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.8.
Fungsi dari Paket glmmML
glmmML(formula, family = binomial, data, cluster, weights, cluster.weights, subset, na.action, offset, prior = c("gaussian", "logistic", "cauchy"), start.coef = NULL, start.sigma = NULL, fix.sigma = FALSE, control = list(epsilon = 1e-08, maxit = 200, trace = FALSE), method = c("Laplace", "ghq"), n.points = 8, boot = 0)
FMIPA-UNEJ
Daftar Isi
Judul
glmmboot(formula, family = binomial, data, cluster, weights, subset, na.action, offset, start.coef = NULL, JJ J I II control = list(epsilon = 1e-08, maxit = 200, trace = FALSE), boot = 0) 425 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.9.
Skrip Manipulasi Grafik
plot(x,y, main="DIAGRAM BESAR DENGAN GRAFIK MINI") abline(lm(y~x), col="blue")
FMIPA-UNEJ
Daftar Isi
op <- par(fig=c(.02,.5,.55,.98), new=TRUE) hist(x, probability=T, col="light blue", xlab="HistY", ylab="", main="", axes=F) lines(density(x), col="red", lwd=2) box() op1 <- par(fig=c(.46,.98,.02,.45), new=TRUE) qq.plot(x, main="QQNorm", dist="norm") box() par(op) par(op1)
Judul
JJ J
I II
426 dari 490
Cari Halaman
Kembali
split.screen(c(1,2)) split.screen(c(2,1), screen = 2)
Layar Penuh
Tutup
Keluar
screen(1) plot(x,y,main="Diagram Pencar (X,Y)") abline(lm(y~x)) screen(3) hist(y, probability=T, main="Histogram Y") lines(density(y), col="red", lwd=2) screen(4) qq.plot(x,main="QQ.norm X")
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
427 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.10.
Skrip Membangkitkan Data Regresi dengan Peubah Kelompok FMIPA-UNEJ
#simulasi data regresi dengan kelompok require n<-60 #genap ns<-.5*n sd<-20 g<-rep(c("L","P"),each=ns) x1<-round(rnorm(n,50,8)) x2<-round(rnorm(n,50,8)) y1a<-10+x1[1:ns]*3.1+4*x2[1:ns]+rnorm(ns,0,sd) y1b<-10+x1[(ns+1):n]*3+4*x2[(ns+1):n]+rnorm(ns,0,sd) y1<-c(y1a,y1b) y2a<-50+x1[1:ns]*3+4*x2[1:ns]+rnorm(ns,0,sd) y2b<--50+x1[(ns+1):n]*3+4*x2[(ns+1):n]+rnorm(ns,0,sd) y2<-c(y2a,y2b)
Daftar Isi
Judul
JJ J
I II
428 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
y3a<-60-.5*x1[1:ns]-.5*x2[1:ns]+rnorm(ns,0,sd) y3b<--70+.5*x1[(ns+1):n]+x2[(ns+1):n]+rnorm(ns,0,sd) y3<-c(y3a,y3b) FMIPA-UNEJ
DataSimReg<-data.frame(y1,y2,y3,g,x1,x2) Daftar Isi
Judul
JJ J
I II
429 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
430 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
LAMPIRAN
B
Daftar Isi
DATA UNTUK ILUSTRASI
Judul
JJ J
I II
431 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.1.
Data dari Paket actuar
dental Individual dental claims data set gdental Grouped dental claims data set hachemeister Hachemeister data set
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
432 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.2.
Data dari Paket ade4
abouheif.eg acacia aminoacyl apis108 ardeche arrival atlas atya avijons avimedi aviurba bacteria banque baran95 bf88 bordeaux
Phylogenies and quantitative traits from Abouheif Spatial pattern analysis in plant communities Codon usage Allelic frequencies in ten honeybees populations at eight microsatellites loci Fauna Table with double (row and column) partitioning Arrivals at an intensive care unit Small Ecological Dataset Genetic variability of Cacadors Bird species distribution Fauna Table for Constrained Ordinations Ecological Tables Triplet Genomes of 43 Bacteria Table of Factors African Estuary Fishes Cubic Ecological Data Wine Tasting
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
433 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
bsetal97 Ecological and Biological Traits buech Buech basin butterfly Genetics-Ecology-Environment Triple capitales Road Distances carni19 Phylogeny and quantative trait of carnivora carni70 Phylogeny and quantitative traits of carnivora carniherbi49 Taxonomy, phylogenies and quantitative traits of carnivora and herbivora casitas Enzymatic polymorphism in Mus musculus chatcat Qualitative Weighted Variables chats Pair of Variables chazeb Charolais-Zebus chevaine Enzymatic polymorphism in Leuciscus cephalus clementines Fruit Production cnc2003 Frequenting movie theaters in France in 2003 coleo Table of Fuzzy Biological Traits corvus Corvus morphology deug Exam marks for some students doubs Pair of Ecological Tables dunedata Dune Meadow Data ecg Electrocardiogram data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
434 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ecomor elec88 escopage euro123 fission
Ecomorphological Convergence Electoral Data K-tables of wine-tasting Triangular Data Fission pattern and heritable morphological traits friday87 Faunistic K-tables fruits Pair of Tables ggtortoises Microsatellites of Galapagos tortoises populations granulo Granulometric Curves hdpg Genetic Variation In Human Populations housetasks Contingency Table humDNAm human mitochondrial DNA restriction data ichtyo Point sampling of fish community irishdata Geary's Irish Data julliot Seed dispersal jv73 K-tables Multi-Regions kcponds Ponds in a nature reserve lascaux Genetic/Environment and types of variables lizards Phylogeny and quantitative traits of lizards
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
435 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
macaca macon mafragh maples mariages meau
Landmarks Wine Tasting Phyto-Ecological Survey Phylogeny and quantitative traits of flowers Correspondence Analysis Table Ecological Data : sites-variables, sites-species, where and when meaudret Ecological Data : sites-variables, sites-species, where and when microsatt Genetic Relationships between cattle breeds with microsatellites mjrochet Phylogeny and quantitative traits of teleos fishes mollusc Faunistic Communities and Sampling Experiment monde84 Global State of the World in 1984 morphosport Athletes' Morphology newick.eg Phylogenetic trees in Newick format njplot Phylogeny and trait of bacteria olympic Olympic Decathlon oribatid Oribatid mite ours A table of Qualitative Variables
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
436 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
palm
Phylogenetic and quantitative traits of amazonian palm trees pap Taxonomy and quantitative traits of carnivora perthi02 Contingency Table with a partition in Molecular Biology presid2002 Results of the French presidential elections of 2002 procella Phylogeny and quantitative traits of birds rankrock Ordination Table rhone Physico-Chemistry Data rpjdl Avifauna and Vegetation santacatalina Indirect Ordination sarcelles Array of Recapture of Rings seconde Students and Subjects skulls Morphometric Evolution steppe Transect in the Vegetation syndicats Two Questions asked on a Sample of 1000 Respondents t3012 Average temperatures of 30 French cities tarentaise Mountain Avifauna taxo.eg Examples of taxonomy
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
437 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tintoodiel tithonia tortues toxicity trichometeo ungulates vegtf veuvage westafrica worksurv yanomama zealand
Tinto and Odiel estuary geochemistry Phylogeny and quantitative traits of flowers Morphological Study of the Painted Turtle Homogeneous Table Pair of Ecological Data Phylogeny and quantitative traits of ungulates. Vegetation in Trois-Fontaines Example for Centring in PCA Freshwater fish zoogeography in west Africa French Worker Survey (1970) Distance Matrices Road distances in New-Zealand
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
438 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.3.
Data dari Paket agricolae
CIC Data for AMMI Analysis ComasOxapampa Data AUDPC Comas - Oxapampa Glycoalkaloids Data Glycoalkaloids LxT Data Line by tester RioChillon Data and analysis Mother and baby trials carolina1 Data Carolina I carolina2 Data Carolina II carolina3 Data Carolina III clay Data of Ralstonia population in clay soil corn Data of corn cotton Data of cotton disease Data evaluation of the disease overtime genxenv Data of potato yield in a different environment grass Data for Friedman test growth Data growth of trees haynes Data of yield for nonparametrical stability analysis homog1 Data of frijol huasahuasi Data of yield in Huasahuasi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
439 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ltrv markers melon
Data clones from the LTVR population Data of molecular markers Data of yield of melon in a Latin square experiment natives Data of native potato pamCIP Data Potato Wild paracsho Data of Paracsho biodiversity plots Data for an analysis in split-plot potato Data of cutting ralstonia Data of population bacterial Wilt: AUDPC rice Data of Grain yield of rice variety IR8 sinRepAmmi Data for AMMI without repetition soil Data of soil analysis for 13 localities sweetpotato Data of sweetpotato yield trees Data of species trees. Pucallpa wilt Data of Bacterial Wilt (AUDPC) and soil
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
440 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.4.
Data dari Paket asuR
BtheB BtheBlong budworm cathedral flowers gala growth
Beat the Blues Data Beat the Blues Data budworm data Medieval cathedrals in England Flower Species diversity on the Galapagos Islands Weight Gain of two Species at different Nitrogen Concentrations houseflies Housfly Development mytrees Simulated tree data oring O-ring data pea Pea data plants Plant height schoolclass Schools and Classes unemployment data on long / short term unemployment weight Weight Gain wellplate wellplate wellplate2 wellplate wellplate3 wellplate
FMIPA-UNEJ
Daftar Isi
Judul
JJ
J
I
II
441 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
442 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.5. Adler Angell Anscombe Baumann Bfox Blackmoor Burt Can.pop Chile Chirot Cowles Davis DavisThin Duncan Ericksen Florida Freedman
Data dari Paket car Experimenter Expectations Moral Integration of American Cities U. S. State Public-School Expenditures Methods of Teaching Reading Comprehension Canadian Women's Labour-Force Participation Exercise Histories of Eating-Disordered and Control Subjects Fraudulent Data on IQs of Twins Raised Apart Canadian Population Data Voting Intentions in the 1988 Chilean Plebiscite The 1907 Romanian Peasant Rebellion Cowles and Davis's Data on Volunteering Self-Reports of Height and Weight Davis's Data on Drive for Thinness Duncan's Occupational Prestige Data The 1980 U.S. Census Undercount Florida County Voting Crowding and Crime in U. S. Metropolitan Areas
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
443 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Friendly Format Effects on Recall Ginzberg Data on Depression Greene Refugee Appeals Guyer Anonymity and Cooperation Hartnagel Canadian Crime-Rates Time Series Leinhardt Data on Infant-Mortality Mandel Contrived Collinear Data Migration Canadian Interprovincial Migration Data Moore Status, Authoritarianism, and Conformity Mroz U.S. Women's Labor-Force Participation OBrienKaiser O'Brien and Kaiser's Repeated-Measures Data Ornstein Interlocking Directorates Among Major Canadian Firms Pottery Chemical Composition of Pottery Prestige Prestige of Canadian Occupations Quartet Four Regression Datasets Robey Fertility and Contraception SLID Survey of Labour and Income Dynamics Sahlins Agricultural Production in Mazulu Village Soils Soil Compositions of Physical and Chemical Characteristics
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
444 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
States UN US.pop Vocab Womenlf
Education and Related Statistics for the U.S. States GDP and Infant Mortality Population of the United States Vocabulary and Education Canadian Women's Labour-Force Participation
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
445 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.6.
Data dari Paket DAAG
ACF1 Cars93.summary DAAGxdb Lottario Manitoba.lakes SP500W90 SP500close ais allbacks anesthetic ant111b antigua appletaste austpop
Aberrant Crypt Foci in Rat Colons A Summary of the Cars93 Data set List, each of whose elements hold rows of a file, in character format Ontario Lottery Data The Nine Largest Lakes in Manitoba Closing Numbers for S and P 500 Index - First 100 Days of 1990 Closing Numbers for S and P 500 Index Australian athletes data set Measurements on a Selection of Books Anesthetic Effectiveness Averages by block of corn yields, for treatment 111 only Averages by block of yields for the Antigua Corn data Tasting experiment that compared four apple varieties Population figures for Australian States and
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
446 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Territories Biomass Data Southern Oscillation Index Data Southern Oscillation Index Data Boston Housing Data -- Corrected US Car Price Data Percentage of Sugar in Breakfast Cereal Cape Fur Seal Data Populations of Major Canadian Cities (1992-96) Dose-mortality data, for fumigation of codling moth with methyl bromide cottonworkers Occupation and wage profiles of British cotton workers cuckoohosts Comparison of cuckoo eggs with host eggs cuckoos Cuckoo Eggs Data dengue Dengue prevalence, by administrative region dewpoint Dewpoint Data droughts Periods Between Rain Events elastic1 Elastic Band Data Replicated elastic2 Elastic Band Data Replicated Again elasticband Elastic Band Data biomass bomsoi bomsoi2001 bostonc carprice cerealsugar cfseal cities codling
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
447 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
fossilfuel fossum frogs frostedflakes fruitohms geophones head.injury headInjury hills hills2000 houseprices humanpower1 humanpower2 ironslag jobs kiwishade leafshape leafshape17 leaftemp
Fossil Fuel Data Female Possum Measurements Frogs Data Frosted Flakes data Electrical Resistance of Kiwi Fruit Seismic Timing Data Minor Head Injury (Simulated) Data Minor Head Injury (Simulated) Data Scottish Hill Races Data Scottish Hill Races Data - 2000 Aranda House Prices Oxygen uptake versus mechanical power, for humans Oxygen uptake versus mechanical power, for humans Iron Content Measurements Canadian Labour Force Summary Data (1995-96) Kiwi Shading Data Full Leaf Shape Data Set Subset of Leaf Shape Data Set Leaf and Air Temperature Data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
448 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
leaftemp.all litters lung measles medExpenses mifem mignonette milk modelcars monica moths nsw74demo nsw74psid1 nsw74psid3 nsw74psidA oddbooks orings ozone pair65 possum
Full Leaf and Air Temperature Data Set Mouse Litters Cape Fur Seal Lung Measurements Deaths in London from measles Family Medical Expenses Mortality Outcomes for Females Suffering Myocardial Infarction Darwin's Wild Mignonette Data Milk Sweetness Study Model Car Data WHO Monica Data Moths Data Labour Training Evaluation Data Labour Training Evaluation Data Labour Training Evaluation Data A Subset of the nsw74psid1 Data Set Measurements on 12 books Challenger O-rings Data Ozone Data Heated Elastic Bands Possum Measurements
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
449 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
possumsites poxetc primates races2000 rainforest rareplants rice roller science seedrates socsupport softbacks sorption spam7 stVincent sugar tinting toycars two65
Possum Sites Deaths from various causes, in London from 1629 till 1881, with gaps Primate Body and Brain Weights Scottish Hill Races Data - 2000 Rainforest Data Rare and Endangered Plant Species Genetically Modified and Wild Type Rice Data Lawn Roller Data School Science Survey Data Barley Seeding Rate Data Social Support Data Measurements on a Selection of Paperback Books sorption data set Spam E-mail Data Averages by block of yields for the St. Vincent Corn data Sugar Data Car Window Tinting Experiment Data Toy Cars Data Unpaired Heated Elastic Bands
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
450 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
vince111b vlt wages1833 whoops zzDAAGxdb
Averages by block of corn yields, for treatment 111 only Video Lottery Terminal Data Wages of Lancashire Cotton Factory Workers in 1833 Deaths from whooping cough, in London List, each of whose elements hold rows of a file, in character format
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
451 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.7.
Data dari Paket dataset
AirPassengers Monthly Airline Passenger Numbers 1949-1960 BJsales Sales Data with Leading Indicator BJsales.lead (BJsales) Sales Data with Leading Indicator BOD Biochemical Oxygen Demand CO2 Carbon Dioxide uptake in grass plants ChickWeight Weight versus age of chicks on different diets DNase Elisa assay of DNase EuStockMarkets Daily Closing Prices of Major European Stock Indices, 1991-1998 Formaldehyde Determination of Formaldehyde HairEyeColor Hair and Eye Color of Statistics Students Harman23.cor Harman Example 2.3 Harman74.cor Harman Example 7.4 Indometh Pharmacokinetics of Indomethicin InsectSprays Effectiveness of Insect Sprays JohnsonJohnson Quarterly Earnings per Johnson & Johnson Share LakeHuron Level of Lake Huron 1875-1972 LifeCycleSavings Intercountry Life-Cycle Savings Data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
452 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Loblolly Nile Orange OrchardSprays PlantGrowth Puromycin Seatbelts Theoph Titanic ToothGrowth
Growth of Loblolly pine trees Flow of the River Nile Growth of Orange Trees Potency of Orchard Sprays Results from an Experiment on Plant Growth Reaction velocity of an enzymatic reaction Road Casualties in Great Britain 1969-84 Pharmacokinetics of theophylline Survival of passengers on the Titanic The Effect of Vitamin C on Tooth Growth in Guinea Pigs UCBAdmissions Student Admissions at UC Berkeley UKDriverDeaths Road Casualties in Great Britain 1969-84 UKgas UK Quarterly Gas Consumption USAccDeaths Accidental Deaths in the US 1973-1978 USArrests Violent Crime Rates by US State USJudgeRatings Lawyers' Ratings of State Judges in the US Superior Court USPersonalExpenditure Personal Expenditure Data VADeaths Death Rates in Virginia (1940) WWWusage Internet Usage per Minute
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
453 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
The World's Telephones Ability and Intelligence Tests Passenger Miles on Commercial US Airlines, 1937-1960 airquality New York Air Quality Measurements anscombe Anscombe's Quartet of "Identical" Simple Linear Regressions attenu The Joyner-Boore Attenuation Data attitude The Chatterjee-Price Attitude Data austres Quarterly Time Series of the Number of Australian Residents beaver1 (beavers) Body Temperature Series of Two Beavers beaver2 (beavers) Body Temperature Series of Two Beavers cars Speed and Stopping Distances of Cars chickwts Chicken Weights by Feed Type co2 Mauna Loa Atmospheric CO2 Concentration crimtab Student's 3000 Criminals Data discoveries Yearly Numbers of Important Discoveries esoph Smoking, Alcohol and (O)esophageal Cancer euro Conversion Rates of Euro Currencies euro.cross (euro) Conversion Rates of Euro Currencies
WorldPhones ability.cov airmiles
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
454 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
eurodist Distances Between European Cities faithful Old Faithful Geyser Data fdeaths (UKLungDeaths) Monthly Deaths from Lung Diseases in the UK freeny Freeny's Revenue Data freeny.x (freeny) Freeny's Revenue Data freeny.y (freeny) Freeny's Revenue Data infert Infertility after Spontaneous and Induced Abortion iris Edgar Anderson's Iris Data iris3 Edgar Anderson's Iris Data islands Areas of the World's Major Landmasses ldeaths (UKLungDeaths) Monthly Deaths from Lung Diseases in the UK lh Luteinizing Hormone in Blood Samples longley Longley's Economic Regression Data lynx Annual Canadian Lynx trappings 1821-1934 mdeaths (UKLungDeaths) Monthly Deaths from Lung Diseases in the UK morley Michaelson-Morley Speed of Light Data mtcars Motor Trend Car Road Tests
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
455 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nhtemp nottem
Average Yearly Temperatures in New Haven Average Monthly Temperatures at Nottingham, 1920-1939 precip Annual Precipitation in US Cities presidents Quarterly Approval Ratings of US Presidents pressure Vapor Pressure of Mercury as a Function of Temperature quakes Locations of Earthquakes off Fiji randu Random Numbers from Congruential Generator RANDU rivers Lengths of Major North American Rivers rock Measurements on Petroleum Rock Samples sleep Student's Sleep Data stack.loss (stackloss) Brownlee's Stack Loss Plant Data stack.x (stackloss) Brownlee's Stack Loss Plant Data stackloss Brownlee's Stack Loss Plant Data state.abb (state) US State Facts and Figures state.area (state) US State Facts and Figures state.center (state) US State Facts and Figures state.division (state)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
456 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
US State Facts and Figures state.name (state) US State Facts and Figures state.region (state) US State Facts and Figures state.x77 (state) US State Facts and Figures sunspot.month Monthly Sunspot Data, 1749-1997 sunspot.year Yearly Sunspot Data, 1700-1988 sunspots Monthly Sunspot Numbers, 1749-1983 swiss Swiss Fertility and Socioeconomic Indicators (1888) Data treering Yearly Treering Data, -6000-1979 trees Girth, Height and Volume for Black Cherry Trees uspop Populations Recorded by the US Census volcano Topographic Information on Auckland's Maunga Whau Volcano warpbreaks The Number of Breaks in Yarn during Weaving women Average Heights and Weights for American Women
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
457 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.8.
Data dari Paket demogR
Data sets in package demogR: FMIPA-UNEJ
goodman
Demographic data from Venezuela, Madagascar and the United States in the late 1960s
Daftar Isi
Judul
JJ J
I II
458 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.9. aatemp abrasion aflatoxin africa alfalfa amlxray babyfood beetle bliss breaking broccoli cathedral chicago chiczip
Data dari Paket faraway Annual mean temperatures in Ann Arbor, Michigan Wear on materials according to type, run and position aflatoxin dosage and liver cancer in lab animals miltary coups and politics in sub-Saharan Africa Effects of seed inoculum, irrigation and shade on alfalfa yield Match pair study for AML and Xray link Respiratory disease rates of babies fed in different ways Beetles exposed to fumigant Bliss insecticide data Breaking strength of materials Broccoli weight variation Cathedral nave heights and lengths in England Chicago insurance redlining Chicago zip codes north-south
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
459 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
chmiss choccake chredlin clot cmob cns
cornnit corrosion cpd ctsib death debt diabetes dicentric
Chicago insurance redlining Chocolate cake experiment with split plot design Chicago insurance redlining Blood clotting times Social class mobility from 1971 to 1981 in the UK Malformations of the central nervous system coagulation Blood coagulation times by diet composite Strength of a thermoplastic composite depending on two factors Corn yields from nitrogen application Corrosion loss in Cu-Ni alloys Projected and actual sales of 20 consumer products Effects of surface and vision on balance Death penalty in Florida 1977 psychology of debt Diabetes and obesity, cardiovascular risk factors Radiation dose effects on chromosomal
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
460 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
divusa drugpsy dvisits eco eggprod eggs epilepsy esdcomp exa exb eyegrade fat femsmoke fpe fruitfly gala gavote
abnormality Divorce in the USA 1920-1996 Choice of drug treatment for psychiatry patients Doctor visits in Australia Ecological regression example Treatment and block effects on egg production Laboratory testing of dried egg fat content Seizure rates of epileptics under treatment Complaints about emergency room doctors Non parametric regression test data A Non parametric regression test data B grading of eye pairs for distance vision Percentage of Body Fat and Body Measurements Mortality due to smoking according age group in women 1981 French Presidential Election Longevity of fruiflies depending on sexual activity and thorax length Species diversity on the Galapagos Islands Undercounted votes in Georgia in 2000
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
461 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
presidential election haireye Hair and eye color happy love, work and happiness hormone Hormones and Sexual Orientation hprice Housing prices in US cities 86-94 hsb Career choice of high school students infmort Infant mortality according to income and region irrigation Agricultural experiment with irrigation jsp Junior Schools Project kanga Historic Kangaroos lawn Cut-off times of lawnmowers leafblotch Leaf blotch on barley mammalsleep Sleep in Mammals: Ecological and Constitutional Correlates meatspec Meat spectrometry to determine fat content melanoma Melanoma by type and location motorins Third party motor insurance claims in Sweden in 1977 neighbor Questionnaire study of neighborly help nels88 Subset of National Education Longitudinal Study 1988
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
462 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nepali nes96 oatvar odor ohio orings ozone parstum peanut penicillin pima pipeline pneumo potuse prostate psid pulp pvc rabbit
Nepali child heath study US 1996 national election study Yields of oat varieties planted in blocks Odor of chemical by production settings Ohio Children Wheeze Status Spache Shuttle Challenger O-rings Ozone readings in LA Marijuana and parent alcohol and drug use Carbon dioxide effects on peanut oil extraction Penicillin yields by block and treatment Diabetes survey on Pima Indians NIST data on ultrasonic measurements of defects in the Alaska pipeline Pneumonoconiosis in coal miners Marijuana usage by youth Prostate cancer surgery Panel Study of Income Dynamics subset Brightness of paper pulp depending on shift operator Production of PVC by operator and resin railcar Rabbit weight gain by diet and litter
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
463 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ratdrink rats resceram salmonella sat savings seatpos semicond sexab sexfun solder sono soybean spector speedo star stat500 strongx
Rat growth weights affected by additives Effect of toxic agents on rats Shape and plate effects on current noise in resistors Salmonella reverse mutagenicity assay School expenditure and test scores from USA in 1994-95 Savings rates in 50 countries Car seat position depending driver size Semiconductor split-plot experiment Post traumatic stress disorder in abused adult females Marital sex ratings Solder skips in circuit board manufacture Sonoluminescence Germination failures for soybean seeds Teaching methods in Economics Speedometer cable shrinkage Star light intensities and temperatures Scores for students in Stat500 class Strong interaction experiment data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
464 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
suicide teengamb toenail troutegg
Suicide method data from the UK Study of teenage gambling in Britain Toenail infection treatment study Survival of trout eggs depending on time and location truck Truck leaf spring experiment turtle Incubation temperature and the sex of turtles twins Twin IQs from Burt uncviet UNC student opinions about the Vietnam War uswages Weekly wages of US male workers in 1988 vision Vision acuity tests wafer resitivity of wafer in semiconductor experiment wavesolder Defects in a wave soldering process wbca Wisconsin breast cancer database weldstrength welding strength DOE wheat Insect damage to wheat varieties
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
465 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.10. gam.data gam.newdata kyphosis
Data dari Paket gam Simulated dataset for gam Simulated dataset for gam A classic example dataset for GAMs
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
466 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.11.
Data dari Paket ISwR
IgM Immunoglobulin G alkfos Alkaline phosphatase data ashina Ashina's crossover trial bcmort Breast cancer mortality bp.obese Obesity and blood pressure caesar.shoe (caesarean) Caesarean section and maternal shoe size coking Coking data cystfibr Cystic fibrosis lung function data eba1977 Lung cancer incidence in four Danish cities 1968-1971 energy Energy expenditure ewrates Rates of lung and nasal cancer mortality, and total mortality. fake.trypsin Trypsin by age groups graft.vs.host Graft versus host disease heart.rate Heart rates after enalaprilat hellung Growth of Tetrahymena cells
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
467 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
intake juul juul2 kfm lung malaria melanom nickel nickel.expand philion react red.cell.folate rmr secher secretin stroke tb.dilute thuesen tlc vitcap vitcap2
Energy intake Juul's IGF data Juul's IGF data, extended version Breast-feeding data Methods for determining lung volume Malaria antibody data Survival after malignant melanoma Nickel smelters in South Wales Nickel smelters in South Wales, expanded Dose response data Tuberculin reactions Red cell folate data Resting metabolic rate Birth weight and ultrasonography Secretin-induced blood glucose changes Estonian stroke data Tuberculin dilution assay Ventricular shortening velocity Total lung capacity Vital capacity Vital capacity, full data set
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
468 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
wright zelazo
Comparison of Wright peak-flow meters Age at walking FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
469 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.12.
Data dari Paket lmtest
ChickEgg Chickens, Eggs, and Causality Mandible Mandible Data USDistLag US Macroecnomic Data bondyield Bond Yield currencysubstitution Currency Substitution ftemp Femal Temperature Data fyff U.S. Macroeconomic Time Series gmdc U.S. Macroeconomic Time Series growthofmoney Growth of Money Supply ip U.S. Macroeconomic Time Series jocci U.S. Macroeconomic Time Series lhur U.S. Macroeconomic Time Series moneydemand Money Demand pw561 U.S. Macroeconomic Time Series unemployment Unemployment Data valueofstocks Value of Stocks wages Wages
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
470 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.13. Aids2 Animals Boston Cars93 Cushings DDT GAGurine Insurance Melanoma OME Pima.te Pima.tr Pima.tr2 Rabbit Rubber SP500 Sitka
Data dari Paket MASS Australian AIDS Survival Data Brain and Body Weights for 28 Species Housing Values in Suburbs of Boston Data from 93 Cars on Sale in the USA in 1993 Diagnostic Tests on Patients with Cushing's Syndrome DDT in Kale Level of GAG in Urine of Children Numbers of Car Insurance claims Survival from Malignant Melanoma Tests of Auditory Perception in Children with OME Diabetes in Pima Indian Women Diabetes in Pima Indian Women Diabetes in Pima Indian Women Blood Pressure in Rabbits Accelerated Testing of Tyre Rubber Returns of the Standard and Poors 500 Growth Curves for Sitka Spruce Trees in 1988
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
471 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Sitka89 Skye Traffic UScereal UScrime VA abbey accdeaths anorexia bacteria beav1 beav2 biopsy birthwt cabbages caith cats cement chem
Growth Curves for Sitka Spruce Trees in 1989 AFM Compositions of Aphyric Skye Lavas Effect of Swedish Speed Limits on Accidents Nutritional and Marketing Information on US Cereals The Effect of Punishment Regimes on Crime Rates Veteran's Administration Lung Cancer Trial Determinations of Nickel Content Accidental Deaths in the US 1973-1978 Anorexia Data on Weight Change Presence of Bacteria after Drug Treatments Body Temperature Series of Beaver 1 Body Temperature Series of Beaver 2 Biopsy Data on Breast Cancer Patients Risk Factors Associated with Low Infant Birth Weight Data from a cabbage field trial Colours of Eyes and Hair of People in Caithness Anatomical Data from Domestic Cats Heat Evolved by Setting Cements Copper in Wholemeal Flour
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
472 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
coop cpus crabs deaths drivers eagles epil farms fgl forbes galaxies gehan genotype geyser gilgais hills housing immer leuk
Co-operative Trial in Analytical Chemistry Performance of Computer CPUs Morphological Measurements on Leptograpsus Crabs Monthly Deaths from Lung Diseases in the UK Deaths of Car Drivers in Great Britain 1969-84 Foraging Ecology of Bald Eagles Seizure Counts for Epileptics Ecological Factors in Farm Management Measurements of Forensic Glass Fragments Forbes' Data on Boiling Points in the Alps Velocities for 82 Galaxies Remission Times of Leukaemia Patients Rat Genotype Data Old Faithful Geyser Data Line Transect of Soil in Gilgai Territory Record Times in Scottish Hill Races Frequency Table from a Copenhagen Housing Conditions Survey Yields from a Barley Field Trial Survival Times and White Blood Counts for
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
473 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mammals mcycle menarche michelson minn38 motors muscle newcomb nlschools npk npr1 oats painters petrol phones quine
Leukaemia Patients Brain and Body Weights for 62 Species of Land Mammals Data from a Simulated Motorcycle Accident Age of Menarche data Michelson's Speed of Light Data Minnesota High School Graduates of 1938 Accelerated Life Testing of Motorettes Effect of Calcium Chloride on Muscle Contraction in Rat Hearts Newcomb's Measurements of the Passage Time of Light Eighth-Grade Pupils in the Netherlands Classical N, P, K Factorial Experiment US Naval Petroleum Reserve No. 1 data Data from an Oats Field Trial The Painter's Data of de Piles N. L. Prater's Petrol Refinery Data Belgium Phone Calls 1950-1973 Absenteeism from School in Rural New South Wales
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
474 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
road rotifer ships shoes shrimp shuttle snails steam stormer survey synth.te synth.tr topo waders whiteside wtloss
Road Accident Deaths in US States Numbers of Rotifers by Fluid Density Ships Damage Data Shoe wear data of Box, Hunter and Hunter Percentage of Shrimp in Shrimp Cocktail Space Shuttle Autolander Problem Snail Mortality Data The Saturated Steam Pressure Data The Stormer Viscometer Data Student Survey Data Synthetic Classification Problem Synthetic Classification Problem Spatial Topographic Data Counts of Waders at 15 Sites in South Africa House Insulation: Whiteside's Data Weight Loss Data from an Obese Patient
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
475 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.14.
Data dari Paket UsingR
BushApproval HUMMER KSI
U.S. President George Bush approval ratings Deliveries of new HUMMER vehicles Data set on automobile deaths and injuries in Great Britain MLBattend Major league baseball attendance data OBP On base percentage for 2002 major league baseball season age.universe Best estimate of the age of the universe aid monthly payment for federal program alaska.pipeline Comparison of in-field and laboratory measurement of defects alltime.movies Top movies of all time aosat Artic Oscillation data based on SAT data arctic.oscillations Measurement of sea-level pressure at the arctic babies Mothers and their babies data babyboom Babyboom: data for 44 babies born in one 24-hour period. batting Batting statistics for 2002 baseball season
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
476 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
baycheck
Population estimate of type of Bay Checkerspot butterfly best.times Best track and field times by age and distance blood blood pressure readings breakdown Time of insulating fluid to breakdown bright.stars List of bright stars with Hipparcos catalog number brightness Brightness of 966 stars bumpers Bumper repair costs for various automobiles bycatch Number of Albatrosses accidentaly caught during a fishing haul cabinet Estimated tax savings for US President Bush's cabinet camp Mount Campito Yearly Treering Data, -3435-1969. cancer cancer survival times carbon Carbon Monoxide levels at different sites carsafety Fatality information in U.S. for several popular cars central.park Weather in Central Park NY in May 2003 central.park.cloud Type of day in Central Park, NY May 2003 cfb Bootstrap sample from the Survey of Consumer
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
477 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
chicken chips co2emiss coins coldvermont corn crime deflection diamond divorce do dottodot dowdata dvdsales emissions ewr
Finances weight gain of chickens fed 3 different rations Measurements of chip wafers Carbon Dioxide Emissions from the U.S.A. from fossil fuel The coins in my change bin Daily minimum temperature in Woodstock Vermont Comparison of corn for new and standard variety violent crime rates in 50 states of US Deflection under load Price by size for diamond rings Time until divorce for divorced women (by age) ~~function to do ... ~~ Dot-to-dot puzzle The Dow Jones average from Jan 1999 to October 2000 Monthly DVD player sales since introduction to May 2004 CO2 emissions data and gross domestic product for 26 countries Taxi in and taxi out times at EWR (Newark)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
478 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
airport for 1999-2001 exec.pay Direct compensation for 199 United States CEOs in the year 2000 fat Body measurements to predict percentage of body fat in males father.son Pearson's data set on heights of fathers and their sons female.inc Income distribution for females in 2001 firstchi Age of mother at birth of first child five.yr.temperature Five years of weather in New York City florida County-by-county results of year 2000 US presidential election in Florida galileo Galileo data on falling bodies galton Galton's height data for parents and children gap Sales data for the Gap gasprices Monthly average gasoline prices in the United States goalspergame Goals per game in NHL google Google stock values during 2005-02-07 to 2005-07-07 grades Current and previous grades
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
479 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
grip hall.fame healthy heartrate home homedata homeprice homework iq kid.weights last.tie lawsuits malpract mandms math
Effects of cross-country ski-pole grip Data frame containing baseball statistics including Hall of Fame membership Healthy or not? Simulated data of age vs. max heart rate Maplewood NJ homedata Maplewood NJ assessed values for years 1970 and 2000 Sale price of homes in New Jersey in the year 2001 Homework averages for Private and Public schools IQ scores Weight and height measurement for a sample of U.S. children Last tie in 100 coin tosses Law suit settlements malpractice settlements Proportions of colors in various M and M's varieties Standardized math scores
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
480 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
maydow midsize mw.ages nba.draft normtemp npdb nym.2002 oral.lesion ozonemonthly paradise pi2000 primes puerto rat reaction.time
Dow Jones industrial average and May maximum temperature Price of new and used of three mid-sized cars Age distribution in year 2000 in Maplewood New Jersey NBA draft lottery odds for 2002 Body temperature and heart rate of 130 health individuals National Practioner Data Bank Random sample of 2002 New York City Marathon finishers Oral lesion location by town Monthly mean ozone values at Halley Bay Antartica Annual snowfall at Paradise Ranger Station, Mount Ranier first 2000 digits of pi Primes numbers less than 2003 Incomes for Puerto Rican immigrants to Miami Survival times of 20 rats exposed to radiation Reaction time with cell phone usage
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
481 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
reddrum salmon.rate Salmon salmonharvest samhda
Growth of red drum Simulated Data on Rate of Recruitment for
Salmon harvest in Alaska from 1980 to 1998 Substance Abuse and Mental Health Data for teens scatter.with.hist Scatterplot with histograms scrabble Distribution of Scrabble pieces simple.sim Simplify the process of simulation skateranks Judges scores for disputed ice skating competition slc Sodium-Lithium countertransport smokyph Water pH levels at 75 water samples in the Great Smoky Mountains south Murder rates for 30 Southern US cities southernosc Southern Oscillations sp500.excess Excess returns of S&P 500 squareplot Create a squareplot alternative to a segmented barplot stud.recs Student records student.expenses Some simulated data on student expenses
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
482 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
superbarplot tastesgreat tcm1y tempsalinity too.young twins u2 urchin.growth vacation watertemp yellowfin
/
super segmented barplot Does new goo taste great? One-year treasury security values Temperature/Salinity measurements along a moving Eddy What age is too young for a male to data a female? Burt's IQ data for twins Song and lengths for U2 albums Data on growth of sea urchins vacation days Temperature measurement of water at 85m depth Yellow fin tuna catch rate in Tropical Indian Ocean
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
483 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
INDEKS PENULIS Daftar Isi
Judul
JJ J
Akaike, 261 Bowerman, 56, 235, 272 Burns, 78 Chamber, 70, 261, 341, 347 Cleveland, 70 Crawley, 235, 272, 325 Davidian, 60
Diggle, 356, 357 Dobson, 63, 277, 313, 315, 347 Faraway, 235, 257 Giltinan, 60 Harville, 144 Hastie, 70, 261 Hjorth, 261
I II
484 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kenward, 364 Kuhnert, 272 Kutner, 272 Laird, 60 Liang, 361 Maindonald, 272 McCullagh, 277, 355 Mendenhall, 44 Meyer, 31 Murrel, 272 Nelder, 277, 347, 355 Neter, 56, 144, 235, 272 Ripley, 235, 261, 347 Searle, 144 Smith, 364 Smyth, 51
Timm, 144 Tirta, 65, 73, 78, 91, 243, 246, 396 Venables, 70, 235, 261, 272 Vezalini, 272 Wackery, 44 Ware, 60 Wasserman, 272 Wedderburn, 361 Zeger, 361 Zoonekyn, 272
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
485 dari 490
Cari Halaman
Kembali
Layar Penuh
Tibshirani, 70 Tutup
Keluar
FMIPA-UNEJ
INDEKS SUBJEK Daftar Isi
Judul
JJ J
seragam, 364
CLI, 72
algoritma lengkap, 50 penuh, 51 terpartisi, 50, 51 AR-1, 364
distribusi Binomial, 284 Binomial Negatif, 287 eksponensial, 287 Gamma, 286 Inverse Gauss, 287 Normal, 286
boneka, 197
I II
486 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Pareto, 287 Poisson, 285 eksplanatori, 275 eleminsi, 29 fungsi hubungan kanonik, 63 natural, 63 Gamma-HGLM, 374 GEE, 351, 363, 364 GLM, 363 GLS, 185 GUI, 72 heteroskedastik, 182, 185 homoskedastik, 182, 185 invariant, 52 JGIG, 374, 394 kanonik, 278
keluarga eksponensial, 62, 276, 277 korelasi serial, 59 uniform, 58 log komplementer, 297 logistik, 322 logit, 90, 297, 322 longitudinal, 60, 350 matriks determinan, 115 ordo, 113 positif definit, 123 positif semi definit, 124 singuler, 115 teras, 116 model linier bertingkat, 59 GEE, 65 GLM, 61 GLMM, 64
FMIPA-UNEJ
Daftar Isi
Judul
JJ J
I II
487 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
HGLM, 64 hirarkis tergeneralisir, 64 klasik, 53 LMM, 57 NLM, 55 normal, 53 tergeneralisir, 62 multikolinieritas, 67
sampel, 44, 45 sekawan, 374, 375 sistematis, 275 skoring Fisher, 50 skoring Fisher, 184 skrip, 72 WLS, 185
FMIPA-UNEJ
Daftar Isi
Judul
Newton-Raphson, 50, 184 pemodelan, 30 deterministik, 33 stokastik, 35 probit, 297, 322 regresi Ridge, 67 repeated measurement, 60 measurements, 350 measures, 350
JJ J
I II
488 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
INDEKS FUNGSI R Daftar Isi
Judul
JJ J
?NamaPaket, 75 abline(), 79 barplot(), 79 boxplot(), 79
gee(), 90, 368, 369 glm(), 89, 326, 368 glmML(), 90 help(), 75 hist(), 79
I II
489 dari 490
Cari Halaman
Kembali
contour(), 79 example(), 75
library(), 74 lm(), 88, 213
Layar Penuh
Tutup
Keluar
lmer(), 89 lmm(), 89 lrm(), 90 FMIPA-UNEJ
nls(), 90 pairs(), 79 persp(), 79 plot(), 79, 257
Daftar Isi
Judul
qq.plot(), 79 reg.line(), 79 require(), 74 rug(), 79 scatterplot(), 79 scatterplot.matrix(), 79 sp(), 79 split.screen(), 81 spm(), 79
JJ J
I II
490 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar