UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 1 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
ANalisis DAta dan GRAfik dengan R (ANDAGRAR
J
I
Hal. 2 dari 234
-Versi Elektronik) Cari Halaman
Kembali
Prof. Drs. I. M. Tirta, Dip.Sc, M.Sc., Ph.D.
II
Layar Penuh
[email protected] Tutup
February 28, 2012 Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 3 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
DAFTAR ISI
Daftar Isi
Judul
JJ
J
I
II
Hal. 1 dari 234
I
STATISTIKA INFERENSIAL DENGAN R
13 Cari Halaman
1 PROGRAM STATISTIKA R 1.1 Sekilas Program Statistika R . . . . 1.2 RGUI dengan R-Commander . . . . 1.3 RCommander dengan Menu Bahasa 1.4 Editor Skrip dengan Tinn-R . . . . 1.5 Data untuk Ilustrasi . . . . . . . .
. . . . . . . . . . . . Indonesia . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
15 19 21 25 28 30
Kembali
Layar Penuh
Tutup
Keluar
1.6 1.7
Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . 31 Soal-soal Latihan . . . . . . . . . . . . . . . . . . . 32
2 KONSEP DASAR STATISTIKA 2.1 Statistika dan Data Statistik . . . . 2.2 Jenis Data . . . . . . . . . . . . . 2.3 Distribusi Data . . . . . . . . . . . 2.4 Ukuran Pemusatan dan Penyebaran 2.4.1 Ukuran Pemusatan . . . . . 2.4.2 Ukuran Penyebaran . . . . 2.5 Bacaan Lebih Lanjut . . . . . . . . 2.6 Soal-soal Latihan . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
3 EXPLORASI DATA 3.1 Menyiapkan Data pada R . . . . . . . . 3.1.1 Mengedit langsung data . . . . . 3.1.2 Memanggil Data dari Database R 3.1.3 Mengimpor data dari file . . . . . 3.1.4 Membangkitkan Data Simulasi . 3.2 Explorasi Data . . . . . . . . . . . . . .
. . . . . . . .
. . . . . .
. . . . . . . .
. . . . . .
. . . . . . . .
. . . . . .
. . . . . . . .
. . . . . .
. . . . . . . .
. . . . . .
. . . . . . . .
35 37 42 46 50 50 53 59 60
. . . . . .
63 66 67 68 71 73 76
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 2 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.3 3.4
3.2.1 Deskripsi Data . . . . . . . 3.2.2 Visualisasi Data Univariat . 3.2.3 Visualisasi Data Multivariat Bacaan Lebih Lanjut . . . . . . . . Soal-soal Latihan . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
77 80 84 96 97
UNEJ
Daftar Isi
4 UJI RATA-RATA DAN PROPORSI 99 4.1 Interval Keyakinan dan Uji Rata-rata . . . . . . . . 101 4.1.1 Hasi-hasil Statistika . . . . . . . . . . . . . 101 4.1.2 Tingkat Interval Keyakinan dan Peluang Penutup108 4.1.3 Distribusi Beda Rata-rata Kelompok Saling Bebas . . . . . . . . . . . . . . . . . . . . 110 4.1.4 Distribusi Beda Sampel/ Kelompok Tidak Saling Bebas . . . . . . . . . . . . . . . . . 112 4.2 Uji hipotesis rata-rata . . . . . . . . . . . . . . . . 117 4.2.1 Menggunakan menu R-Commander . . . . . 120 4.3 Interval Keyakinan dan Uji Proporsi . . . . . . . . . 123 4.3.1 Interval keyakinan proporsi . . . . . . . . . . 123 4.3.2 Interval keyakinan beda proporsi . . . . . . . 124 4.3.3 Uji hipotesis proporsi dan beda proporsi . . . 125
Judul
JJ
J
I
II
Hal. 3 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.4 4.5 4.6
Fungsi-fungsi R . . . . . . . . . . . . . . . . . . . . 127 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . 128 Soal-soal Latihan . . . . . . . . . . . . . . . . . . . 129 UNEJ
5 ANALISIS VARIANSI (ANAVA) 5.1 Konsep Dasar Anava . . . . . . . . . . . . . . . . 5.2 Uji Anava Faktor Tunggal . . . . . . . . . . . . . 5.2.1 Alternatif Formula untuk perhitungan secara semi manual . . . . . . . . . . . . . . . . 5.2.2 Uji Anava dengan R atau R-Commander . 5.3 Anava Multi Faktor . . . . . . . . . . . . . . . . 5.3.1 Eksplorasi Grafik Beda Rata-rata . . . . . 5.4 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . 5.5 Soal-soal Latihan . . . . . . . . . . . . . . . . . .
131 . 133 . 136
Daftar Isi
Judul
. . . . . .
140 141 144 147 152 153
JJ
J
I
Hal. 4 dari 234
Cari Halaman
Kembali
6 DASAR-DASAR PEMODELAN STOKASTIK 6.1 Prinsip Pemodelan . . . . . . . . . . . . . . . . 6.2 Langkah-langkah Penting Dalam Pemodelan . . . 6.2.1 Langkah penting dalam Pemodelan secara Umum . . . . . . . . . . . . . . . . . . .
155 . 159 . 166
II
Layar Penuh
Tutup
. 166 Keluar
6.3
6.4
6.5 6.6 6.7
6.2.2 Langkah penting dalam Pemodelan Stokastik167 Metode Mengestimasi Parameter . . . . . . . . . 172 6.3.1 Metode kuadrat terkecil . . . . . . . . . . . 172 6.3.2 Metode likelihood maksimum . . . . . . . . 173 6.3.3 Mencari maksimum dengan metode numerik 174 Model Linier dan Perkembangannya . . . . . . . . 178 6.4.1 Model linier klasik . . . . . . . . . . . . . 179 6.4.2 Model linier tercampur . . . . . . . . . . . 181 6.4.3 Model linier tergeneralisasi . . . . . . . . . 184 6.4.4 Model linier campuran tergeneralisasi . . . . 187 Pengembangan Lain Model Linier . . . . . . . . . . 189 Outline Buku . . . . . . . . . . . . . . . . . . . . . 192 Latihan Soal- soal . . . . . . . . . . . . . . . . . . 193
7 REGRESI LINIER SEDERHANA 7.1 Bentuk dan Asumsi . . . . . . . . . . . . . . . . 7.2 Estimasi Parameter . . . . . . . . . . . . . . . . 7.2.1 Estimasi dengan Metode Kuadrat Terkecil 7.2.2 Estimasi dengan Metode Likelihood Maksimum . . . . . . . . . . . . . . . . . . . .
195 . 197 . 198 . 198
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 5 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
. 202 Keluar
7.3
7.4 7.5
Uji Inferensial dari βˆj . . . . . . . . . . . . . . . . 205 7.3.1 Distribusi βˆj . . . . . . . . . . . . . . . . . 205 7.3.1.1 Distribusi βˆj bila σ 2 diketahui . . 205 7.3.1.2 Distribusi βˆj bila σ 2 tidak diketahui207 7.3.2 Estimasi selang dari βj . . . . . . . . . . . . 208 7.3.3 Uji Hipotesis . . . . . . . . . . . . . . . . 209 7.3.4 Interval Prediksi Rata-rata dan Nilai Tunggal 210 7.3.5 Melaporkan nilai probabilitas p . . . . . . . 211 7.3.6 Menentukan Model dengan R . . . . . . . . 212 7.3.7 Menggunakan fungsi lm() . . . . . . . . . . 212 7.3.8 Menggunakan Menu R-Commander . . . . . 216 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . 217 Latihan Soal- Soal . . . . . . . . . . . . . . . . . . 218
Glosarium
219
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 6 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
DAFTAR GAMBAR
Daftar Isi
Judul
JJ
J
I
II
Hal. 7 dari 234
1.1 1.2 1.3 1.4 2.1
Tampilan RGUI versi 2.2.1 Standar untuk Windows Tampilan Menu R-Commander Asli . . . . . . . . Tampilan Menu R-Commander Menu Bahasa Indonesia . . . . . . . . . . . . . . . . . . . . . . . . Tampilan Editor Skrip Tinn-R . . . . . . . . . . .
23 24
Cari Halaman
Kembali
26 29
Sebaran Data dengan Mean Berbeda tetapi Dispersi Sama . . . . . . . . . . . . . . . . . . . . . . 55
Layar Penuh
Tutup
Keluar
2.2 2.3 2.4
3.1 3.2 3.3 3.4 3.5
3.6 3.7
Sebaran Data dengan Mean Sama tetapi Dispersi Berbeda . . . . . . . . . . . . . . . . . . . . . . . 56 Sebaran Data dengan Mean Sama tetapi Dispersi Berbeda . . . . . . . . . . . . . . . . . . . . . . . 57 Perspektif dan Kontur Dua Peubah dengan r = 0 (atas) dan r = 0.8 (bawah) . . . . . . . . . . . . . 58 Menu Dialog Membaca Data . . . . . . . . . . . . 72 Contoh Histogram, Boxplot, QQPlot dan Diagram Lingkaran . . . . . . . . . . . . . . . . . . 87 Komponen Boxplot . . . . . . . . . . . . . . . . . 88 Histogram dan Denstias Berat Ayam . . . . . . . 89 Contoh Diagram boxplot dengan mempertimbangkan kelompok. Diagram menunjukkan bahwa distribusi keliling batang pohon berhubungan dengan jenis pohon . . . . . . . . . . . . . . . . . . . . . . . . 90 Contoh Diagram Pencar . . . . . . . . . . . . . . 91 Contoh Matriks Diagram Pencar dengan Beberapa Peubah Acak . . . . . . . . . . . . . . . . . 92
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 8 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8
Contoh Diagram Permukaan 3 Dimensi yang mengandung Peubah Kualitatif . . . . . . . . . . . . . 93 3.9 Contoh Representasi Tiga Dimensi Regresi dengan dua Peubah Penjelas . . . . . . . . . . . . . 94 3.10 Contoh CoPlot . . . . . . . . . . . . . . . . . . . 95
UNEJ
Daftar Isi
4.1 4.2 4.3 4.4 4.5
Ilustrasi distribusi rata-rata sampel . . . Grafik Simulasi Interval Keyakinan . . . Menu Uji Rata-rata . . . . . . . . . . . . Menu Uji Beda rata-rata . . . . . . . . . Menu R-Commander untuk uji proporsi .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
115 116 121 122 126
Judul
JJ
J
I
II
Hal. 9 dari 234
5.1 5.2 5.3 5.4 5.5 5.6 5.7
Ilustrasi konsep Anava . . . . . . . . . . . . Ilustrasi konsep Anava . . . . . . . . . . . . Menu dialog anova satu arah . . . . . . . . . Menu dialog anova multi arah . . . . . . . . Contoh Mean Plot untuk ilustrasi uji anava Contoh Mean Plot untuk ilustrasi interaksi . Contoh Mean Plot untuk ilustrasi uji anava
. . . . . . .
. . . . . . .
. . . . . . .
134 135 143 146 149 150 151
6.1
Ilustrasi Regresi 1 . . . . . . . . . . . . . . . . . . 190
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.2
Ilustrasi Regresi 2 . . . . . . . . . . . . . . . . . . 191
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 10 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
DAFTAR TABEL
Daftar Isi
Judul
JJ
J
I
II
Hal. 11 dari 234
3.1 3.2 3.3
Penulisan Data pada R . . . . . . . . . . . . . . . 68 Perintah Untuk Data Acak . . . . . . . . . . . . . 74 Tabel Fungsi Eksplorasi Data . . . . . . . . . . . 86
5.1 5.2
Tabel Anava Faktor Tunggal . . . . . . . . . . . . 139 Tabel Anava Faktor Ganda . . . . . . . . . . . . . 145
6.1
Tabel jumlah (kg) salak dan anggur dan harga yang dibayar . . . . . . . . . . . . . . . . . . . . . 164
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 12 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Bagian I Judul
STATISTIKA INFERENSIAL DENGAN R
JJ
J
I
II
Hal. 13 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 14 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
1
Daftar Isi
Judul
PROGRAM STATISTIKA R JJ
J
I
II
Hal. 15 dari 234
Cari Halaman
Bab ini terutama diarahkan untuk mempersiapkan mahasiswa dalam melakukan praktikum terutama yang terkait dengan penguasaan piranti lunak R. Dalam kenyataannya, untuk menganalisis data penguasaan terhadap piranti lunak mutlak diperlukan. Piranti lunak R dipilih karena skaligus merupakan salah satu piranti lunak yang menjadip usat pengembangan di Laboratorium Statistika FMIPA Univertsitas Jember.
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 16 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Indikator Kompetensi Setelah menyelesaikan materi pada bab ini pembaca menguasai kemampuan yang ditandai oleh indikator seperti berikut:
UNEJ
memahami R dan kenapa perlu menggunakan R; Daftar Isi
dapat menginstal R dengan beberapa pustaka yang diper-
lukan; dapat membuka R dan mengaktifkan pustaka RComman-
Judul
JJ
J
I
II
der; dapat memanggil fungsi yang diperlukan baik melalui skrip
maupun menu;
Hal. 17 dari 234
Cari Halaman
dapat memangil dokumentasi bantuan untuk fungsi yang
diperlukan.
Kembali
Layar Penuh
Pada bab ini dibahas secara ringkas Program R, pemanfaatan dan pengembangannya terutama untuk menghasilkan Program Statistika dengan menu berbahasa Indonesia. Hasil modifikasi
Tutup
Keluar
dari Program R ini merupakan hasil riset yang dilakukan secara mandiri sejak tahun 2003 yang dimulai dengan men-download mencoba dan memanfaatkan R untuk kegiatan Praktikum. Pada mulanya pemanfaatan R hanya terbatas dengan pendekatan RCLI (R Command Line Interface). Proses penerjemahan menu ke bahasa Indonesia menjadi lebih cepat sejak mencoba pustaka Rcmdr dan tcltk. Bahkan sejak R memiliki kemampuan Internasionalisasi,, penerjemahan menu dapat dilakukan secara global melalui file pot.
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 18 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.1.
Sekilas Program Statistika R
Program R atau biasa disebut R adalah salah satu paket analisis data dan pemrograman, yang merupakan paket open source yang dapat diperoleh secara cuma-cuma pada situs http://cran.rproject.org/. Sebenarnya R adalah paket pemrograman yang termasuk keluarga S (bahasa S). Ada dua program utama yang ditulis dengan bahasa S, yaitu S-Plus yang dikembangkan secara komersial dan R yang dikembangkan melalui konsep open source atau kode terbuka. Beda keduanya terletak pada Antarmuka penggunanya. S-Plus telah dilengkapi dengan menu yang sangat lengkap, sering disebut sebagai advanced Grapical User Interface (GUI), sedangkan R lebih mengandalkan Command Line Interface(CLI) dari pada menu. Belakangan banyak kontributor yang menyumbang paket menu interface untuk R. Paket program R ini sudah dilengkapi banyak kemampuan internal untuk menganalisis data maupun menampilkan grafik sehingga R bisa dikatagorikan sebagai paket pengolahan data (paket statistika). Selain itu telah pula dikembangkan modul khusus untuk metode analisis tertentu oleh banyak orang yang disebut
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 19 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
library atau pustaka. Dewasa ini R populer dipergunakan baik dibidang akademik maupun industri. R mempunyai kemampuan yang hampir sama dengan S-Plus kecuali dari segi kemudahan penggunaannnya. Piranti lunak yang dikembangkan melalui konsep open source populer dengan sebutan OSS (]it open source sofwares atau bisa kita sebut sebagai PLKB (Piranti Lunak Kode terBuka).
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 20 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.2.
RGUI dengan R-Commander
Sebenarnya ada beberapa GUI atau interface yang dapat dipakai untuk mengaktifkan R melalui menu. GUI untuk program R biasa disebut RGUI. Salah satu RGUI dikembangkan oleh R-Development Corre Team (RDCT). Dibandingkan dengan program-program komersial berbasis Windows, interface RGUI ini memang masih sangat sederhana. Menu yang tersedia hanya empat kelompok yaitu: File, Edit, Misc, Package dan Help seperti ditunjukkan Gambar 1.1. RGUI standar ini dapat difungsikan dengan beberapa cara yaitu:
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 21 dari 234
1. memberikan perintah-perintah pendek satu-baris (Command line) yang iikuti dengan enter; dengan cara ini perintah pendek ini akan langsung ditafsirkan dan dikerjakan R; 2. menulis perintah panjang pada suatu file yang selanjutnya dipanggil melalui pilihan source file. Bagi pengguna yang sangat bergantung pada menu, memang akan mengalami hambatan karena tidak bisa sekaligus mengedit dan menjalankan skrip seperti yang bisa dilakukan pada
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
S-Plus. Untuk mengatasi hal ini dapat dilakukan dengan menginstall suatu interface RGUI yang lain diantaranya adalah RCommander. Untuk R versi 2.2. ke atas dan RCommander versi 1.2.7 ke atas, tersedia RCommander dengan menu bahasa Inggris dan menu bahasa Indonesia, yang merupakan kontribusi penulis (Lihat Gambar 1.2 dan Gambar 1.3). Untuk mengaktifkan menu berbahasa Indonesia, pada properties dari shortcut R di desktop ditulis
UNEJ
Daftar Isi
Judul
JJ
J
I
II
"C:\Program Files\R\R-2.2.1\bin\Rgui.exe" LANGUAGE=id Hal. 22 dari 234
R-Commander adalah salah satu RGUI yang tampilannya sederhana sehingga sangat cocok bagi pemula. Untuk dapat menggunakan RGUI RCommander kita harus menginstal pustaka RCmdr dengan cara terlebih dahulu mendownload RCmdr.zip selanjutnya menginstal pustaka tersebut dalam R. Untuk mengaktifkannya kita lakukan perintah
Cari Halaman
Kembali
Layar Penuh
Tutup
library(Rcmdr) Keluar
UNEJ
Daftar Isi
Judul
Gambar 1.1: Tampilan Jendela Pembukaan RGUI untuk Windows.
JJ
J
I
II
Hal. 23 dari 234
Dengan perintah di atas kita memperoleh RGUI seperti Gambar 1.2 atau Gambar 1.3. Dari RGUI ini kita dapat memilih mengedit data serta melakukan analisis data maupun grafik. Dengan RGUI ini kita dimungkinkan mengedit data sebagaimana layaknya menggunakan worksheet seperti excel dan lain-lainnya. RGUI ini juga menyediakan informasi bantuan pada menu help.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 24 dari 234
Gambar 1.2: Tampilan Menu R-Commander dalam bahasa Inggris. Selain ada menu tarik, juga terdapat panel, Jendela Skrip dan Jendela Hasil
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.3.
RCommander dengan Menu Bahasa Indonesia
Rcommander ini pada dasarnya merupakan modifikasi menu RCommander asli. Salah satu tampilan dapat dilihat pada Gambar 1.3. Menu RCommander ini terutama diperuntukkan bagi pengguna pemula dari R atau bagi mereka yang tidak mempunyai cukup dasar dalam pemrograman komputer. Untuk dapat mengaktifkan menu Bahasa Indonesia, maka yang harus dilakukan adalah langkah-langkah berikut. 1. Dapatkan skrip menu berbahasa Indonesia dari Lab Statistika Jurusan Matematika FMIPA UNEJ 2. Salin/copy file yang diperoleh pada direktori yang dimaksud yaitu: ...\library\Rcmdr\etc, untuk menyimpan menu ...\library\Rcmdr\doc untuk menyimpan dokumen-
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 25 dari 234
Cari Halaman
Kembali
Layar Penuh
tasi dan ...\library\Rcmdr\R untuk interface menu dengan
II
Tutup
program R. Keluar
UNEJ
Daftar Isi
Gambar 1.3: Tampilan Menu R-Commander dalam Menu Bahasa Indonesia.
Tampilan RGUI RCommander terdiri atas 4 item panel, 8 menu utama dan 3 jendela. Panel RComander terdiri atas
Judul
JJ
J
I
II
Hal. 26 dari 234
1. Panel data aktif. Panel ini menunjukkan data yang sedang aktif dipergunakan dalam analisis. Data aktif dapat diubah dengan mengklik bagian inidan memilih data yang tersedia. 2. Panel edit data. Panel ini berfungsi untuk mengaktifkan editor data. Dengan editor data kita dapat mengedit data seperti layaknya menggunakan spredsheet excel. 3. Panel lihat data. Berfungsi untuk melihat spreadsheet data tanpa bisa mengedit.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. Panel model aktif. Panel ini menunjukkan model yang sedang aktif dipergunakan dalam analisis regresi (model linier). Bila kita telah melakukan lebih dari sekali analisis regresi pada data yang sama, kita dapat membandingkan model-model tadi.
UNEJ
Daftar Isi
Sebagian dari pohon menu yang penting dari RCommander dapat dilihat pada Lampiran ??.
Judul
JJ
J
I
II
Hal. 27 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.4.
Editor Skrip dengan Tinn-R
Menu RCommander sesungguhnya telah dapat mengakomodasi kebutuhan analisis data dengan statistika dasar seperti: Uji beda dengan t, uji Anova, Uji Regresi (LM dan GLM), Uji Nonparametrik). Namun, untuk mahasiswa jurusan matematika, diharapkan tetap mempelajari cara penulisan skrip R. Selain mempelajari dan menjalankan skrip R melalui Jendela Skrip RCommander, penulisan dan pengiriman skrip dapat jug adilakukan melalui Program Editor Tinn-R (lihat Gambar 1.4. Pembahasan lebih detail tentang pemrograman R dan penggunaan Tinn-R dapat dilihat pada Tirta bk:TirtaR1. Selain itu untuk pemrograman R dapat juga dibaca Tirta bk:TirtaSP45
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 28 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 29 dari 234
Gambar 1.4: Tampilan Editor Skrip Tinn-R
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.5.
Data untuk Ilustrasi
R menyediakan banyak koleksi data sebagai ilustrasi. Data yang ada pada R dapat diperiksa melalui salah satu perintah berikut.
UNEJ
data() data(package = .packages(all.available = TRUE))
Daftar Isi
Judul
Sebagian dari data dapat dilihat pada Lampiran ??. JJ
J
I
II
Hal. 30 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.6.
Bacaan Lebih Lanjut
Sebagian besar referensi terkait dengan program R masih berupa tulisan di internet dalam Bahasa Indonesia yang dapat dilihat pada situs http://wwwr.r-project.org. Beberapa referensi dalam bahasa Indonesia telah mulai dirintis diantaranya Tirta (bk:TirtaR1,art:Tirta2005, bk:TirtaRcmdr)
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 31 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.7.
Soal-soal Latihan
Diskusikan dalam kelompok terdiri atas 3-4 orang. 1. Tentang prospek pemanfaatan program open source untuk mengatasi maraknya kasus pembajakan program komputer, bagaimana komentar anda terhadap pendapat bahwa Indonesia merupakan salah satu negara yang banyak melakukan pembajakan program komputer dan pendapat yang mengatakan bahwa untuk kepentingan pendidikan dan pengajaran tidak perlu ragu-ragu melakukan pembajakan. 2. Lakukan eksplorasi R menjalankan beberapa demo yang ada. 3. Lakukan eksplorasi RCommander baik dalam menu Bahasa Inggris maupun Bahasa Indonesia dengan mengaktifkan salah satu data yang ada pada paket R.
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 32 dari 234
Cari Halaman
Kembali
Layar Penuh
4. Lakukan pelacakan dengan google untuk mencari informasi atau dokumen yang terkait dengan analisis statistika statistical analysis dan proram R. Catat judul-judul dokumen
II
Tutup
Keluar
(buku ataupun artikel online) dalam format daftar pustaka. Jika mungkin buat ringkasan singkat tentang apa yang dibahas dalam dokumen tersebut (lihat ringkasan dokumen ataupun daftar isinya).
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 33 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 34 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
2
Daftar Isi
KONSEP DASAR STATISTIKA
Judul
JJ
J
I
II
Hal. 35 dari 234
Bab ini terutama diarahkan untuk memberikan pengertian umum tentang statistika dan dasar teori distribusi data.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Indikator Kompetensi Setelah menyelesaikan materi pada bab ini pembaca menguasai kemampuan yang ditandai oleh indikator seperti berikut:
UNEJ
dapat menjelaskan lingkup statistika deskriptif dan staDaftar Isi
tistika inferensial; menjelaskan pengaruh ukuran pemusatan dan penyebaran
Judul
terhadap distribusi data; dapat menentukan distribusi yang mungkin sesuai dengan
jenis data dilihat dari skalanya.
JJ
J
I
II
Hal. 36 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.1.
Statistika dan Data Statistik
Untuk memahami prinsip dasar statistika ada baiknya kita mengikuti definisi tentang statistika diantaranya seperti berikut ini.
UNEJ
1. Menurut Webster’s New Collegiate Dictionary statistika didefinisikan sebagai “cabang matematika yang berkaitan dengan pengumpulan, analisis, interpretasi, dan penyajian dari sejumlah data numerik ”.
Daftar Isi
Judul
JJ
2. Kendal dan Stuart (1977) mengatakan: “ Statistika adalah cabang dari metode ilmiah yang berhubungan dengan pengumpulan data yang dikumpulkan dengan mencacah atau mengukur sifat- sifat dari populasi.” 3. Fasher (1958), mengatakan bahwa “ statistika berhubungan dengan metode untuk menarik kesimpulan dari hasil percobaan atau proses.” 4. Freund dan Walpole (1987) melihat statistika sebagai “sains pengambilan keputusan di dalam ketidakpastian.”
J
I
II
Hal. 37 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5. Mood, Graybill dan Boes (1974) mendefinisikan statistika sebagai “teknologi dari metode ilmiah” dan menambahkan bahwa statistika berhubungan dengan :“(1) rancangan percobaan dan penyelidikan, (2) penarikan kesimpulan statistik.” 6. Mendenhall bk:Mendenhall79 mendefinisikan statistika sebagai suatu “bidang sains yang berkaitan dengan ekstraksi informasi dari data numerik dan menggunakannya untuk membuat keputusan tentang populasi dari mana data tersebut diperoleh.”
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 38 dari 234
Jadi secara umum dapat dikatakan bahwa statistika adalah suatu teori informasi, dengan penarikan kesimpulan sebagai tujuannya. Tujuan statistika adalah untuk membuat kesimpulan tentang suatu yang lebih luas (disebut populasi) berdasarkan keterangan yang ada pada sebagian contoh (disebut sampel) yang diambil dari populasi tersebut. Teori statistika adalah suatu teori informasi yang barhubungan dengan pengangkaan informasi, menentukan percobaan atau prosedur untuk pengumpulan data, de-
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ngan biaya minimal, dari sejumlah informasi tertentu, dan menggunakan informasi ini untuk membuat kesimpulan- kesimpulan. Pembuatan kesimpulan terhadap populasi yang tidak diketahui adalah prosedur yang terdiri atas dua langkah. Pertama, kita menentukan prosedur- prosedur penarikan kesimpulan yang cocok dari situasi yang dihadapi; dan kedua, kita mencari ukuran kecocokan dari kesimpulan yang dihasilkan. Jadi informasi merupakan bagian yang sangat penting dalam menggunakan statistik sebagai alat mengambil keputusan. Demikian juga sebaliknya statistika adalah salah satu alat yang dapat dipergunakan untuk memanfaatkan informasi sebagai bahan pengambilan keputusan. Selain karena menggunakan informasi sebagai landasan pengambilan keputusan, pengambilan keputusan dengan statistika juga memiliki keunggulan lain yaitu statistika juga memberikan ukuran kecocokan atau ukuran kesalahan dari kesimpulan yang dibuat (Mendenhall [15]). Informasi yang dijadikan dasar pengambilan keputusan biasa disebut sebagai data statistik.
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 39 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Statistika adalah ilmu yang mempelajari prosedur pengambiKeluar
lan keputusan dari sejumlah kecil informasi pada sampel, untuk digeneralisasikan pada lingkungan yang lebih luas yaitu populasi. Prosedur ini meliputi, mengorganisir, meringkas, menyajikan data dan menguji dugaan. Karena luasnya cakupan statistika, maka statistika dibedakan menjadi dua kelompok besar yaitu Statistika Deskriptif yaitu prosedur yang meliputi mengorganisir, meringkas dan menyajikan data. Sedangkan prosedur lebihlanjut terkait dengan pengolahan data untuk pendugaan, peramalan atau pengujian dugaan disebut Statistika Inferensial. Populasi pada umumnya diartikan sebagai keseluruhan individu atau subjek yang menjadi kepentingan dalam suatu studi atau penelitian. Jika penelitian tentang berat dan tinggi badan mahasiswa suatu perguruan tinggi, maka populasinya adalah seluruh mahasiswa perguruan tinggi tersebut.
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 40 dari 234
Cari Halaman
Kembali
Layar Penuh
sampel adalah sebagian individu yang dijadikan contoh atau dasar pengambilan keputusan. Dalam populasi di atas, sebagian mahasiswa tersebut dapat dikumpulkan sebagai
II
Tutup
Keluar
sampel (dalam jumlah dan dengan prosedur yang memenuhi syarat) untuk dipelajari. Data adalah informasi dari populasi atau sampel yang menjadi kepentingan studi.
UNEJ
Variabel/Peubah adalah bagian dari data yang merupakan karakteristik populasi dan sampel yang menjadi perhatian atau kepentingan studi (misalnya, jenis kelamin, pendidikan, tinggi badan dan sebagainya)
Daftar Isi
Judul
JJ
Parameter adalah nilai atau ukuran yang menggambarkan deskripsi populasi (misalnya rerata, variansi, korelasi dan sebagainya) Statistik selain bermakna data, secara khusus juga bermakna sebagai nilai atau ukuran yang menggambarkan deskripsi sampel (misalnya rata-rata sampel, veriansi sampel, korelasi sampel dan sebagainya)
J
I
II
Hal. 41 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.2.
Jenis Data
Data numerik pada umumnya dapat dibedakan menjadi dua kelompok besar yaitu data hasil pencacahan (disebut data enumerasi) dan data dari hasil pengukuran disebut data metrik. Pengukuran (meassurement) menghasilkan data numerik yang disebut data metrik. Data ini disajikan dalam bentuk angka atau bilangan. Secara umum data ini dapat dikelompokkan kedalam beberapa jenis sekala yaitu nominal, ordinal, interval dan rasio yang dapat dijelaskan seperti berikut ini (Lihat Guilford & Fruchter [7] ).
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 42 dari 234
Nominal Sering hasil pengukuran kategori disajikan dalam bentuk angka misalnya jenis kelamin di label 0 untuk perempuan dan 1 untuk laki-laki. Dalam hal ini, angka 0 dan 1 hanyalan label atau angka dan bukan bilangan. Oleh karena itu angka-angka ini tidak dapat dimanipulasi secara aritmatik dan statistik dalam arti tidak dapat dijumlah maupun dirata-rata. Namun, kita bisa berbicara frekuensi atau proporsi masing-masing kategori.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Ordinal Dalam beberapa hal hasil pengukuran kontinu dikelompokkan menjadi beberapa kategori yang termasuk kategori kuantitatif. Misalnya dalam hasil belajar pembaca bukan perolehan angkanya yang diperhatikan tetapi rankingnya. Demikian juga sesungguhnya perubahan skor ujian pembaca dari skala seratus ke skala lima (0-4) sesungguhnya menghasilkan skala ordinal yang bisa dilabel E-A. Sesungguhnya angka-angka ini juga belum bisa dimanipulasi secara aritmatik (dalam arti dijumlah, dirata-rata dan sjenisnya). Skala ordinal belum memiliki unit pengukuran yang sama, yaitu jarak antara 0 ke 1 belum, tentu sama dengan jarak 1 ke 2 dan seterusnya.
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 43 dari 234
Cari Halaman
Interval Contoh pengukuran dengan skala interval adalah skor hasil ujian pembaca . Pada skala interval, angka-angka sudah memiliki makna bilangan dan dapat dimanipulasi secara aritmatik (dijumlah dikurangkan dan sebagainya). Skala ini sudah memiliki unit pengukuran yang sama (misalnya skor 65,70, dan sebagainya). Skala ini juga sudah memiliki angka 0, namun belum mutlak. Artinya, pem-
II
Kembali
Layar Penuh
Tutup
Keluar
baca yang mendapat skor 0 tidak berarti tidak memiliki pengetahuan sama sekali. Demikian juga suhu 0 derajat tidak berarti suatu benda tidak memiliki panas atau suhu sama sekali. Rasio Rasio merupakan skala yang paling sempurna. Skala ini telah memiliki 0 mutlak, dapat dibandingkan secara rasio. Contoh misalnya berat suatu benda. bilangan 0 menunjukkan tidak ada berat. Suatu objek yang berat 10 satuan dapat dikatakan beratnya dua kali berat objek yang beratnya 5 satuan. Rasio berat objek yang beratnya 75 unit dan 50 unit adalah 3:2 dan seterusnya. Pencacahan umumnya dilakukan pada populasi yang bersifat kategorik, baik yang bersifat kualitatif maupun kuantitatif. Kategori kualitatif misalnya kelompok masyarakat kaya-miskin, daerah maju-tertinggal. Katergori kuantitatif biasanya aslinya merupakan sebaran kontinu yang dikelompokkan menjadi beberapa kategori misalnya hasil ujian dikelompokkan mejadi lulustidak lulus. Selain itu ada kalanya data memuat informasi yang yang merupakan karakteristik kelompok yang bersifat alamiah,
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 44 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
yang tidak menunjukkan perbedaan tingkat kualitas satu dengan lainnya misalnya: jenis kelamin (Laki-Perempuan), jenis pekerjaan, kebangsaan dan sebagainya. Untuk data kategorik, hasil pencacahan dapat disajikan dalam bentuk frekuensi atau proporsi. Dalam kenyataannya suatu data sampel dapat terdiri atas beberapa peubah yang masing-masing memiliki skala berbeda, misalnya data mahasiswa dapat terdiri atas: (i) jenis kelamin dan agama yang bersitaf nominal, (ii) nilai matakuliah yang bersifat ordinal, (A-E) atau interval (0-100) (iii) umur, tinggi dan berat badan yang bersifat rasio dan sebagainya. Data dapat berisi berbagai informasi yang dapat dikelompokkan sebagai karakteristik populasi yang menjadi perhatian atau kepentingan studi (misalnya, jenis kelamin, pendidikan, tinggi badan dan sebagainya)
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 45 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.3.
Distribusi Data
Sebagaimana disampaikan sebelumnya bahwa statistika terkait dengan prosedur pengambilan keputusan berdasarkan data yang ada. Prosedur dalam statistika diturunkan menggunakan teori peluang dan distribusi serta kaidah-kaidah deduktif yang berlaku dalam matematika. Penurunan prosedur dalam statistika menggunakan pendekatan deduktif. Sedangkan aplikasi prosedur dalam pengolahan data untuk mengambil keputusan dapat dianggap sebaga pendekatan induktif (dari kuhusus/sampel ke umum/populasi). Oleh karena itu memiliki gambaran mengenai distribusi data sangat penting sebelum seseotang melangkah lebih jauh dalam menggunakan statistik untuk pengambilan keputusan. Pembahasan yang lebih rinci dan matematis merupakan bagian dari Statistika Matematika sedangkan dalam Metode Statistika lebih dilihat dari sisi kebutuhan praktis dalam melihat kondisi data. Distribusi data pada dasarnya merupakan fungsi dengan domain[domain??] data dan kodomain[kodomain??] nilai peluang dari [0,1]. Selain itu daerah yang dibentuk oleh kurva
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 46 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
fungsi distribusi ini dengan sumbu X dan batas atas dan bawahnya meliputi daerah dengan luas 1, yaitu memiliki probabilitas 100%. Jenis distribusi data dapat dikelompokkan dalam beberapa jenis dan dalam diktat ini hanya dibahas jenis distribusi yang banyak dipakai atau dijumpai di lapangan. 1. Distribusi Kontinu. Distribusi ini adalah untuk data yang bersifat kontinu, yang biasaya merupakan hasil pengukuran (tinggi badan, berat badan, tonnase produksi sawah perhektar dan sebagainya). Dilihat dari sekala pengukuran, distribusi kontinu cocok diasumsikan untuk data dengan skala interval atau rasio. Ada beberapa distribusi kontinu yang penting diantaranya adalah: (a) Distribusi Normal. Selain bersifat kontinu, distribusi ini memiliki ciri-ciri penting diantaranya: (i) rentang data terbuka secara infinit ke kiri dan ke kanan Rx = (−∞, ∞), (ii) bersifat simetris dan unimodal (memiliki maksimum tunggal) (b) Distribusi t. Sifat distribusi t secara umum hampir sama dengan distribusi normal. Perbedaan terletak pada
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 47 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tinggi dan lebarnya kurva. Dalam kondisi tertentu distribusi t dapat berimpit dengan distribusi Normal. (c) Distribusi Eksponensial. Distribui ini meliputi beberapa jenis termasuk eksponensial, Chi-kuadrat, dan Gamma. Distribusi-distribusi ini mempunyai sifat rentang data nonnegatif 0 ≤ x dan umumnya bersifat tidak simetris. (d) Distribusi F. Distribusi ini juga memiliki sifat hampir sama dengan distribusi t dalam hal rentang dan bentuk kurva. 2. Distribusi Diskrit. Distribusi ini adalah untuk data diskrit yang biasanya merupakan hasil pencacahan. Ada beberapa distribusi penting yang banyak dipakai untuk jenis distribusi diskrit ini, diantaranya adalah:
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 48 dari 234
Cari Halaman
Kembali
(a) Distribusi Binomial dan Multinomial. Distribusi ini sesuai untuk data yang bersifat nominal dengan rentang terbatas, misalnya laki-perempuan, kaya-menengah-miskin, dan sejenisnya.
II
Layar Penuh
Tutup
(b) Distribusi Poisson. Distribusi ini adalah untuk data Keluar
yang bersifat diskrit dengan rentang yang tak terbatas, misalnya jumlah pelanggan yang antri, jumlahbutir darah merah dalam suatu volume darah, jumlah pengidap suatu penyakit di daerah tertentu.
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 49 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.4.
Ukuran Pemusatan dan Penyebaran
Secara umum karakteristik distribusi ditentukan oleh dua hal penting yaitu ukuran pemusatan tendensi sentral dan ukuran penyebaran dispersi. Ukuran pemusatan ditentukan oleh beberapa ukuran diantaranya adalah: Mean atau rerata atau ratarata, Median, Kuantil dan Modus. Sedangkan dispersi ditentukan oleh beberapa ukuran diantaranya adalah: Range (rentang), deviasi baku, variansi.
UNEJ
Daftar Isi
Judul
JJ
2.4.1.
Ukuran Pemusatan
Ada beberapa ukuran emusatan yang biasa dipakai diantaranya adalah seperti berikut ini.
J
I
Hal. 50 dari 234
Cari Halaman
Kembali
Mean atau Rerata. Mean atau Rerata biasanya dinotasian dengan µX atau µY adalah istilah yang dipergunakan untuk parameter populasi, sedangkan untuk statistik sampel ¯ biasa disebut rata-rata sampel dan dinotasikan dengan X atau Y¯ . Dalam praktisnya, rata-rata sampel dihitung de-
II
Layar Penuh
Tutup
Keluar
ngan menggunakan rumus X ¯= 1 X xi N UNEJ
Median. Median adalah nilai yang membagi frekuansi data menjadi dua bagian yaitu 50% bagian bawah dan 50% bagian atas. Untuk distribusi yang bersifat simetris (Normal dan t), nilai mean dan median berimpit. Secara manual cara menghitung median adalah sebagai berikut: 1. urut data dari rendah ke tinggi 2. Jika banyaknya data ganjil, tentukan nilai data yang menempati urutan di tengah-tengah. Misalnya jika N = 11 setelah diurut, median adalah nilai yang menempati urutan ke 6. 3. jika banyaknya data genap, median dihitung dari ratarata dua nilai yang dekat di tengah. Misalnya untuk N − 10, setelah nilai diurut, median adalah rata-rata nilai ke 5 dan ke 6.
Daftar Isi
Judul
JJ
J
I
II
Hal. 51 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kuantil. Kuantil adalah nilai yang membagi frekuansi data menjadi empat bagian yaitu Kuantil 1 adalah nnilai yang membatasi 25% bagian bawah dan 75% bagian atas.
UNEJ
Daftar Isi
Kuantil 2 = Median adalah nilai yang membatasi 50% bagian bawah dan 50% bagian atas. Kuantil 2 = Median adalah nilai yang membatasi 75% bagian bawah dan 25% bagian atas. Prinsip menghitung kuantil secara manual sama dengan cara menghitung median. Modus. Modus adalah nilai atau pengamatan yang memiliki frekuensi tertinggi. Distribusi yang memiliki modus tunggal disebut unimodal sedangkan distribusi yang memiliki lebih dari satu modus disebut multimodal. Untuk distribusi yang bersifat simetris dan unimodal (Normal dan t), nilai mean, median, dan modus berimpit.
Judul
JJ
J
I
II
Hal. 52 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.4.2.
Ukuran Penyebaran
Ada beberapa karakteristik yang biasa dijadikan ukuran penyebaran diantaranya adalah sepertri berikut ini. UNEJ
Range. Range adalah selisih antara nilai tertinggidengan nilai terendah RX = max(X) − min(X)
Daftar Isi
Judul
Variansi dan Deviasi Baku. Deviasi baku menunjukkan lebar sebaran suatu data, variansi merupakan kuadrat dari deviasi baku. Notasi untuk variansi populasi adalah σ 2 sedangkan untuk variansi sampel dinotasikan dengan S 2 . Jadi harus dicatat bahwa deviasi baku dan variansi adalah ukuran yang bersifat nonnegatif 2 N ¯ X x − X i 2 SX = N −1 i=1 Korelasi. Untuk data lebih dari satu peubah, adakalanya antara peubah satu dengan yang lain memiliki derajat asosiasi yaitu kecenderungan yang terjadi pada peubah lain apabila
JJ
J
I
II
Hal. 53 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
peubah yang satu menaik atau menurun. Derajat asosiasi populasi dinotasikan dengan ρ dan derajat asosiasi sampel dinotasikan dengan r. Dapat dibuktikan (dalam statistika matematika) bahwa −1 ≤ r ≤ 1. hP i hPN i N ¯ ¯ i=1 xi − X i=1 yi − Y s rXY = 2 2 (xi −X¯ ) (xi −X¯ ) N −1
UNEJ
Daftar Isi
Judul
N −1
Berikut adalah ilustrasi sebaran data dilihat dari pemusatan dan sebarannya. Gambar 2.1 menggambarkan sebaran normal yang memiliki rataan berbeda tetapi dispersi sama. Secara grafis, kurva menunjukkan lebar yang sama tetapi pusatnya berbeda. Gambar 2.2 menunjukkan sebaran normal yang memiliki pemusatan (rataan) sama sama tetapi dispersi berbeda. Gambar menunjukkan bahwa rentang (range) bergantung pada dispersi. Gambar 2.3 menggambarkan sebaran tiga macam distribusi kontinu yaitu distribusi Normal, t dan Eksponensial. Distribusi Normal dan Eksponensial selain berbeda dalam rentang domain, juga dalam kesimetrisan. Gambar 2.4
JJ
J
I
II
Hal. 54 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
menggambarkan pengaruh korelasi terhadap sebaran dua peubah dilihat dari bentuk perspektif dan konturnya. Distribusi Normal 0.4
UNEJ
Judul
JJ
0.2
peluang
0.3
Daftar Isi
J
I
II
0.1
Hal. 55 dari 234
0.0
Cari Halaman
Kembali −6
−4
−2
0
2
4
6
X
Layar Penuh
Gambar 2.1: Sebaran Data dengan Mean Berbeda tetapi Dispersi Sama Tutup
Keluar
Distribusi Normal 0.4
UNEJ
0.3
Daftar Isi
0.2
JJ
J
I
II
Hal. 56 dari 234
0.1
peluang
Judul
0.0
Cari Halaman
−5
0
5
Kembali
X
Layar Penuh
Gambar 2.2: Sebaran Data dengan Mean Sama tetapi Dispersi Berbeda Tutup
Keluar
Distribusi Kontinu 0.4
UNEJ
Daftar Isi
0.3
Dist−Normal
0.2
Dist−Eksp
JJ
Dist−t
J
I
II
Hal. 57 dari 234
0.1
peluang
Judul
0.0
Cari Halaman
−5
0
5
10
Kembali
X
Gambar 2.3: Sebaran Data dengan Mean Sama tetapi Dispersi Berbeda
Layar Penuh
Tutup
Keluar
3 1
2
UNEJ
−2
vy
−1
0
mz
Daftar Isi
Judul
−3
vx
−3
−2
−1
0
1
2
3
J
I
II
3
JJ
1
2
Hal. 58 dari 234
0
Cari Halaman
−2
vy
−1
mz
−3
vx
Kembali
−3
−2
−1
0
1
2
3
Layar Penuh
Gambar 2.4: Perspektif dan Kontur Dua Peubah dengan r = 0 (atas) dan r = 0.8 (bawah)
Tutup
Keluar
2.5.
Bacaan Lebih Lanjut
Ada cukup banyak referensi yang dapat dibaca untuk lebih memahami materi pada bab ini. Beberapa referensi dalam Bahasa UNEJ Indonesia diantaranya Hadi bk:Hadi82, Sudjana bk:Sudjana96. Dalam Bahasa Inggris beberapa referensi yang direokemdasikan Daftar Isi untuk dibaca diantaranya Mendenhall (bk:Mendenhall79, bk:Mendenhall93), Gravetter & Wallnau bk:GravetterWalnau04. Judul JJ
J
I
II
Hal. 59 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.6.
Soal-soal Latihan
Diskusikan soal-soal berikut secara berkelompok (3-4 orang). UNEJ
1. diketahui 11 data berikut. Tentukan, minimum, maksimum, rentang, rata-rata, median, kuantil ke-1 dan kuantil ke-3
Daftar Isi
56.11208 51.79550 48.14551 50.78253 46.47393 59.46114 47.52536 51.04185 49.66142 51.25023 45.84077 JJ 2. Seseorang ingin memiliki data tentang mahasiswa suatu perguruan tinggi yang meliputi (i) penghasilan orang tua, (ii) asal provinsi, (iii) jumlah saudara kandung dalam keluarga, (iv) nilai UAN. Tentukan jenis distribusi yang mungkin diberlakukan untuk masing-masing peubah tadi. 3. Tentukan persamaan dan perbedaan ciri-ciri dari distribusi Normal, dan distribusi Eksponensial, serta beri masingmasing dua contoh data yang dapat diasumsikan memiliki distribusi ini..
Judul
J
I
II
Hal. 60 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. Tentukan persamaan dan perbedaan ciri-ciri dari distribusi Binomial, dan distribusi Poisson, serta beri masing-masing dua contoh data yang dapat diasumsikan memiliki distribusi ini.
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 61 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 62 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
3
Daftar Isi
Judul
EXPLORASI DATA JJ
J
I
II
Hal. 63 dari 234
Cari Halaman
Dalam bab ini dibahas teknik mengeksplorasi data mnggunakan R baik melalui grafik maupun secara deskriptif. Bagi pembaca jurusan matematika atau statistika, dapat mencoba simulasi untuk lebih memahami konsep-konsep statistika yang dipakai. Bagi yang hanya ingin menggunakan sebagai panduan menganalisis data, dapat memusatkan perhatian pada uraian menu R-Commander, hanya saja dalam banyak hal, R-Commander
Kembali
Layar Penuh
Tutup
Keluar
tidak diilustrasikan dengan tampilan menu aslinya, tetapi diilustrasikan dengan => yang menyatakan pemilihan menu, submenu atau item dari menu (Diagram pohon menu RCommander yang lebih lengkap dapat dilihat pada Lampiran ??).
UNEJ
Menu A => submenu 1 => subsubmenu a => item menu i => submenu 2 => subsubmenu b => item menu ii
Daftar Isi
Judul
JJ
J
I
II
Hal. 64 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Indikator Kompetensi Pembaca , dengan menggunakan pendekaran GUI atau CLI, dapat:
UNEJ
1. menyusun data dalam worksheet R Daftar Isi
2. mengimpor data dari format program lain Judul
3. membangkitkan data melalui simulai 4. melalkukan eksplorasi data secara grafis sesuai kebutuhan (melalui boxplot, diagram pencar, diagram rata-rata dan sebagainya) 5. dapat meningkatkan kualitas (enhanced) grafik melalui CLI
JJ
J
I
II
Hal. 65 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.1.
Menyiapkan Data pada R
Sebelum melakukan analisis statistika, data yang akan dianalisis harus sudah siap terlebih dahulu. Dilihat dari sumbernya data dibedakan atas dua jenis yaitu data riil dan data simulasi. Data riil diperoleh dari hasil penelitian dengan mengikuti prosedur yang telah ditetapkan. Data simulasi diperoleh dengan membangkitkannya dengan menggunakan komputer. Data bangkitan atau data simulasi sangat baik dipergunakan untuk mempelajari atau memahami prosedur statistika, karena besarnya parameter dan jenis distribusinya dapat dikendalikan. Data yang akan dianalisis dapat terlebih dahulu disimpan/ ditulis dengan program lain dalam berbagai format (misalnya file tex, file SPSS, Minitab), atau langsung dituliskan dalam worksheet/datasheet dari R. Disamping itu R juga dilengkapi dengan database yang dapat dipanggil untuk dianalisis. Jenis data dapat dikelompokkan menjadi beberapa jenis diantaranya adalah data kualitatif yang berupa angka-angka dan data kuatitatif yang biasanya hanya berupa kategori atau kelompok. Data kuantitatif biasanya diperoleh dari hasil mengukur
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 66 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(misalnya jumlah penghasilan masyarakat perbulan), sedangkan data kualitatif biasanya diperoleh dari hasil mencacah (misalnya jumlah masyarakat yang termasuk kategori miskin di desa atau di perkotaan). 3.1.1.
UNEJ
Mengedit langsung data
Daftar Isi
Untuk memasukkan data langsung melalui datasheet dilakukan perintah berikut:
Judul
JJ
J
I
II
NamaDataSheet<-edit(as.data.frame(NULL)) Hal. 67 dari 234
selanjutnya worksheet dapat diisi sesuai banyaknya data dan banyaknya peubah. Dengan menu R-Commander, editing, maupun penulisan data dapat dilakukan dengan memilih menu berikut. Data => data set baru ... atau denmgan memilih icon pada panel Edit Data Set. Susunan data pada R di atur seperti pada Tabel 3.1.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 3.1: Penulisan Data pada R No Subjek Faktor Peubah1 Peubah2 1 K1 x11 y11 2 K1 x12 y12 ... ... ... ... n1 K1 x1n1 y1n1 ... ... .... ... N Kk xknk yknk
UNEJ
Daftar Isi
Judul
3.1.2.
Memanggil Data dari Database R
Data riil yang telah ada pada R dapat dipanggil dengan perintah
JJ J
I II
Hal. 68 dari 234
data() Cari Halaman
Dengan perintah di atas, R akan memberi informasi seluruh data yang telah ada pada database R beserta pustaka yang memuat data tersebut. Sebagai contoh, berikut adalah beberapa data yang ada pada pustaka stats.
Kembali
Layar Penuh
Tutup
Keluar
Data ... AirPassengers BJsales BOD CO2 ChickWeight DNase EuStockMarkets Harman23.cor Harman74.cor Indometh JohnsonJohnson LakeHuron
Deskripsi
Monthly Airline Passenger Numbers 1949-1960 Sales Data with Leading Indicator Biochemical Oxygen Demand Carbon Dioxide uptake in grass plants Weight versus age of chicks on different diets Elisa assay of DNase Daily Closing Prices of Major European Stock Indices, 1991-1998 Harman Example 2.3 Harman Example 7.4 Pharmacokinetics of Indomethicin Quarterly Earnings per Johnson & Johnson Share Level of Lake Huron 1875-1972 Loblolly Growth of Loblolly pine trees
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 69 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Nile Orange ...
Flow of the River Nile Growth of orange trees
Selanjutnya jika kita ingin memanggil salah satu data yang ada, maka yang perlu dilakukan adalah mengkatifkan pustaka dan datanya,, secara berturutan. library(NamaLibrary) data(Namadata) attach(Namadata)
UNEJ
Daftar Isi
Judul
JJ
Dengan menggunakan R-Commander pemilihan data dapat dilakukan dengan Data => Data Pada Paket => Baca data set dari paket aktif ... Selanjutnya tinggal pilih nama paket dan datanya. Misalkan kita akan mengaktifkan data ChickWeight yang ada pada paket stats, maka Dengan menu R-Commader kita dapat melakukan dengan memilih menu sebagai berikut
J
I
II
Hal. 70 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Data => Data pada Paket => Baca data pada peket aktif => paket stats => data ChickWeight
UNEJ
Sedangkan dengan CLI dapat dilakukan
Daftar Isi
library(stats) data(ChickWeight) atau dengan lebih singkat data(ChickWeight, package="stats") attach(ChickWeight)
Judul
JJ
J
I
Hal. 71 dari 234
Cari Halaman
Untuk selanjutnya data ChickWeight dapat dieksplorasi maupun dianalisis. 3.1.3.
Mengimpor data dari file
kita telah memiliki data yang disimpan dengan program lain seperti Minitab, Excell dan lain-lain. Untuk dapat menggunakan
II
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Gambar 3.1: Menu Dialog Membaca Data Judul
data tersebut maka kita perlu melakukan langkah-langkah berikut. 1. Buka data dengan program aslinya (Minitab, Excell) lalu simpan/eksport data dalam bentuk plain/ascii tex biasanya dengan ekstensi txt. Selanjutnya dibuka dengan perintah read.table read.table(Namafile, header = FALSE, sep = "", quote = "\"'", dec= ".",...)
JJ
J
I
II
Hal. 72 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
header = True jika baris pertama file merupakan judul Keluar
kolom. Untuk tanda desimal, bisa dipergunakan titik atau koma sesuai kondisi data yang dimiliki. 2. Bagi yang menggunakan R-Commander dapat melakukannya dengan menggunakan menu Data dengan memilih submenu . Pilihan jenis data tersedia diantaranya dari Minitab SPSS dan dalam bentuk teks. 3. Dengan menggunakan R-Commander pemilihan data dapat dilakukan dengan => Impor Data
=> Dari file tex/SPSS/Minitab
selanjutnya ikuti pemilihan direktori dan file yang diinginkan. 3.1.4.
Membangkitkan Data Simulasi
Dalam hal memahami konsep-konsep statistika, terutama yang terkait dengan distribusi peluang, penggunaan data simulasi memiliki banyak keunggulan dibanding data riil. Dengan simulasi kita dapat membangkitkan data dengan distribusi dan
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 73 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
parameter (mean, varians, korelasi) sesuai dengan yang dibutuhkan yang nantinya dapat dicocokkan kembali dengan hasil analisis yang diperoleh. Perintah untuk membangkitkan data dari berbagai distribusi dapat dilihat pada Tabel 3.2 sedang daftar yang lebih lengkap dapat dilihat pada Tirta bk:TirtaR1.
UNEJ
Daftar Isi
Tabel 3.2: No Distribusi 1 Normal 2 Eksponensial 2 Poisson 3 Binomial
Perintah Untuk Data Acak Perintah R rnorm(n.sampel,mean,sd) rexp(n.sampel, 1/mean) rpois(n.sampel,mean) rbinom(n.sampel,n.binom,prob)
Simulasi data tidak bisa dilakukan melalui menu R-Commader, tetapi data yang sudah masuk data.frame dapat dianalisis melalui menu R-Commander. Contoh 3.1. Berikut adalah skrip untuk membuat data simulasi yang dapat dipergunakan sebagai ilustrasi berikutnya. Salin skrip ber-
Judul
JJ
J
I
II
Hal. 74 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ikut untuk membangkitkan data yang dapat dipergunakan sebagai ilustrasi berikutnya. Faktor1<-rep(rep(c("A","B","C","D"),each=20),4) Faktor2<-rep(rep(c("L","P"),each=10),4) Y1<-as.numeric(rnorm(80,c(85,80,80,75,90,70,60,55),5)) Y2<-as.numeric(rnorm(80,c(80,85,80,85,85,80,60,75),3)) Y3<-Y1-rnorm(80,10,2) Y4<-(Y1+Y2)/2-rnorm(80,5,3)
UNEJ
Daftar Isi
Judul
Data.sim<-data.frame(Faktor1,Faktor2,Y1,Y2,Y3) attach(Data.sim)
JJ
J
I
II
Hal. 75 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.2.
Explorasi Data
Eksplorasi data mendasar dapat dilakukan melalui R-Commander pada menu statistik (untuk eksplorasi statistik) atau menu grafik (untuk eksplorasi grafis). Untuk dapat menggunakan menu R-Commander, terlebih dahulu data harus diaktifkan dengan memilih kotak data aktif atau melalui menu data. Untuk eksplorasi ikuti petunjuk berikut Statsistik => Ringkasan => Dataset Aktif => Ringkasan numerik Grafik => Boxplot => Diagram Rata-rata Selain itu R juga menyediakan beberapa fungsi yang dapat dipanggil melalui CLI untuk mengeksplorasi data mulai dari informasi ringkasan (min, maks, kuantil) sampai eksplorasi melalui grafis. Beberapa perintah R yang bermanfaat untuk eksplorasi data diantaranya diberikan pada Tabel 3.3. Dalam tabel tersebut pustaka atau paket RPackage artinya tersedia pada paket
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 76 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
standar R tanpa perlu memanggil pustaka khusus. Uraian lebih lengkap dari eksplorasi data ini diberikan pada sub berikutnya. 3.2.1.
Deskripsi Data
UNEJ
Untuk data yang bersifat kuantitatif, ada beberapa hal yang dapat diukur yang menjadi karakteristik dari kelompok data bersangkutan. Ukuran data dibedakan menjadi dua macam yaitu ukuran pemusatan (rata-rata, median dan kuantil) dan ukuran penyebaran (rentang dan deviasi baku). Untuk data kuantitatif R-Commander dapat membuat deskripsi data yang meliputi min, max, mean dan median data dapat dieksplorasi dengan perintah summary(data). Cetakan lengkap data dapat diperoleh melalui perintah print(data). Data berikut diambil dari pustaka stats, data ChickWeight yang dapat dilakukan baik melalui menu maupun CLI.
Daftar Isi
Judul
JJ
J
I
Hal. 77 dari 234
Cari Halaman
Kembali
Layar Penuh
summary(ChickWeight) weight Time Min. : 35.0 Min. : 0.00
13
Chick : 12
Diet 1:220
II
Tutup
Keluar
1st Qu.: 63.0 Median :103.0 Mean :121.8 3rd Qu.:163.8 Max. :373.0
1st Qu.: 4.00 Median :10.00 Mean :10.72 3rd Qu.:16.00 Max. :21.00
9 : 12 20 : 12 10 : 12 17 : 12 19 : 12 (Other):506
2:120 3:120 4:118 UNEJ
Daftar Isi
Sedangkan cetakan lengkap datanya adalah Judul
>print(ChickWeight)
JJ
weight Time Chick 1 2 3 4 5 6 ....
42 51 59 64 76 93
0 2 4 6 8 10
1 1 1 1 1 1
Diet 1 1 1 1 1 1
J
I
II
Hal. 78 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
576 577 578
234 264 264
18 20 21
50 50 50
4 4 4 UNEJ
Untuk data simulasi di atas (Data.sim) diperoleh ringkasan yang bisa dipanggil langsung melalui CLI ataupun melalui menu R-Commander
Daftar Isi
Judul
> summary(Data.sim) Faktor1 Faktor2 Y1 A:80 L:160 Min. :43.72 B:80 P:160 1st Qu.:63.93 C:80 Median :75.78 D:80 Mean :73.80 3rd Qu.:83.11 Max. :96.75
Y2 Min. :56.23 1st Qu.:76.58 Median :81.09 Mean :78.81 3rd Qu.:84.69 Max. :90.26
Y3 Min. :32.05 1st Qu.:52.64 Median :66.35 Mean :63.55 3rd Qu.:73.58 Max. :86.65
JJ
J
I
Hal. 79 dari 234
Cari Halaman
Kembali
Untuk data kualitatif deskripsi data dapat dilakukan dengan membuat tabel Kontingensi. Ukuran yang dapat dilakukan untuk data kualitatif diantaranya adalah proporsi satu kelompok dibanding keseluruhan, misalnya proporsi masyarakat yang dikategorikan miskin di daerah perkotaan.
II
Layar Penuh
Tutup
Keluar
3.2.2.
Visualisasi Data Univariat
Paket Statistika R dilengkapi dengan kemampuan membuat dan menyajikan grafik yang sangat baik. Bahkan, kemampuan grafik S (yaitu Splus dan R) diakui melebihi paket statistika lainnya Sebagian besar kemampuan grafik R (baik untuk univariat maupun multivariat) sudah dapat dimanfaatkan melalui menu RCommander . Beberapa jenis grafik untuk eksplorasi dan visualisasi data univariate diataranya seperti berikut ini. Histogram dan kurva distribusi untuk menggambarkan sebaran data dan frekuensi atau peluangnya. Dengan histogram dan kurva distribusi seseorang dapat melihat apakah data yang dimiliki sebarannya cukup simetris, Unimodal atau Multimodal Boxplot untuk menggambarkan posisi data dilihat dari quantilnya (Q1, median, Q3). Dengan boxplot dapat juga dilihat apakah ada data yang tergolong sebagai pencilan; QQ-plot atau kuantil-kuantil plot, yaitu grafik yang mengmbarkan hubungan antara quantil data dengan quantil dis-
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 80 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tribusi teoritisnya. Hubungan yang mengikuti garis lurus menunjukkan kesesuaian antara quantil data dengan quantil distribusi teoritisnya. Dengan kata lain data berdistribusi sama dengan distribusi teoritis yang diperiksa. Untuk distribusi normal grafiknya isebut QQ-norm.
UNEJ
Daftar Isi
Diagram rata-rata untuk menggambarkan rata-rata dengan interval keyakinannya. Diagram lingkaran untuk menggambarkan prosentase sebaran data dilihat dari salah satu pengelompokan yang ada pada data.
Judul
JJ
J
I
Hal. 81 dari 234
ACF untuk mmeriksa ada tidaknya autokorelasi pada data. Cari Halaman
Jenis eksplorasi grafis yang dipilih dapat disesuaikan dengan keperluan, misalnya jika analisis yang akan dilakukan adalah uji rata-rata, maka eksplorasi grafis yang dapat dilakukan adalah: Boxplot dan diagram rata-rata. Jika kita ingin mendapatkan gambaran tentang jenis distribusi data, kita dapat memeriksa distribusi data tersebut apakah sangat menyimpang atau mengikuti distribusi normal dengan menggunakan grafik/plot data seperti
II
Kembali
Layar Penuh
Tutup
Keluar
histogram, qqnorm, dan diagram densitas. Data normal akan memiliki densitas yang relatif simetrik dan diagram qq yang relatif mengikuti garis lurus. Untuk data yang tidak berdistribuai normal diantaranya ditunjukkan oleh ketidaksimetrisan yang mencolok serta diagram qq yang tidak mengikuti garis lurus. Contoh 3.2. Untuk contoh riil, misalkan dari data “Chicken Weight” kita ingin memeriksa distribusi beratnya ayam. Grafik histogram, qqnorm dan densitas dari data tersebut dapat dilihat pada Gambar 3.4. Gambar menunjukkan bahwa data berat tidak cukup simetris untuk memenuhi asumsi distribusi normal.
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 82 dari 234
Cari Halaman
par(mfrow=c(2,2)) hist(ChickWeight$weight) qqnorm(ChickWeight$weight) plot(density(ChickWeight$weight),type='l') plot(density(ChickWeight$weight),type='p')
II
Kembali
Layar Penuh
Tutup
Keluar
Jika menggunakan menu R-Commander, kita juga dapat memilih apakah ploting yang dilakukan memperhatikan adanya kelompok atau tidak. Perhatian terhadap kelompok bermanfaat sebagai gambaran kasar apakah kira-kira ada beda yang mencolok dari distribusi peubah yang kita amati dilihat dari kelompokkelompok yang ada (misalnya Jender, Status sosial dan lain sebagainya). Untuk mengilustrasikan hal ini kita dapat mengambil suatu data yang juga ada pada pustaka stats, yaitu data “Orange”, baik melalui CLI maupun R-Commander. Data Orange terdiri atas dua peubah yaitu: Age (usia pohon) dan Circumference (keliling batang) dan satu faktor/ kelompok yaitu: Tree (Jenis pohon). Untuk memperoleh grafik (misalnya tentang Circumference) yang memperhatikan kelompok (Tree) Pada saat pembentukan grafik boxplot pilih
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 83 dari 234
Cari Halaman
Kembali
Data => boxplot => plot dengan kelompok => Tree
II
Layar Penuh
Tutup
Keluar
3.2.3.
Visualisasi Data Multivariat
Selain gambaran distribusinya, kita juga memerlukan gambaran data dilihat dari hubungan antara peubah satu dengan lainnya, atau sebaran kelompok satu dengan lainnya. Diagram yangbiasa dipakai untuk menggambarkan kondisi ini adalah diagram pencar (untuk dua peubah), diagram pencar tiga dimensi (untuk tiga peubah) dan matriks diagram pancar maupun coplot (untuk lebih dari tiga peubah). Berikut adalah contoh berbagai variasi diagram pencar, termasuk yang datanya mengandung vpeubah kualitatif. Selain itu R juga dilengkapi dengan paket RGL yang mampu menyajikan animasi dari grafik tiga dimensi. Untuk data multivariat, misalnya data yang terdiri dari tiga peubah acak (X, Y, Z), masing-masing terdiri atas tiga subpopulasi (P1 , P2 , P3 ). Sebelum melakukan analisis lebih jauh ada beberapa pertanyaan mendasar yang dapat dieksplorasi melalui grafik, diantaranya:
UNEJ
Daftar Isi
Judul
JJ
J
I
Hal. 84 dari 234
Cari Halaman
Kembali
Layar Penuh
1. adakah hubungan (korelasi) antara ketiga peubah? 2. apakah hubungan antara peubah berbeda untuk tiap subpopulasi atau sama untuk seluruh subpopulasi?
II
Tutup
Keluar
Gambaran informasi data seperti di atas dapat diakses melalui grafik trellis yaitu dengan perintah xyplot(), coplot() atau dengan pairs(). Untuk memahami penggunaan coplot dan pair kita ambil data yang merupakan data simulasi nilai ujian dari beberapa sekolah. Dari Gambar 3.7 dan Gambar 3.2.3 terlihat bahwa kelima jenis pohon memiliki hubungan yang relatif berbeda antara ukuran lingkaran jeruk dengan usianya. Dalam konteks regresi, beberapa subkelompok data memiliki garis regresi yang berbeda. Dengan R-Commander fasilitas di atas dapat diakses dengan memilih menu berikut:
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 85 dari 234
Grafik => Matriks Diagram Pencar Grafik => Diagram Rata-rata
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 3.3: Tabel Fungsi Eksplorasi Data Fungsi Deskriptif print() summary() Grafik hist() stem() density() qqnorm()
Pustaka
Data
Deskripsi
RPackages
uni/multivariatmencetak data secara keseluruhan univariat memperoleh ringkasan data
mencetak histogram data graphics stem & leaf plot (mode teks) menggambar sebaran data memeriksa normalitas data dengan diagram quantil(QQPlot) qqline() menambah garis lurus pada diagram qq(QQPlot)] boxplot() menggambar quantil data [Boxplot] dotchart() RPackages multivariat histogram berganda coplot() grahics menggambar sebaran data dengan kondisi peubah tertentu xyplot() lattice menggambar sebaran pasangan data pair() graphics menggambar pasangan sebaran data plot() RPackages mengambar sebaran data dengan 2 peubah biplot() stats multivariat biplot multivariat data hclust() analisis klaster bertingkat manova() multivariat analisis anova untuk data
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 86 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
90
0.030
70
NMat
80
0.020 0.010
60
Daftar Isi
50
0.000
Density
UNEJ
50
60
70
80
90
Judul
100
simdat$NMat
JJ
J
I
II
Sekolah Hal. 87 dari 234 ●
80 70 60
simdat$NMat
90
●● ●●●● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
50
●●
SMA−M
SMA−K
Cari Halaman
Kembali
● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ●●
SMAN−1
SMAN−2
●
Layar Penuh −2
−1
0
1
2
norm quantiles
Gambar 3.2: Contoh Histogram, Boxplot, QQPlot dan Diagram Lingkaran
Tutup
Keluar
* * O O
NILAI EKSTRIM
UNEJ
Daftar Isi
PENCILAN 3R
Judul 1,5 R
JJ
Q3
J
I
II
R=Q3-Q1
Q2
BATAS BUKAN PENCILAN
Hal. 88 dari 234
Q1
1,5 R
Cari Halaman 3R O O
* *
PENCILAN
NILAI EKSTRIM
Gambar 3.3: Komponen Boxplot untuk Memeriksa ada tidaknya Pencilan atau Nilai Ekstrim
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 89 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Gambar 3.4: Histogram dan Denstias Berat Ayam. Grafik menunjukkan data tidak cukup simetris
Keluar
200
UNEJ
Judul
JJ 100
circumference
150
Daftar Isi
J
I
II
Hal. 90 dari 234
50
Cari Halaman
Kembali
Layar Penuh
3
1
5
2
4
Tree
Gambar 3.5: Contoh Diagram boxplot dengan mempertimbangkan kelompok. Diagram menunjukkan bahwa distribusi keliling batang pohon
Tutup
Keluar
UNEJ
●
●
80
● ● ●● ● ●● ● ●
● ●
●
●
● ● ● ●●●
Judul
● ● ●
● ● ●● ●
●
●
● ●
70
●
● ●
● ●
● ●
● ●
● ●●
●
JJ
●● ●
●
● ● ● ●
●●
● ●
●
● ● ● ●
●
●
● ●
●
●
●
50
I
Hal. 91 dari 234 ●
60
70
80 NMat
90
II
SMA−K SMA−M SMAN−1 SMAN−2
50
50
●
●
J
●
60
60
● ● ● ●●
Daftar Isi
●
● ●
NFis
70
●
● ● ● ●● ● ●
●
●●
80
● ● ●
NFis
●
90
90
●
● ●
50
60
70
80
90
NMat
Gambar 3.6: Contoh Diagram Pencar tanpa mempertimbangkan peubah kualitatif (kiri) dan dengan peubah kualitatif (kanan).
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
80
90
100 ●
●
NFis
●
●
● ● ● ●●
● ● ●● ●
●
●
●
●
●
●
Density
●
●
●
●
●
● ●
●
●
● ● ● ● ●
●
● ●
●
● ●
●
●
●
● ● ●● ● ●● ●● ● ● ●● ●● ●
●
● ●
●
● ● ● ● ● ● ● ● ●●●
● ●
● ● ●
● ● ●
● ●
●
●
● ●
●
●
● ●
●
●
100
●
●
● ●
●
●
●
●
● ● ● ●
● ●
●
● ●
● ●
● ●
● ●
●
● ●
● ●
●
JJ
●
● ●●
●
●
●
●
●
●
J
I
II
●
● ●
●
●
●
●
●
Hal. 92 dari 234
● ● ●
●
● ●
●
● ●
●
●
●
● ●
●
●
NMat
● ● ● N =● 80 Bandwidth = ●3.956 ● ● ● ● ●
●
● ●
● ● ●
●
● ●
● ●
● ● ● ●
●
●● ● ● ● ● ● ● ●
● ●
●● ●
●
● ●● ● ● ●● ● ●● ● ● ● ●
●
●
● ●
●
● ●
●
●
●
● ●
Kembali
● ●
●
●
● ● ●
●
●
●
●
● ●
● ●
●●
●
●
●
● ●
Layar Penuh
●
| || ||||| ||||| ||||||||||||||||| ||||||||||||||| |
●
60
70
80
90
Cari Halaman
● ●
●
●● ●
●
● ●
●
●
80
●
●
90
● ● ●● ● ● ● ●● ●● ●● ● ●● ● ●● ●● ● ● ● ● ● ●● ● ● ● ●● ● ●● ● ● ●●●
●
●
●
||||| |||| | | | ||| |||||||| |||| |||||| |||||||| ||||||||||
●
●
70
●
60
●
●
● ●
Density
60
●
● ●
●●
●
● ●
50
●●
● ●
●
● ●
●
●
●
●
Judul
● ●
● ●
●
●
● ● ●
●
●
●
●
●● ●●
● ●●
●
●
●
● ●● ● ●
● ● ●
● ●
●
●
● ● ● ● ●
●●
70
●● ●
● ● ● ● ● ●
●
●
●
●
● ●
NIng
●
Daftar Isi
●
50
60
70
80
50
●
●
●
Density
90
●
●
●
●
● ●
●
●
●
●
● ●● ● N = 80 Bandwidth = 4.601 ● ●
●
80
● ●
●
UNEJ
● ●
● ●
●
●
| || |||| | |||||| |||||||||| |||||||||||| |||||| ||| | | ●
● ● ● ● ●●● ● ●●● ●●● ●
● ●
●
● ● ● ●● ●●
● ●
●
●
●
●● ● ● ●● ● ● ● ●●
● ●
70
●
●
60
● ●
●
●
50
●
90
70
80
60
90
N = 80 Bandwidth = 4.416
Gambar 3.7: Contoh Matriks Diagram Pencar dengan Beberapa Peubah Acak
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 93 dari 234
Cari Halaman
Kembali
Layar Penuh
Gambar 3.8: Contoh Diagram Permukaan 3 Dimensi yang mengandung Peubah Kualitatif
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 94 dari 234
Cari Halaman
Kembali
Layar Penuh
Gambar 3.9: Contoh Representasi Tiga Dimensi Regresi dengan dua Peubah Penjelas
Tutup
Keluar
Given : Sekolah
SMAN−2 SMAN−1
UNEJ SMA−M SMA−K
50
60
Daftar Isi
70
80
90
Judul ●
●
●● ●
●
●
●●
●
● ● ●● ●
60
●
●
● ●
J
I
● ●
NFis
●
90
Cari Halaman
●
● ● ●
● ● ● ● ● ●
80
●
70
● ●
Kembali
● ●
● ●● ●
● ●
●
●●
●
●● ●
60
●
Layar Penuh
● ● ● ● ●●
●
50
● ●
II
Hal. 95 dari 234
● ●
50
●
●
JJ
●
●
●
80
● ●
● ●●
● ● ●
70
●
90
●
● ●
Tutup 50
60
70
80
90
NMat
Gambar 3.10: Diagram Coplot yang menggambarkan hubungan dua peubah
Keluar
3.3.
Bacaan Lebih Lanjut
Dengan perkembangan pesat dari teknologi perangkat lunak di bidang statistika, eksplorasi dan visualisasi data menjadi kegiatan yang sangat populer dilakukan sebelum melakukan analisis. Tehnik ini dikenal dengan EDA (Explolatory Data Analysis). EDA pada umumnya memanfaatkan kemmpuan grafik statistik untuk memperoleh gambaran umum tentang data baik dari segi distribusinya maupun hubungan antar peubah nya. Beberapa referensi yang dapat dibaca tentang EDA diantaranya adalah Filliben ibk:Filliben2006 dan khusus untuk aplikasi Grafik R untuk statistika dapat dilihat Zoonekyn m:Zoonekyn2005.
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 96 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.4.
Soal-soal Latihan
Diskusikan soal-soal berikut dalam kelompok 2-3 orang. 1. Aktifkan salah satu data pada R, misalnya Orange, CO2, Prestige dan lain lainnya. Selanjutnya lakukan eksplorasi sebagai berikut:
UNEJ
Daftar Isi
(a) buat ringkasan numerik dari data (b) buat grafik histogram data (c) buat grafik boxplot dengan atau tanpa mempertimbangkan kelompok yang ada
Judul
JJ
J
I
Hal. 97 dari 234
(d) buat grafik plot rerata (mean plot) Cari Halaman
(e) buat grafik qq (f) buat matrksdiagram pencar 2. Lakukan hal yang sama seperti di atas untuk data yang lain (termasuk data yang anda kumpulkan atau simulasikan sendiri)
II
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 98 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
4
Daftar Isi
UJI RATA-RATA DAN PROPORSI
Judul
JJ
J
I
II
Hal. 99 dari 234
Pada bab ini akan dibahas teknik analisis data terkait dengan uji beda dua kelompok baik mengenai rata-rata maupun proporsi. Pembahasan ini merupakan bagian dari statistika inferensial yang sederhana.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Indikator Kompetensi Pembaca dapat menggunakan R untuk mengiluskrasikan konsep interval keyakinan, menghitungnya, serta melakukann uji hipotesis tentang mean dan proporsi yang ditandai dengan kemampuan
UNEJ
Daftar Isi
1. mengilustrasikan konsep interval keyakinan Judul
2. menghitung interval keyakinan JJ
J
I
II
3. melakukan uji rata-rata untuk berbagai jenis sampel 4. melakukan uji proporsi untuk berbagai jenis sampel
Hal. 100 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.1. 4.1.1.
Interval Keyakinan dan Uji Rata-rata Hasi-hasil Statistika
Berikut adalah hasil-hasil dalam statistika matematika yang mendasari analisis statistika. Hasil-hasil ini dapat dijumpai pada buku-buku teks tentang statistika matematika, seperti pada WackerlyWackerly Wackerly et al.bk:WMS96, Meyer[16, Bab 13], dan Hogg dan Craig bk:HoggCraig95 Definisi 4.1 (Populasi). Populasi adalah Himpunan Semesta dari peubah yang menjadi perhatian peneliti
UNEJ
Daftar Isi
Judul
JJ
J
I
II
Hal. 101 dari 234
Harus dibedakan antara subjek dengan populasi. Populasi dalam statistika berbeda dengan pengertian populasi dalam bidang biologi. Dalam statistika populasi adalah objek yang menjadi perhatian. Misalnya, jika yang menjadi perhatian peneliti adalah prestasi belajar mata kuliah tertentu pembaca suatu jurusan, maka sebenarnya yang menjadi populasi adalah Jadi Nilai Mata Kuliah tersebut, bukan mahasiswa peserta mata kuliah. Jadi populasi adalah himpunan objek, bukan himpunan orang.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Definisi 4.2 (Sampel). Sampel adalah sebagian dari himpunan semesta yang benar-benar diobservasi, mewakili keseluruhan objek yang menjadi perhatian. UNEJ
Dalam hal nilai suatu mata kuliah, jika ada 200 peserta mata kuliah tersebut, maka populasinya adalah 200 nlai mata kuliah. Jika dari 200 nilai tersebut diambil 50 untuk diteliti, maka kumpulan 50 nilai yang mewakili tersebut disebut sampel. Sampel harus representatif, benar-benar mewakili populasi sehingga sering disebut sebagai miniatur dari populasi. Untuk dapat mengaplikasikan tehnik-tehnik statistika dalam sampel, maka sampel harus diambil dengan memperhatikan teknik sampling, salah satu diantaranya yang menjadi syarat penting adalah pengambilan secara acak/random. Syarat lain sangat bergantung apakah dalam populasi ada strata, klaster atau pengelompokan yang perlu mendapat perhatian. Hasil 4.1 (Sifat Reproduktif Distribusi Normal). Jika X1 , X2 , · · · , Xi , · · · , Xn berdistribusi Normal, N (µi , σi2 ) dan masing-mmasing
Daftar Isi
Judul
JJ
J
I
II
Hal. 102 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
saling independen (secara berpasangan (Xi||Xj , i 6= j), maka: ! n n n X X X Y = ai X i ∼ N ai µi , a2i σi2 i=1
i=1
i=1
UNEJ
Definisi 4.3 (Sampel Acak). Jika Xi , i = 1, · · · , n berasal dari distribusi normal N (µ, σ 2 ) yang diambil secara saling bebas, maka dikatakan Xi merupakan sampel acak dari N (µ, σ 2 ).
Daftar Isi
Judul
Syarat utama sampel acak ini adalah berdistribusi sama dan saling independen sehingga sering dinotasikan dengan Xi i.i.d. N (µ, σ 2 ).
JJ
J
I
II
Definisi 4.4 (Statistik Sampel). Statistik adalah fungsi yang diperoleh dari sampel. Dua statistik yang sangat terkenal dan ¯ dan Varians sampel banyak dipakai adalah Rata-rata sampel (X) (S 2 ) 2 Pn N ¯ X X − X 1 i ¯= X Xi dan S 2 = i=1 n i=1 n−1
Hal. 103 dari 234
Distribusi dari statistik sampel di atas diberikan dalam hasil berikut ini.
Tutup
Cari Halaman
Kembali
Layar Penuh
Keluar
Hasil 4.2 (Distribusi Mean Sampel, jika σ diketahui). Jika Xi , i = 1, · · · , n adalah sampel acak dari N (µ, σ 2 ), dan σ dike¯ ∼ N (µ, σ 2 /√n). tahui maka X UNEJ
Hasil 4.3. Jika sampel diambil dari populasi berdistribusi normal maka n−1 S 2 ∼ χ2n−1 σ2
Daftar Isi
Judul
Hasil 4.4. Jika Z ∼ N (0, 1) dan V ∼
χ2k ,
maka
Z ∼ tk t=p V /k Hasil di atas diperoleh dari sifat reproduktif dari distribusi ¯ merupakan pennormal dengan ai = 1/n. Dikatakan bahwa X duga titik dari mean µ. Jika σ 2 tidak diketahui maka σ 2 diganti dengan σb2 = S 2 . Distribusi yang dihasilkan menjadi seperti berikut ini. Hasil 4.5 (Distribusi Mean Sampel σ tak diketahui). Jika Xi , i = 1, · · · , n adalah sampel acak dari N (µ, σ 2 ), dan σ tidak diketahui maka:
JJ
J
I
II
Hal. 104 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. jika n relatif kecil (n < 60) maka
¯ X−µ √ S/ n
∼ tn−1 .
2. jika n relatif besar (n ≥ 60) maka tn−1 ≈ N (0, 1) dengan ¯ X−µ √ ∼ N (0, 1). kata lain S/ n √ Besaran S/ n disebut standar kesalahan rata-rata, yaitu
UNEJ
Daftar Isi
S SX¯ = √ n Pemahaman terhadap distribusi statistik (khususnya ratarata sampel) dapat diilustrasikan melalui simulasi. Misalkan sampel berukuran n = 25 diambil secara acak dari populasi berdistribusi N (50, 9). Dari sampel yang diambil dihitung ratarata sampel x¯. Jika pengambilan sampel diulang sampai 60 kali dan semua rata-rata dicatat, maka kita dapat membuat histogram atau diagram densitas dari kumpulan rata-rata tadi. Secara teoritis sampling ini akan menghasilkan √ kesalahan baku atau deviasi baku semua rata-rata sebesar σ/ 25 = 0.6 n<-25 m<-60 mu<-50
Judul
JJ J
I II
Hal. 105 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sigma<-3 vr<-seq(0,0,length=m) for(i in 1:m){ x<-rnorm(n,mu,sigma) vr(i)<-mean(x) } print(mean(vr)) # mencetak rata-rata dari semua rata-rata print(sqrt(vr)) # mencetak deviasi baku dari semua rata-rata summary(vr)
UNEJ
Daftar Isi
Judul
Salah satu eksekusi skrip di atas menghasilkan keluaran berikut dengan grafik (histogram, boxplot, densitas dan diagram quantil) seperti pada Gambar 4.1 > print(mean(vr)) # mencetak rata-rata dari semua rata-rata [1] 50.04896 > print(sqrt(var(vr))) # mencetak deviasi baku dari semua rata-rata [1] 0.5951607 > summary(vr) Min. 1st Qu. Median Mean 3rd Qu. Max. 48.64 49.64 50.04 50.05 50.50 51.53 Selanjutnya dari distribusi statistik (dalam hal ini rata-rata sampel) dapat dihitung peluang mean populasi berada pada suatu interval tertentu. Jika σ diketahui, maka ¯ −µ X √ ≤ 1, 96 = 0, 95 P −1, 96 ≤ σ/ n
JJ J
I II
Hal. 106 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dengan cara yang sama ¯ −µ X √ ≤ 2, 58 = 0, 99 P −2, 58 ≤ σ/ n atau secara umum
UNEJ
P
−zα/2 ≤
¯ −µ X √ ≤ zα/2 σ/ n
= (1 − α)
(4.1)
Demikian juga meski σ tidak diketahui, tetapi ukuran sampel dapat dianggap ¯ −µ X √ ≈ N (0, 1). Untuk sampel yang cukup besar (n → ∞) maka tn−1 ≈ Z dan S/ n relatif kecil dan σ tidak diketahui maka: ¯ −µ X √ ≤ tα/2,n−1 = (1 − α) P −tα/2,n−1 ≤ (4.2) S/ n √ Dalam bentuk yang lain (disebut metode Pivot) dan mengganti notasi S/ n dengan SX¯ diperoleh hasil yang disebut Interval/Selang Keyakinan seperti berikut ini. Hasil 4.6 (Interval Keyakinan sampel besar). Dari suatu sampel yang berasal ¯ dan dari distribusi normal dengan statistik sampel, masing-masing rata-rata X varians sampel S 2 , jika sampel dianggap cukup besar, maka interval keyakinan (1 − α) × 100%) untuk penduga mean populasi (µ) adalah ¯ − zα/2 S ¯ ≤ µ ≤ X ¯ + zα/2 S ¯ X X X
(4.3)
Daftar Isi
Judul
JJ J
I II
Hal. 107 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Secara umum untuk sampel tidak cukup besar berlaku Keluar
Hasil 4.7 (Interval Keyakinan sampel kecil). Dari suatu sampel, berukuran n, yang berasal dari distribusi normal dengan statistik sampel, masing-masing rata¯ dan varians sampel S 2 , jika sampel dianggap cukup besar, maka interval rata X keyakinan (1 − α) × 100%) untuk penduga mean populasi (µ) adalah ¯ − tα/2,(n−1) S ¯ ≤ µ ≤ X ¯ + tα/2,(n−1) S ¯ X X X
(4.4)
Sejauh ini telah diberikan gambaran pentingnya ukuran sampel besar dalam untuk dapat memanfaatkan distribusi yang lebih sederhana (yaitu distribusi normal). Ukuran sampel besar bahkan dapat membuat sampel yang tidak beasal dari distribusi normal, menghasilkan statistik yang mendekati berdistribusi normal sebagaimana dinyatakan dalam Teorema Limit Pusat berikut. Hasil 4.8 (Teorema Limit Pusat). Misalkan suatu sampel acak berukuran n diambil dari populasi berdistribusi D(µ, σ 2 ) yang tidak harus normal, maka ¯ −µ X √ ∼ N (0, 1) lim n→∞ σ/ n
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 108 dari 234
Cari Halaman
4.1.2.
Tingkat Interval Keyakinan dan Peluang Penutup
Interval keyakinan yang diturunkan melalui teori matematika dan peluang pada dasarnya adalah merupakan prosedur yang dilakukan pada sampel. Jika prosedur ini dilakukan berulang-ulang, maka sekitar (1 − α) × 100%) dari interval keyakinan yang dihasilkan akan memuat mean populasi (µ). Jika dilakukan melalui simulasi, prosentase interval yang benar-benar memuat µ disebut Peluang Penutup (coverage probability). Misalkan suatu populasi diketahui berdistribusi normal N (50, 9). Dari populasi ini diambil sampel dengan n berukuran 30, lalu dibuat
Kembali
Layar Penuh
Tutup
Keluar
interval keyakinannya dengan α = 0, 05. Selanjutnya pengambilan sampel diulangulang sampai banyak kali (misalnya 25 kali) dan setiap kali µ berada pada interval keyakinan, intervalnya dicatat. Selanjutnya dihitung prosentase interval keyakinan yang memuat µ. Maka kita akan lihat peluang penutupnya akan mendekati (1 − α) × 100%. Selanjutnya interval-interval keyakinan yang dihasilkan dapat juga diilustrasikan secara grafis. n<-30 m<-25 mu<-50 sgm<-2 ik<-0.95 tk<-qt(ik,n-1) x1<-mu-sgm x2<-mu+sgm ymax<-m+m/25 y<-seq(0, ymax,0.5) x<-0*y+mu konter<-seq(0,0,length=m) mdata<-matrix(0,m,6) mdata[,2]<-mu plot(x,y,type='l',col='green',main='Interval Keyakinan', xlab="Interval", ylab="sampel",xlim=c(x1,x2)) for(i in 1:m){ x<-rnorm(n,mu,sgm) x.rat<-mean(x) mdata[i,6]<-x.rat
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 109 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
x.sd <-sqrt(var(x))/sqrt(n) bb<-x.rat-tk*x.sd ba<-x.rat+tk*x.sd xin<-seq(bb,ba,0.01) yin<-0*xin+i mdata[i,1]<-bb mdata[i,3]<-ba if(bb<=mu & mu<=ba){ konter[i]<-1 mdata[i,4]<-1 lines(xin,yin,col='blue')} else{lines(xin,yin,col='red')} } pr<-sum(konter)/m cat("\n Peluang penutup :",pr,"\n")
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 110 dari 234
Ketika dieksekusi skrip di atas menghasilkan Peluang penutup : 0.96 dan grafik interval keyakinan seperti pada Gambar 4.2. Hasil yang sedikit berbeda akan diperoleh setiap kali skrip di atas dieksekusi.
4.1.3.
Distribusi Beda Rata-rata Kelompok Saling Bebas
Pada sampel yang kita pelajari sekarang, kita menghitung distribusi beda mean dari populasi yang terdiri atas 2 kelompok (subpopulasi yang saling bebas), yaitu X dan Y di asumsikan saling bebas. Data seperti ini biasa dijumpai pada penelitian yang berupa survei dimana gejala lyag diamati merupakan gejala yang tumbuh/ muncul secara alamiah. Sampel yang diperoleh disebut sampel saling bebas.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Ada kondisi dimana sampel acak X tidak saling bebas dengan sampel acak Y dan kondisi ini akan dipelajari pada sub berikutnya. 2 ) dan Hasil 4.9 (Distribusi Beda Rata-rata). Jika Xi ; i = 1, 2, · · · nX ∼ N (µX , σX 2 Yj ; j = 1, 2, · · · nY ∼ N (µY , σY ), maka
¯ − Y¯ ∼ N (µX − µY ), (σ 2 /m + σ 2 /n) X X Y
UNEJ
Daftar Isi
atau ¯ − Y¯ − (µX − µY ) X q ∼ N (0, 1) 2 /m + σ 2 /n) σX Y
Judul
JJ J
Secara umum, jika σ tidak diketahui, dan ukuran sampel relatif kecil, maka berlaku Hasil 4.10 (Distribusi Beda Rata-rata). Jika Xi ; i = 1, 2, · · · nX sampel bebas 2 ) dan Y ; j = 1, 2, · · · n sampel bebas dari ∼ N (µ , σ 2 ), dimana dari N (µX , σX j Y Y Y baik sesama X, Y maupun antara X dengan Y semua saling bebas maka
I II
Hal. 111 dari 234
Cari Halaman
Kembali
¯ − Y¯ − (µX − µY ) X ∼ tnX +nY −2 Sep
(4.5) Layar Penuh
dengan s Sep =
2 + (n − 1)S 2 (nX − 1)SX Y Y nX + nY − 2
1 1 + NX NY
(4.6)
Tutup
Keluar
Persamaan 4.6 disebut standar kesalahan beda rata-rata. Dengan cara yang sama dengan interval keyakinan mean, maka diperoleh interval keyakinan beda mean (µX − µY ) untuk taraf keyakinan (1 − α) × 100%), adalah ¯ − Y¯ − tα/2,n +n −2 Sep Batas bawah = X X Y ¯ ¯ Batas atas = X − Y + tα/2,nX +nY −2 Sep Besaran nX + nY − 2 merupakan derajat kebebasan dari distribusi t yang dihasilkan.
UNEJ
Daftar Isi
Judul
4.1.4.
Distribusi Beda Sampel/ Kelompok Tidak Saling Bebas
Pada penelitian eksperimen, sampel biasanya terdiri atas dua kelompok yaitu kelompok eksperimen dan kelompok kontrol sebagai pembanding. Sebelum eksperimen dimulai kedua kelompok ini dibuat berada pada kondisi yang sama/hampir sama sehingga perbedaan hasil pada akhir eksperimen dapat disimpulkan/diyakini sebagai akibat pengaruh eksperimen. Ada dua cara memperoleh kelompok eksperimen dan kelompok kontrol yaitu: 1. kelas paralel atau kelas berpasangan yaitu dengan membuat kelas kontrol dan kelas eksperimen paralel dan masing-masing anggota sampelnya berpasangan misalnya (X1 , Y1 ), (Xi , Yi ), · · · , (Xn , Yn )
JJ J
I II
Hal. 112 dari 234
Cari Halaman
Kembali
Layar Penuh
2. kelas pre-post esxperiment yaitu satu kelompok sekaligus menjadi kelompok kontrol (sebelum dia dikenai perlakuan) dan kelompok eksperimen. X adalah pengamatan sebelum perlakuan (kontrol) dan Y adalah pengamatan setelah perlakuan
Tutup
Keluar
Dari cara pelaksanaan eksperimen dapat difahami bahwa kedua sampel yang diperoleh X dan Y bukanlah sampel yang saling bebas. Untuk sampel dengan kondisi seperti ini yang bisa dicari adalah distribusi dari beda masing-masing amatan (Xi , Yi ). Dengan menggunakan sifat reproduktif distribusi normal untuk σ diketahui dan distribusi t untuk σ tak diketahui, maka diperoleh:
UNEJ
2 dan Y ∼ N (µ , σ 2 , maka X − Y berdistribusi Hasil 4.11. Jika X ∼ N (µX , σX Y Y 2 N (µX − µY ), σt dengan
Daftar Isi
2 σt = σX + σY2 − 2σX σY ρXY Judul
dan ρXY disebut korelasi antara X dan Y yang dari sampel diperoleh dengan menghitung Pn (xi − x ¯)(yi − y¯) r = i=1 2 Sx Sy2
JJ J
I II
Hal. 113 dari 234
Dalam praktisnya dilapangan diberlakukan prosedur sebagai berikut: 1. Definisikan Di = Xi − Yi untuk i = 1, 2, · · · , n 2. Hitung varians sampel dari D yaitu Pn ¯ 2 (Di − D) 2 SD = i=1 n−1
Cari Halaman
Kembali
Layar Penuh
3. maka diperoleh distribusi (X − Y ) − (µX − µY ) D − µD √ = √ ∼ tn−1 SD / n SD / n
Tutup
Keluar
4. selanjutnya diperoleh interval keyakinan (1 − α) × 100% dari beda kelompok ini adalah ¯ − tα/2,n−1 × SD /√n bb : D ¯ + tα/2,n−1 × SD /√n ba : D
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 114 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
50.0
10
UNEJ
5
Daftar Isi
0
49.0
Frequency
51.0
15
Histogram of vr
Judul 48.5
49.5
50.5
51.5
vr
JJ J density(x = vr)
Normal Q−Q Plot
0.6
Hal. 115 dari 234 51.0
●
50.0
●● ● ●●●● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ●●●● ● ●●●
49.0
0.2
0.4
Sample Quantiles
●
0.0
Density
I II
Cari Halaman
Kembali
● ●
Layar Penuh 48
49
50
51
N = 60 Bandwidth = 0.2362
52
−2
−1
0
1
2
Theoretical Quantiles
Tutup
Gambar 4.1: Ilustrasi distribusi rata-rata sampel diambil dari 60 sampel masing-masing berukuran 25 dari populasi N (50, 9)
Keluar
25
Interval Keyakinan
UNEJ
20
Daftar Isi
sampel
15
Judul
I II
10
JJ J
Hal. 116 dari 234
5
Cari Halaman
0
Kembali
48
49
50
51
52
Layar Penuh
Interval Tutup
Gambar 4.2: Interval keyakinan 95%. Dari 25 kali pengambilan sampel ada 24 interval yang memuat µ dengan prosentase 96%. Interval berwarna merah (garis putus-putus) menunjukkan interval yang
Keluar
4.2.
Uji hipotesis rata-rata
Dalam analisis data ada kalanya bukan nilai atau interval estimasi yang diperlukan, tetapi keputusan apakah suatu parameter sama dengan suatu nilai tertentu atau apakah dua parameter sama atau tidak. Prosedur untuk mendapatkan kesimpulan seperti ini disebut uji hipotesis yang sesungguhnya terkait dengan interval estimasi. Ada beberapa istilah yang perlu difahami dalam uji hipotesis diantaranya adalah: uji statistik, hipotesis, daerah penolakan dan nilai p (Lihat Mendenhall [15, Bab 5]). Hipotesis dalam statistika dibedakan menjadi hipotesis nol (H0 )dan hipotesis alternatif atau hipotesis kerja (HA ). Hipotesis alternatif adalah hipotesis yang ingin dibuktikan sesuai dengan teori yang mendasari penelitian yang dilakukan. Hipotesis nol adalah hipotesis yang ingin ditolak dalam rangka membuktikan benarnya hipotesis alternatif. Uji statistik adalah fungsi statistik yang dipergunakan untuk menguji apakah suatu hipotesis nol diterima atau ditolak. Untuk uji rata-rata ada dua bentuk uji mendasar yaitu uji rata-rata dan uji beda rata-rata.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 117 dari 234
Cari Halaman
Hasil 4.12 (Uji Rata-rata). Uji rata-rata dengan hipotesis nol H0 : µ = µ0 menggunakan uji statistik x ¯ − µ0 √ t= s/ n dengan t ∼ tn−1 Nilai t yang diperoleh dari uji statistik sering disebut sebagai nilai t-hitung yang dinotasikan dengan t0 . Nilai p dari suatu nilai statistik t0 didefinisikan sebagai berikut:
Kembali
Layar Penuh
Tutup
Keluar
1. untuk HA dua arah, yaitu HA : µ 6= µ0 , maka pt0 = P (t ≤ −|t0 | atau t ≥ |t0 |) 2. untuk HA satu arah ke kiri, yaitu HA : µ < µ0 , maka
UNEJ
pt0 = P (t ≤ t0 ) 3. untuk HA satu arah ke kanan, yaitu HA : µ > µ0 , maka pt0 = P (t > t0 )
Daftar Isi
Judul
dengan derajat kebebasan t yang sesuai. Keputusan yang diambil adalah JJ J
1. terima H0 jika p > α 2. terima H0 jika p ≤ α
I II
Hal. 118 dari 234
Hasil 4.13 (Uji beda rata-rata). Uji rata-rata dengan hipotesis nol H0 : µX − µY menggunakan uji statistik x ¯ − y¯ t= Sep
Cari Halaman
Kembali
dengan t ∼ tnX +nY −2 Nilai p − val dari suatu nilai statistik t0 , dinotasikan pt0 , untuk uji beda didefinisikan sebagai berikut: 1. untuk HA dua arah, yaitu HA : µX 6= µY , maka
Layar Penuh
Tutup
pt0 = P (t ≤ −|t0 | atau t ≥ |t0 |) Keluar
2. untuk HA satu arah ke kiri, yaitu HA : µX < µY , maka pt0 = P (t ≤ t0 ) 3. untuk HA satu arah ke kanan, yaitu HA : µX > µY , maka pt0 = P (t > t0 ) dengan derajat kebebasan t yang sesuai. Keputusan yang diambil adalah 1. terima H0 jika p > α
UNEJ
Daftar Isi
Judul
2. terima H0 jika p ≤ α atau
JJ J
I II
1. jika p > 0, 05, tidak ada beda signifikan antara µX dan µY 2. jika 0, 01 < p ≤ 0, 05, ada beda signifikan antara µX dan µY 3. jika p ≤ 0, 01, ada beda sangat signifikan antara µX dan µY Dengan menggunakan komputer secara umum, peluang P (X ≤ x0 ) pada distribusi tertentu, dapat dihitung dengan perintah pdistribusi, dengan distribusi adalah salah satu dari norm, poiss, t dan distribusi lainnya. Misalnya untuk distribusi t dengan derajat kebebasan k kita dapat menghitung: 1. P (t ≤ t0 ) = pt(t0,k) 2. P (t ≥ t1 ) =1-pt(t1,k)
Hal. 119 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
3. P (t1 ≤ t ≤ t2 ) =pt(t1,k)+(1-pt(t2,k)) Keluar
4.2.1.
Menggunakan menu R-Commander
Dengan menggunakan menu R-Commander, pengguna R tinggal memilih jenis HA serta tingkat keyakinan yang dipergunakan. Perhatikan Gambar 4.3 untuk uji rata-rata dan Gambar 4.4 untuk uji beda rata-rata UNEJ
Latihan 4.1. Lakukan latihan berikut dengan menggunakan menu R-Commander i aktifkan data Orange
Daftar Isi
Judul
ii hitung ringkasan data Orange, catat rata-rata untuk age dan circumference iii misalkan µ0 adalah mean age atau circumference ditambah 10. iv uji hiipotesis apakah mean age atau circumference sama dengan µ0 yang ditetapkan di atas. Nilai µ0 harus dimasukkan sendiri ke dalam analisis melalui menu.
JJ J
I II
Hal. 120 dari 234
Cari Halaman
v ulangi hal di atas untuk data simulasi seperti pada Contoh 3.1 Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 121 dari 234
Cari Halaman
Kembali
Gambar 4.3: Menu Uji Rata-rata
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 122 dari 234
Cari Halaman
Kembali
Gambar 4.4: Menu Uji Beda rata-rata Layar Penuh
Tutup
Keluar
4.3.
Interval Keyakinan dan Uji Proporsi
Pada dasarnya interval keyakinan ataupun uji hupotesis yang berkaitan dengan proporsi mirip dengan interval keyakinann atau uji hipotesis rata-rata untuk data kuantitatif. Hanya saja proporsi diukur pada data kualitatif sedangkan rata-rata diukur untuk data kuantitatif. Sebagai ilustrasi untuk data kemiskinan di perkotaan dapat diukur proporsi penduduk miskin di daerah perkotaan. Data/ informasi dapat diperoleh dari sampel dibeberapa kota yang nantinya digeneralisasikan pada suatu wilayah yang sesuai (misalnya tingkat propinsi atau nasional). Berikut adalah beberapa konsep statistika yang terkait dengan proporsi yang dapat dijumpai dalam banyak buku teks analsis statistika, diantaranya Mendenhall bk:Mendenhall93.
UNEJ
Daftar Isi
Judul
JJ J
4.3.1.
Interval keyakinan proporsi
Bada bagian ini pembaca harus ekstra hati-hati membedakan notasi p untuk proporsi dan p untuk peluang terkait nilai statistik (p − val). Tumpang tindih notasi tidak bisa dihindarkan karena sama-sama dipakai secara luas dalam bidang statistika. Pembaca harus dapat membedakan bilamana p mewakili uji proporsi dan bila mana mewakili nilai peluang. Definisi 4.5. Proporsi sampel untuk suatu kategori adalah perbandingan antara banyaknya subsampel untuk kategori bersangkutan dengan besarnya seluruh sammpel x pˆ = n
I II
Hal. 123 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Definisi 4.6. Standar kesalahan proporsi sampel s.e.(ˆ p) didefinisikan sebagai r p(1 − p) s.e.(ˆ p) = n Hasil 4.14. Untuk n relatif besar, maka pˆ − p ∼ N (0, 1) s.e.(ˆ p) Hasil 4.15. Interval keyakinan (1 − α) × 100% untuk proporsi populasi p adalah pˆ − zα/2 × s.e.(ˆ p) ≤ p ≤ pˆ + zα/2 × s.e.(ˆ p)
UNEJ
Daftar Isi
Judul
JJ J
4.3.2.
I II
Interval keyakinan beda proporsi
Jika dari sampel X dan Y masing-masing berukuran nX dan nY diperoleh proporsi sampel sebesar pˆX dan pˆY , maka untuk beda proporsi populasi diperoleh interval keyakinan berikut Hasil 4.16. Interval keyakinan (1 − α) × 100% untuk beda proporsi populasi pX dan pY adalah h i h i c ≤ p ≤ (ˆ c (ˆ pX − pˆY ) − zα/2 × s.e.(∆p) pX − pˆY ) + zα/2 × s.e.(∆p)
Hal. 124 dari 234
Cari Halaman
Kembali
Layar Penuh
dengan s c = s.e.(∆p)
pX (1 − pX ) pY (1 − pY ) + nX nY
Tutup
Keluar
4.3.3.
Uji hipotesis proporsi dan beda proporsi
Berikut adalah rangkuman dari uji proporsi populasi (Mendenhall bk:Mendenhall93) 1. H0 : p = p0 UNEJ
2. HA : (a) HA : p 6= p0 (dua arah)
Daftar Isi
(b) HA : p > p0 (satu arah bagian kanan) (c) HA : p < p0 (satu arah bagian kiri)
Judul
3. Uji statistik pˆ − p0 p= q
pˆ(1−ˆ p n
dengan pˆ =
x n
dan hitung nilai peluang p.val sesuai HA dengan menggunakan pendekatan distribusi normal, yaitu p ∼ N (0, 1) 4. Daerah penolakan: pilih α yang sesuai sebagai taraf signifikansi yang diinginkan 5. Keputusan: (a) Terima H0 jika p.val > α
JJ J
I II
Hal. 125 dari 234
Cari Halaman
Kembali
Layar Penuh
(b) Tolak H0 jika p.val ≤ α Dengan menu R-Commander, kita tingal memilih HA , memasukkan p0 menggunakan pendekatan normal atau dengan binomial, seperti pada Gambar 4.5
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 126 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Gambar 4.5: Menu R-Commander untuk uji proporsi Keluar
4.4.
Fungsi-fungsi R
Beberapa fungsi untuk analisis data yang umum banyak diperoleh pada pustaka stats untuk analisis data univariat dan pustaka multiv dan mva untuk analisis multivariat. Beberapa fungsi pada pustaka tersebut diantaranya adalah sebagai berikut Fungsi t.test()
aov() bartlett.test()
Pustaka stats
stats
Data Normal (sampel kecil < 30 Normal
Deskripsi Uji beda mean dua populasi
UNEJ
Daftar Isi
Judul
Uji beda mean tiga atau lebih populasi Uji homogenitas varians
JJ J
I II
Hal. 127 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.5.
Bacaan Lebih Lanjut
Untuk lebih mendalami materi uji beda pada bab ini disarankan membaca beberapa referensi berikut diantaranya: Hadi bk:Hadi82, Sudjana bk:Sudjana96, Mendenhall bk:Mendenhall93. Untuk uji yang terkait dengan penggunaan R, dapat dibaca beberapa referensi online seperti: Maidonald m:Maindonald2001 dan Vesalini m:Vezalini2002.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 128 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.6.
Soal-soal Latihan
Aktifkan data CO2 pada R selanjutnya lakukan uji berikut. 1. Ringkasan data secara numerik UNEJ
2. Eksplorasi data secara grafis terkait uji beda 3. Lakukan uji beda rata-rata untuk kelompok Type atau Treatment terhadap data conc atau uptake. Apakah hipotesis yang menyatakan ”kelompok Quebec dan Mississippi memiliki rata-rata conc berbeda secara signifikan” dapat diterima. 4. Lakukan uji proporsi dengan hipotesis bahwa 45% Type adalah berupa Quebec
Daftar Isi
Judul
JJ J
I II
Hal. 129 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 130 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
5 Daftar Isi
ANALISIS VARIANSI (ANAVA)
Judul
JJ J
I II
Hal. 131 dari 234
Pada bab sebelumnya telah dibahas statistika inferensial tentang uji rata-rata untuk dua kelompok atau untuk kategori dengan dua level. Pada bab ini akan dibahas uji untuk tiga kelompok atau lebih, atau untuk kelompok dengan level lebih dari dua, misalnya status pendidikan (SD, SMP, SMA/K dan PT).
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Indikator Kompetensi Pembaca dapat menggunakan R untuk melakukann uji hipotesis tentang mean yang berasal dari tiga kelompok atau lebih yang ditandai dengan kemapuan 1. menjelaskan kenapa uji mean dilakukan dengan analisis variansi;
UNEJ
2. menyebutkan asumsi yang diperlukan oleh analisis variansi; Daftar Isi
3. merumuskan dan menguji hipotesis dari suatu data yang berasal dari 3 kelompok atau lebih. Sejauh ini kita telah mempelajari uji rata-rata atau beda dua rata-rata. Dengan kata lain uji rata-rata untuk kelompok dengan maksimum dua level. Untuk uji semacam ini kita menggunakan uji t baik yang saling bebas maupun yang berpasangan. Pada bab ini kita akan membahas uji beda rata-rata dengan lebih dari dua kelompok kita.
Judul
JJ J
I II
Hal. 132 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.1.
Konsep Dasar Anava
Uji untuk memeriksa beda mean dengan kelompok lebih dari dua disebut uji anava (Analisis variansi). Berikut adalah ilustrasi untuk memahami kenapa uji analisis variansi dapat dipergunakan untuk mendeteksi adanya beda lebih dari dua mean. Perhatikan ilustrasi sebaran 5 kelompok data masing-masing dengan rata-rata kelompoknya seperti pada Gambar 5.2 dan Gambar 5.1. Pada kedua gambar tersebut dapat dilihat bahwa ada dua jenis variansi yang dapat dilihat yaitu variansi di dalam masing-masing kelompok (yang menunjukkan sebaran dari masing-masing data terhadap rata-rata kelompoknya, dan variansi antar kelompok yang menggambarkan adanya sebaran rata-rata kelompok terhadap rata-rata total. Dengan asumsi bahwa variansi kelompok adalah homogen maka semakin besar variansi antar kelompok dibanding variansi dalam kelompok menunjukkan semakin kuat bukti bahwa kelompok yang diwakili subsampel memiliki mean yang berbeda. Oleh karena itu dengan membandingkan variansi antar kelompok dengan variansi dalam kelompok dapat disimpulkan apakah mean kelompok sama atau berbeda. Lihat Gambar 5.2. Analisis variansi (disebut juga analisis ragam sederhana hanya terdiri atas satu faktor (disebut kelompok atau perlakuan misalnya jenis kelamin, sekolah, jenis tes dan sejenisnya) sedangkan untuk yang lebih kompleks dapat terdiri atas dua atau lebih faktor. Dalam hal ini kelompok dan perlakuan merupakan faktor berbeda (misalnya peneliti sekaligus ingin melihat pengaruh perbedaan sekolah dan jenis kelamin).
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 133 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
D
UNEJ
A B
Kelompok
Sebaran Data
Daftar Isi
25
30
35
40
Respons
Judul
JJ J
I II
Hal. 134 dari 234
Plot Densitas
0.08
C D E A Kembali
0.00
Prob.
Cari Halaman
B
Layar Penuh
25
30
35
40
Respons
Gambar 5.1: Ilustrasi sebaran 5 kelompok data. Tidak adanya beda sebaran yang mencolok antara masing-masing kelompok dengan dalam
Tutup
Keluar
D
UNEJ
A B
Kelompok
Sebaran Data
Daftar Isi
0
10
20
30
40
Respons
Judul
JJ J
I II
Hal. 135 dari 234
Plot Densitas
0.08
C
D
E
A Kembali
0.00
Prob.
Cari Halaman
B
Layar Penuh
0
10
20
30
40
Respons
Gambar 5.2: Ilustrasi sebaran 5 kelompok data. Perbedaan mencolok antara sebaran dalam kelompok dengan sebaran masing-masing kelom-
Tutup
Keluar
5.2.
Uji Anava Faktor Tunggal
Misalkan suatu data terdiri atas satu faktor yang terdiri atas k kelompok (tingkat), masing-masing dengan nk sampel. Dalam uji anava, varians populasi diganti dengan penduganya yaitu varians sampel yang lebih dikenal dengan istilah rata-rata kuadrat (RK) atau Mean Square (MS) yang diperoleh dari Jumlah Kuadrat (JK) atau Sum Square (SS) dibagi derajat kebebasannya untuk memperoleh penduga takbias. Partisi Jumlah Kuadrat maupun Rata-rata Kuadrat diperoleh dengan mempartisi simpangan data yang dibedakan menjadi simpangan terhadap rata-rata keseluruhan (¯ y.. ), simpangan data terhadap rata-rata kelompok (¯ yi. ), dan simpangan rata-rata kelompok terhadap rata-rata keseluruhan. Hubungan yang diperoleh adalah
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 136 dari 234
yij − y¯.. = | {z }
Deviasi Total
y¯ − y¯ | i. {z ..}
Deviasi Antar Kelompok
+
yij − y¯i. | {z }
(5.1)
Deviasi Dalam Kelompok
Cari Halaman
Kembali
Dengan menguadratkan besaran di sebelah kiri dan di sebelah kanan dan dilakukan penyederhanaan maka diperoleh hubungan Jumlah Kuadrat dan Ratarata Kuadratnya sebagai berikut (lihat Netter et al. bk:NWK85)
Layar Penuh
Tutup
JKT = JKP + JKK Keluar
dengan JKT (Jumlah Kuadrat Total) =
ni k X X
(yij − y¯.. )2
i=1 j=1
JKP (Jumlah Kuadrat Perlakuan) =
ni k X X
UNEJ
2
(¯ yi. − y¯.. )
i=1 j=1
=
JKK (Jumlah Kuadrat Kesalahan) =
k X
Daftar Isi
ni (¯ yi. − y¯.. )2
i=1 nj k X X
Judul
(yij − y¯i. )2
JJ J
I II
i=1 j=1
1. Varians Total atau Rata-rata Kuadrat Total (RKT) JKT = V T = RKT = N −1
Pk
i=1
Pni
j=1 (yij
Hal. 137 dari 234
− y¯.. )2
Cari Halaman
N −1
dengan
Kembali
k ni k X 1 XX y¯.. = yij dan N = ni N i=1 j=1
i=1
2. Varians Antar kelompok atau Rata-rata Kuadrat Perlakuan (RKP). Varians ini disebut juga varians Perlakuan karena dalam rancangan percobaan sering kali pengelompokan dalam sampel menunjukkan adanya perbedaan
Layar Penuh
Tutup
Keluar
perlakuan (treatment) yang dilakukan pada masing-masing kelompok atau subsampel. JKP V A = RKP = k−1 Pk Pni yi. − y¯.. ) j=1 (¯ i=1 = k−1 Pk ni (¯ yi. − y¯.. ) = i=1 k−1 3. Varians Dalam sampel Rata-rata Kuadrat Dalam atau Rata-rata Kuadrat Kesalahan (RKD=RKK) JKT − JKP JKK = N − 1 − (k − 1) N −k Pk Pni Pk 2 ¯.. ) − i=1 ni (¯ yi. − y¯.. ) i=1 j=1 (yij − y
V D = RKK = =
N −k
Beberapa istilah yang banyak dipergunakan diantaranya
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 138 dari 234
Cari Halaman
Kembali
1. JKT=SST (Sum Square Total); 2. JKP=JKA (Jumlah Kuandrat Antar)=SSB (Sum Square Between ), RKP=MSB (Meean Square Between); 3. JKK=JKD (Jumlah Kuadrat Dalam)=SSE (Sum Square Error)=SSW (Sum Square Within); RKK=MSE (Mean Square Error).
Layar Penuh
Tutup
Keluar
Dengan asumsi bahwa data berasal dari distribusi normal, dapat diturunkan bahwa jumlah kuadrat (JKA=JKP dan JKK) masing-masing berdistribusi χ2 dengan derajat kebebasan sesuai dengan derajat kebebasan masing-masing bentuk kuadrat bersangkutan dan satu sama lain saling bebas. Dengan demikian perbandingan keduanya akan menghasilkan distribusi F dengan derajat pembilang dan penyebut diambil dari derajat kebebasan masing-masing, yaitu: F =
RKP ∼ Fk−1,N −k RKK
UNEJ
Daftar Isi
dengan RK = JK/db dan JKT = JKP + JKK. Tabel analisis varians dapat dilihat pada Tabel 5.1. Uji perbedaan rata-rata dengan menggunakan anava dapat dirangkum sebagai berikut: Asumsi Asumsi yang harus dipenuhi uji variansi adalah
Judul
JJ J
I II
Hal. 139 dari 234
Sampel diambil dari populasi yang berdistribusi normal dengan variansi homogin
Cari Halaman
kelompok satu dengan lainnya saling bebas Kembali
Tabel 5.1: Tabel Anava Faktor Tunggal Sumber Variasi DB JK RK Perlakuan k − 1 JKP RKP=JKP/(k − 1) Kesalahan N − k JKK RKK=JKK/(N − k) Total N − 1 JKT
F RKP/RKK (Fk−1,N −k )
Layar Penuh
Tutup
Keluar
Hipotesis Uji hipotesis dirumuskan sebagai berikut: H0 Semua populasi memiliki mean yang sama (µ1 = · · · = µk ) HA Paling tidak ada dua kelompok yang memiliki mean berbeda (∃i 6= j, µi 6= µj ).
UNEJ
Uji Statistika Uji statistik adalah: Daftar Isi
RKP F0 = RKK
Judul
Uji Hipotesis Dengan menghitung nilai p.val pada F (F0 )k−1,N −k dengan kesimpulan 1. jika p.val > 0.05 maka tidak ada beda signifikan antara mean yang diuji; 2. jika 0.01 < p.val ≤ 0.05 maka paling tidak ada dua mean yang berbeda signifikan; 3. jika p.val ≤ 0.01 maka paling tidak ada dua mean yang berbeda sangat signifikan;
5.2.1.
Alternatif Formula untuk perhitungan secara semi manual JKT =
ni k X X i=1 j=1
Yij2 −
1 N
ni k X X
JJ J
I II
Hal. 140 dari 234
Cari Halaman
Kembali
Layar Penuh
2 Yij
Tutup
i=1 j=1 Keluar
JKP =
k X i=1
2 2 ni ni k X X X 1 Yij − Yij N j=1
i=1 j=1
JKE = JKT − JKP UNEJ
------------------------------------------------------------DIET BERAT ----------------------------------------------------1 2 3 4 ------------------------------------------------------------91 110 85 80 89 84 92 72 102 84 89 89 82 85 85 79 93 89 72 72 93 87 80 76 ------------------------------------------------------------Yi. = TOTAL Y..= ------------------------------------------------------------Yi.^2 = -------------------------------------------------------------
Daftar Isi
Judul
JJ
J
I
Hal. 141 dari 234
Cari Halaman
Kembali
Layar Penuh
5.2.2.
Uji Anava dengan R atau R-Commander
Dengan menggunakan R uji analisis variansi dapat dilakuan dengan memanggil fungsi aov yaitu:
II
Tutup
Keluar
aov(respon~kelompok,data=data.freme) R-Commander telah memiliki menu yang siap diakses untuk melakukan uji analisis variansi. Pilihan uji anova berada pada menu Statistika. Sebagai contoh penggunaan uji anava dengan menu R-Commander kita akan memanfaatkan basis data yang telah disediakan oleh R pada pustaka stats. Untuk mengaktifkan salah satu data pada pustaka stats ikuti cara berikut (lihat juga Gambar 3.1 halaman 72) dan misalkan kita memilih data Orange. =>Data=>Baca Data dari Paket =>Pilih Paket => Pilih Data Selanjutnya untuk melakukan uji anava ikuti langkah berikut => Statistika => Uji Rata-rata/mean => anava satu arah Bila langkah di aiats diikuti, kita akan memperoleh tampilan seperti pada Gambar 5.3. Pada gambar tersebut terlihat bahwa untuk data Orange hanya tersedia satu kelompok/faktor yaitu Tree yang menunjukkan jenis pohon jeruk dan dua respon, misalnya kita pilih circumference yang menunjukkan keliling batang pohon jeruk. Selain itu ada juga pilihan apakah kita ingin melihat uji berpasangan atau tidak. Hsil analisis adalah sebagai berikut yang menunjukkan tidak adanya bedayang signifikan (p.val = 0.4857). Analysis of Variance Table
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 142 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Response: circumference Keluar
Df Sum Sq Mean Sq F value Pr(>F) Tree 4 11841 2960 0.8834 0.4857 Residuals 30 100525 3351 UNEJ
Daftar Isi
Judul
JJ J
I II
Gambar 5.3: Menu dialog anova satu arah Hal. 143 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.3.
Anava Multi Faktor
Analisis varians selanjutnya dapat diperluas untuk sekaligus memeriksa atau menguji beda rata-rata yang dikelompokkan atas beberapa faktor dengan jumlah level bervariasi. Sebagai ilustrasi kita ambil contoh sederhana dengan dua faktor yaitu faktor A (misalnya sekolah) dan faktor B (jenis kelamin). Misalkan peneliti ingin meneliti ada tidaknya perbedaan nilai ujian suatu mata pelajaran (misalnya matematika) dari beberapa sekolah juga antara siswa pria dan perempuan. Dalam kasus multi faktor seperti ini, ada beberapa pertanyaan pokok yaitu apakah ada perbedaan prestasi dari masing-masing sekolah sekolah dan apakah ada perbedaan prestasi antara siswa laki-laki dan perempuan. Pertanyaan tersebut menyelidiki pengaruh faktor utama atau main effects. Selain itu ada juga pertanyaan tambahan yaitu: apakah perbedaan prestasi matematika dari kedua jenis kelamin bergantung pada sekolah? Pertanyaan ini memeriksa apakah ada pengaruh interaksi antara sekolah (faktor A) dengan jenis kelamin (faktor B). Ilustrasi secara grafik tentang adanya interaksi dapat dilihat pada Gambar 5.6. Ringkasan analisis varians dengan dua faktor (A dan B) diberikan pada Tabel 5.2. Keluaran anava terutama berupa tabel anava yang berisi sumber variasi, derajat kebebasan dan nilai F serta p.val. Selain itu juga diinformasikan ringkasan mean dan deviasi baku dari data yang dihitung perpasangan faktor. Keluaran berikut adalah hasil analisis data simulasi dengan dua fakror yaitu A( dengan 5 level/tingkat) dan faktor B dengan 4 level.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 144 dari 234
Cari Halaman
Kembali
Layar Penuh
Mean Respon FaktorA B1 B2 A1 0.6316032 0.02352914 A2 4.3843496 15.01071223
B3 0.2492653 9.8645554
B4 -0.1309664 -3.1866694
Tutup
Keluar
Tabel 5.2: Tabel Anava Faktor Ganda/ Multi Faktor Sumber DB JK RK F0 Distribusi Variasi Faktor A a−1 JK(A) RKP RKP/ (Fa−1,ab(r−1) ) RKK Faktor B b−1 JK(B) RKK (Fb−1,ab(r−1) ) A×B (a − 1)× JK(AB) (F(a−1)(b−1),ab(r−1) ) (b − 1) JK(AB) (F(a−1)(b−1),ab(r−1) ) Kesalahan ab(r-1) JKK RKK Total N −1 JKT
UNEJ
Daftar Isi
Judul
JJ J
A3 10.7027717 29.66461105 20.7192812 -5.9320402 A4 15.6488281 44.50848649 29.1709683 -8.8033237 A5 20.2773067 60.47144199 40.2166051 -11.8190263
I II
Hal. 145 dari 234
Cari Halaman
St.Dev Respons FaktorA B1 A1 1.2074597 A2 1.5388709 A3 0.6670030 A4 0.8586452 A5 0.7122736
B2 0.4300686 0.7395929 0.4669000 1.0347464 1.4802049
B3 0.6546097 0.6201595 0.8852323 1.0621368 1.1593780
B4 1.1142916 0.7457983 1.5050601 0.5214592 1.2964164
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Gambar 5.4: Menu dialog anova multi arah Judul
Banyaknya Respon per Faktor Faktor B FaktorA B1 B2 B3 B4 A1 5 5 5 5 A2 5 5 5 5 A3 5 5 5 5 A4 5 5 5 5 A5 5 5 5 5 ANOVA Response: Respons FaktorA FaktorB
Sum Sq Df F value Pr(>F) 9198.1 4 2321.34 < 2.2e-16 *** 17556.0 3 5907.54 < 2.2e-16 ***
JJ J
I II
Hal. 146 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FaktorA:FaktorB 8748.8 12 735.99 < 2.2e-16 *** Residuals 79.2 80 --Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 UNEJ
5.3.1.
Eksplorasi Grafik Beda Rata-rata
Dengan prinsip kerja analisi anova seperti di atas, maka pemahaman terhadap interppretasi hasil analisis dapat dibuat lebih baik dengan menggunakan eksplorasi grafik. Sesungguhnya eksplorasi grafik selain dapat dipergunakan sebagai ilustrasi hasil analisis statistika juga dapat dimanfaatkan sebagai eksplorasi awal sebelum memilih uji statistik yang sesuai dengan kondisi data. Ada dua macam presentasi grafik yang siap diimplemantasikan melalui menu R-Commander yaitu Grafik Rata-rata dan Grafik Box-plot. Dengan kedua sajian grafik ini kita dapat lebih mudah menginterpretasikan hasil analisis uji varians. Gambar Plot rata-rata dan Box-plot dari data Orange dapat dilihat pada Gambar 5.5. Untuk data dengan dua faktor, ada tidaknya pengaruh faktor utama dan interaksi dapat dilihat grafik rata-rata (plot mean) seperti diilustrasikan pada Gambar 5.6. 1. Apabila kurva (garis-garis patah) yang mewakili rata-rata dari kombinasi level dari kedua faktor membentuk garis sejajar sumbu X dan tidak terpisah secara mencolok antara faktor B, berartii tidak ada pengaruh
Daftar Isi
Judul
JJ J
I II
Hal. 147 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
masing-masing faktor (A maupun B) (Gambar 5.6(1)) 2. Apabila kurva (garis-garis patah) yang mewakili rata-rata dari kombinasi level dari kedua faktor membentuk garis sejajar sumbu X tetapi antara level (B) terpisah secara mencolok, berarti tidak ada pengaruh faktor A tetapi ada pengaruh faktor B dan tidak ada interaksi (Gambar 5.6(2))
UNEJ
Daftar Isi
3. Apabila kurva tidak sejajar dengan sumbu X, tetapi sejajar satu sama lain dan terpisah antara faktor B, berarti ada pengaruh dari faktor utama (baik A maupun B) tetapi tidak ada interaksi (Gambar 5.6(3)). 4. Apabila kurvanya tidak sejajar sumbu X dan masing-masing tidak sejajar satu sama lain, berarti ada interaksi sekaligus juga ada pengaruh faktor utama (Gambar 5.6(4)). Ilustrasi lebih detil dari anova dua faktor dengan ilustrasi interval keyakinan 95% dapat dilihat pada Gambar f.meanplot.anava2. Dari grafik akanlangsung dapat dilihat secara kasar apakah ada perbedaan mean pada salah satu atau faktor kedua faktor, termasuk adanya interaksi.
Judul
JJ J
I II
Hal. 148 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
150
UNEJ
●
●
●
●
●
50
mean of Orange$circumference
Plot of Means
Daftar Isi
Judul
3
1
5
2
4
JJ J
I II
Orange$Tree Hal. 149 dari 234
150
Kembali
Layar Penuh
50
circumference
Cari Halaman
Tutup
3
1
5 Tree
2
4
Keluar
FB
●
●
15
●
● A1
A2
A3
A4
FB
10
●
B1 B2 B3 B4
Respons
●
B1 B2 B3 B4
UNEJ
Daftar Isi 5
4.8
5.0
● Respons
20
Plot Mean (2)
5.2
Plot Mean (1)
A5
●
●
A1
A2
●
●
●
A3
A4
A5
Faktor A
Faktor A
Plot Mean (3)
Plot Mean (4)
Judul
JJ J
● A1
A2
A3
A4
Faktor A
A5
50
●
30 −10
5
●
●
Respons
25
● ●
FB B1 B2 B3 B4
10
●
15
Respons
35
FB
I II
● A1
●
A2
●
A3
●
A4
●
B1 B2 B3 B4
A5
Hal. 150 dari 234
Cari Halaman
Kembali
Faktor A
Layar Penuh
Gambar 5.6: Contoh Mean Plot untuk ilustrasi uji anava dengan dua faktor dan empat macam hubungan kedua faktor
Tutup
Keluar
Grafik Rata−rata 60
UNEJ
FB B1 B2 B3 B4
Daftar Isi
Judul
JJ J
20
●
I II
Hal. 151 dari 234
● ● 0
Respons
40
●
●
Cari Halaman
● Kembali
Layar Penuh
Tutup
A1
A2
A3
A4
Faktor A
A5 Keluar
5.4.
Bacaan Lebih Lanjut
Bagi pembaca yang ingin mendalami lebih jauh Analisis varians dapat membaca Netter et al. bk:NWK85, untuk pendekatan yang lebih matematis. Bagi pembaca yang hanya membutuhkan pendekatan praktis dapat membaca Mendenhall bk:Mendenhall93. Referensi anava yang secara khusus membahas aplikasi R untuk anava dapat dibaca pada Vezalini m:Vezalini2002, Maidonald m:Maindonald2001 dan Faraway m:Faraway2002 yang menggunakan pendekatan regresi.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 152 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.5.
Soal-soal Latihan
Diskusikan dalam kelompok dengan 2-3 orang 1. Misalkan suatu faktor terdiri atas 3 level dan uji anava untuk faktor ini terhadap variabel yang lain hasilnya adalah signifikan. Jelaskan apa maknanya, apakah berarti rata-rata ketiga kelompok tadi secara berpasangan (pairwise) semua berbeda signifikan? 2. Eksplorasi data yang ada pada R dan pilih data yangmemiliki kelompok atau faktor dengan level lebih dari dua. Selanjutnya lakukan uji beda dengan kelompok lebih dari dua (anava).
UNEJ
Daftar Isi
Judul
JJ J
3. Perhatikan data simulasi nilai ujian sekolah, selidiki apakah ada perbedaan rata-rata hasil ujian dilihat dari jenis kelamin dan sekolah. Apakah tren (kecenderungan) berdasarkan jenis kelamin sama untuk semua sekolah?
I II
Hal. 153 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 154 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
6 Daftar Isi
DASAR-DASAR PEMODELAN STOKASTIK
Judul
JJ J
I II
Hal. 155 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tujuan Umum Mahasiswa memahami hakekat pemodelan dalam bidang statistika serta mempunyai gambaran tentang kedudukan dan perkembangan model- model linier dalam uji statistika
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 156 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tujuan Khusus Setelah menyelesaikan bab ini mahasiswa diharapkan dapat: 1. menyebutkan perbedaan antara pemodelan stokastik dan pemodelan deter-ministik; 2. menyebutkan langkah- langkah penting dalam pemodelan stokastik;
UNEJ
Daftar Isi
3. menyebutkan komponen- komponen penting dalam model linier; Judul
4. menyebutkan persamaan dan perbedaan dari model linier normal, model linier campuran, model linier tergeneralisasi, model linier campuran tergeneralisasi, model linier hierarkis; 5. menyebutkan metode untuk menghitung penduga parameter.
JJ J
I II
Hal. 157 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi 1. Hakekat pemodelan 2. Langkah- langkah penting dalam pemodelan
UNEJ
3. Model linier dan perkembangannya 4. Metode mengestimasi parameter 5. Mendiagnosis model
Daftar Isi
Judul
JJ J
I II
Hal. 158 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.1.
Prinsip Pemodelan
Ketika kita menganalisis data dengan menggunakan metode statistika, kita hampir selalu menekankan asumsi yang dikenakan terhadap data yang di analisis. Asumsi-asumsi itu dapat meliputi hubungan antara peubah, maupun sebaran dari galat (error). Namun, mungkin tidak semua kita menyadari bahwa saat itu sebenarnya kita sedang menerapkan suatu pemodelan (dalam hal ini pemodelan statistik) dalam memecahkan persoalan yang dihadapi maupun membuat suatu kesimpulan tentang masalah yang dihadapi. Ketika kita berbicara model atau pemodelan dalam bidang matematika atau statistika, mungkin pikiran kita membayangkan materi matematika yang sudah merupakan tingkat lanjut (advanced mathematics) yang membutuhkan pemahaman kalkulus lanjut maupun persamaan diferensial. Pemodelan, baik disadari atau tidak, implisit atau eksplisit, sebenarnya selalu dilakukan pada saat kita menggunakan matematika (atau khususnya statistika) dalam memecahkan masalah dalam kehidupanm riil. Bahkan, sejak kita belum menjadi mahasiswa, yaitu ketika di SLTP/SMU kita menyelesaikan soal bentuk cerita (words problem), kita juga sebenarnya menerapkan pemodelan matematika. Demikian juga ketika kita menyelesaikan aplikasi sistim persamaan linier dalah kehidupan sehari- hari.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 159 dari 234
Cari Halaman
Kembali
Definisi 6.1 (Prinsip Pemodelan). Model matematika dari suatu masalah adalah rumusan masalah dalam bentuk persamaan matematika
Layar Penuh
Definisi 6.2. Pemodelan matematika adalah proses menerjemahkan masalah dalam bahasa umum ke dalam bahasa atau persamaan matematika
Tutup
Keluar
Sebagai ilustrasi, berikut disampaikan contoh soal penerapan sistim persamaan linier dan langkah- langkah penyelesaian yang dianjurkan. Contoh 6.1. Seorang ibu membeli 3 kilogram salak dan 2 kilogram anggur. Ibu tersebut harus membayar sebesar Rp 17 000,- Sedangkan ibu lain yang membeli 3 kilogram salak dan 5 kilogram anggur harus membayar Rp 29.000,-. Jika pedagang memberlakukan harga yang tetap terhadap kedua ibu- ibu tadi, berapa harga perkilogram salak dan harga perkilogram anggur? Selanjutnya berapa harga yang harus dibayar jika seseorang membeli x kg salak dan y kg anggur? Untuk menjawab persoalan di atas dianjurkan untuk menempuh langkahlangkah berikut, yang mungkin hanya dilakukan secara implisit. 1. Kita misalkan bilangan yang ingin kita cari (dalam hal ini harga satu kilogram salak dan harga satu kilogram anggur) masing- masing sebagai a dan b. Kita membuat persamaan matematika dari persoalan dalam bentuk cerita tadi. Disini sebenarnya kita sedang membuat model matematika suatu persoalan. Untuk soal di atas model matematika yang kita peroleh adalah 3a + 2b = 1700 (6.1) 3a + 5b = 29000 2. Kita menyelesaikan persamaan matematika di atas dengan teori matematika yang kita miliki. Dengan metode eleminasi dan substitusi balik kita memperoleh a = 3000 dan b = 4000.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 160 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Mensubsitusikan secara serempak nilai a dan b yang diperoleh ke sistim persamaan yang dimiliki untuk memeriksa apakah hasil yang kita peroleh benar atau tidak. 4. Menyimpulkan bahwa harga satu kilogram salak adalah Rp 3000 dan harga satu kilogram anggur adalah Rp 4000. Jadi harga x kg salak dan y kg anggur adalah H = 3000x + 4000y Jadi dapat dipahami bahwa pemodelan atau menerjemahkan masalah sehari-hari ke persamaan matematika merupakan bagian yang sangat penting dalam menyelesaikan persoalan sehari- hari dengan menggunakan matematika. Pentingnya pemodelan dalam matematika juga dinyatakan oleh Prof. J. Neyman, yang dikutip dari Meyer, sebagai berikut: Whenever we use mathematics in order to study some observational phenomena we must essentially begin by building a mathematical model (deterministic or probabilistic) for these phenomena. Of necessity, the model must simplify matters and certain details must be ignored. The success of the model depends on whether or not the details ignored are really unimportant in the development of the phenomena studied. The solution of mathematical problems may be correct and yet be in considerable disagreement with the observed data simply because the underlying assumptions made are not warranted. It is usually quite difficult to state with certainty, whether or not a given mathematical model is adequate before some observational data are obtained. In order to check the validity of the model, we must deduce a number of
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 161 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
consequences of our model and then compare these predicted results with observations. [Kapan saja kita menggunakan metematika untuk mempelajari fenomena yang teramati, kita mesti perlu mulai dengan membangun suatu model matematika (determisistik atau probabilistik) untuk fenomena tersebut. Sangat penting, model yang dibuat harus menyederhanakan persoalan dan beberapa rincian mesti diabaikan. Keberhasilan model bergantung pada apakah rincian yang diabaikan benar- benar tidak penting dalam pengembangan fenomena yang dipelajari. Biasanya sangat sulit untuk menyatakan dengan pasti, apakah suatu model matematika adalah tepat atau tidak sebelum diperoleh data pengamatan. Dalam rangka memeriksa validitas model, kita harus menurunkan sejumlah konsekuensi (dalil) dari model kita dan membandingkan hasil dugaan teoritis dengan pengamatan] (Meyer [16]).
UNEJ
Daftar Isi
Judul
JJ J
Pembuatan model dari suatu persoalan adalah ibarat pembuatan peta suatu wilayah. Dalam proses pembuatan peta, mesti ada penyederhanaan, yaitu mengabaikan rincian hal-hal yang tidak menjadi kepentingan. Sangat jelaslah bahwa peta yang baik adalah peta yang sederhana namun memuat secara akurat informasi yang diperlukan. Peta yang terlalu rinci, dalam hal tertentu menjasdi tidak komunikatif, karena terlalu banyak informasi yang tidak diperlukan. Sementara, di lain pihak, peta yang terlalu sederhana yang mengabaikan informasi yang penting, dapat menjerumuskan pembacanya kepada sasaran yang keliru. Demikian juga, dalam menyelesaikan persoalan dengan menggunakan matematika, biasanya kita selalu memulai dengan model yang paling sederhana yang berarti banyak informasi yang diabaikan. Karenanya penyelesaian persoalan secara matematis ini, mungkin benar tapi tidak bermanfaat dan tidak bermakna, karena model yang diban-
I II
Hal. 162 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gun tidak sesuai dengan data yang diamati, akibat adanya asumsi penting yang dibuat untuk mendasarinya diabaikan. Itulah sebabnya dalam penyelesaian persoalan secara matematika (atau statistika khususnya), kita memang biasanya mulai dari model yang sederhana kemudian dikembangkan secara berangsur-angsur ke model yang lebih kompleks yang semakin sesuai dengan kondidi riil di lapangan. Pada Contoh 1.1, sebenarnya setelah diperoleh kesimpulan akhir tentang harga barang, hasil tersebut perlu diperiksa atau dicocokkan dengan keadaan riil dilapangan dengan mengambil beberapa informasi yang lain, apakah temuan tersebut berlaku, menyimpang sedikit atau banyak. Sehingga kita bisa mengambil langkah apakah model yang kita pakai perlu diperbaiki atau tidak. Pada Contoh 1.1, ada asumsi yang dikenakan dalam persoalan tersebut yaitu pedangang diasumsikan mengenakan harga yang tetap kepada semua pembeli. Ini berarti peubah harga dianggap merupakan peubah tetap yang tidak bersifat acak. Dengan demikian mengambil dua pembeli sudah cukup untuk mementukan atau menghitung harga dua komuditas (anggur dan salak).
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 163 dari 234
Cari Halaman
Persoalan akan menjadi lebih kompleks apabila dalam kenyataan di lapangan pedagang mengenakan harga yang berbeda-beda kepada pembeli dan sangat boleh jadi kenyataan inilah yang banyak terjadi di lapangan, terutama di pasar-pasar tradisional. Dalam kondisi ini ada kemungkinan dari beberapa pembeli diperoleh informasi (data) yang berbeda- beda misalnya dari 10 pembeli diperoleh informasi seperti pada Tabel 6.1 yang berupa data fiktif. Kedua sifat alami dari gejala ini menuntut pemodelan yang berbeda. Pemodelan yang pertama yang tidak memperhitungkan adanya sebaran harga
Kembali
Layar Penuh
Tutup
Keluar
Tabel 6.1: Tabel jumlah (kg) salak dan anggur dan harga yang dibayar Nomor Jumlah Kg Jumlah Kg Jumlah Pembeli Salak (X1 ) Anggur (X2 ) Harga dalam Rupiah (H) 1 2 4 20 500 2 6 3 29 000 3 3 2 17 000 4 4 5 31 500 5 5 6 40 000 6 6 3 30 500 7 3 5 29 000 8 2 2 14 500 9 5 6 39 500 10 6 6 41 000
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 164 dari 234
Cari Halaman
disebut pemodelan deterministik (matematika). Dalam pemodelan ini peubah yang diamati dianggap tetap (fixed) dan tidak memiliki sebaran sehingga hubungan yang diperoleh merupakan hubungan matematika yang bersifat fungsional murni (misalnya, y = f (x)). Pemodelan yang kedua, menganggap peubah harga berubah- ubah dengan sebaran tertentu (misalnya, normal). Pemodelan ini disebut pemodelan stokastik (statistika). Hubungan yang diperoleh selain mengandung komponen fungsional, juga mengandung adanya galat yang merupakan peubah acak yang berdistribusi de-
Kembali
Layar Penuh
Tutup
Keluar
ngan sebaran tertentu. Jadi hubungan yang diperoleh menjadi y = f (x, α, β)+ e, dengan e adalah peubah acak/ random yang berdistribusi normal, misalnya. Fungsi f dan sebaran e biasanya bergantung kepada suatu konstanta yang belum diketahui yang disebut parameter. Parameter inilah yang biasanya menjadi fokus kepentingan dalam pemodelan statistika. Dalam contoh di atas X1 , X2 dan Y disebut variabel/ peubah yang diketahui dari data sedangkan α dan β adalah parameter yang akan dicari). Sehingga persamaan matematika yang sekarang harus diselesaikan adalah h = β1 x1 + β2 x2 + . Selanjutnya dengan mengenakan beberapa pembatasan atau asumsi, dalam statistika, diperoleh berbagai variasi model. Asumsi yang paling sederhana yang juga menghasilkan model yang paling sederhana adalah bahwa ei berdistribusi identik dan independen. Model-Statistika Linier membahas berbagai alternatif model serta penyelesaiannya. Dengan prosedur stokastik mengˆ hasilkan persamaan yang berupa dugaan harga (H) ˆ = 3001, 73x1 + 3968, 40x2 h dengan 3001,732 disebut penduga β1 atau βˆ1 yaitu dugaan harga 1 kg salak dan 3968,40 disebut βˆ2 yaitu digaan harga 1 kg anggur.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 165 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.2.
Langkah-langkah Penting Dalam Pemodelan
6.2.1.
Langkah penting dalam Pemodelan secara Umum
Dari uraian pada Contoh 1.1 sebenarnya sudah tergambar langkah- langkah yang penting dalam pemodelan secara umum. Langkah- langkah tersebut dapat diuraikan secara lebih eksplisit seperti berikut ini.
UNEJ
Daftar Isi
Penentuan model Langkah ini meliputi: 1. menentukan/ mengidentifikasi peubah;
Judul
2. menentukan parameter yang menjadi kepentingan; 3. menentukan hubungan antara parameter dan peubah serta 4. menentukan distribusi komponen acak; Penentukan hubungan serta distribusi ini tentunya disesuaikan dengan kondisi dan sifat permasalahan yang dihadapi. Menyelesaikan model Langkah ini meliputi menghitung nilai variabel atau konstanta yang ada pada model dengan menggunakan kaidah- kaidah matematika maupun statistika baik secara analitik maupun numerik.
JJ J
I II
Hal. 166 dari 234
Cari Halaman
Kembali
Layar Penuh
Melakukan verifikasi Hasil yang diperoleh dari penyelesaian model sebelum disimpulkan atau diinterpretasikan ke dalam persoalan nnyata semestinya diverifikasi apakah sudah sesuai dengan model yang digunakan. Langkah ini penting untuk meyakinkan tidak adanya kesalahan
Tutup
Keluar
perhitungan, kesalahan pemrograman (kalau menggunakan komputer), maupun kesalahan konsep matematika yag digunakan dalam menyelesaikan model. Menarik kesimpulan Selanjutnya hasil yang diperoleh diinterpretasikan sesuai dengan persoalan riil yang menjadi dasar pemilihan model. Melakukan uji kecocokan Karena pada umumnya pemodelan dimulai dari yang sederhana dengan menggunakan asumsi- asumsi secara ketat, maka tidak mustahil hasil yang dihasilkan tidak terlalu cocok dengan kondisi riil di lapangan. Melalui langkah ini seseorang mendapat gambaran apakah model yang dipilih sesuai atau perlu menggunakan meningkatkan kompleksitas modelnya dengan menambah variabel maupun konstanta dalam model atau mencoba hubungan fungsi yang lebih kompleks.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 167 dari 234
6.2.2.
Langkah penting dalam Pemodelan Stokastik Cari Halaman
Sebenarnya langkah- langkah dalam pemodelan stokastik sudah tergambar langkah- langkah yang penting dalam pemodelan secara umum. Namun ada beberapa langkah yang sifatnya khas yang tidak dilakukan dalam pemodelan umum. Sifat khas ini disebabkan karena dalam pemodelan statistika ada parameter yang menjadi kepentingan dan ada komponen galat yang bersifat acak (distribusional). Langkah-langkah penting yang harus ditempuh dalam pemodelan stokastik dapat diuraikan seperti berikut ini.
Kembali
Layar Penuh
Tutup
Penentuan model. Langkah ini meliputi: Keluar
1. menentukan/ mengidentifikasi peubah; 2. menentukan parameter yang menjadi kepentingan; 3. menentukan hubungan antara parameter dan peubah serta 4. menentukan distribusi komponen acak. Dalam pemodelan stokastikpun penentuan hubungan serta distribusi ini tentunya disesuaikan dengan kondisi dan sifat permasalahan yang dihadapi.
UNEJ
Daftar Isi
Judul
Mengestimasi parameter yang menjadi kepentingan. Langkah ini identik dengan menyelesaikan persamaan matematika yang diperoleh sebagai model matematika dari permasalahan yang dihadapi. Langkah ini meliputi menghitung nilai parameter-parameter yang ada pada model dengan menggunakan kaidah- kaidah matematika maupun statistika baik secara analitik maupun numerik. ”
JJ J
I II
Hal. 168 dari 234
Cari Halaman
Menarik kesimpulan/ melakukan uji inferensi. Dalam pemodelan stokastik, karena peubah yang dihadapi adalah peubah yang bersifat random/ acak maka hasil yang diperoleh masih harus diuji 1. apakah hasil yang diperoleh secara statistika signifikan atau tidak;
Kembali
Layar Penuh
2. bagaimana besaran kesalahan dari dugaan yang diperoleh, 3. bagaimana sebaran atau rentangan atau interval dari hasil yang diperoleh?
Tutup
Keluar
Melakukan uji kecocokan (goodness of fit) atau mengadakan diagnostik model. Hasil yang diperoleh selain diuji signifikansinya, mestinya juga diuji kecocokannya dengan kondisi riil dilapangan. Melalui langkah diagnostik diperiksa UNEJ
1. apakah ada kecocokan atau tidak antara asumsi yang dilakukan dengan kondisi riil data;
Daftar Isi
2. apakah perlu melalukan remidi (mentransformasi data sehingga kondisi yang disyaratkan oleh model terpenuhi) atau
Judul
3. apakah perlu mencari alternatif model yang lebih cocok. JJ J
Uji kecocokan ini biasanya dilakukan pada sisa (residu) dari penggunaan model. Itu sebabnya langkah ini kebanyakan dilakukan sesudah model dipilih. Untuk melakuakn uji ini diperlukan data yang parameternya diketahui (data hasil simulasi). Bagi para teorisi statistika ( statistisi ), yang mereka lakukan adalah menurunkan metode umum/ prosedur dalam mengestimasi parameter, menguji dan mendiagnosis dan meremidi model yang mereka buat. Sedangkan tugas praktisi (statistikawan) adalah menerapkan metode sesuai dengan persyaratan yang ditentukan atau yang dihasilkan oleh para statistisi. Bagi para teorisi statistika, atau statistisi, yang mereka lakukan adalah menurunkan metode umum/ prosedur dalam mengestimasi parameter, menguji dan mendiagnosis dan meremidi model yang mereka buat. Sedangkan
I II
Hal. 169 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tugas praktisi menerapkan metode sesuai dengan persyaratan yang ditentukan atau yang dihasilkan oleh para statistisi. Selain itu, tugas para teorisi statistika (statistisi) adalah juga membangun berbagai model alternatif, untuk berbagai kondisi dilapangan. Kemudian, secara deduktif (matematis) menurunkan sifat- sifat dari model tersebut, cara mengestimasi parameter, cara mendiagnosis model serta mengaplikasikan model- model yang diturunkan kedalam suatu paket komputer yang ramah (gampang dipakai dan dipahami) sehingga bisa dipakai oleh para praktisi di lapangan. Lebih tegasnya menurut Mendenhall (1979) dikatakan
UNEJ
Daftar Isi
Judul
The statisticians study various inferential procedures, looking for the best predictor or decicion-making process for a given situation. Even more important, the statistician provides information concerning the goodness of an inferential procedures. [Para statistisi mempelajari berbagai prosedur penarikan kesimpulan, mencari penduga terbaik- atau proses pengambilan keputusan untuk kondisi tertentu. Bahkan lebih jauh mereka menyediakan informasi berkaitan dengan kecocokan dari suatu prosedur pengambilan keputusan] (Mendenhall [14]). Bagi para analis (praktisi) statistika atau para statistikawan, tugas pokoknya adalah mempelajari model- model yang ditawarkan beserta persyaratan dan prosedur yang harus ditempuh dalam menerapkan model tersebut. Hal ini sejalan dengan fungsi dan tujuan ilmu statistika itu sendiri sebagaimana digambarkan Wackery et al. [25] bahwa tujuan statistika adalah membuat
JJ J
I II
Hal. 170 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
kesimpulan tentang populasi berdasarkan informasi yang diperoleh pada suatu sampel dan untuk memberikan ukuran derajat kecocokan dari kesimpulan itu. UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 171 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.3.
Metode Mengestimasi Parameter
Salah satu langkah pokok dalam pemodelan statistika adalah mengestimasi parameter yang menjadi kepentingan. Dalam model linier ada dua kelompok parameter yang menjadi kepentingan yaitu yang paling penting adalah parameter efek tetap atau parameter regresi βj (j = 0, 1, 2, ..., k tergantung pada dimensinya) dan biasanya diperlukan juga mengestimasi parameter dispersi (misalnya ,σ tergantung pada model linier yang dihadapi). Kadangkadang parameter dispersi ini diasumsikan diketahui. Ada dua metode yang banyak dipakai dalam mengestimasi parameter efek tetap dalam model linier yaitu: 1. metode kuadrat terkecil (least square method) dan 2. metode likelihood maksimum (maximum likelihood method).
6.3.1.
Metode kuadrat terkecil
Pada dasarnya parameter yang diestimasi adalah parameter dari garis regresi dari model yang mewakili populasi. Estimasi ini diperoleh berdasarkan informasi atau sebaran sampel yang dimiliki. Metode least square, menggunakan pendekatan geometris. Secara geometris, garis yang paling mewakili sebaran sampel adalah garis yang mempunyai simpangan minimum, atau galat terkecil dengan pencaran data. Untuk memudahkan perhitungan, jarak yang aslinya berupa harga mutlak dari galat, |i | diganti dengan kuadrat galat tersebut e2i .
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 172 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Langkah langkah dalam mengestimasi parameter dari sampel sebanyak n dengan metode kuadrat terkecil adalah: 1. mengubah persamaan model yi = xi β + i menjadi i = xi β − yi ; 2. P mencari bentuk kuadrat dan jumlah kuadrat dari kesalahan, yaitu Q = n 2 i=1 i ; 3. menghitung penduga parameter dengan mencari minimum dari Q terhadap βj . Dalam pembicaraan kita di bidang statistika, kalau kita membicaraan tentang maksimum/ minimum suatu fungsi, maka yang menjadi kepentingan kita adalah nilai peubah atau paremeter, yang menyebabkan fungsi itu mencapai maksimum/ minimum dan bukan nilai maksimum/ atau minimum fungsi tersebut.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 173 dari 234
Cari Halaman
6.3.2.
Metode likelihood maksimum
Kalau metode kuadrat terkecil menggunakan pendekatan geometris, maka metode likelihood maksimum menggunakan pendekatan distribusi. Dari data yang dimiliki serta asumsi distribusi yang diberlakukan pada data tersebut kita memperoleh fungsi likelihood dari data tersebut. Jelasnya langkah tersebut dapat diuraikan sebagai berikut. Langkah- langkah dalam mencari penduga likelihood maksimum adalah seperti berikut ini.
Kembali
Layar Penuh
Tutup
Keluar
1. Tentukan likelihood dari data Y = (Y1 , Y2 , · · · , Yn )T ,yang mempunyai fungsi kepadatan peluang masing-masing ψ(θ), yaitu L=
n Y
ψ(θ)
i=1
Fungsi likelihood tidak lain adalah fungsi kepadatan probabilitas darai Y , hanya saja nilai y dianggap diketahui (dari data), tetapi parameternya (θ) yang tidak diketahui.
UNEJ
Daftar Isi
Judul
2. Tentukan maksimum dari L atau log −L terhadap parameter θ. JJ J
6.3.3.
I II
Mencari maksimum dengan metode numerik
Pada umumnya maksimum suatu fungsi tidak bisa diperoleh secara analitik, oleh karenanya diperlukan pendekatan yang disebut metode numerik. Mencari maksimum/ minimum suatu fungsi F () pada dasarnya sama dengan mencari nilai nol atau penyelesaian fungsi f (θ) = F 0 (θ) = dF/dθ. Metode numerik yang biasa dipakai dalam mencari maksimum likelihood adalah Metode Newton-Raphson yang merupakan metode iteratif. Langkah- langkah pokok dari metode Newton-Raphson ini dapat diuraikan sebagai berikut:
Hal. 174 dari 234
Cari Halaman
Kembali
Layar Penuh
1. menentukan nilai awal b0 2. melakukan iterasi sampai konvergen (sampai kriteria konvergensi terpenuhi)
Tutup
Keluar
b1 = b0 −
F 0 (b0 ) F 00 (b0 )
(6.2)
b1 = b0 −
f (b0 ) f 0 (b0 )
(6.3)
atau
dimana f () = F 0 ().
UNEJ
Daftar Isi
Apabila peubah atau parameternya berdimensi tinggi, maka fungsi turunan pertamanya berupa vektor (D) sedang turunan keduanya akan berupa matriks yang disebut matriks Hessian (H). Bentuk multivariat dari NewtonRaphson ini adalah b1 = b0 − D(b0 ) H−1 (6.4) (b0 ) Lebih khusus lagi, dalam statistika matriks Hessian ini kadang kadang lebih sederhana jika diganti dengan negatif dari nilai harapan nya yang disebut matriks informasi, dinotasikan I = −E[H]. Persamaan iterasi yang menggunakan matriks informasi dikenal dengan metode skoring dari Fisher (Fisher’s scoring) yang ditunjukkan oleh persamaan berikut. b1 = b0 + D(b0 ) I −1 (b0 )
Judul
JJ J
I II
Hal. 175 dari 234
Cari Halaman
Kembali
(6.5)
Ada tiga hal penting yang harus diperhatikan dalam mengaplikasikan metode numerik (Newton-Raphson maupun Skoring dari Fisher) yaitu:
Layar Penuh
Tutup
1. algorithma yang dipakai (lengkap atau terpartisi), Keluar
2. nilai awal dan 3. kriteria konvergensi Nilai awal untuk b0 ditentukan sedemikian sehingga pada saat itu b0 = y. Sedangkan kriteria konvergensi bisa menggunakan maks(|b1 − b0 |) , untuk bilangan positif sangat kecil, misalnya 10−3 .Jika parameter yng diestimasi terdiri atas beberapa unsur, maka ada beberapa cara yang ditempuh dalam mengestimasi dengan menggunakan metode Newton-Raphson yaitu seperti berikut ini.
UNEJ
Daftar Isi
Judul
1. Mengestimasi secara serempak dengan memperlakukan parameteryang diestimasi sebagai sebuah vektor penduga. Cara ini disebut pendekatan algoritma penuh. Cara ini cocok apabila setiap unsur dari vektor parameter mempunyai sifat-sifat (konvergensi) yang relatif sama. 2. Mengelompokkan unsur-unsur parameter yang sejenis. Unsur-unsur sejenis lalu diberlakukan sebagai suatu vektor. Dengan demikian akan diperoleh lebih dari satu vektor parameter. Masing-masing vektor parameter yang diestimasi dengan cara multivariate, tetapi pendugaan vektor satu dengan lainnya dilakukan secara selang-seling. Selang seling dapat dilakukan pada setiap iterasi (nested), atau setelah masingmasing konvergen pada kondisi tertentu(zig-zag). Algoritma seperti ini disebut algoritma terpartisi (partitioned algorithm). Pengelompokan biasanya dilakukan berdasarkan parameter regresi (β) dan parameter dispersi (φ) yang biasanya kedua jenis parameter ini mempunyai sifatsifat yang berbeda terutama dilihat dari kecepatan konvergensinya.
JJ J
I II
Hal. 176 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Pembahasan kedua algoritma di atas (penuh dan terpartisi) dapat dilihat pada Smyth [19] dan Smyth [20].
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 177 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.4.
Model Linier dan Perkembangannya
Perkembangan pemodelan stokastik, terutama model linier, dapat dikatakan dimulai pada abad ke 19 yang didasari oleh teori matematika yang diletakkan diantaranya oleh Gauss, Boole, Cayley dan Sylvester yang terkait dengan teori invarian dalam aljabar. Teori invarian aljabar mempelajari bentuk-bentuk kuantitas yang tidak berubah terhadap suatu transformasi linier. Teori invarian ini yang mendasari perkembangan teori nilai eigen, vektor eigen, matriks determinan, metode dekomposisi dan masih banyak lagi yang lainnya. Salah satu contoh dalam statistika kita tahu bahwa korelasi dua peubah acak tidak berubah walaupun peubah-peubah tersebut mengalami transformasi. Perkembangan model linier dimulai dengan perkembangan analisis regresi pada abad 19 oleh Pearson perkembangan korelasi segera setelah itu. Teori regresi ini yang menjadi dasar perkembangan teori model linier. Perkembangan model linier tidak bisa dilepaskan dengan perkembangan teori mtriks atau aljabar linier. Melalui teori matriks (determinan, invers, perkalian matriks) pembahasan model linier dapat didekati secara umum. Dalam subbab ini perkembngan model linier lebih dititik beratkan dari dua asumsi dasar yaitu distribusi dan indeoendensi kesalahan. Sebagaimana diuraikan sebelumnya, bahwa pemodelan dimulai dari yang sederhana, yang secara matematis mudah diselesaikan, kemudian berkembang ke arah yang lebih realistik. Hal ini dapat dilakukan dengan menerapkan berbagai asumsi yang berbeda terhadap distribusi kesalahan dalam model yang digunakan. Prinsip seperti ini telah berkembang dari model
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 178 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
yang paling sederhana (klasik), ke model hirarkis tergeneralisasi yang saat ini merupakan pemodelan yang paling terkini. Dalam sub-bab ini diuraikan secara ringkas perkembangan model linier ditinjau dari segi distribusi dan independensi kesalahannya. UNEJ
6.4.1.
Model linier klasik Daftar Isi
Di atas telah disebutkan bahwa pemodelan stokastik memiliki bentuk umum Y = Xβ +
(6.6)
Dalam hal ini merupakan kesalahan atau galat yang diasumsikan merupakan peubah acak yang berasal dari suatu distribusi tertentu, misalnya normal. Peubah x adalah peubah yang bukan acak dan adalah parameter yang menentukan koefisien dari peubah peubah tetap tadi. Dalam ilustrasi pada Contoh 1.1. misalnya, dianggap bahwa sebenarnya ada hubungan yang bersifat tetap yang menentukan harga barang di pasar. Namun, selain itu masih ada lagi faktor lain yang bersifat acak yang menyebabkan harga barang tadi dalam kenyataannya dari pembeli ke pembeli mungkin menyimpang dari fungsi hubungan tadi. Dalam pemodelan statistika/ stokastik, kedua komponen ini dipisahkan yaitu yang bersifat tetap dan fungsional dinotasikan dengan f (x, β), yang bisa disebut sebagai komponen tetap (fixed), sedangkan komponen lainnya, , yang bersifat acak disebut sebagai komponen acak (random component) atau dalam hal ini secara khusus disebut komponen kesalahan (error component). Dari segi fungsi hubungan f , bentuk yang paling
Judul
JJ J
I II
Hal. 179 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sederhana adalah hubungan linier, sehingga dari aspek ini model yang paling sederhana yang kita miliki adalah model linier. Sedangkan dari segi komponen acaknya, yang paling sederhana adalah asumsi bahwa kesalahannya berdistribusi normal dan saling independen antara satu respon dengan respon lainnya. Asumsi ini menghasilkan model linier normal sederhana atau Normal Linear Models (NLM). Dari kedua hal tersebut lahirlah yang disebut model normal sederhana atau model linier klasik yang secara formal dapat diuraikan sebagai berikut. Definisi 6.3 (Bentuk dan Asumsi Model Linier Klasik). Model: yi =
k X
UNEJ
Daftar Isi
Judul
JJ J
xij βi + i
I II
(6.7)
j=0
atau untuk keseluruhan respon dapat dituliskan dalam bentuk matriks seperti persamaan (6.6),
Hal. 180 dari 234
Cari Halaman
Y = Xβ + Kembali
Asumsi: xi bukan peubah acak dan diukur tanpa kesalahan dan i independen dengan 0i untuk setiap i 6= i0 dan masing-masing berdistribusi N (0, σ 2 ). Dari asumsi diatas diperoleh bahwa secara keseluruhan dapat dianggap berdistribusi multivariat normal (MVN) dengan koefisen variasi konstan,
Layar Penuh
Tutup
Keluar
yang dinotasikan dengan ∼ M V N (0, σ 2 I). Model mensyaratkan bahwa respon ke i dan ke i0 adalah saling bebas (independen), yang berarti tidak ada korelasi diantaranya. Beberapa referensi yang membahas model linier normal ini diantaranya adalah Neter et al. [18], Bowerman et al.[1]. UNEJ
6.4.2.
Model linier tercampur
Dalam kenyataan, di lapangan banyak pengamatan yang menghasilkan respon yang tidak saling independen. Misalnya, apabila pada suatu subjek dilakukan pengamatan yang berulang- ulang maka respon yang diperoleh antara satu dengan sebelumnya, atau satu dengan berikutnya, dapat dipastikan akan saling berkorelasi. Dengan demikian, pengamatan yang diperoleh bukan lagi merupakan hasil pengamatan atau respon tunggal, tetapi merupakan vektor respon. Tentu saja respon seperti ini dapat ditangani dengan metode multivariat. Namun ada kekhasan dari pengamatan seperti ini, yaitu korelasi/ hubungan antara respon satu dengan lainnya biasanya berpola, sehingga dianggap kurang pas kalau ditangani dengan metode multivariat biasa. Untuk menangani respon-respon semacam ini model linier klasik di atas lalu dikembangkan menjadi model linier campuran atau Linear Mixed Models (LMM). Dalam model ini hubungan antara respon yang satu dengan lainnya dianggap berasal dari pengaruh suatu peubah yang tidak kentara atau laten (subjek, misalnya). Untuk itu komponen tetap (f (x)) diuraikan lagi menjadi komponen tetap dan komponen efek acak (random effects). Dengan demikian model ini memiliki dua komponen acak yaitu komponen galat () dan kompo-
Daftar Isi
Judul
JJ J
I II
Hal. 181 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nen efek acak yang biasanya dinotasikan dengan u. Model ini biasa disebut model linier campuran (linear mixed model) yang dapat didefinisikan sebagai berikut. Definisi 6.4 (Bentuk dan Asumsi Model Linier Campuran).
UNEJ
Model:
Daftar Isi
Y = Xβ + Zu +
(6.8) Judul
Asumsi: u ∼ M V .
N (0, σ12 I)
dan ∼ M V
N (0, σ22 I).
u independen dengan JJ J
Sebenarnya varians u dapat bervariasi sehingga membentuk matriks varianskovarians dari (Y) yang bervariasi juga. Struktur matriks varians-kovarians ini dapat dibentuk sesuai kondisi respon yang dihadapi. Bentuk yang paling sederhana di atas menghasilkan matriks varians-kovarians yang disebut matriks uniform atau compound symmetry. Dengan menggunakan jumlah peubah acak yang berdistribusai normal dan saling independen bisa diperoleh bahwa bentuk varians-kovarian Y , yang termasuk jenis uniform, adalah V=
σ12 + σ22 · · · σ12 2 2 σ1 · · · σ1 + σ22 .. .. .. . . . 2 σ1 ··· σ12
··· ··· .. .
σ12 σ12 .. .
· · · σ12 + σ22
I II
Hal. 182 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
atau secara umum 1 ··· .. . . . . V = φ ρ ··· . . .. . . ρ ···
ρ ··· .. . . . .
ρ .. . 1 ··· ρ .. . . .. . . . ρ ··· 1
(6.9) UNEJ
Daftar Isi
Model ini mengasumsikan bahwa korelasi antara pengamatan satu dan lainnya bersifat konstan (uniform). Struktur lain yang juga banyak diterapkan adalah auto regresive 1 (ar1) atau disebut korelasi serial yaitu:
1
V = φ
ρ ρ2 .. .
ρ ρ2 . .. . .. ··· 1 . . . .. .
ρk · · · ρ2
· · · ρk . .. . .. ··· ρ ... ρ ρ 1
Judul
JJ J
(6.10)
Model ini mengasumsikan bahwa seiring dengan jarak yang makin jauh, maka korelasi/ hubungan antara respon tersebut semakin kecil. Model linier campuran/tercampur sering juga disebut dengan istilah model linier bertingkat (hierarchical linear model). Istilah bertingkat digunakan karena model ini biasa juga didefinisikan secara bertingkat seperti berikut ini.
I II
Hal. 183 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Definisi 6.5. Asumsi Model Linier Bertingkat Keluar
1. Ada efek acak ui yang berhubungan dengan strata atau subjek ke i, untuk i = 1, ...n dimana antara satu efek acak dengan lainnya saling independen dan berdistribusi normal dengan mean 0; 2. Kondisional terhadap efek acak ke i , respon-respon di dalam strata ini juga saling independen dan berdistribusi normal dengan mean dan varians konstan. Model linier Campuran tidak menjadi fokus pembahasan dalam buku ini. Bagi pembaca yang tertarik, referensi yang bisa dijadikan acuan untuk mempelajari model linier bertingkat ini diantaranya adalah Bab 4 dari Davidian dan Giltinan [2], Diggle et al. [3], Laird dan Ware [9]. Sedangkan untuk model yang lebih umum yaitu termasuk model-model non-linier dapat dilihat pada Davidian dan Giltinan [2]
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 184 dari 234
6.4.3.
Model linier tergeneralisasi
Kondisi lain di lapangan yang tidak dapat ditangani langsung oleh model linier klasik adalah adanya kenyataan bahwa, distribusi respon tidak mesti normal. Memang kondisi seperti ini bisa ditanggulangi dengan mengadakan transpormasi dari respon. Transpormasi yang banyak dipakai adalah transpormasi logaritma. Namun, ada beberapa permasalahan yang mungkin timbul sebagai efek dari transpormasi ini misalnya seperti berikut ini. Respon yang sudah ditranspormasi mungkin mendekati distribusi normal, tetapi akibat transpormasi ada kemungkinan syarat yang lain (syarat ketidak-bergantungan)
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
menjadi tidak terpenuhi. Adanya kerancuan dalam menafsirkan hasil penelitian oleh karena efek yang diuji adalah dalam skala logaritma, bukan dalam sekala aslinya. Hal ini menyebabkan kesimpulan terasa janggal misalnya, ”ada hubungan positif antara log-konsentrasi pemupukan dengan log-panen”. Untuk menangani kondisi dimana respon yang ada tidak berdistribusi Normal, tetapi masih saling bebas, maka para statistisi yang dipelopori oleh Nelder dan Wedderburn [17] telah mengembangkan model linier yang dikenal dengan Gereralized Linear Model (GLM). Model linier ini menggunakan asumsi bahwa repon memiliki distribusi keluarga ekponensial. Distribusi keluarga eksponensial adalah distribusi yang sifatnya lebih umum, dimana distribusi- distribusi yang banyak kita kenal (Normal, Gamma, Poisson) termasuk di dalamnya dan merupakan bentuk- bentuk khusus dari distribusi Keluarga Eksponensial. Definisi distribusi Keluarga Eksponensial ini belum dibahas pada diktat ini dan diharapkan akan dapat dibahas pada edisi tahun berikutnya. Kalau kita simak model linier klasik, kita menemukan beberapa hal yang sifatnya khas dan istimewa yaitu:
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 185 dari 234
Cari Halaman
1. ada komponen tetap yang disebut prediktor linier ; Kembali
2. respon yi berdistribusi normal dan saling independen dan 3. mean yi adalah µi =
Pk
Layar Penuh
j=0 xij βj .
Dalam model linier tergeneralisasi, hubungan di atas mengalami perubahan atau generalisasi, sebagaimana dalam definisi berikut:
Tutup
Keluar
Definisi 6.6 (Asumsi Model Linier Tergeneralisasi). Model linier tergeneralisasi adalah model yang mengandung tiga hal yaitu: P 1. komponen tetap yang disebut prediktor linier ηi = kj=0 xij βj ; UNEJ
2. respon yi berdistribusi secara independen dalam keluarga eksponensial; 3. hubungan antara mean dengan prediktor linier ditunjukkan fungsi g(.) yang disebut fungsi ’link’ sedemikian sedingga g(µi ) = ηi . Fungsi g() disebut fungsi hubungan (link-function). Ada fungsi hubungan khusus yang disebut fungsi hubungan kanonik atau natural yang berkaitan erat dengan distribusi y. Misalnya, jika distribusinya normal maka g() adalah identitas. Dari hal di atas dikatakan bahwa komponen penting dalam model linier tergeneralisasi ada tiga yaitu: (i) adanya prediktor linier,
Daftar Isi
Judul
JJ J
I II
Hal. 186 dari 234
Cari Halaman
(ii) adanya distribusi keluarga eksponensial dan Kembali
(iii) adanya fungsi-hubungan. Layar Penuh
Referensi yang umum dijadikan acuan utama mempelajari model linier tergeneralisasi ini adalah Generalized Linear Models oleh McCullagh dan Nelder [13], sedangkan sebagai pemula dapat menggunakan pengantar yang ditulis oleh Dobson [4].
Tutup
Keluar
6.4.4.
Model linier campuran tergeneralisasi
Model linier ini muncul akibat adanya tuntutan bahwa, di lapangan sangat mungkin terjadi adanya respon yang tidak saja tidak berdistribusi normal tetapi juga tidak independen. Model linier ini merupakan gabungan antara model linier campuran dan model linier tergeneralisasi. Model linier campuran ini ada dua macam.
UNEJ
Daftar Isi
1. Model yang pertama komponen acaknya diasumsikan berdistribusi Normal dan menggunakan bentuk aditif seperti pada model linier campuran yang tidak tergeneralisasi. Model linier ini yang biasa disebut sebagai Model linier campuran tergeneralisasi (GLMM=Generalized Linear Mixed Model)
Judul
JJ J
I II
2. Model yang kedua menggunakan bentuk multiplikatif dan komponen Hal. 187 dari 234 acaknya tidak dibatasi dengan distribusi Normal.l Model linier ini sering juga disebut Model linier hirarkis tergereralisasi bertingkat (HGLM=Hierarchical Cari Halaman Generalized Linear Model). Model linier ini termasuk model linier yang relatif baru dan masih sedang dikembangkan (lihat misalnya Lee dan Kembali Nelder [10] dan Tirta [21]. Gambar berikut menunjukkan kedudukan masing-masing model linier. Layar Penuh
3. Untuk data yang sekaligus tidak normal dan tidak saling bebas, Liang & Zeger [11] dan Zeger & Liang [27] memperkenalkan metode yang disebut disebut Generalized Estimating Equations (untuk selanjutnya disingkat GEE) yang merupakan sebuah analogi atau generalisasi mul-
Tutup
Keluar
tivariat dari quasi-likelihood. Manakala tidak ada fungsi likelihood yang pasti untuk dijadikan acuan, cukup beralasan untuk menduga/ mengestimasi dengan menyelesaikan sebuah analogi multivariat dari metode quasi-score yang diperkenalkan Wedderburn [26] dimana kita hanya perlu menentukan bentuk mean atau rataan (sebagai momen pertama) dan matriks varians-kovariansnya (sebagai momen kedua), tanpa perlu mengetahui bentuk pasti likelihoodnya. Pembahasan yang lebih detil dapat dibaca pada Diggle et al. [3].
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 188 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.
Pengembangan Lain Model Linier
Selain berkembang akibat variasi asumsi distribusi dari kesalahan, model linier juga berkembang ke arah variasi kondisi peubah bebas atau peubah penjelas X. Adapun asumsi dasar dari peubah X adalah bukan peubah acak (tidak memiliki distribusi) dan merupakan besaran kuantitatif. Dalam perkembangannya, ada kalanya Xj merupakan peubah acak dan Xj dan Xj0 tidak saling bebas, dalam kondisi begini, dikatakan terjadi multikolinieritas antara peubah bebas X. Tingginya multikolinieritas dapat menyebabkan adanya estimasi parameter tidak teliti. Secara matematis X −j dan Xj0 yang tidak saling bebas, menunjukkan bahwa salah satu kolom matriks X merupakan kombinasi linier linier dari kolom-kolom lainnya yang menyebabkan X tidak dalam rank penuh, sehingga invers matriks XT X menjadi tidak terdefinisikan. Ada beberapa prosedur atau tehnik untuk menangani masalah multikolinieritas, diantaranya adalah regresi Ridge (lihat Neter et al[18]). Tidak jarang juga kumpulan data yang kita miliki, sesungguhnya merupakan sekumpulan dari berapa kelompok data atau sampel sesungguhnya terdiri atas beberapa subsampel. Persoalan yang dihadapi adalah apakah model (garis regresi) masing-masing kelompok harus berbeda atau dapat digabung dalam satu moded yang sama. Dalam hal ini sebagian peubah penjelas Xj akan merupakan peubah kuantitatif, atau merupakan indikator kelompok atau grup dari kelompok yang ada pada data, sampel maupun populasi. Analisis model linier yang menangani data semacam ini menggunakan peuban boneka dummy variable dan dapat dilihat pada Neter et al[18].
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 189 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 190 dari 234
Cari Halaman
Kembali
Layar Penuh
Gambar 6.1: Ilustrasi Data yang menunjukkan adanya pencilan Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 191 dari 234
Cari Halaman
Kembali
Gambar 6.2: Ilustrasi Data yang memerlukan pemisahan model dari subsampelnya
Layar Penuh
Tutup
Keluar
6.6.
Outline Buku
Buku ini lebih banyak menekankan pada bentuk pemodelan linier yang berasumsi bahwa respon atau kesalahan saling bebas. Namun pada bagian akhir diberikan pengantar analisis data yang melihat respon yang tidak saling bebas dengan pendekatan quasy likelihood. Dari uraian yang telah dibicarakan sebelumnya dapat dilihat bahwa ada beberapa hal yang harus dikuasai sebelum membicarakan model-odel yang lebih spesifik, diantaranya: Kemampuan komputer. Kemampuan pemrograman atau penggunaan paket program statistika merupakan hal yang tidak dapat dihindarkan mengingat hampir seluruh perhitungan analisis statistika karena kompleksitas dan ukuran datanya, tidak efisien lagi dikerjakan secara manual. Dalam buku ini akan difokuskan pada aplikasi paket statistika yang merupakan program open source yang dapat diperoleh secara bebas di internet (http://www.r-project.org). Program ini sangat populer dikalangan peneliti statistika dan juga banyak diapliakskan dalam bidang finansial (Faraway[5]). Teori matriks. Hampir semua analiss data sekarang ini melibatkan data dalam ukuran besar, namun dapat disajikan dalam bentuk matriks atau vektor. Oleh karena itu sebelum membahas pemodelan lebih jauh pembahasan teori matrks juga sangat diperlukan.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 192 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.7.
Latihan Soal- soal
1. Sebutkan apakah perbedaan antara pemodelan stokastik dan pemodelan deterministik dan berikan contoh. 2. Sebutkan langkah-langkah penting dalam pemodelan stokastik. 3. Sebutkan komponen-komponen penting dalam model linier dan asumsinya. 4. Sebutkan persamaan dan perbedaan dari model linier normal, model linier campuran, model linier tergeneralisasi, model linier campuran tergeneralisasi, model linier hierarkis; 5. Sebutkan prinsip dasar dan langkah- langkah pokok dari metode likelihood maksimum.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 193 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 194 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
BAB
7 Daftar Isi
REGRESI LINIER SEDERHANA
Judul
JJ J
I II
Hal. 195 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Indikator Kompetensi Setelah membaca materi pada bab ini diharapkan pembaca menguasai kompetensi yang ditandai oleh kemampuan
UNEJ
1. menentukan model dan asumsi model linier normal Daftar Isi
2. mengestimasi parameter yang menjadi kepentingan dengan metode kuadrat terkecil 3. mengestimasi parameter yang menjadi kepentingan dengan metode likelihood maksimum
Judul
JJ J
I II
4. menentukan distribusi penduga likelihood maksimum dan uji inferensi Hal. 196 dari 234
5. menerapkan pendekatan matriks untuk regresi berganda; 6. dapat menggunakan paket/library lm() maupun menu R-Commander pada R untuk melakukan analisis regresi/ model linier normal
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
7.1.
Bentuk dan Asumsi
Misalkan hubungan antara peubah respon (Yi ) dengan peubah tetap (Xi ) untuk subjek i = 1, 2, ...n, ditentukan oleh Y1 = β0 + β1 X1 + 1 .. .. .. . . . Yi = β0 + β1 Xi + i (7.1) .. .. .. . . . Yn = β0 + β1 Xn + n
UNEJ
Daftar Isi
Judul
dengan: 1. Xi adalah peubah tetap yang tidak bersifat acak (lebih lanjut diasumsikan Xi diukur tanpa kesalahan);
JJ J
I II
Hal. 197 dari 234
2. i , yaitu komponen kesalahannya, adalah berdistribusi identik dan independen normal dengan mean 0 dan varian konstan (misalnya σ 2 );
Cari Halaman
0
3. kesalahan individu satu dengan lainnya saling bebas, yaitu untuk i 6= i , maka i ||i0 atau korelasi i dengan i0 adalah 0.
Kembali
Dari asumsi dapat ditentukan bahwa ekspektasi dari setiap renpon adalah E [Yi ] = β0 + β1 Xi
(7.2)
yang merupakan sebuah garis lurus yang kita sebut garis regresi populasi. Se-dangkan sebaran setiap pasangan (Xi , Yi ) alan berada pada atau sekitar garis tersebut sesuai dengan besarnya i .
Layar Penuh
Tutup
Keluar
7.2.
Estimasi Parameter
Dalam kenyataan, kita hanya memiliki pasangan-pasangan data (Xi , Yi ) untuk i = 1, 2, · · · , n. Dari data yang kita miliki kita ingin mengestimasi regesi populasi maupun sebaran simpangan datanya. Maka parameter yang menjadi kepentingan utama dalam regresi sederhana di atas adalah komponen β0 dari koefisien regresi β = . Parameter lain yang juga perlu diestiβ1 masi adalah komponen variasi σ 2 . Sebagaimana telah disebutkan sebelumnya ada dua metode yang akan digunakan dalam mengestimasi parameter yaitu metode kuadrat terkecil dan metode kecenderungan (likelihood) maksimum.
UNEJ
Daftar Isi
Judul
JJ J
7.2.1.
Estimasi dengan Metode Kuadrat Terkecil
Seperti telah diuraikan pada Bab 1, bahwa dengan metode kuadrat terkecil, secara geometris kita mencari garis sedemikian sehingga kesalahan (selisih ordinat titik terhadap garis) menjadi minimum. Untuk mengakomodasi tanda positif dan negatif, maka yang diminimumkan adalah jumlah kuadrat selisih ordinat tadi. Untuk mengestimasi parameter dengan menggunakan metode kuadrat terkecil maka ditempun langkah-langkah berikut ini. 1. Karena yang akan diminimumkan adalah kesalahan, maka langkah pertama yang harus dilakukan adalah mengubah model linier menjadi eksplisit terhadap kesalahan. Dari bentuk model pada persamaan (7.1),
I II
Hal. 198 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
diperoleh rumusan kesalahan i = Y − (β0 + β1 Xi )
(7.3) UNEJ
2. Mengkuadratkan kesalahan yang diperoleh serta menjumlahkannya untuk seluruh pasangan data. Dari bentuk tersebut diperoleh bentuk jumlah kuadrat kesalahan sebagai berikut
Q=
n X i=1
2i
=
n X
2
[Yi − (β0 + β1 Xi )] =
n X
" Yi −
i=1
i]1
1 X
#2 βj Xij
Daftar Isi
Judul
(7.4)
j=0
JJ J
I II
Dalam hal ini Xi0 = 1 dan Xi1 = Xi . Hal. 199 dari 234
3. Menurunkan bentuk kuadrat yang diperoleh terhadap parameter yang menjadi kepentingan. Estimasi dengan metode kuadrat terkecil diproses dengan mencari minimum Q terhadap βj . Minimum dari Q terhadap diperoleh dengan mencari turunan pertama maupun ke dua
Cari Halaman
Kembali
n
X ∂Q [Yi − (β0 + β1 Xi )] = −2 ∂β0 i=1
Layar Penuh
n
X ∂Q = −2 [Yi − (β0 + β1 Xi )] Xi ∂β1 i=1
Tutup
Keluar
4. Menyusun persamaan normal yang diperoleh dari sistem persamaan ∂Q/∂βj = 0. Dari hasil sebelumnya diperoleh persamaan normal Pn [Y − (β + β X )] = 0 i 0 1 i i=1 Pn . i=1 [Yi − (β0 + β1 Xi )] Xi = 0
(7.5)
UNEJ
Daftar Isi
Persamaan normal di atas selanjutnya dapat disederhanakan menjadi Judul
n X
Yi − nβ0 − β1
i=1 n X i=1
Xi Yi − β0
n X i=1
Xi − β1
n X i=1 n X
Xi = 0
(7.6a) JJ J
Xi2 = 0
(7.6b)
I II
Hal. 200 dari 234
i=1 Cari Halaman
5. Dari persamaan normal (7.6a) di atas diperoleh Kembali
n n 1X 1X ˆ β0 = Yi − β1 Xi n i=1 n i=1 ¯ = Y¯ − β1 X
(7.7a) Layar Penuh
(7.7b) Tutup
Hasil persamaan (7.7) ini selanjutnya disubstitusikan pada persamaan Keluar
normal (7.6b) sehingga diperoleh: P P P Xi Yi X Y − i i n ˆ β1 = P P 2 Xi2 − ( nXi ) P P P n ni=1 Xi Yi − ( ni=1 Xi ) ( ni=1 Yi ) = P P n Xi2 − ( Xi )2 P ¯ P Yi Xi Yi − X = P . ¯ 2 X2 − n X
(7.8a) UNEJ
(7.8b) Daftar Isi
(7.8c)
i
Judul
2
¯ = Xi − X P ¯ Yi (Xi − X) βˆ1 = P 2 ¯ Xi − X
Mengingat bahwa
P
P
Xi2 −
P ¯2 P 2 ¯ 2 , maka X = Xi −nX JJ J
I II
(7.8d) Hal. 201 dari 234
Sebagaimana telah disampaikan bahwa metode kuadrat terkecil belum memanfaatkan informasi distribusi dari i . Oleh karena itu apabila σ 2 tidak diketahui, tidak ada cara khusus dengan metode kuadrat terkecil untuk mengestimasi σ 2 . Namun, σ 2 biasa diestimasi dari rata-rata kuadrat deviasi data terhadap garis regresi yang diperoleh dari βˆj . Derajat kebebasan yag dimiliki oleh deviasi ini adalah n − k dimana k adalah banyaknya penduga βj . Jadi untuk model dengan dua parameter β0 dan β1 , maka n i2 1 Xh 2 2 ˆ ˆ ˆ σ = se = Yi − (β0 + β1 Xi ) (7.9) n − 2 i=1
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
7.2.2.
Estimasi dengan Metode Likelihood Maksimum
Sesuai dengan prinsip model linier normal, maka setiap peubah respon Yi merupakan sample dari peubah acak yang berdistribusi normal dan saling independen dengan mean E(Yi ) = β0 + β1 Xi dan varians σ 2 , yaitu Yi ∼ N (E(Yi ), σ 2 ). Dengan demikian kita peroleh seperti berikut ini.
UNEJ
Daftar Isi
1. Likelihood Yi adalah
Judul
"
1 1 Li = √ exp − 2 σ 2π
Yi − β0 − β1 Xi σ
2 #
JJ J
.
I II
Hal. 202 dari 234
2. Likelihood dari Y = (Y1 , Y2 , · · · , Yi , · · · , Yn )T yang komponennya saling bebas adalah
Cari Halaman
Kembali
L=
n Y
Li
Layar Penuh
i=1
1 = √ σ 2π
n
"
n
1X exp − 2 i=1
Yi − β0 − β1 Xi σ
2 # .
Tutup
Keluar
Log-likelihood l = log L adalah 2 n √ 1X Yi − β0 − β1 Xi l = −n log σ 2π − 2 i=1 σ n 1 X n 2 (Yi − β0 − β1 Xi )2 . = − log 2πσ − 2 2 2σ i=1
Selanjutnya turunan l terhadap β0 , β1 dan σ 2 diperoleh sebagai berikut n
X ∂l 1 = − 2 (2)(−1) (Yi − β0 − β1 Xi ) ∂β0 2σ i=1 n 1 X = 2 (Yi − β0 − β1 Xi ) σ i=1
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 203 dari 234
Cari Halaman
n
X 1 ∂l = − 2 (2)(−1) (Yi − β0 − β1 Xi ) Xi ∂β1 2σ i=1 n ∂l 1 X (Yi − β0 − β1 Xi ) Xi = 2 ∂β1 σ i=1 n ∂l n 1 X =− 2 + 4 (Yi − β0 − β1 Xi )2 . 2 ∂σ 2σ 2σ i=1
Kembali
Layar Penuh
Tutup
Keluar
Dari persamaan di atas diperoleh persamaan normal untuk β0 dan β1 identik dengan persamaan normal (7.5). Selanjutnya dari ∂l/∂σ 2 = 0 diperoleh 2
nσ +
n X
(Yi − β0 − β1 Xi )2 = 0
UNEJ
i=1
sehingga penduga kemungkinan maksimum untuk σ 2 adalah
Daftar Isi
n
1X σˆ2 = (Yi − β0 − β1 Xi )2 . n i=1
Judul
Sebenarnya estimasi σ 2 di atas berlaku untuk kondisi β0 , β1 atau µ yang diketahui. Jika tidak diketahui, maka penduga di atas akan menjadi bias. Untuk menghilangkan bias maka pembaginya (derajat kebebasannya) harus dikurangi sebesar banyaknya parameter yang harus diestimasi sebelummnya. Dalam kasus model sederhana yang kita bahas, banyaknya parameter ada 2 yaitu (β0 , β1 ). Dengan demikian derajat kebebasannya menjadi n − 2 dan bentuk penduga σ untuk penduga llikelihood seteleh disesuaikan manjadi
JJ J
I II
Hal. 204 dari 234
Cari Halaman
Kembali
σˆ2 =
1 n−2
n X i=1
Yi − βˆ0 − βˆ1 Xi
2
(7.10) Layar Penuh
Tutup
Keluar
7.3.
Uji Inferensial dari βˆj
Sebagaimana dijelaskan dalam langkah-langkah pemodelan stokastik, bahwa besaran yang diperoleh dari penyelesaian model, yang berupa penduga, harus diuji secara statistik. Untuk keperluan ini, perlu diketahui distribusi dari penduga yang diperoleh.
UNEJ
Daftar Isi
7.3.1.
Distribusi βˆj
Setelah memperoleh estimasi dari parameter βj , maka selanjutya kita perlu memperoleh sifat sebaran dari penduga- penduga tersebut. Dapat ditunjukkan (dianjurkan untuk membuktikan sendiri) bahwa penduga-penduga yang diperoleh adalah penduga tak bias dalam arti h i h i ˆ E β0 = β0 dan E βˆ1 = β1 . Sedangkan untuk varians βj diperoleh hasil yang berbeda untuk kasus σ 2 diketahui dan σ 2 tidak diketahui.
Judul
JJ J
I II
Hal. 205 dari 234
Cari Halaman
Kembali
7.3.1.1.
Distribusi βˆj bila σ 2 diketahui Layar Penuh
Varians dari penduga-penduga βˆj dapat diturunkan dengan menggunakan prinsip bahwa:
Tutup
2
1. untuk suatu konstanta c, maka Var(cY ) = c Var (Y ); Keluar
P P 2. Bahwa Yi dan Yi0 adalah saling bebas karenanya Var[ Yi ]] = [Var(Yi )] ; 3. Var(Yi ) = σ 2 , sedang komponen yang lain berfungsi sebagai peubah tidak acak sehingga tidak memiliki varians dan dalam konteks ini dapat diaggap sebagai konstanta c. Dari bentuk penduga βˆ0 , seperti pada persamaan (7.7) dan βˆ1 pada persamaan (7.8), dapat lihat bahwa βˆj merupakan kombinasi linier dari Yi yang mempunyai varians σ 2 . Dari kenyataan ini dapat dihitung varians βˆj seperti berikut ini. Hasil 7.1. Jika σ 2 diketahui, maka varians dari penduga βˆ0 dan βˆ1 masing masing adalah: ¯2 X 1 2 ˆ +P Var(β0 ) = ¯ 2 σ n (Xi − X) σ2 Var(βˆ1 ) = P ¯ 2 (Xi − X)
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 206 dari 234
(7.11) Cari Halaman
(7.12)
Kita lihat bahwa sesungguhnya penduga βˆj merupakan kombinasi linier dari Yi yang berdistribusi normal. Oleh karena itu jika σ 2 diketahui maka masing-masing penduga βj berdistribusi normal dengan varians seperti pada Hasil 7.1. Dengan demikian bisa kita simpulkan hasil berikut
Kembali
Layar Penuh
Tutup
Keluar
Hasil 7.2. Jika σ 2 diketahui dan var (βˆj ) dihitung seperti pada Hasil 7.1, maka βˆ − βj qj ∼ N (0, 1) (7.13) ˆ var(βj )
UNEJ
Daftar Isi
7.3.1.2.
Distribusi βˆj bila σ 2 tidak diketahui
Dalam kenyataannya, σ 2 lebih sering tidak diketahui dan harus diestimasi dari data yang ada seperti yang telah dilakukan sebelumnya yaitu
Judul
JJ J
I II
n
s2e
= σˆ2 =
2 1 X ˆ ˆ Yi − β0 − β1 Xi n − 2 i=1
Hal. 207 dari 234
Cari Halaman
Hasil 7.3. Apabila σ tidak lagi diketahui tetapi diganti dengan σˆ2 = s2e , maka var(βˆj ) dinotasikan dengan s2 (βˆj ); j = 0, 1 menjadi 2
¯2 1 X ˆ s (β0 ) = +P s2e 2 ¯ n (Xi − X) " # P 1 (1/n Xi )2 = +P 2 s2e P n Xi − 1/n ( Xi )2 2
Kembali
(7.14a)
Layar Penuh
(7.14b)
Tutup
Keluar
2
se s (βˆ1 ) = P ¯ 2 (Xi − X) s2e =P 2 P Xi − 1/n ( Xi )2 2
(7.15a) (7.15b)
Hasil 7.4. Apabila σ 2 tidak lagi diketahui tetapi diganti dengan σˆ2 = s2e , dan var(βˆj ) diganti dengan s2 (βˆj ); j = 0, 1, terutatama jika ukuran sampel tidak cukup besar, maka βˆj − βj βˆ − βj qj = ∼ tn−2 , ˆj ) s( β 2 ˆ s (βj )
(7.16)
Hasil di atas dapat diperluas untuk banyaknya parameter lebih dari dua misalnya k. Jika ukuran sampel cukup besar, maka sesuai sifat distribusi t, distribusi t akan mendekati N(0,1). Dengan demikian distribusinya identik dengan sebelumnya, ketika σ 2 diketahui.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 208 dari 234
Cari Halaman
Kembali
7.3.2.
Estimasi selang dari βj
Sesuai dengan distribusi dari βˆj , maka estimasi selang diperoleh dengan melihat nilai t atau z yang membatasi prosentase atau luas daerah dari kurva fungsi kepadatannya. Pada umumnya kita menghitung estimasi selang yang simetrik.
Layar Penuh
Tutup
Keluar
Hasil 7.5. Penduga selang βj untuk tarap keyakinan (1 − α) × 100% atau tarap signifikansi α × 100%, jika σ diketahui atau n cukup besar adalah βˆj − zα/2
q q ˆ ˆ var(βj ) ≤ βj ≤ βj + zα/2 var(βˆj )
(7.17) UNEJ
Hasil 7.6. Penduga selang βj untuk tarap keyakinan (1 − α) × 100%) atau tarap signifikansi α × 100%, dinotasikan I.K (1 − α) × 100% jika σ tidak diketahui dan n kecil adalah βˆj − tα/2,n−2 s(βˆj ) ≤ βj ≤ βˆj + tα/2,n−2 s(βˆj )
7.3.3.
(7.18)
Uji Hipotesis
Selain menghitung penduga interval dari parameter regresi βj , sering juga dilakukan uji hipotesis untuk mengetahui apakah koefisien regresi populasi dianggap signifikan atau tidak. Dalam statistika dua macam hipotesis yang biasanya diuji, yaitu hipotesis nol (H0 ) dan hipotesis kerja (HA ) H0 : βj = 0; yaitu βj tidak signifikan HA : βj 6= 0; yaitu βj signifikan Adapun kriteria penerimaan atau penolakan H0 dapat dilakukan dengan beberapa cara yaitu
Daftar Isi
Judul
JJ J
I II
Hal. 209 dari 234
Cari Halaman
Kembali
Layar Penuh
1. melihat I.K (1 − α) × 100% dari βj yaitu 0 ∈ I.K. 0 6∈ I.K.
: :
H0 diterima H0 ditolak
Tutup
Keluar
2. dengan membandingkan nilai statistik yang diperoleh, yaitu th =
βˆj dengan tα/2,n−k s(βˆj )
dan dengan kriteria th < tα/2,n−k : H0 diterima th ≥ tα/2,n−k : H0 ditolak 3. Dengan menghitung nilai probabilitas p yang didefinisikan sebagai
UNEJ
Daftar Isi
Judul
p = 2P (T > th ); dengan catatan T ∼ tn−k Selanjutnya kriteria penerimaan hipotesis adalah p > 5% : H0 diterima atau βj tidak signifikan 1% < p ≤ 5% : H0 ditolak dengan βj signifikan p ≤ 1% : H0 ditolak dengan βj sangat signifikan Jika βj tidak signifikan atau dapat dianggap 0, berarti tidak ada hubungan atau pengaruh signifikan Xj terhadap Y . Dengan kata lain tidak ada kontribusi signifikan dari peubah Xj terhadap model yang diperiksa.
7.3.4.
Interval Prediksi Rata-rata dan Nilai Tunggal
Interval keyakinan prediksi rata-rata Y¯ dan nilai tunggal Yˆi pada tingkat nilai peubah penjelas Xi pada dasarnya dapat dicari dengan menghitung varians dari µˆi , maupun varianas Yˆi . Dari bentuk estimasi regresi diperoleh bahwa:
JJ J
I II
Hal. 210 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. varians µ ˆ sama dengan umlah dari varians βˆj , yaitu 2 σc = Y¯
7.3.5.
Melaporkan nilai probabilitas p
UNEJ
Selain menghitung estimasi interval maupun melakukan uji hipotesis dengan distribusi t maupun z, paket- paket statistik biasa melaporkan nilai probabilitas yang disebut nilai p yaitu luas daerah yang berada dibagian ujung yang dibatasi oleh statistik t∗ yaitu p = P (T ≥ |t∗ | dengan t∗ =
β − βˆ . ˆ S(β)
Untuk uji dua arah yang simetris maka
Daftar Isi
Judul
JJ J
I II
Hal. 211 dari 234
p = 1 − P (−t∗ ≤ tn−1 ≤ t∗ ). Cari Halaman
Dengan demikian semakin kecil nilai p akan semakin signifikan hasilnnya dan semakin kuat penolakan H0. Dalam bahasa R perhitungan p dapat dilakukan dengan p<-2*(1-pt(t,df)) Hasil 7.7. Penolakan Hipotesis nol (Ho) dengan menggunakan p adalah sebagai berikut: Ho ditolak pada taraf signifikansi α × 100% jika dan hanya jika p ≤ (α × 100%)
Kembali
Layar Penuh
Tutup
Keluar
Secara individu, uji signifikansi koefisien βˆj dengan menggunakan nilai p dapat dilakukan sebagai berikut: 1. βˆj sangat signifikan jika p ≤ 1%; 2. βˆj signifikan jika 1% < p ≤ 5%; 3. βˆj tidak signifikan jika p > 5%;
7.3.6.
Menentukan Model dengan R
7.3.7.
Menggunakan fungsi lm()
lm() adalah library yang merupakan analisis model linier normal. Format perintahnya adalah:
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 212 dari 234
lm(formula, data,...) Cari Halaman
dengan: 1. formula adalah peubah respon dan peubah-peubah penjelas yang dinyatakan dalam bentuk y~x1+x2+. . .. Jika ingin menggunakan persamaan regresi tanpa konstanta maka pada formula ditulis y~x1+x2-1 atau y~0+x1+x2 2. data adalah nama data yang akan dianalisis, yang memuat nama-mana peubah yang dimasukkan pada formula
Kembali
Layar Penuh
Tutup
Keluar
Ada beberapa informasi yang dapat diekstrak dari objek yang dihasilkan fungsi lm() ini diantaranya: ˆ 1. coef(objek) untuk mengekstrak koefisien regresi β. 2. deviance(objek) untuk mengekstrak jumlah kuadrat sisa. 3. formula(objek) untuk mengekstrak rumusan model yang dipergunakan 4. plot(objek) untuk menghasilkan grafik yaitu seperti grafik sisa, grafik fitted value dan beberapa disgnostik. 5. print(objek) untuk mencetak hasil singkat analisis. 6. step(objek untuk memeriksa model yang paling cocok dengan cara elihat angka AIC (Akaike’s Information Criterion) yang paling besar. 7. summary((plot) untuk mencetak
lengkap hasil analisis.
Untuk mengetahui lebih jauh komponen-komponen yang tersedia dari suatu objek dapat dilakukan dengan >names(objek)
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 213 dari 234
Cari Halaman
Kembali
Layar Penuh
Contoh 7.1. Misalkan kita ingin mencari persamaan regresi (model linier) dari peubah kecepatan/speed dan jatrak tempuh distance kendaraan pada data cars. Perintah dan hasil keluaran untuk mengetahui ringkasan data adalah:
Tutup
Keluar
> data(cars) > summary(cars) speed Min. : 4.0 1st Qu.:12.0 Median :15.0 Mean :15.4 3rd Qu.:19.0 Max. :25.0
dist Min. : 2.00 1st Qu.: 26.00 Median : 36.00 Mean : 42.98 3rd Qu.: 56.00 Max. :120.00
UNEJ
Daftar Isi
Judul
Setelah diketahui nama peubah-peubahnya maka kita dapat menulis perintah model linier seperti berikut:
JJ
J
I
II
Hal. 214 dari 234
>contoh.lm<-lm(dist~speed,data=cars) >print(summary(contoh.lm)) Call: lm(formula = dist ~ speed, data = cars) Residuals: Min 1Q -29.069 -9.525
Cari Halaman
Kembali
Median -2.272
3Q 9.215
Max 43.201
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -17.5791 6.7584 -2.601 0.0123*
Layar Penuh
Tutup
Keluar
speed 3.9324 0.4155 9.464 1.49e-12 *** --Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: 15.38 on 48 degrees of freedom Multiple R-Squared: 0.6511, Adjusted R-squared: 0.6438 F-statistic: 89.57 on 1 and 48 DF, p-value:1.490e-12
UNEJ
Daftar Isi
Judul
Dari hasil yang diperoleh dapat disimpulkan bahwa konstanta α = β0 adalah signifikan (1% < p < 5%) dan koefisien speed adalah sangat signifikan (p < 1%). Untuk mengetahui komponen-komponen yang dapat diekstrak dari objek contoh.lm dapat dilakuakn dengan perintah berikut. Sedangkan untuk memanggil salah satu komponen objek dilakukan dengan NamaObjek$komponen.
JJ J
I II
Hal. 215 dari 234
Cari Halaman
>names(contoh.lm) [1] "coefficients" "residuals" [5] "fitted.values" "assign" [9] "xlevels" "call"
"effects" "qr" "terms"
"rank" "df.residual" "model"
Kembali
Layar Penuh
>contoh.lm$coeff (Intercept) speed -17.579095 3.932409
Tutup
Keluar
7.3.8.
Menggunakan Menu R-Commander
Untuk regresi linier sederhana, analisis dapat dilakukan melalui menu Statistics atau Statistika seperti berikut. Statistika => Pencocokan Model => Regresi Liier atau Statistics => Fits Model => Linear Regression
UNEJ
Daftar Isi
Dari jendela dialog yang ada kita dapat menentukan peubah penjelas (bebas) dan peubah respon atau peubah terikatnya.
Judul
JJ J
I II
Hal. 216 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
7.4.
Bacaan Lebih Lanjut
Regresi linier sederhana merupakan salah satu bentuk model linier dengan asumsi distribusi normal dan satu peubah bebas. Tehnik ini telah berkembang luas dengan jumlah peubah bebas yang lebih dari satu baik yang berupa peubah kuantitatif maupun kualitatif/ faktor. Uraian detil mengenai model linier baik yang sederhana maupun yang lebih kompleks dapat dilihat pada Bowerman et al. [1] dan Neter et al. [18]. Aplikasi R untuk Regresi yang cukup intensif dapat dilihat pada Faraway [5]. Pembaca dapat juga membaca aplikasi SPlus untuk Analisis Statistika Modern oleh Venables & Ripley [23].
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 217 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
7.5.
Latihan Soal- Soal
1. Tentukan model dan asumsi model linier normal 2. Tentukan bentuk biasa (sumasi) maupun matriks dari jumlah kuadrat kesalahan. 3. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Skoring Fisher untuk mengestimasi parameter regresi pada model linier sederhana dengan metode kuadrat terkecil 4. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Skoring Fisher untuk mengestimasi parameter regresi pada model linier sederhana dengan metode likelihood maksimum 5. Jelaskan distribusi penduga likelihood, baik untuk sampel besar maupun untuk sampel kecil.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 218 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
GLOSARIUM
Daftar Isi
Judul
JJ J
I II
Hal. 219 dari 234
A
Cari Halaman
Antarmuka Antarmuka (interface) adalah bagian program/alat yang menjembatani komunikasi antara pengguna dengan komputer, antara alat ukur dengan komputer, dan sejenisnya.
Kembali
Layar Penuh
Tutup
aov()
aov(formula, ...)
adalah fungsi untuk melakukan uji anava. Keluar
B bartlett.test() bartlett.test(x, ...), adalah fungsi untuk melakukan uji homogenitas varians. UNEJ
Boxplot
tampilah grafis dari kuantil data yang dinyatakan dalam bentuk kotak. Pada Boxplot digambarkan posisi median (Q2), kuantil 1(Q1) dan kuantil 3(Q3). Boxplot juga memberi gambaran ada tidaknya pencilan (outlier).
Daftar Isi
Judul
D Diagram Pencar (Scattergram) Diagram pencar adalah representasi grafik dari distribusi dua peubah acak yang disajikan dalam bentuk titik-titik dengan koordinat ditentukan oleh nilai observasi pasangan peubah acak tadi.
JJ J
I II
Hal. 220 dari 234
Cari Halaman
Kembali
I Interval/Selang Keyakinan Interval/Selang Keyakinan adalah selang yang diyakini memuat nilai parameter populasi dengan tingkat peluang tertentu. Tingkat peluang yang banyak dipakai adalah 95% dan 99%.
Layar Penuh
Tutup
Keluar
K Keluarga Eksponensial Keluarga Eksponensial adalah distribusi yang merupakan kesatuan (unifikasi) distribusi-distribusi penting yang banyak dipakai seperti antara lain Normal, Gamma, Binomial, Poisson dalam satu bentuk distribusi.
UNEJ
Daftar Isi
Kontingensi Tabel kontingensi adalah tabel yang memuat pengelompokan n sampel ke dalam dua atau lebih peubah kualitatif. Tabel kontingensi dapat digunakan untuk memeriksa hubungan antara dua peubah kualitatif.
Judul
JJ J
M Matriks Diagram Pencar Matriks Diagram Pencar (Scatter Plot Matrix) adalah matriks yang menggambarkan diagram pencar lebih dari dua variabel. Pada diagonal biasanya disajikan densitas, histogram atau diagram kuantil, sedangkan pada off diagonal disajikan diagram pencar masing-masing pasangan variabel.
I II
Hal. 221 dari 234
Cari Halaman
Kembali
Layar Penuh
Multimodal multimodal adalah distribusi yang memiliki peluang maksimum (modus) di lebih dari satu titik. Dengan kata lain distribusi yang memiliki lebih dari satu modus).
Tutup
Keluar
O Outlier/pencilan Pencilan adalah data yang besarnya menyimpang dari kelompoknya melebihi batas kewajaran distribusi data. UNEJ
P Peluang Penutup (Coverage Probability) adalah prosentase banyaknya interval keyakinan yang memuat nilai parameter yang sebenarnya dalam simulasi. Populasi Populasi adalah himpunan semesta dari variabel yang menjadi perhatian peneliti.
Daftar Isi
Judul
JJ J
I II
Hal. 222 dari 234
Q QQPlot
QQplot atau Plot Kuantil adalah diagram yang menggambarkan hubungan antara quantil teoritis suatu distribusi dengan kuantil riil suatu data. Khusus untuk distribusi normal grafiknya disebut QQnorm.
Cari Halaman
Kembali
Layar Penuh
T t.test()
t.test(x, y, ...), adalah fungsi untuk menganalisis beda ratarata variabel x dan y.
Tutup
Keluar
U Unimodal Unimodal adalah distribusi yang memiliki peluang maksimum (modus) di satu titik. Dengan kata lain distribusi yang memiliki satu modus.
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 223 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 224 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
UNEJ
DAFTAR PUSTAKA
Daftar Isi
Judul
JJ J
I II
Hal. 225 dari 234
[1] Bowerman,B.L. R.T. Cornell and D.A. Dickey. Linear Statistical Models, an Appplied Approach. Duxbury Press, Boston, 1986. [2] M. Davidian and D.M. Giltinan. Nonlinear Models for Repeated Measurement Data. Chapman and Hall, London, 1995. [3] P.J. Diggle, K-Y. Liang and S.L. Zeger. Analysis of Longitudinal Data. Oxford Science Publications, London, 1st edition, 1994. [4] A.J. Dobson. An Introduction to Generalized Linear Models. Chapman and Hall, London, 1990.
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[5] J.J. Faraway. Practical Regression and Anova http://www.stat. Isa.umic.edu/∼faraway/book/, 2002.
Using
R.
[6] Filliben. NIST/SEMATECH e-Handbook of Statistical Methods, chapter Exploratory Data Analysis. NIST-SEMATEC, http://www.itl.nist.gov/div898/handbook/eda/eda.htm, 2006. [27 Maret 2006].
UNEJ
Daftar Isi
[7] J.P. Guilford & B. Fruchter. Fundamental Statistics in Psychology and Education. McGraw Hill, Tokyo, 6th edition, 1978. [8] R.V. Hogg and A.T. Craig. Introduction to Mathematical Statistics. Prentice-Hall, Englewood Cliffs, 5th edition, 1995. [9] N.M. Laird and J.H. Ware. Random effects models for longitudinal data. Biometrics, 38:963–974, 1982. [10] Y. Lee and J.A. Nelder. Hierarchical generalized linear models. J.R. Statist. Soc., 58:619–678, 1996. [11] K-Y Liang and S.L. Zeger. Longitudinal data analysis using generalized linear models. Biometrika, 73:13–22, 1986.
Judul
JJ J
I II
Hal. 226 dari 234
Cari Halaman
Kembali
[12] J.H. Maindonald. Using R for Data Analysis and Graphics An Introduction. ANU-Australia, June 2001.
Layar Penuh
[13] P. McCullagh and J.A. Nelder. Generalized Linear Models. Chapman and Hall, London, 2nd edition, 1989.
Tutup
Keluar
[14] W. Mendenhall. Introduction to Probability and Statistics. Duxbury, Belmont USA, 5th edition, 1979. [15] W. Mendenhall. Beginning Statistics A to Z. Duxbury, Belmont USA, 1993. [16] P.L. Meyer. Introductory Probability and Statistical Applications. Addison-Wisley Pub. Co., Massachusets, 2nd edition, 1970. [17] J.A. Nelder and R.W.M. Wedderburn. J.R.Statist.Soc., 57:359–407, 1972.
Generalized linear models.
UNEJ
Daftar Isi
Judul
[18] Neter J., W. Wasserman and M.H. Kutner. Applied Linear Statistical Models. Irwin, Illinois, 2nd edition, 1985.
JJ J
[19] G.K. Smyth. Generalized linear models with varying dispersion. J.R. Statist. Soc, 51:47–60, 1989.
Hal. 227 dari 234
I II
Cari Halaman
[20] G.K. Smyth. Partitioned algorithms for maximum likelihood and other nonlinear estimation. Statistics and Computing, 6:201–216, 1996. [21] I M. Tirta. Analysis of Gamma Data with Random Effects. PhD thesis, Department of Mathematics Statistics and Computing Sciences, The University of New England, Armidale, NSW Australia, 1999. [22] I M. Tirta. Buku Panduan Program Statistika R. Penerbit Universitas Jember, Jember, 2005. ISBN 979-8176-37-5.
Kembali
Layar Penuh
Tutup
Keluar
[23] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus. Springer, New York, 1994. [24] J. Vezalini. Using R http://www.r.project.org, 2002.
for
Introductory
Statistics. UNEJ
[25] Wackerly D.D., Mendenhall W. &Scheafer R. L. . Mathematical Statistics with Application. Duxbury, Belmont USA, 5th edition, 1996. [26] R.W.M. Wedderburn. Quasi-likelihood functions, generalized linear models, and the Gauss-Newton method. Biometrika, 61:439–447, 1974.
Daftar Isi
Judul
[27] S.L. Zeger and K-Y. Liang. Longitudinal data analysis for discrete and continuous outcomes. Biometrics, 42:121–130, 1986.
JJ J
[28] V. Zoonekyn. Statistics UNIX/48 R/all.html, 2005.
Hal. 228 dari 234
with
R.
http://zoonek2.free.fr/
I II
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
INDEKS PENULIS
UNEJ
Daftar Isi
Judul
JJ J
Bowerman, 209
Neter, 209
Craig, 97
Ripley, 209
Faraway, 20, 209 Filliben, 94
Scheafer, 97 Venables, 209
I II
Hal. 229 dari 234
Cari Halaman
Kembali
Hogg, 97 Kutner, 209 Mendenhall, 57, 58, 60, 61, 97, 113, 119, 121 Meyer, 97
Wackerly, 97 Wasserman, 209 Zoonekyn, 94
Layar Penuh
Tutup
Keluar
INDEKS SUBJEK
UNEJ
Daftar Isi
Judul
JJ J
algoritma penuh, 168 terpartisi, 168 boxplot, 79 CLI, 19 Data setting, 65 data eksplorasi, 74 kualitatif, 65
simulasi, 65 diagram pencar glosari, 36 ekplorasi data, 74 eksperimen, 109 eleminsi, 152 GUI, 19, 21
I II
Hal. 230 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
hipotesis, 113 Keluar
interval keyakinan, 103 invariant, 170 kontingensi, 77 kualitatif, 65 library, 19 Linux, 21 model linier bertingkat, 175 GEE, 179 GLM, 177 GLMM, 179 HGLM, 179 hirarkis tergeneralisasi, 179 klasik, 171 LMM, 173 NLM, 172 normal, 171 tergeneralisasi, 177 multikolinieritas, 181 multimodal, 78 peluang
penutup, 106 pemodelan, 153 deterministik, 156 stokastik, 156 pivot, 103 populasi, 57, 60 pustaka, 19 qqplot glosari, 84 regresi Ridge, 181 RGUI R-Commander, 25 SciViews, 20 WinEdt, 20 ringkasan statistik, 74
UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 231 dari 234
Cari Halaman
Kembali
S, 19 sampel, 57, 60 standar kesalahan beda rata-rata, 109 rata-rata, 101 statistika, 56–58, 60
Layar Penuh
Tutup
Keluar
survei, 108 Teorema Limit Pusat, 104 unimodal, 78 UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 232 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
INDEKS FUNGSI R
UNEJ
Daftar Isi
Judul
JJ J
attach(), 68
hist(), 84
biplot(), 84 boxplot(), 84
library(), 68
coplot(), 84 data(), 68 density, 84 dotchart(), 84
I II
Hal. 233 dari 234
Cari Halaman
manova(), 84 pairs(), 84 plot(), 84
Kembali
Layar Penuh
edit(), 66
qqline(), 84 qqnorm(), 84
hclust(), 84
read.table(), 71
Tutup
Keluar
stem(), 84 summary(), 84 xyplot(), 84 UNEJ
Daftar Isi
Judul
JJ J
I II
Hal. 234 dari 234
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar