D3 Komputer dan Sistem Informasi
MODUL D3 KOMSI
Praktikum Statistika dan Penyajian Data (Rahma Dewi Permana, S.Si.)
Laboratorium Komputer D3 Komputer dan Sistem Informasi
Diploma Informatika dan Instrumentasi
Sekolah Vokasi Universitas Gadjah Mada
DAFTAR ISI
Praktikum Statistika ................................................................................................................... 1 DAFTAR ISI.............................................................................................................................. 2 BAB I ......................................................................................................................................... 4 1.1. Pendahuluan ................................................................................................................ 4 1.2. Paket Program R.......................................................................................................... 4 1.3. Instalasi R .................................................................................................................... 5 1.3.1. Menginstal R pada sistem operasi Windows ....................................................... 5 1.3.2. Menginstal Rcommander pada sistem operasi Windows................................... 10 BAB II...................................................................................................................................... 13 2.1. Pendahuluan .............................................................................................................. 13 2.2. Penggunaan Rcmdr .................................................................................................... 13 2.2.1. Entry data........................................................................................................... 14 2.2.2. Menampilkan data yang sedang aktif ................................................................ 17 2.2.3. Importing data ................................................................................................... 18 2.2.4. Memilih data set yang aktif ............................................................................... 19 2.2.5. Recoding ............................................................................................................ 20 2.2.6. Compute ............................................................................................................. 21 2.2.7. Menghapus variabel pada dataset ...................................................................... 23 2.2.8. Menghapus baris pada dataset ........................................................................... 24 2.3. Latihan ....................................................................................................................... 25 BAB III .................................................................................................................................... 26 3.1. Pendahuluan .............................................................................................................. 26 3.2. Ringkasan Numerik ................................................................................................... 26 3.2.1. Contoh 1 ............................................................................................................. 26 3.2.2. Contoh 2 ............................................................................................................. 28 3.3. Penyajian Data........................................................................................................... 30 3.3.1. Diagram batang dan daun (steam and leaf plot) ................................................ 30 3.3.2. Boxplot (diagram kotak dan titik) ...................................................................... 32 3.3.3. Histogram ........................................................................................................... 34 3.4. Latihan ....................................................................................................................... 35 BAB IV .................................................................................................................................... 37 4.1. Pendahuluan .............................................................................................................. 37 4.2. Distribusi Frekuensi .................................................................................................. 40 4.3. Penyajian Data Kategori............................................................................................ 41 4.4. Latihan ....................................................................................................................... 42 BAB V ..................................................................................................................................... 44 5.1. Pendahuluan .............................................................................................................. 44 5.2. Contoh ....................................................................................................................... 46 5.3. Latihan ....................................................................................................................... 50 BAB VI .................................................................................................................................... 51 6.1. Distribusi Normal ...................................................................................................... 51 6.1.1. Membangkitkan data berdistribusi normal ........................................................ 52 6.1.2. Menghitung quantil (z tabel) .............................................................................. 52 6.1.3. Menghitung probabilitas (p-value) .................................................................... 54 6.2. Distribusi Student-t.................................................................................................... 56 6.2.1. Membangkitkan data berdistribusi student-t...................................................... 57 Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
2
6.2.2. Menghitung quantil (t tabel) .............................................................................. 57 6.2.3. Menghitung probabilitas (menghitung (p_value)) ............................................. 58 6.3. Latihan ....................................................................................................................... 59 BAB VII ................................................................................................................................... 60 7.1. Uji Proporsi Satu Populasi ........................................................................................ 60 7.2. Uji Proporsi Dua Populasi ......................................................................................... 62 7.3. Latihan ....................................................................................................................... 64 BAB VIII ................................................................................................................................. 65 8.1. Pendahuluan .............................................................................................................. 65 8.2. Inferensi Statistik untuk Mean Populasi Normal ...................................................... 65 8.2.1. Uji hipotesis ....................................................................................................... 65 8.2.2. Interval konfidensi ............................................................................................. 66 8.3. Latihan ....................................................................................................................... 68 BAB IX .................................................................................................................................... 70 9.1. Uji Hipotesis Mean 2 Populasi Independen (Uji Independen sample t test)............. 70 9.2. Uji Hipotesis Mean 2 Populasi Dependen (Uji Paired t test) ................................... 75 9.3. Latihan ....................................................................................................................... 79 BAB X ..................................................................................................................................... 81 10.1. Pendahuluan........................................................................................................... 81 10.2. Asumsi dalam Anova............................................................................................. 81 10.3. Uji Anova Satu Arah ............................................................................................. 82 10.4. Uji Perbandingan Ganda ........................................................................................ 83 10.5. Latihan ................................................................................................................... 93 BAB XI .................................................................................................................................... 95 11.1. Pendahuluan........................................................................................................... 95 11.2. Uji Simultan ( Over all test ) dalam Regresi ......................................................... 96 11.3. Uji Koefisien regresi ( uji parsial ) ........................................................................ 96 11.4. Contoh ................................................................................................................... 97 11.5. Latihan ................................................................................................................. 103 DAFTAR PUSTAKA ............................................................................................................ 104
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
3
BAB I PAKET PROGRAM PENGOLAH DATA Tujuan Praktikum a.
Praktikan dapat mengenal program R (RGUI dan Rcmdr)
b.
Praktikan dapat menginstal program R
1.1. Pendahuluan Statistika merupakan salah satu ilmu penunjang ilmu-ilmu lainnya terutama dalam merumuskan kesimpulan suatu permasalahan penelitian. Begitu juga teknologi komputer juga merupakan penunjang utama dalam bidang-bidang ilmu lain. Seiring dengan kemajuan teknologi komputer, paket program untuk aplikasi statistika juga semakin maju. Perhitunganperhitungan yang dulu memerlukan waktu yang cukup lama, sekarang dapat dikerjakan dengan cepat, mudah, dan akurat, serta mampu menangani data dengan jumlah sampel dan variabel yang sangat besar. Saat ini, cukup banyak paket program pengolah data statistik, baik yang bersifat komersial ataupun bersifat free, di antaranya: a. Komersial SPSS dan semua produk terkait, Minitab, STATA, Microstat, SAS, BMDP, Genstat, Statistica, Splus, dll. General Purpose : Matlab, Maple, C/C++, Fortran, Java, dll. Problem: Harga lisensi sangat mahal, bahkan upgrade harus mengeluarkan biaya besar, source code bersifat rahasia dan “bug” sulit di track. b. Open Source SPSS-Like : Open Stat VISTA Splus Clone : R Pada praktikum ini hanya akan dibahas penggunaan software R untuk analisis statistika dasar.
1.2. Paket Program R R adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik R. R dibuat oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru, dan kini dikembangkan oleh R Development Core Team. Bahasa R kini digunakan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
4
statistikawan untuk pengembangan perangkat lunak statistika, serta digunakan secara luas untuk pengembangan perangkat lunak statistika dan analisis data. R menyediakan berbagai teknik statistika (permodelan linier dan nonlinier, uji statistik klasik, analisis deret waktu, klasifikasi, klasterisasi, dan sebagainya) serta grafik. R, sebagaimana S, dirancang sebagai bahasa komputer sebenarnya, dan mengizinkan penggunanya untuk menambah fungsi tambahan dengan mendefinisikan fungsi baru. Kekuatan besar dari R yang lain adalah fasilitas grafiknya, yang menghasilkan grafik dengan kualitas publikasi yang dapat memuat simbol matematika.
1.3. Instalasi R 1.3.1. Menginstal R pada sistem operasi Windows Klik dua kali file R-2.3.2-win.exe yang telah di download melalui internet. Kemudian akan keluar tampilan sebagai berikut :
Pilih bahasa yang akan digunakan, default pada instalasi program ini adalah English, kemudian OK.
Klik Next pada jendela dialog di atas dan akan muncul sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
5
Klik Next kemudian muncul jendela dialog sebagai berikut :
Jendela dialog di atas digunakan untuk menentukan lokasi instalasi dari R. Di sini default lokasi instalasinya, yakni pada direktori C:\Program Files\R\R-3.0.2. Jika ingin mengubah lokasi instalasinya dapat dengan mengklik browse kemudian pilih lokasi yang diinginkan.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
6
Default instalasi adalah menggunakan mode 32-bit User instalation. Anda dapat juga memilih mode instalasi lain. Akan tetapi, mode default di atas sudah cukup untuk keperluan praktikum kita. Terlihat instalasi mode ini membutuhkan space 75.1 MB dari hard disk. Selanjutnya klik Next.
Pada jendela dialog di atas kita pilih default kemudian pilih Next.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
7
Jendela dialog di atas untuk menentukan lokasi shortcut dari program R pada start menu program. Di sini kita akan menggunakan modus default dari instalasi, yakni shortcut akan diletakkan pada direktori R. Kemudian pilih Next dan sekali lagi pada jendela dialog selanjutnya, maka proses instalasi akan dimulai. Silakan menunggu sampai proses instalasi selesai.
Jika proses telah selesai kemudian akan keluar jendela dialog sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
8
Klik Finish pada jendela dialog di atas. Kemudian pada desktop windows dan start menu dari windows akan terdapat shortcut dari R. Shortcut dari program R pada desktop windows dapat dilihat pada gambar berikut
Klik dua kali shortcut R pada desktop atau pada start menu kemudian akan muncul tampilan sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
9
1.3.2. Menginstal Rcommander pada sistem operasi Windows Untuk menginstal Rcommander, pilih menu Packages > Install package(s) from local zip files .... Kemudian pilih file Rcmdr_2.0-3.zip. Lihat seperti pada jendela dialog berikut
Klik open kemudian paket Rcmdr akan terinstal dan lihat tampilan pada Rconsole. Tampilan Rconsole akan tampil seperti gambar di bawah ini :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
10
Pada dialog Rconsole terdapat error dan perlu di instal paket tcltk2. Langkah untuk menginstal paket tcltk2 sama seperti proses menginstal paket Rcmdr di atas. Kemudian jalankan paket Rcommander yang dapat dilakukan dengan dua cara, yakni dengan mengetikkan perintah berikut pada Rconsole : >library(Rcmdr)
dan menekan Enter satu kali, atau dengan memilih menu Packages>Load package ... dan memilih Rcmdr pada daftar paket library yang terinstal sebagai berikut :
Tekan OK dan akan muncul seperti ini
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
11
Agar paket Rcmdr dapat berjalan secara sempurna maka perlu diinstal paket-paket lainnya yang telah tercantum di atas. Proses penginstalan paket-paket tersebut sama seperti proses penginstalan paket Rcmdr.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
12
BAB II MANAJEMEN DATA DENGAN R-GUI Tujuan Praktikum: a.
Praktikan dapat melakukan manajemen data menggunakan R-Gui
2.1. Pendahuluan Data processing (entry data, editing dan exporting) merupakan suatu langkah yang penting dalam melakukan analisis statistika. Ada banyak macam dan ukuran data yang mampu diolah menggunakan R. Secara umum, paling tidak ada dua macam bentuk data yang ingin kita olah, yaitu data yang sudah kita miliki yang barangkali ditulis menggunakan program sheet lain seperti Excel, database, text ataupun program pengolahan data yang lain. Pada bab ini akan ditunjukkan bagaimana melakukan data processing menggunakan R-Gui. Akan dibahas cara-cara untuk melakukan entry data, editing data, importing data dan transformasi data sederhana. 2.2. Penggunaan Rcmdr Pertama-tama buka paket Rcmdr dengan cara sebagai berikut : Packages>load packages
Pilih paket Rcmdr kemudian OK. Selanjutnya akan muncul Rcommander seperti dibawah : Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
13
2.2.1. Entry data Untuk melakukan entry data klik Data > New data set
Kemudian akan muncul jendela dialog sebagai berikut :
Ketik nama data set misal dengan nama uji1 kemudian klik OK.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
14
Untuk entry data klik edit data set kemudian akan muncul sebagai berikut :
Sebagai latihan, lakukan entry data berikut ke Rcmdr. Nama Ivan Mely Rosa Setia Mayone Lady Anita Wanto Heri Danu
IPK 2.4 2.8 3.5 2.7 2.9 3.3 3.1 2.9 2.2 2.0
Sks 40 42 46 42 4o 42 44 42 40 38
Keterangan Nama : nama mahasiswa IPK
: IPK yang diperoleh
Sks
: jumlah sks yang telah ditempuh
Ketikkan ketiga variabel (nama, IPK, dan Sks) pada Data editor. Selanjutnya tampilan Data editor menjadi sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
15
Untuk pemberian nama variabel klik pada var1 maka akan muncul :
Tulis nama variabel nama kemudian close. Langkah yang sama digunakan untuk pemberian nama variabel IPK dan Sks. Pada pemberian nama untuk IPK maka klik var2 kemudian tulis nama variabelnya dengan IPK, dan pemberian nama untuk Sks maka klik var3 kemudian tulis nama variabelnya dengan Sks. Selanjutnya, nama kolom akan berubah sesuai tampilan berikut ini :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
16
Close Data editor untuk mengakhiri proses entry data. Tampak sekarang pada jendela Rcommander terlihat data set bernama uji1 saat ini sedang aktif.
2.2.2. Menampilkan data yang sedang aktif Untuk menampilkan data yang sedang aktif di memori, klik tombol View data set. Maka jendela data akan dibuka, menampilkan data yang sedang aktif di memori komputer saat ini, yakni data uji1.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
17
2.2.3. Importing data Selain proses entry data, Rcommander juga dapat digunakan untuk melakukan import data dari format data yang diberikan pada program lain, yakni data dari Excel atau Open Office.org calc (disimpan dalam format file text/dat/csv), SPSS, MINITAB, dan STATA. Pada praktikum kali ini, kita akan menggunakan metode importing data dari file notepad.
Entry data nama, BB, dan kalori pada notepad kemudian save dengan nama uji2.txt dengan tampilan sebagai berikut :
Klik pada Rcommander Data > Import data > from text file, clipboard, or URL...
Kemudian akan muncul tampilan sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
18
Tulis nama data set dengan nama uji2 kemudian OK dan akan muncul sebagai berikut :
Pilih file yang akan di import dari folder yang sesuai kemudian klik open.
2.2.4. Memilih data set yang aktif Untuk memilih data set yang aktif, gunakan menu Data>Active data set>select active set …
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
19
Kemudian pilih data set yang akan dibuka dengan cara klik salah satu data set kemudian klik OK.
2.2.5. Recoding Misalkan kita akan melakukan coding terhadap variabel IPK dari data set uji1. IPK
Kode
0 – 1.9
1
2 – 2.9
2
≥3 3 Klik Data>manage variable in active data set>recode variabel.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
20
Pilih variabel yang akan dilakukan recoding, tulis nama variabel baru dari IPK setelah dilakukan recoding dan tulis sintax recode seperti ketentuan di atas kemudian klik OK. Tampilannya sebagai berikut :
Hasil dapat dilihat dengan cara klik view data set pada Rcomander. Kemudian akan diperoleh hasil sebagai berikut :
2.2.6. Compute Misalkan saja kita ingin melakukan transformasi terhadap variabel kalori yang dimiliki pada data set uji1 dengan cara menambahkan nilai Sks dengan 20. Untuk melakukan hal tersebut, pertama-tama aktifkan data set uji1. Kemudian buka menu Data>Manage variables in active dataset>Compute variable ...
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
21
Pilih variabel kalori, tulis nama variabel baru dengan nama Sks_baru, dan tulis pada expression to compute dengan Sks+20
Hasil dapat dilihat dengan cara klik view data set pada Rcomander. Kemudian akan diperoleh hasil sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
22
2.2.7. Menghapus variabel pada dataset Klik Data > Manage variables in active data se t> Delete variable from data set ...
Kemudian akan tampil sebagai berikut ini :
Pilih variabel yang akan dihapus, misalkan variabel yang akan dihapus adalah variabel IPK_kode maka klik pada IPK_kode kemudian OK.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
23
2.2.8. Menghapus baris pada dataset Klik Data > active data set > Remove row(s) from active data set ...
Kemudian akan muncul sebagai berikut :
Tuliskan baris ke berapa saja yang akan dihapus pada jendela dialog di atas, misal baris yang akan dihapus adalah baris ke 2 dan 3 maka tuliskan seperti di atas dan diperoleh hasil sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
24
2.3. Latihan 1.
Berikut data nilai ujian mata kuliah statistika dari 28 mahasiswa :
59
99
55
20
80
78
68
9
39
86
60
35
78
64
84
60
67
69
90
58
59
50
63
7
68
41
77
44
a. Lakukan entry data nilai ujian mata kuliah statistika di atas. b. Lakukan recode pada data di atas dengan kategori sebagai berikut:
Nilai
Kode
0 – 20
1
21 - 40
2
41 - 60
3
61 - 80
4
81 - 100
5
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
25
BAB III RINGKASAN DAN PENYAJIAN DATA NUMERIK Tujuan Praktikum a.
Praktikan mampu melakukan peringkasan data numerik
b.
Praktikan dapat melakukan penyajian data numerik (berupa boxplot, stem and leaf, dan histogram)
3.1. Pendahuluan Ringkasan Numerik merupakan ringkasan data yang berupa statistik-statistik seperti jumlah data (N), rata-rata (mean), median, deviasi standar, standar eror, kuartil1 (Q1), kuartil3 (Q3), dan sebagainya. Ringkasan numerik memberikan gambaran data berupa ukuran pusat, letak data dan ukuran dispersi dalam bentuk numerik. Selain itu, ringkasan numerik juga diperlukan sebagai estimasi dari nilai-nilai karakteristik data. Sedangkan penyajian data numerik dapat dilakukan melalui grafik dan tabel. Grafik dan tabel yang bermanfaat untuk menggambarkan data, di antaranya adalah histogram, bar chart, box plot, stem and leaf plot, scatter plot, dan lain-lain.
3.2. Ringkasan Numerik 3.2.1. Contoh 1 Berikut data nilai UTS mata kuliah statistika dari 21 mahasiswa : 59
99
55
80
78
68
39
86
60
78
64
84
67
69
90
59
50
63
68
41
77
Langkah – langkah membuat ringkasan numerik (menggunakan numerical summaries) : a. Input data UTS pada notepad kemudian import ke Rcmdr b. Setelah data dimasukkan kemudian pilih menu Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
26
Statistics > Summaries > Numerical Summaries > ok
c. Output : Mean 68.28571
sd 15.46009
IQR 19
0% 39
25% 59
50% 68
75% 78
100% 99
N 21
d. Langkah – langkah membuat ringkasan numerik (menggunakan Active data set): a. Input data UTS pada notepad kemudian import ke Rcmdr b. Setelah data dimasukkan kemudian pilih menu Statistics > Summaries > Active data set > ok c. Output :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
27
>summary(UTS) UTS Min 1st Qu. Median Mean 3rd Qu. Max
: : : : : :
39.00 59.00 68.00 68.29 78.00 99.00
Dari output di atas dapat diketahui nilai ringkasan numeriknya, yaitu nilai UTS statistik terendah adalah 39 (Min.) sedangkan yang tertinggi adalah 99 tahun (Max.), rata-rata (Mean) nilainya 68,29 , nilai kuartil1 (1st Qu.), median, dan kuartil3 (3rd Qu.) berturut-turt 59, 68, dan 78.
3.2.2. Contoh 2 Berikut data nilai UTS dan UAS mata kuliah statistika dari 12 mahasiswa : UTS 59 80 39 78 67 59 68 99 78 86 64 69
UAS 60 85 50 80 60 65 70 96 81 85 70 71
Langkah-langkah (menggunakan numerical summaries) : a. Input data pada data set Rcmdr :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
28
b. Untuk menampilkan ringkasan numerik dari nilai UTS dan UAS, pilih menu Statistics > Summaries > Numerical Summaries > pilih UTS dan UAS > OK
c. Output : mean
sd
IQR
0%
25%
50%
75%
100%
N
UAS
72.75
13.08104
18.25
50
63.75
70.5
82.0
96
12
UTS
70.50
15.30003
15.75
39
62.75
68.5
78.5
99
12
Langkah-langkah (menggunakan Active data set) : a. Input data pada data set Rcmdr : b. Setelah data dimasukkan kemudian pilih menu Statistics > Summaries > Active data set > ok c. Output : >summary(nilai) UTS
UAS
Min
:
39.00
Min
:
50.00
1st Qu.
:
62.75
1st Qu.
:
63.75
Median
:
68.50
Median
:
70.50
Mean
:
70.50
Mean
:
72.75
3rd Qu.
:
78.50
3rd Qu.
:
82.00
Max
:
99.00
Max
:
96.00
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
29
3.3. Penyajian Data 3.3.1. Diagram batang dan daun (steam and leaf plot) Secara umum, diagram batang dan daun dapat menggambarkan bentuk visual data dengan menggunakan data aslinya. Bagian yang berperan sebagai batang adalah angka yang mempunyai level lebih besar daripada angka pada daun. Sebagai contoh batang adalah puluhan, maka sebagai daun adalah satuannya. Banyaknya daun dalam satu batang dapat lebih dari satu.
Contoh 1 Langkah-langkah: 1.
Aktifkan data UTS pada data set Rcmdr.
2.
Setelah data diaktifkan kemudian pilih menu Graphs > Steam-and-leaf-display... > OK Leaf Digit dapat diganti sesuai keinginan.
3. Output (menggunakan leaf digit Automatic): Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
30
1 | 2: represents 12 leaf unit : 1 n : 21 1 3. | 9 2 4* | 1 4. | 3 5* | 0 6 5. | 599 9 6* | 034 (4) 6. | 7889 7* | 8 7. | 788 5 8* | 04 3 8. | 6 2 9* | 0 1 9. | 9
4. Keterangan output: a. Leaf unit (unit daun/ satuan) sebesar 1 atau sepersatuan. b. Kolom paling kiri menunjukkan frekuensi kumulatif lebih dari sama dengan (terletak di bawah (4)) dan kurang dari sama dengan (terletak di atas (4)), sedangkan (4) menunjukkan bahwa median dari data terletak pada baris tersebut. c. Kolom tengah menunjukkan batang dan kolom paling kanan menunjukkan daun.
Contoh 2 Langkah-langkah: a.
Aktifkan data UTS UAS pada data set Rcmdr
b.
Setelah data diaktifkan kemudian pilih menu Graphs > Steam-and-leaf-display > pilih UTS> hilangkan check-list pada Automatic pilih Leaf Digits 1OK
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
31
c.
Output : > stem.leaf(nilai$UTS, unit=1, na.rm=TRUE) 1 | 2: represents 12 leaf unit: 1 n: 12 1 3 | 9 4 | 3 5 | 99 (4) 6 | 4789 5 7 | 88 3 8 | 06 1 9 | 9
> stem.leaf(nilai$UAS, unit=1, na.rm=TRUE) 1 | 2: represents 12 leaf unit: 1 n: 12 1 5* | 0 5. | 3 6* | 00 4 6. | 5 (3) 7* | 001 7. | 5 8* | 01 3 8. | 555 9* | 1 9. | 6
Beberapa keuntungan dari diagram batang dan daun adalah : 1.
Dapat melihat bentuk distribusi data,
2.
Melihat data aslinya,
3.
Melihat adanya data ekstrem,
4.
Dapat menentukan frekuensi dengan cepat dan tepat,
5.
Dapat membandingkan beberapa data.
3.3.2. Boxplot (diagram kotak dan titik) Seperti halnya diagram batang dan daun, diagram kotak dan titik juga dapat digunakan untuk melihat bentuk distribusi data serta melihat dengan mudah adanya data ekstrem. Contoh 1 Langkah-langkah: Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
32
Aktifkan data UTS pada data set Rcmdr.
b.
Setelah data diaktifkan kemudian pilih menu Graphs > Boxplot... > OK
nilai maksimum
70
median kuartil bawah (Q1)
40
50
UTS
kuartil atas (Q3)
60
80
90
100
a.
nilai minimum
Pada output di atas terlihat bahwa boxplot UTS tersebut simetris.
Contoh 2 Langkah-langkah: a.
Misalnya ingin dibandingkan boxplot nilai UTS dan UAS.
b.
Buatlah data baru berdasarkan data nilai dengan format seperti ini :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
33
c. Setelah data di atas siap, pilih menu Graphs > Boxplot.. > variable = nilai
Output
70 40
50
60
nilai
80
90
100
d.
UAS
UTS UTS_UAS
Dari output di atas terlihat bahwa boxplot UAS relatif lebih tinggi dibandingkan boxplot UTS. Hal ini berarti ada kenaikan nilai mahasiswa.
3.3.3. Histogram Contoh 1 Langkah-langkah: 1.
Aktifkan data UTS pada data set Rcmdr.
2.
Setelah data diaktifkan kemudian pilih menu Graphs Histogram..
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
34
Pada Option tersedia pilihan untuk menentukan jumlah interval yang diinginkan, yaitu pada kolom Number of bins. Namun, pada praktikum ini digunakan automatic method untuk jumlah interval (metode Sturges). Untuk scaling (harga yang ada pada histogram) digunakan Frequency counts. Selanjutnya klik ok, maka akan ditampilkan output histogram sebagai
3 0
1
2
frequency
4
5
6
berikut:
30
40
50
60
70
80
90
100
UTS
Grafik histogram di atas menunjukkan data cukup simetris. 3.4. Latihan 1.
Berikut ini adalah data hasil pengamatan jumlah pengunjung perpustakaan D3 Informasi dan Intrumentasi selama Bulan Juni. 39 38 29 29 44 35 43 45
50 45 45 38 34 31 47 38
41 21 40 49 44 45 49 25
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
35
Berdasarkan data tersebut, buatlah : a.
Ringkasan numeriknya,
b.
Diagram Boxplot, stem and leaf dan histogramnya.
2.
Perhatikan nilai ujian basis data untuk 40 orang mahasiswa berikut ini : 79 80 70 68 90 92 80 30 58 76
49 84 71 71 35 93 91 72 20 57
48 90 92 85 83 76 58 99 83 88
72 70 38 51 73 21 72 95 82 70
Berdasarkan data tersebut, buatlah : a.
Ringkasan numeriknya,
b.
Diagram Boxplot, stem and leaf dan histogramnya.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
36
BAB IV RINGKASAN DAN PENYAJIAN DATA KATEGORI
Tujuan Praktikum a.
Praktikan mampu melakukan peringkasan data kategori
b.
Praktikan dapat melakukan penyajian data kategori (berupa bar graph dan pie chart)
4.1. Pendahuluan Adakalanya data kuantitatif ingin kita bentuk ke dalam data kualitatif (kategori), yaitu dikelompokkan menjadi beberapa bagian. Misalnya ada data mengenai tekanan darah, kemudian data tersebut ingin dikelompokkan menjadi tekanan darah rendah, normal, dan tinggi. Contoh yang lain misalnya ada data IPK mahasiswa, kemudian ingin dikelompokkan menjadi rendah, sedang dan tinggi, dan masih banyak contoh-contoh yang lain.
Contoh Berikut data IPK dari 20 mahasiswa
1.6 2.2 2.6 3.4 3.1 2.7 2.3 2.6 2.5 2.8
3.6 3.4 3.3 2.9 2.8 3.0 2.4 1.9 2.5 2.8
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
37
Entry data sebagai berikut :
Data IPK di atas akan diubah menjadi data kualitatif dengan cara coding yaitu IPK yang di bawah 2 termasuk IPK rendah, IPK antara 2 sampai 2.9 termasuk IPK sedang dan IPK di atas atau sama dengan 3 termasuk IPK tinggi.
Klik Data > manage variable in active data set > recode variable
Pada view data set akan muncul sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
38
Pada view data set muncul variabel baru IPK_kode yang merupakan coding dari nilai IPK. Variabel IPK_kode akan kita ganti untuk 1 = rendah, 2 = sedang, 3=tinggi dengan cara klik Data > manage variable in active data set > convert numeric variables to factors. Pilih IPK_kode. Klik OK.
Selanjutnya akan muncul peringatan. Klik Yes.
Ganti nama variabel IPK_kode dan klik OK.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
39
Selanjutnya, view dataset akan muncul sebagai berikut :
4.2. Distribusi Frekuensi Summaries > Frequency distribution
Output : > .Table
# counts for IPK_kode
rendah
sedang
tinggi
2
12
6
> round(100*.Table/sum(.Table), 2) rendah
sedang
tinggi
10
60
30
# percentages for IPK_kode
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
40
Dari output di atas diperoleh IPK yang rendah berjumlah 2 mahasiswa, IPK sedang berjumlah 12 mahasiswa, dan IPK tinggi berjumlah 6 mahasiswa. Sedangkan persentase pada masing-masing kategori yaitu IPK rendah = 10%, IPK sedang = 60%, dan IPK tinggi = 30%.
4.3. Penyajian Data Kategori Bar Graph Langkah- langkah penyajian data menggunakan Bar Graph adalah : Graph > Bar Graph
b.
Output :
6 0
2
4
Frequency
8
10
12
a.
rendah
sedang
tinggi
IPK_kode
Dari bar graph di atas terlihat bahwa mahasiswa paling banyak IPK-nya adalah berkategori sedang yaitu berjumlah 12 mahasiswa, sedangkan mahasiswa yang IPK-nya rendah hanya 2 mahasiswa dan IPK-nya tinggi berjumlah 6 mahasiswa. Pie chart a.
Graph > Pie Chart
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
41
b.
Output : IPK_kode
sedang
Frequency
rendah
tinggi
IPK_kode
Pada pie chart terlihat bahwa bagian yang berwarna merah muda menunjukkan bagian yang paling kecil yaitu IPK mahasiswa rendah dan bagian yang paling besar adalah berwarna hijau yaitu IPK mahasiswa sedang.
4.4. Latihan 1.
Sebuah kota disebut metropolitan, berkembang atau kecil dilihat dari jumlah penduduk yang menempati kota tersebut. Jika jumlah penduduk di kota tersebut melebihi 100.000 penduduk maka disebut kota metropolitan. Jika kota tersebut memiliki penduduk melebihi 30.000 penduduk dan tidak melebihi angka 100.000 maka disebut kota berkembang. Sedangkan jika kota tersebut memiliki penduduk tidak lebih dari 30.000 penduduk maka disebut kota kecil. 126.557 113.902 14.845 37.546 87.561 30.381 30.381 13.543 41.553 29.431 109.881 254.578 98.478 9.856 98.765
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
42
Berdasarkan jumlah penduduk di bawah ini, buatlah a. Tabel distribusi frekuensi dengan kategori kota! b. Diagram lingkaran dan diagram batangnya!
2.
Perhatikan nilai ujian basis data untuk 80 orang mahasiswa berikut ini : 79 80 70 68 90 92 80 30 58 76
49 84 71 71 35 93 91 72 20 57
48 90 92 85 83 76 58 99 83 88
72 70 38 51 73 21 72 95 82 70
Jika nilai di atas dikategorikan dengan nilai huruf : 0 – 20 = E, 21 – 40 = D, 41 – 60 = C, 61 – 80 = B, 81 – 100 = A a.
Buatlah tabel distribusi frekuensi dari data di atas
b.
Buatlah diagram lingkaran dan diagram batangnya!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
43
BAB V TRANSFORMASI DATA
Tujuan Praktikum a. Praktikan mampu melakukan transformasi data yang sesuai pada data yang tidak simetris.
5.1. Pendahuluan Dalam analisis statistik sering kali diperlukan asumsi data berdistribusi normal. Apabila digambarkan dalam bentuk grafik, data yang berdistribusi normal akan berbentuk kurang
0.2 0.0
0.1
data_normal
0.3
0.4
lebih sebagai berikut.
0
2000
4000
6000
8000
Index
Terdapat cara yang sederhana untuk mengetahui apakah data berdistribusi normal atau tidak, yaitu dengan menggunakan diagram kotak dan titik atau dikenal juga dengan boxplot. Boxplot terdiri dari 5 ukuran, yaitu median, kuartil atas, kuartil bawah, maksimum, dan minimum. Bentuk boxplot adalah sebagai berikut.
Maksimum
Kuartil atas Median Kuartil bawah
Minimum
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
44
Pada data yang berdistribusi normal, nilai median berada di tengah-tengah kotak dan jarak antara kuartil atas dengan maksimum sama dengan jarak kuartil bawah dengan minimum, sehingga bentuk boxplot simetris. Apabila nilai median berada di tengah-tengah kotak tetapi jarak antara kuartil atas dengan maksimum berbeda dengan jarak antara kuartil bawah dengan minimum, maka sudah cukup dapat dikatakan data berdistribusi normal.
Data yang tidak berdistribusi normal memiliki bentuk box plot yang tidak simetris. Apabila median lebih dekat dengan kuartil atas, maka box plot dikatakan menjurai ke bawah. Data mengumpul di nilai-nilai yang besar.
Apabila median lebih dekat dengan kuartil bawah, maka box plot dikatakan menjurai ke atas. Data mengumpul di nilai-nilai yang kecil.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
45
0.4 0.3 0.2 0.1 0.0 Untuk mengatasi data yang tidak berdistribusi normal, dapat dilakukan transformasi data. Pemilihan transformasi yang tepat dapat dilakukan menggunakan “Tangga Transformasi” yang dibuat oleh Tukey. Berikut tangga transformasi.
Pemilihan transformasi dilakukan berdasarkan tipe juraian, yaitu menjurai ke atas atau ke bawah, serta kuat atau tidaknya juraian.
5.2. Contoh Berikut data jumlah tamu yang berkunjung dalam waktu 2 bulan pada 21 hotel : 150 175 149 180 190 195 185
200 210 215 225 300 112 140
121 103 97 120 99 90 142
Untuk mengetahui data sudah berdistribusi normal atau belum, dibuat boxplot dari data tersebut, namun sebelumnya lakukan entry data. Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
46
Selanjutnya, akan tampil sebagai berikut :
Kemudian tampilkan boxplot-nya dengan cara Graphs Boxplot..
200 100
150
jml_tamu
250
300
Output :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
47
Pada output di atas terlihat bentuk boxplot jumlah tamu agak menjurai ke atas. Selanjutnya akan dilakukan transformasi untuk jumlah tamu tersebut. Karena data menjurai ke atas, akan dicoba dilakukan transformasi menggunakan
x . Dibuat variabel baru yang
merupakan akar dari variabel jml_tamu.
Pilih Data > Manage variables in active dataset > Compute variable ...
Selanjutnya pada view data set akan muncul variabel baru, yaitu akar_jml_tamu.
Selanjutnya dibuat boxplot dari variabel akar_jml_tamu untuk mengetahui apakah variabel tersebut sudah berdistribusi normal atau belum, diperoleh hasil sebagai berikut :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
48
16 14 10
12
akar_jml_tamu
Terlihat data masih sedikit menjurai ke atas, maka dicoba transformasi log x. Transformasi log x dapat dilakukan dengan cara klik Data > Manage variables in active dataset > Compute variable ...
Pada view data set akan muncul variabel baru dengan nama log_jml_tamu.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
49
2.3 2.2 2.0
2.1
log_jml_tamu
2.4
Kemudian buat boxplot untuk variabel log_jml_tamu :
Terlihat boxplot sudah cukup simetris. Sehingga transformasi yang cocok adalah log(x).
5.3. Latihan 1.
Berikut ini adalah data hasil pengamatan jumlah pengunjung perpustakaan D3 Informasi dan Instrumentasi selama Bulan Juni. 39 38 29 29 44 35 43 45
50 45 45 38 34 31 47 38
41 21 40 49 44 45 49 25
Apakah data tersebut simetris? Jika tidak, lakukan transformasi data yang sesuai! 2.
Perhatikan nilai ujian basis data untuk 40 orang mahasiswa berikut ini : 79
49
48
72
80
84
90
70
70
71
92
38
68
71
85
51
90
35
83
73
92
93
76
21
80
91
58
72
30
72
99
95
58
20
83
82
76
57
88
70
Apakah data tersebut simetris? Jika tidak, lakukan transformasi data yang sesuai!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
50
BAB VI DATA RANDOM DAN DISTRIBUSI PELUANG Tujuan Praktikum 1. Praktikan mampu membangkitkan data berdistribusi normal dan student-t. 2. Praktikan mampu menghitung kuartil distribusi normal dan student-t. 3. Praktikan mampu menghitung probabilitas pada distribusi normal dan student-t.
6.1. Distribusi Normal Distribusi normal, disebut juga distribusi Gauss, adalah distribusi probabilitas yang paling banyak digunakan dalam berbagai analisis statistika dan kebanyakan pengujian hipotesis mengasumsikan normalisasi suatu data. Distribusi normal baku adalah distribusi normal yang memiliki rata-rata nol dan simpangan baku satu. Distribusi ini juga dijuluki kurva lonceng (bell curve) karena grafik fungsi kepekatan probabilitasnya mirip dengan bentuk lonceng. Distribusi normal memiliki sifat simetris, yaitu mean distribusi terletak di tengah dengan luas bagian sebelah kiri sama dengan bagian sebelah kanan (berbentuk lonceng) sehingga total daerah di bawah kurva sebelah kiri = total daerah di bawah kurva sebelah kanan = 0,5 f ( x; , ) 2
( x ) 2
1 2
2
e
2 2
, x
dengan π = 3,14159… dan e = 2,71828
Selain beberapa konstanta yang tidak akan berubah nilainya (e, π), bentuk distribusi kurva normal ditentukan oleh tiga variabel, yaitu: x = nilai dari distribusi variabel μ = mean dari nilai-nilai distribusi variabel σ = standar deviasi dari nilai-nilai distribusi variabel
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
51
6.1.1. Membangkitkan data berdistribusi normal
Contoh 1 1.
Akan digenerate data berdistribusi normal dengan jumlah data 30, mean = 0 dan sd =1.
2.
Ketikkan perintah berikut pada Rconsole > rnorm(30,0,1)
3.
Output :
[1]
0.5983855
0.7116100
17.798.840
-0.7995579
0.5873402
0.7797935
[7]
-0.5498465
-0.6635432
-0.7301439
0.2039722
-0.8284992
0.2853933
[13]
-0.1644072
13.300.272
14.178.972
0.1490345
0.3342537
0.8401881
[19]
-0.1758526
-0.1296207
-0.1290194
-0.5588599
20.510.804
0.4010594
[25]
-14.258.976
-0.2047000
0.6815185
-0.6308402
0.4461653
-0.5619954
Contoh 2 1.
Akan digenerate data berdistribusi normal dengan jumlah data 20, mean = 1 dan sd =1.5
2.
Ketikkan perintah berikut pada Rconsole > rnorm(20,1,1.5)
3.
Output :
[1]
-0.08308384
-0.83413525
-161.502.683
256.278.227
0.09009768
0.92929601
[7]
231.988.484
-145.564.267
0.76614766
0.77806463
318.023.558
0.17707811
[13]
-1.66562843
0.81019267
136.364.658
-135.878.857
-0.70399104
165.615.288
[19]
-228.021.370
187.995.815
6.1.2. Menghitung quantil (z tabel)
Tentukan harga Zα, sedemikian P (Z ≤ Zα,) = α (lower tail) atau P (Z ≥ Zα,) = 1-α (upper tail) untuk harga α berikut: Langkah Rcmdr > Distributions > Normal Distributions > Normal Quantiles Contoh 1 Lower tail pada α = 0.05
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
52
Output > qnorm(c(0.05), mean=0, sd=1, lower.tail=TRUE) [1] -1.644854
Contoh 1 Upper tail
Output : > qnorm(c(0.05), mean=0, sd=1, lower.tail=FALSE) [1] 1.644854
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
53
6.1.3. Menghitung probabilitas (p-value) Langkah : Rcmdr > Distributions > Normal Distributions > Normal Probabilities
Contoh 1 Hitung probabilitas P (Z < 2,5)!
Output > pnorm(c(2.5), mean=0, sd=1, lower.tail=TRUE) [1] 0.9937903
Contoh 2 Hitung probabilitas P (Z > 2,5)!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
54
Output > pnorm(c(2.5), mean=0, sd=1, lower.tail=FALSE) [1] 0.006209665
Selain menggunakan program R, perhitungan probabilitas distribusi normal juga bisa menggunakan tabel distribusi normal, yaitu tabel yang memuat probabilitas dari berbagai nilai variabel dalam distribusi normal. Yang menjadi masalah dalam penyusunan tabel tersebut adalah kenyataan bahwa terdapat banyak sekali macam distribusi normal, dipengaruhi oleh besarnya nilai mean (μ) dan standar deviasinya (σ). Untuk mengatasi hal tersebut, maka para ahli hanya membuat satu buah tabel yaitu tabel untuk menghitung nilainilai probabilitas distribusi normal standar, sedangkan jika akan menghitung probabilitas nilai-nilai variabel distribusi normal yang tidak standar, tetap bisa menggunakan tabel distribusi normal standar tersebut dengan memakai metode konversi. Yang dimaksud distribusi normal standar adalah distribusi normal dengan sifat khusus, yaitu distribusi dengan normal yang mean = 0 dan standar deviasi = 1. Namun, apabila menggunakan program R maka bisa langsung menghitung probabilitas dengan cara menyesuaikan nilai mean dan standar deviasinya. b
P ( X b)
( x ) 2
1 2
2
e
2 2
dx
Dapat dihitung menggunakan tabel Normal Standar dengan terlebih dahulu 2 Z ~ N (0,1) mentransformasikan skala X ~ N ( , ) ke ,
Z
X
Contoh Distribusi normal dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12, N(60,122). Akan dihitung P(X<76). Jawab Melakukan transformasi X ke Z dengan cara sebagai berikut : Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
55
Z
X
P( X 76) P(
76 60 12 1,33
maka
X
76 60 ) 12
P( Z 1,33) 0,9082
P(Z 1,33) dicari menggunakan Rcmdr sebagai berikut :
Distribution > continuous distributions > Normal distribution > normal probabilities
Output > pnorm(c(1.33), mean=0, sd=1, lower.tail=TRUE) [1] 0.9082409
Jadi P(X<76) dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12 adalah 0.91. Langsung menyesuaikan nilai mean dan standar deviasi pada program R :
Output > pnorm(c(76), mean=60, sd=12, lower.tail=TRUE) [1] 0.9087888
Jadi P(X<76) dengan mean 𝜇 = 60 dan deviasi standar 𝜎 = 12 adalah 0.91. 6.2. Distribusi Student-t Distribusi dengan variabel acak kontinu lainnya selain dari distribusi normal ialah distribusi student atau distribusi-t. Fungsi densitasnya adalah : 1 1 / 2 t 2 1 fT (t ; ) / 2
1 / 2
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
56
6.2.1. Membangkitkan data berdistribusi student-t Contoh 1 1.
Akan digenerate data berdistribusi t dengan n = 30 derajat bebas (df) = 29
2.
Ketikkan perintah berikut pada Rconsole > rt(30,29)
3.
Output
[1]
-0.94589143
157.648.795
-114.010.950
-0.23615789
-0.44198098
-0.18686742
[7]
223.321.053
0.03286632
129.338.590
148.717.072
-140.589.470
-0.67482811
[13]
0.73623844
0.69210436
-131.728.576
-0.19948329
231.273.571
0.65029448
[19]
156.583.856
-0.33549403
-174.624.680
-0.42242872
-149.979.037
-0.01405696
[25]
211.386.245
165.604.664
-0.38456833
0.64421307
119.870.866
-0.91036348
Contoh 2 1.
Akan digenerate data berdistribusi t dengan n = 20 derajat bebas (df) = 19.
2.
Ketikkan perintah berikut pada Rconsole >rt(20,19)
3.
Output
[1]
0.79774930
-0.33928362
0.50735857
0.48591979
149.433.708
-152.215.201
[7]
-0.70716824
-124.884.096
0.24890676
-0.12314463
-299.654.585
-103.572.273
[13]
182.672.652
-0.26042455
-0.07129386
-122.985.248
0.38592455
-0.32887532
[19]
0.51296267
0.22746948
6.2.2. Menghitung quantil (t tabel) Langkah Rcmdr > Distributions > t Distributions > t Quantiles Contoh Tentukan harga quantil dari distribusi t dengan α = 0.05 dan derajat bebas 9 Lower Tail
Output Lower Tail > qt(c(0.05), df=9, lower.tail=TRUE) [1] -1.833113
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
57
Upper Tail
Output Upper Tail > qt(c(0.05), df=9, lower.tail=FALSE) [1] 1.833113
6.2.3. Menghitung probabilitas (menghitung (p_value)) Contoh 1 Hitung probabilitas distribusi t dengan nilai t < 2.5 dengan db=9
Output > pt(c(2.5), df=9, lower.tail=TRUE) [1] 0.9830691
Jadi P(t<2.5) dengan db=9 adalah 0.9830691
Contoh 2 Hitung probabilitas distribusi t dengan nilai t > 2.5 dengan db=9
Output > pt(c(2.5), df=9, lower.tail=FALSE) [1] 0.01693091
Jadi P(t>2.5) dengan db=9 adalah 0.01693091 Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
58
6.3. Latihan 1. Bangkitkan data berdistribusi normal dengan : a. n = 65, mean = 10, dan sd = 3 b. n = 45, mean = 10, dan sd = 4 c. n = 100, mean = 11, dan sd = 5 2. Bangkitkan data berdistribusi t dengan : a. n = 95, db = 94 b. n = 55, db = 54 c. n = 28, db = 27 3. Hitung nilai dari : a. Z0.85 b. Z0.08 c. Z0.42 4. Hitung nilai dari : a. P(Z > 2.6) b. P(Z < -1.6) c. P(-0.8 < Z< 1.4) 5. Hitung nilai dari : a. t0.15;15 b. t0.8;23 c. t0.35;18
6. Hitung nilai dari : a. P(t > 1.9) dengan db=12 b. P(t < -1.45) dengan db=15 c. P(t > -0.25) dengan db=12
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
59
BAB VII UJI PROPORSI Tujuan Praktikum 1. Praktikan mampu melakukan analisis data menggunakan uji proporsi 1 populasi 2. Praktikan mampu melakukan analisis data menggunakan uji proporsi 2 populasi
7.1. Uji Proporsi Satu Populasi Uji Hipotesis. Kita ingin menguji suatu hipotesis bahwa persentase suatu populasi sama dengan harga tertentu p0 dalam kasus n besar. Uji ini dapat dilakukan dalam langkah-langkah sebagai berikut : 1. Merumuskan Hipotesis a. H0 : p = p0 (uji dua sisi) H1 : p ≠ p0 b. H0 : p ≤ p0 (uji sisi kanan) H1 : p > p0 c. H0 : p ≥ p0 (uji sisi kiri) H1 : p < p0 2.
Menentukan tingkat signifikansi α
3.
Statistik Penguji
x p n dimana x = jumlah „sukses‟ dalam sampel atau menggunakan p-value 4.
Daerah kritis : daerah dimana H0 ditulak H1 diterima Ho ditolak jika p_value < α
5.
Kesimpulan Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.
Langkah-langkah dengan Rconsole Buka R, lalu pada Rconsole ketikkan perintah berikut : > prop.test (x, n, p = NULL, alternative = c("two.sided", "less", "greater"), conf.level = 0.95, correct = TRUE)
x
: Jumlah sukses
n
: Jumlah total
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
60
p
: proporsi
alternative
: hipotesis alternatif
conf.level
: level konfidensi / tingkat keyakinan
Contoh Pabrik gelas “Kawung” mengklaim bahwa lebih dari
95% gelas yang diproduksinya
berkualitas baik. Sebuah penelitian dari 200 sampel gelas memperlihatkan adanya gelas yang cacat sebanyak 18 buah. Apakah anda menerima pernyataan pabrik tersebut? Uji dengan taraf signifikasi 5% ! Jawab p = 0.95 n = 200 x = 182 Syntax > prop.test(182,200,0.95,c("greater"))
Output 1-sample proportions test with continuity correction data: 182 out of 200, null probability 0.95 X-squared = 5.9211, df = 1, p-value = 0.9925 alternative hypothesis: true p is greater than 0.95 95 percent confidence interval: 0.8681495 1.0000000 sample estimates: p 0.91
1.
Merumuskan Hipotesis H0 : p ≤ 0.95 (gelas yang diproduksi pabrik “Kawung” kurang dari sama dengan 95% yang berkualitas baik) H1 : p > 0.95 (gelas yang diproduksi pabrik “Kawung” lebih dari 95% yang berkualitas baik)
2.
Menentukan tingkat signifikansi α = 0.05
3.
Statistik Penguji p-value = 0.9925
4.
Daerah kritis : daerah dimana H0 ditulak H1 diterima Ho ditolak jika p_value < α
5.
Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
61
p-value = 0.9925 > 0.05 maka H0 tidak ditolak jadi gelas yang diproduksi pabrik “Kawung” kurang dari sama dengan 95% yang berkualitas baik. Dengan kata lain gelas yang diproduksi pabrik “Kawung” tidak lebih dari 95% yang berkualitas baik sehingga pernyataan pabrik tersebut tidak dapat diterima.
7.2. Uji Proporsi Dua Populasi Ingin diuji suatu hipotesis bahwa selisih proporsi (persentase) dua populasi p1-p2 sama dengan harga p0 tertentu. Dengan n1 dan n2 yang cukup besar dan dengan dasar penyusunan inferensi yang sama seperti dalam estimasi interval, dapat disusun uji hipotesis sebagai berikut : 1. Merumuskan Hipotesis a. H0 : (p1-p2) = p0 (uji dua sisi) H1 : (p1-p2) ≠ p0 b. H0 : (p1-p2) ≤ p0 (uji sisi kanan) H1 : (p1-p2) > p0 c. H0 : (p1-p2) ≥ p0 (uji sisi kiri) H1 : (p1-p2) < p0 2. Menentukan tingkat signifikansi α 3. Statistik Penguji menggunakan p-value 4. Daerah kritis : daerah dimana H0 ditolak H1 diterima Ho ditolak jika p_value < α 5. Kesimpulan Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α. Langkah-langkah pada Rconsole ketikkan perintah berikut : x.total=c(x1,x2) n.total=c(n1,n2) prop.test(x.total,n.total,alternative=c("two. sided","less","greater"),conf.level=0.95)
Contoh Bagian akademik Vokasi ingin mengetahui perbandingan antara mahasiswa tahun kedua dan mahasiswa tahun ketiga yang bekerja sebagai programmer di luar tugas kuliah. Dari 150 mahasiswa tahun kedua dan 120 mahasiswa tahun ketiga yang berhasil diwawancarai, diketahui ada 30 mahasiswa tahun kedua dan 63 mahasiswa tahun ketiga yang bekerja Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
62
sebagai programmer di luar tugas kuliah. Jika alpa = 5%, tentukan apakah ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa tahun kedua dan ketiga? Jawab n1
= jumlah mahasiswa tahun kedua = 150
n2
= jumlah mahasiswa tahun ketiga = 120
x1
= jumlah mahasiswa tahun kedua yang bekerja sebagai programmer = 30
x2
= jumlah mahasiswa tahun ketiga yang bekerja sebagai programmer = 63
alpa
= 5%
Syntax x.total=c(30,63) n.total=c(150,120) prop.test(x.total,n.total,alternative="two.sided",conf.level=0.95)
Output 2-sample test for equality of proportions with continuity correction data: x.total out of n.total X-squared = 29.7624, df = 1, p-value = 4.884e-08 alternative hypothesis: two.sided 95 percent confidence interval: -0.4424117 -0.2075883 sample estimates: prop 1 prop 2 0.200 0.525
1. Merumuskan Hipotesis H0 : p1 = p2 (tidak ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa tahun kedua dan ketiga) H1 : p1 ≠ p2 (ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa tahun kedua dan ketiga) 2. Menentukan tingkat signifikansi α = 0.05 3. Statistik Penguji p-value = 4.884e-08 = 4.884 x 10-8 4. Daerah kritis : daerah dimana H0 ditolak H1 diterima Ho ditolak jika p_value < α 5. Kesimpulan p-value = 4.884 x 10-8 < 0.05 maka H0 ditolak jadi ada perbedaan proporsi mahasiswa yang bekerja sebagai programmer di luar tugas kuliah antara mahasiswa tahun kedua dan ketiga. Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
63
7.3. Latihan 1.
Siti membuat jus mangga buatan sendiri untuk dijual di perpustakaan UGM. Petugas perpustakaan menyatakan bahwa banyak pengunjung perpustakaan menyukai jus mangga buatan Siti. Siti akan menambah jumlah produksi jika pengunjung yang menyukai jus mangganya berjumlah lebih dari 80%. Siti pun membuat kuisioner dengan bertanya ke 50 pengunjung perpustakaan selama seminggu, hasilnya 38 pengunjung menyukai jus mangga buatan Siti. Dari keterangan di atas, apakah Siti jadi menambah jumlah produksi jus mangga buatannya? Gunakan α = 5%!
2.
Seorang mahasiswa KOMSI yang sedang menyelesaikan Tugas Akhir melakukan sebuah penelitian tentang efektivitas sistem yang dibuatnya. Jika lebih dari 90% pengguna menganggap bahwa sistemnya mudah dipelajari dan sesuai kebutuhan maka mahasiswa ini jadi menerapkan sistemnya tersebut di instansi terkait. Mahasiswa ini menggunakan alpa dan beta testing dan meminta beberapa orang untuk mencoba sistem dan meminta testimoni sistem pada respondennya. Dari 110 responden yang diminta untuk mencoba sistemnya, 85 orang menganggap bahwa sistemnya mudah dipelajari dan sesuai dengan kebutuhan pengguna. Dari keterangan di atas, apakah mahasiswa ini jadi menerapkan sistemnya di instansi yang membutuhkan? Gunakan α = 5%!
3.
Sebuah lembaga survei ingin mengetahui berapa perbandingan antara dosen laki-laki dan perempuan yang mempunyai pekerjaan lain di luar kampus di sebuah Universitas. Dari 670 dosen pria dan 560 dosen wanita yang berhasil diwawancarai diketahui ada 410 dosen laki-laki dan 277 dosen wanita yang mempunyai pekerjaan di luar kampus. Jika alpa = 10%, tentukan apakah ada perbedaan proporsi dosen yang mempunyai pekerjaan lain di luar kampus!
4.
Sebuah agen penjualan notebook ingin melihat jenis merk notebook mana yang lebih handal antara X dan Y. Untuk tujuan tersebut agen menghubungi 500 pembeli notebook merk X dan 600 pembeli notebook merk Y yang usia notebook-nya kurang dari 2 tahun. Setiap pembeli diberikan pertanyaan apakah mereka pernah melakukan servis berat notebook-nya selama 1 tahun terakhir. Hasilnya 90 pembeli merk X dan 65 pembeli merk Y pernah melakukan servis berat notebook-nya. Apakah ada perbedaan kehandalan notebook merk X dan Y? (gunakan alpha = 0.05)!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
64
BAB VIII UJI HIPOTESIS MEAN SATU POPULASI NORMAL dan VARIANSI TIDAK DIKETAHUI (UJI t) Tujuan Praktikum 1.
Praktikan mampu melakukan analisis data menggunakan uji rata-rata satu populasi normal dan variansi tidak diketahui.
8.1. Pendahuluan Jika dipunyai sampel random X1, X2, ..., Xn berasal dari populasi Normal dengan mean μ dan variansi σ2 maka variabel random t
X s n
berdistribusi t dengan derajat bebas (n-1). Distribusi ini digunakan untuk inferensi mean populasi normal dengan ukuran sampel (n) kecil (n<30)dan σ tidak diketahui. Untuk n yang semakin besar maka distribusi t ini akan mendekati distribusi Normal.
8.2. Inferensi Statistik untuk Mean Populasi Normal 8.2.1. Uji hipotesis Ingin diketahui apakah mean (μ) dari suatu populasi Normal sama dengan μ0 (konstanta) berdasarkan sampel random berukuran n. Langkah uji hipotesisnya dapat di urutkan sebagai berikut : 1. Hipotesis a. H0 : μ = μ0 (uji dua sisi) H1 : μ ≠ μ0 b. H0 : μ ≤ μ0 (uji sisi kanan) H1: μ > μ0 c. H0 : μ ≥ μ0 (uji sisi kiri) H1: μ<μ0 2. Diambil tingkat signifikansi α 3. Statistik penguji
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
65
X s n
t
(jika σ tidak diketahui)
atau p_value 4. Daerah kritis: daerah dimana H0 ditolak. a. H0 ditolak jika t > t n−1;α/2 atau t < - tn-1:;α/2 b. H0 ditolak jika t > t n−1;α (untuk uji kanan) c. H0 ditolak jika t < - t n−1;α (untuk uji kiri) atau d. H0 ditolak jika p_value < α (untuk semua uji) 5. Kesimpulan Berdasarkan langkah 4 dan hasil hitungan statistik penguji langkah 3, diambil kesimpulan apakah H0 ditolak atau tidak ditolak pada tingkat signifikansi α.
8.2.2. Interval konfidensi Misalkan X1, X2, ..., Xn adalah sampel random yang diambil dari populasi Normal dengan mean μ dan variansi σ2 maka maka interval konfidensi (1-α) 100% untuk μ adalah B≤μ≤A 2
Karena σ tidak diketahui maka menurut teorema distribusi t diperoleh
s 2 n s A X t n 1; 2 n
B X t n 1;
dengan nilai t n 1;
2
diperoleh dari tabel distribusi t.
Karena uji hipotesis dan interval konfidensi di atas menggunakan statistik t, maka sering dinamakan uji t. Contoh Seorang administrator sistem informasi penjualan tiket bus antarkota ingin mengetahui apakah data penjualan yang masuk pada satu bulan sudah memenuhi target, yaitu menjual lebih dari 100 tiket per hari. Berikut ini data penjualan tiket dalam 30 hari : 89
53
137
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
66
60 73 66 78 112 150 65 70 72
64 117 143 58 73 63 70 78 100
69 83 75 78 83 136 162 76 60
Apakah penjualan tiket tersebut mencapai target ? Gunakan alpha 5%!
Jawab 1. Hipotesis H0 : μ ≤ 100 (penjualan yang masuk pada satu bulan kurang dari sama dengan 100 tiket per hari) H1: μ > 100 (penjualan yang masuk pada satu bulan lebih dari 100 tiket per hari) 2. Diambil tingkat signifikansi α 3. Statistik penguji t = -2.3211 dan p-value = 0.9862 yang diperoleh dari : Statistics > Means > Single sample t-test...
Output One Sample t-test data: tiket$tiket t = -2.3211, df = 29, p-value = 0.9862 alternative hypothesis: true mean is greater than 100 95 percent confidence interval: 77.65674 Inf sample estimates:
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
67
mean of x 87.1
4. Daerah kritis : H0 ditolak jika p_value <α 5. Kesimpulan Karena p_value = 0,9862 > 0,05 maka H0 tidak ditolak, berarti rata-rata penjualan yang masuk pada satu bulan kurang dari sama dengan 100 tiket per hari. Hal ini menunjukkan bahwa target penjualan belum terpenuhi. 8.3. Latihan 1.
Seorang programmer web internet marketing SEO ingin mengetahui apakah web yang dibuat pada satu bulan sudah memenuhi target, yaitu minimal dikunjungi
50
pengunjung per hari. Lakukanlah uji hipotesis dengan alpa = 10%! Berikan interpretasinya? Berikut data yang diperoleh selama 30 hari :
32 35 33 38 39 37 41 45 43 47 2.
53 64 57 66 58 67 56 66 59 63
71 69 53 55 58 63 66 62 67 70
Seorang mahasiswa KOMSI mendapat tugas praktikum statistika untuk mengetahui berapakah jumlah pengunjung kantin selama 20 hari kerja sudah sesuai target pemilik kantin, yaitu 50 orang/hari. Lakukanlah uji hipotesis dengan alpa = 5%! Berikan interpretasinya? Berikut data yang diperoleh selama 20 hari:
35 43 51 38
53 64 42 43
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
68
60 55 50 65 38 42
3.
58 43 36 40 58 43
Petugas parkir kampus VOKASI menghitung jumlah mahasiswa yang memakai sepeda ke kampus. Pengamatan dilakukan selama 20 hari kerja. Pengamatan dilakukan untuk mengetahui apakah himbauan terhadap mahasiswa agar memakai sepeda ke kampus sudah terpenuhi, yaitu dengan melihat apakah mahasiswa yang bersepeda sudah lebih dari 40 mahasiswa/hari. Lakukanlah uji hipotesis dengan alpa = 5%! Berikan interpretasinya! Berikut data yang diperoleh selama 20 hari : 27 33 31 38 38 40 42 36 37 41
39 32 42 43 35 34 36 40 38 43
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
69
BAB IX UJI HIPOTESIS MEAN DUA POPULASI Tujuan Praktikum 1. Praktikan mampu melakukan analisis data menggunakan uji rata-rata dua populasi independen. 2. Praktikan mampu melakukan analisis data menggunakan uji rata-rata dua populasi dependen.
9.1. Uji Hipotesis Mean 2 Populasi Independen (Uji Independen sample t test) Uji rata-rata 2 sampel independen (bebas) adalah metode yang digunakan untuk menguji kesamaan rata-rata dari 2 populasi yang bersifat independen. Independen maksudnya adalah bahwa populasi yang satu tidak dipengaruhi atau tidak berhubungan dengan populasi yang lain. 1. Hipotesis a. H0 : μ1 - μ2 = 0 (uji dua sisi) H1 : μ1 - μ2 ≠ 0 b. H0 : μ1 - μ2 ≤ 0 (uji sisi kanan) H1 : μ1 - μ2 > 0 c. H0 : μ1 - μ2 ≥ 0 (uji sisi kiri) H1 : μ1 - μ2 < 0 2. Tingkat signifikansi, α = 5% 3. Statistik Uji, p_value 4. Daerah kritis Ho ditolak jika p_value < α 5. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
70
Contoh Dipunyai data tentang pengujian ketahanan terhadap 2 merk genteng dengan anggapan data diambil dari populasi normal. Ujilah apakah bisa dikatakan kedua kualitas genteng sama? Genteng A 120 122 120 138 130 128 132
Genteng B 115 120 118 130 135 126 127
Langkah-langkah menjawab soal di atas : 1. Input data pada dataset Rcmdr :
2. Variabel Merk_genteng akan kita ganti untuk 1=genteng A dan 2=genteng B dengan cara : Klik Data > manage variable in active data set > convert numeric variables to factors
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
71
Pada view data set akan muncul sebagai berikut :
3. Melakukan uji Levene’s test (uji kesamaan variansi) statistics > Variances >Levene’s test Langkah-langkah uji hipotesis : a. Hipotesis H0: Variansi kedua populasi sama (σ1 = σ2) H1: Variansi kedua populasi tidak sama (σ1 ≠σ2) b. Tingkat signifikansi, alpha = 5% c. Statistik Uji Cara mencari nilai p_value dari uji Levene’s test : statistics > Variances >Levene’s test Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
72
Output Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 1 0.0048 0.946 12
Dari output di atas diperoleh nilai p_value = 0.946 4. Daerah kritis Ho ditolak jika p_value < α 5. Kesimpulan p_value = 0.946 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti Variansi kedua populasi sama. 6. Melakukan Uji Independen t test a. Hipotesis H0 : μ1 - μ2 = 0 (rata-rata ketahanan kedua genteng sama) H1 : μ1 - μ2 ≠ 0 (rata-rata ketahanan kedua genteng berbeda) b. Tingkat signifikansi, α = 5% c. Statistik Uji, P_value Cara memperoleh p_value dari uji indpenden t test : statistics > means > Independent sample t-test
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
73
d. Alternative Hypothesis : Two-sided karena pada uji hipotesis independen t test pada kasus di atas yang digunakan adalah uji dua sisi (H1 : μ1 - μ2 ≠ 0 ) e. Confidence Level : .95 diperoleh dari 1 – α, dan tingkat signifikansi yang digunakan α = 0.05 f. Assume equal variances : Yes ( karena pada uji levene’s test kesimpulan yang diperoleh kedua populasi memiliki variansi yang sama. Jika pada kesimpulan uji levene’s test adalah kedua populasi memiliki variansi yang berbeda maka yang dipilih adalah Nomor)
Output Two Sample t-test data:
ketahanan by Merk_genteng
t = 0.73, df = 12,
p-value = 0.4794
alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.386425 10.814996 sample estimates: mean in group genteng A mean in group genteng B 127.1429
124.4286
Dari output di atas diperoleh nilai p_value = 0.4794 5. Daerah kritis Ho ditolak jika p_value < α 6. Kesimpulan p_value = 0.4794 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata ketahanan kedua genteng sama. Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
74
9.2. Uji Hipotesis Mean 2 Populasi Dependen (Uji Paired t test) Uji hipotesis rata-rata 2 populasi dependen juga sering dinamakan uji rata-rata 2 sampel berpasangan atau paired sample t test. Dalam uji ini, suatu populasi diamati/ diberi perlakuan 2 kali, sehingga dihasilkan pasangan-pasangan data untuk masing-masing anggota populasi. Rata-rata selisih pengamatan pertama dan ke dua dinamakan μD. Misalkan dari suatu populasi diambil sampel sebanyak n, kemudian sampel tersebut diamati dan menghasilkan data X1, X2, ..., Xn. Selanjutnya diamati untuk yang ke dua kalinya dan menghasilkan data Y1, Y2, ..., Yn. Dengan demikian dari sampel pertama diperoleh data (X1, Y1), dari sampel ke dua diperoleh (X2, Y2), dan seterusnya sampai sampel ke-n diperoleh (Xn, Yn). Rata-rata selisih pengamatan pertama dan ke dua pada sampel dinamakan 𝐷 dan standar deviasinya dinamakan sD. Berikut uji hipotesis untuk rata-rata 2 populasi dependen.: 1. Hipotesis a. H0: μD = μ0 (uji dua sisi) H1: μD ≠ μ0 b. H0: μD ≤ μ0 (uji sisi kanan) H1: μD > μ0 c. H0: μD ≥ μ0 (uji sisi kiri) H1: μD < μ0 2. Diambil tingkat signifikansi α 3. Statistik penguji, p_value 4. Daerah kritis: H0 ditolak jika p_value < α (untuk semua uji) 5. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
75
Contoh Bagian akademik ingin melakukan survei terhadap pemberian beasiswa PPA. Apakah dengan menggunakan pemberian beasiswa PPA memberi dampak kenaikan terhadap IPK mahasiswa penerima. Nilai α= 5% (0.05). Dengan data berikut : Sebelum Sesudah 3.7 3.6 3.6 3.7 3.8 3.7 3.7 3.6 3.9 3.6 3.8 3.4 3.6 3.5 3.9 3.5
Langkah-langkah menjawab soal di atas : 1. Input data pada data set Rcmdr :
2. Melakukan uji paired t test a. Hipotesis H0 : μD ≥ μ0 (rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih besar atau sama dengan rata-rata IPK mahasiswa setelah menerima beasiswa PPA ) H1: μD < μ0 (rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih kecil dari ratarata IPK mahasiswa setelah menerima beasiswa PPA )
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
76
b. Diambil tingkat signifikansi α c. Statistik penguji Cara memperoleh nilai p_value dari uji paired t test : statistics > means > paired sample t test
d. Alternative Hypothesis : Difference < 0 karena pada uji hipotesis paired t test pada kasus di atas yang digunakan adalah uji sisi kiri (H1: μD < μ0) e. Confidence Level : .95 diperoleh dari 1 – α, dan tingkat signifikansi yang digunakan α = 0.05 Output Paired t-test data:
ipk$Sebelum and ipk$Sesudah
t = 2.8243, df = 7,
p-value = 0.9872
alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf 0.2923918 sample estimates: mean of the differences 0.175
Dari output di atas diperoleh nilai p_value = 0.9872 Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
77
3. Daerah kritis: H0 ditolak jika p_value < α 4. Kesimpulan p_value = 0.9872 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata IPK mahasiswa sebelum menerima beasiswa PPA lebih besar atau sama dengan rata-rata IPK mahasiswa setelah menerima beasiswa PPA (IPK mahasiswa setelah diberi beasiswa PPA tidak lebih bagus dibandingkan sebelum menerima beasiswa).
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
78
9.3. Latihan 1.
Sebuah perusahaan penghasil bahan bakar mobil hendak memilih satu dari dua ramuan kimia yang akan dijadikan campuran di dalam produknya. Ramuan tersebut adalah RDX dan DLL. Untuk memutuskannya, departemen riset perusahaan tersebut mengadakan penelitian untuk menguji efisiensi penggunaan bahan bakar setelah diberi kedua campuran tersebut. Dalam penelitian ini, digunakan 60 buah mobil, 30 di antaranya diberi bahan bakar dengan campuran RDX dan 30 mobil sisanya diberi bahan bakar dengan campuran DLL. Ketiga puluh mobil kemudian dijalankan oleh 60 orang pengemudi dengan kemampuan mengemudi yang homogen pada suatu lintasan tertentu. Dengan memberikan 1 liter bahan bakar untuk setiap mobil, jarak tempuh 30 mobil yang diberi bahan bakar bercampur RDX dan 30 mobil dengan bahan bakar bercampur DLL kemudian dicatat. Apakah terdapat perbedaan jarak tempuh antara menggunakan RDX dan DLL? Data jarak tempuh (dalam kilometer) disajikan pada tabel berikut : RDX 5.21 5.31 5.32 5.12 5.16 5.40 5.29 5.20 5.14 5.23 5.22 5.01 5.19 5.23 5.40
DLL 5.17 5.35 5.09 5.29 5.30 5.14 5.25 5.38 5.39 5.30 5.18 5.35 5.29 5.35 5.20
5.60 5.21 5.43 5.34 5.41 5.26 5.24 5.42 5.31 5.15 5.39 5.50 5.38 5.45 5.36
5.29 5.49 5.31 5.36 5.47 5.53 5.37 5.47 5.48 5.59 5.34 5.47 5.53 5.34 5.28
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
79
2.
Suatu perusahaan menyatakan bahwa sejenis diet baru akan menurunkan berat badan seseorang. Berikut ini dicantumkan berat badan tujuh wanita sebelum dan sesudah mengikuti diet ini. Wanita ke1 2 3 4 5 6 7
Sesudah Sebelum 58.5 60.0 60.3 54.9 61.7 58.1 69.0 62.1 64.0 58.5 62.6 59.9 56.0 54.4
Ujilah pernyataan perusahaan tersebut dengan selang kepercayaan 95%!
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
80
BAB X ANALISIS VARIANSI SATU ARAH Tujuan Praktikum : 1. Melakukan pengujian rata-rata terhadap lebih dari dua populasi independen. 2. Melakukan uji perbandingan ganda pada pasangan populasi yang terbentuk.
10.1. Pendahuluan Analisis Variansi adalah suatu prosedur untuk uji perbedaan mean beberapa populasi (lebih dari dua). Analisis variansi adalah perluasan dari uji independen t test. Pada analisis variansi yang diuji perbedaan dari k populasi. Diketahui bahwa apabila mean di antara populasi sangat berbeda satu dengan yang lainnya maka variansi kumpulan antar mean jauh lebih besar daripada variansi masing-masing populasi. Prosedur anova mendasarkan analisisnya berdasarkan fakta tersebut. Rancangan data untuk anova satu arah dapat dilihat seperti gambar di bawah ini dengan ketentuan bahwa banyaknya sampel tiap populasi tidak harus sama. 1
…
X11
i
k
Xi1
Xk1
X ini
X knk
. .
…
. X 1n1
X1
…
Xi
Xk
S12
…
S i2
S k2
10.2. Asumsi dalam Anova 1. Keindependenan data ( tidak perlu dilakukan pengujian datanya 2. Kenormalan data Bentuk Hipotesa : a. H0 : data berdistribusi normal H1 : data tidak berdistribusi normal b. Tingkat signifikansi (α) Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
81
c. Statistik uji p-value d. Daerah Kritis Ho ditolak jika p-value < α e. Kesimpulan 3. Kesamaan Variansi Bentuk Hipotesa : a. Ho : variansi dari semua populasi sama H1 : minimal ada satu populasi yang mempunyai variansi tidak sama b. Tingkat signifikansi (α) c. Statistik uji p-value d. Daerah Kritis Ho ditolak jika p-value < α e. Kesimpulan Catatan : jika asumsi kesamaan variansi maupun kenormalan data tidak terpenuhi maka lakukan transformasi data, kemudian lakukan uji asumsi lagi.
10.3. Uji Anova Satu Arah Bentuk Uji Hipotesis 1. Ho: µ1 = µ2 = ... = µk ( rata-rata antar populasi itu sama ) H1: µi ≠ µj ; min 1 pasang populasi (i,j) yg mempunyai rata-rata yang berbeda untuk i ≠ j 2. Tingkat signifikansi ( ) 3. Statistik penguji:
SST /( K 1 ) F SSE /( N K )~FK-1, N-K K
SSE ( n 1 )S i i i 1
2
K
2 SST n X X ) i( i i 1
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
82
Tabel anova Source of Variation
df
Sum of Square
Mean of Square
Perlakuan (treatment)
K-1
SST
MST=SST/(K-1)
Sesatan (Error)
N-K
SSE
MSE=SSE/(N-K)
F-rasio F
MST MSE
4. Daerah kritis Ho ditolak jika p_value < alpha atau Fhit > Ftabel 5. Kesimpulan Catatan : Apabila HO diterima maka pekerjaan selesai, tetapi apabila Ho ditolak maka analisa selanjutnya adalah Uji Perbandingan Ganda.
10.4. Uji Perbandingan Ganda Uji perbandingan ganda dapat dilakukan dengan Metode FISHER. Metode ini hampir mirip dengan uji t. Uji perbandingan ganda digunakan untuk mengetahui apakah antar pasangan yang berasal dari kombinasi populasinya itu mempunyai rata-rata yang sama atau tidak. Jika terdapat K perlakuan maka :
K Terdapat 2 kombinasi pasangan H0 yang akan diuji K : jumlah perlakuan Bentuk Uji Hipotesanya adalah sebagai berikut : a. Ho: µi = µj H1: µi ≠ µj b. Tingkat Signifikansi (α) c. Statistik uji p-value d. Daerah Kritis H0 ditolak jika p_value < alpha e. Kesimpulan
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
83
Contoh Diadakan penelitian untuk menentukan pengaruh nutrisi pada perhatian anak SD. Diambil 15 anak yang di acak 3 pola sarapan pagi: tanpa sarapan, sarapan ringan, dan full sarapan. Perhatian mereka terhadap pelajaran dalam menit dicatat dalam tabel berikut : Tanpa sarapan Sarapan ringan Full sarapan 8 14 10 7 16 12 9 12 16 13 17 15 10 11 12 11 13 13 12 14 12 Lakukan Anova One-Way untuk data di atas dengan α= 0.05!
Langkah-langkah untuk menjawab pertanyaan di atas : 1. Uji normalitas data a. Input data pada data set Rcmdr :
b. Melakukan uji normalitas : Statistics > Summaries > Shapiro-Wilk test of normality...
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
84
Output Shapiro-Wilk normality test data: anova$Full_sarapan W = 0.9226, p-value = 0.4898 Shapiro-Wilk normality test data: anova$Sarapan_ringan W = 0.9654, p-value = 0.8632 Shapiro-Wilk normality test data: anova$Tanpa_sarapan W = 0.978, p-value = 0.9493
2. Uji hipotesis : a. Full Sarapan H0 : data berdistribusi normal H1 : data tidak berdistribusi normal Tingkat signifikansi (α) Statistik uji p-value = 0.4898 Daerah Kritis H0 ditolak jika p-value < α Kesimpulan p-value = 0.4898 > α= 0.05 maka H0 tidak ditolak. Hal ini berarti data pada kelompok Full Sarapan berdistribusi normal. b. Sarapan Ringan H0 : data berdistribusi normal H1 : data tidak berdistribusi normal Tingkat signifikansi (α) Statistik uji p-value = 0.8632 Daerah Kritis H0 ditolak jika p-value < α Kesimpulan p-value = 0.8632 > α= 0.05 maka H0 tidak ditolak. Hal ini berarti data pada kelompok Sarapan Ringan berdistribusi normal.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
85
c. Tanpa Sarapan H0 : data berdistribusi normal H1 : data tidak berdistribusi normal Tingkat signifikansi (α) Statistik uji p-value = 0.9493 Daerah Kritis H0 ditolak jika p-value < α Kesimpulan p-value = 0.9493 > α= 0.05 maka H0 tidak ditolak. Hal ini berarti data pada kelompok Tanpa Sarapan berdistribusi normal.
Kesimpulan pada uji normalitas : ketiga populasi berdistribusi normal, jadi asumsi normalitas terpenuhi.
3. Uji Kesamaan Variansi a. Input data pada data set Rcmdr :
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
86
b. Variabel Sarapan akan kita ganti untuk 1 = full sarapan , 2 = sarapan ringan dan 3 = tanpa sarapan dengan cara : Klik Data > manage variable in active data set > convert numeric variables to factors
Pada view data set akan muncul :
Bentuk Hipotesa : H0 : variansi dari semua populasi sama H1 : minimal ada satu populasi yang mempunyai variansi tidak sama Tingkat signifikansi (α)
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
87
Statistik uji Cara mencari nilai p_value dari uji Levene’s test : statistics > Variances >Levene’s test
Output Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 2 0.0783 0.925 18
Dari output di atas diperoleh nilai p_value = 0.925 Daerah Kritis H0 ditolak jika p-value < α Kesimpulan p_value = 0.925 > α = 0.05 maka H0 tidak ditolak. Hal ini berarti Variansi ketiga populasi sama, jadi asumsi kesamaan variansi terpenuhi.
c. Uji Anava Bentuk Hipotesa : 1. H0: µ1 = µ2 = µ3 ( rata-rata perhatian terhadap pelajaran (dalam menit) antara status sarapan adalah sama ) H1: µi ≠ µj ; min 1 pasang populasi (i,j) yang mempunyai rata-rata perhatian terhadap pelajaran (dalam menit) yang berbeda untuk i ≠ j 2. Tingkat signifikansi ( )
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
88
3. Statistik penguji: Statistics > Means > One-way ANOVA...
Output > summary(AnovaModel.1) Df Sum Sq Mean Sq F value Pr(>F) Sarapan 2 56.10 28.048 6.333 0.00827 ** Residuals 18 79.71 4.429 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 > numSummary(anova2$Perhatian statistics=c("mean", + "sd")) mean full sarapan 10.00000 sarapan ringan 13.85714 tanpa sarapan 12.85714
, groups=anova2$Sarapan, sd 2.160247 2.115701 2.035401
data:n 7 7 7
Dari output di atas diperoleh nilai p_value = 0.00827
4. Daerah Kritis H0 ditolak jika p-value < α 5. Kesimpulan p_value = 0.00827 < α = 0.05 maka H0 ditolak. Hal ini berarti minimal ada 1 pasang kelompok sarapan yang rata-rata perhatian terhadap pelajaran (dalam menit) berbeda, maka perlu dilakukan pembandingan ganda.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
89
d. Uji Pembandingan Ganda Statistics > Means > One-way ANOVA...
Output > summary(.Pairs) # pairwise tests Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Tukey Contrasts Fit: aov(formula = Perhatian ~ Sarapan, data = anova) Linear Hypotheses: Estimate Std. Error t value Pr(>|t|) sarapan ringan - full sarapan == 0 3.857 1.125 3.429 0.00818 ** tanpa sarapan - full sarapan == 0 2.857 1.125 2.540 0.05120 . tanpa sarapan - sarapan ringan == 0 -1.000 1.125 -0.889 0.65395 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 (Adjusted p values reported -- single-step method) > confint(.Pairs) # confidence intervals Simultaneous Confidence Intervals Multiple Comparisons of Means: Tukey Contrasts Fit: aov(formula = Perhatian ~ Sarapan, data = anova) Quantile = 2.5519 95% family-wise confidence level Linear Hypotheses: Estimate lwr upr sarapan ringan - full sarapan == 0 3.85714 0.98662 6.72766 tanpa sarapan - full sarapan == 0 2.85714 -0.01338 5.72766 tanpa sarapan - sarapan ringan == 0 -1.00000 -3.87052 1.87052 > cld(.Pairs) # compact letter display sarapanringan tanpasarapan fullsarapan "a" "ab" "b"
Bentuk Uji Hipotesanya adalah sebagai berikut : Full sarapan dan Sarapan Ringan H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full sarapan dan sarapan ringan sama) H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full sarapan dan sarapan ringan berbeda) Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
90
Tingkat Signifikansi (α) = 0.05 Statistik uji p-value = 0.00818 Daerah Kritis H0 ditolak jika p_value < alpha Kesimpulan p_value = 0.00818 < α = 0.05 maka H0 ditolak. Hal ini berarti rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full sarapan dan sarapan ringan berbeda.
Full sarapan dan Tanpa Sarapan H0 : µ1 = µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full sarapan dan tanpa sarapan sama) H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full sarapan dan tanpa sarapan berbeda) Tingkat Signifikansi (α) = 0.05 Statistik uji p-value = 0.0512 Daerah Kritis H0 ditolak jika p_value < alpha Kesimpulan p_value = 0.0512 > α = 0.05 maka Ho tidak ditolak. Hal ini berarti rata-rata perhatian terhadap pelajaran (dalam menit) antara yang full sarapan dan tanpa sarapan sama.
Sarapan Ringan dan Tanpa Sarapan H0 : µ1
= µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang
sarapan ringan dan tanpa sarapan sama) H1: µ1 ≠ µ2 (rata-rata perhatian terhadap pelajaran (dalam menit) antara yang sarapan ringan dan tanpa sarapan berbeda) Tingkat Signifikansi (α) = 0.05 Statistik uji p-value = 0.65395
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
91
Daerah Kritis Ho ditolak jika p_value < alpha Kesimpulan p_value = 0.65395 > α = 0.05 maka H0 tidak ditolak. Hal ini berarti rata-rata perhatian terhadap pelajaran (dalam menit) antara yang sarapan ringan dan tanpa sarapan sama.
Jadi kesimpulan dari uji pembandingan ganda adalah pasangan kelompok yang rata-rata perhatian terhadap pelajaran (dalam menit) berbeda adalah antara full sarapan dan sarapan ringan.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
92
10.5. Latihan 1. Sampel air diambil di empat lokasi sungai untuk menentukan kualitas kebersihannya. Diperoleh data kandungan oksigen sebagai berikut :
Sungai A
Sungai B
Sungai C
Sungai D
5.9
6.3
4.8
6.0
6.1
6.6
4.3
6.2
6.3
6.4
5.0
6.1
6.1
6.4
4.7
5.8
6.0
6.5
5.1
6.3
Lakukan Anova One-Way untuk data di atas dengan α= 0.05!
2. Dari sebuah penelitian tentang kandungan protein yang dikonsumsi mahasiswa, ingin diketahui apakah jenis makanan yang dikonsumsi memiliki kandungan protein yang sama pada tingkat signifikansi 0.05? Diperoleh data sebagai berikut :
Kangkung 48.3 49.8 46.7 49.3 47.5 48.7 48.5
Wortel 43.7 46.8 45.5 44.4 45.3 44.8 42.8 45.1
Susu 46.8 43.7 47.8 44.8 46.6 45.3 46.2
Telur 48.2 47.3 46.4 48.5 46.1 47.6 47.9 48.3
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
93
3. Berdasarkan data sample biaya hosting penyedia layanan web online di Yogyakarta pada September 2010 sampai Mei 2014 dengan tingkat keyakinan 95%, ingin diketahui apakah ada perbedaan rata-rata biaya hosting web online antara kelompok usia penyedia layanan hosting web online? Jika ada perbedaan, kelompok usia penyedia layanan hosting mana saja yang memiliki perbedaan biaya hosting web online?
3 tahun 5 tahun Usia Usia < Usia < < Usia < <= 3 tahun > 7 tahun 5 tahun 7 tahun 226.000 233.000 220.000 133.000 255.000 236.000 298.000 135.000 142.000 240.000 317.000 192.000 145.000 301.000 334.000 163.000 149.000 304.000 339.000 169.000 261.000 305.000 237.000 169.000 267.000 317.000 270.000 175.000 276.000 193.000 272.000 184.000 280.000 194.000 283.000 193.000 294.000 199.000 289.000 200.000 185.000 224.000 221.000 202.000 206.000 226.000 223.000 255.000 212.000 228.000 224.000 262.000 216.000 230.000 226.000 268.000 223.000 180.000 230.000 144.000 137.000 184.000 237.000 148.000 139.000 187.000 245.000 149.000 256.000 190.000 254.000 151.000 155.000 192.000 235.000 157.000 165.000 263.000 259.000 206.000 174.000 264.000 262.000 208.000 182.000 277.000 266.000 231.000 183.000 279.000 266.000 233.000
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
94
BAB XI ANALISIS REGRESI LINEAR SEDERHANA Tujuan Praktikum : 1. Melakukan pengujian untuk mengetahui apakah ada hubungan linear antar dua variabel yaitu variabel dependen dengan independen. 2. Melakukan pengujian terhadap koefisien regresi yaitu terhadap konstanta dan koefisien dari variabel independen. 3. Menghitung besar pengaruh variabel independen terhadap variabel dependen. 4. Pembentukan persamaan regresi.
11.1. Pendahuluan Analisis Regresi merupakan alat statistik yang bermanfaat untuk mengetahui hubungan antara dua variabel atau lebih, sehingga salah satu variabel dapat diduga dari variabel lainnya.
Model regresi :
Y X 1 i 0 1 i ( Y )i X dengan E 0 1 i
Keterangan :
Yi adalah nilai variabel dependen pada observasi ke-i
0 dan 1 adalah parameter koefisien regresi X i adalah konstanta yang diketahui yaitu nilai variabel independen pada observasi ke-i
i adalah error yang bersifat random dengan rata-rata E{ i }= 0 dan variansinya Var{ i }= 2 ; i dan j tidak berkorelasi sehingga nilai covariansinya Cov{ i , j }= 0
untuk semua nilai i dan j ; i j , i = 1, 2, ….. n
Model Regresi di atas dikatakan sederhana, linear dalam parameter, dan linear dalam variabel independent. Dikatakan sederhana karena hanya ada satu variabel independent, linear dalam parameter karena tidak ada parameter yang muncul sebagai suatu eksponen atau hasil kali atau hasil bagi dengan parameter lain, dan linear dalam variabel independent karena variabel ini dalam model berpangkat satu. Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
95
11.2. Uji Simultan ( Over all test ) dalam Regresi Bentuk uji Hipotesanya adalah : 1. Ho : i 0 ; i 0
( model regresi tidak layak digunakan / tidak ada hubungan linear
antara variabel independen dengan variabel dependen ). H1 : i 0 ; i 0 ( model regresi layak digunakan / ada hubungan linear antara variabel independen dengan variabel dependen ). 2. Tingkat signifikansi α 3. Statistik uji : Dengan melihat nilai p-value 4. Daerah Kritis : H0 ditolak jika p-value < α 5. Kesimpulan
11.3. Uji Koefisien regresi ( uji parsial ) 1. Uji terhadap konstanta Bentuk uji hipotesanya adalah sebagai berikut : H0 : β0 = 0 ( konstanta tidak signifikan terhadap model regresi ) H1 : β0 ≠ 0 ( konstanta signifikan terhadap model regresi ) Tingkat signifikansi α Statistik uji : Dengan melihat nilai p-value Daerah Kritis : H0 ditolak jika p-value < α Kesimpulan 2. Uji terhadap koefisien regresi dari β1 Bentuk uji hipotesanya adalah sebagai berikut : H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada pengaruh variabel independen terhadap variabel dependen) H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh variabel independen terhadap variabel dependen) Tingkat signifikansi α Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
96
Statistik uji : Dengan melihat nilai p-value Daerah Kritis : H0 ditolak jika p-value < α Kesimpulan
11.4. Contoh Sebuah penelitian dilakukan untuk mengetahui hubungan antara IQ mahasiswa dengan nilai praktikum algoritma pemrograman. Apakah dapat disimpulkan bahwa IQ mahasiswa berpengaruh terhadap nilai praktikum algoritma pemrograman? IQ 114 115 120 105 118 97 107 110 119
nilai alpro 87 90 96 81 91 76 83 85 95
Langkah-langkah penyelesaian: 1. Input data ke dalam Rcmdr 2. Buat scatter plot antara variabel independen (X) dan variabel dependen (Y) Graph > Scatter Plot
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
97
x-variabel (pick one) : variabel independen y-variabel (pickone) : variabel dependen
Output
85 80
nilai_alpro
90
95
3
6 100
105
110
115
120
IQ
Dari bentuk scatter plot di atas, apakah ada hubungan linear antara nilai IQ dan nilai alpro? ( positif atau negatifkah? ) Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
98
3. Melakukan uji regresi statistics > fit models> linear regression
enter name for model
: nama model yang akan dibentuk
response variabel (pick one)
: sorot nama variabel dependen
explanatory variabel (pick one) : sorot nama variabel independen
Output > summary(RegModel.5) Call: lm(formula = nilai_alpro ~ IQ, data = regresi) Residuals: Min 1Q Median 3Q Max -2.0840 -0.7019 -0.1652 1.2902 1.8427 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -7.3082 7.6429 -0.956 0.371 IQ 0.8456 0.0683 12.379 5.16e-06 *** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 1.471 on 7 degrees of freedom Multiple R-squared: 0.9563, Adjusted R-squared: 0.9501 F-statistic: 153.2 on 1 and 7 DF, p-value: 5.159e-06
Dari output di atas dapat dilakukan uji over all test (simultan), uji parsial, menghitung besarnya pengaruh variabel independen terhadap variabel dependen, dan membentuk persamaan regresinya.
4. Uji Over all test ( uji simultan ) Bentuk hipotesanya adalah sebagai berikutnya: H0 : i 0 ; i 0 (model regresi tidak layak digunakan) H1 : i 0 ; i 0 (model regresi layak digunakan) Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
99
Tingkat signifikansi α =0,05 Statistik uji : p- value = 5,159 x 10-6 Daerah Kritis : H0 ditolak jika p_value < α Kesimpulan p_value = 5,159 x 10-6 < α maka H0 ditolak. Jadi model regresi layak digunakan. 5. Uji parsial a. Uji parsial terhadap konstanta β0 Hipotesanya adalah sebagai berikut: H0 : β0 = 0 ( konstanta tidak signifikan terhadap model regresi) H1 : β0 ≠ 0 ( konstanta signifikan terhadap model regresi ) Tingkat signifikansi α Statistik uji : p-value = 0,371 Daerah Kritis : H0 ditolak jika p-value < α Kesimpulan p-value = 0,371 > α maka H0 tidak ditolak. Jadi konstanta tidak signifikan terhadap model regresi. b. Uji parsial terhadap koefisien regresi β1 Bentuk uji hipotesanya adalah sebagai berikut : H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada pengaruh nilai IQ terhadap nilai alpro) H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh nilai IQ terhadap nilai alpro) Tingkat signifikansi α Statistik uji : p-value = 5,159 x 10-6 Daerah Kritis : H0 ditolak jika p-value < α Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
100
Kesimpulan p_value = 5,159 x 10-6 < α maka H0 ditolak. Jadi koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh nilai IQ terhadap nilai alpro.
Pada hasil uji hipotesis di atas, karena intercept tidak signifikan dalam model regresi, maka variabel tersebut dikeluarkan dan kemudian dilakukan regresi ulang tanpa variabel tersebut.
Untuk mengulang analisis regresi jika ada salah satu variabel yang tidak signifikan digunakan menu Statistics > Fit Models > Linear model…
Output > summary(LinearModel.6) Call: lm(formula = nilai_alpro ~ IQ - 1, data = regresi) Residuals: Min 1Q Median 3Q Max -1.9621 -0.9387 -0.4995 0.3042 2.3557 Coefficients: Estimate Std. Error t value Pr(>|t|) IQ 0.780369 0.004359 179 1.06e-15 *** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 1.463 on 8 degrees of freedom Multiple R-squared: 0.9998, Adjusted R-squared: 0.9997 F-statistic: 3.204e+04 on 1 and 8 DF, p-value: 1.061e-15
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
101
c. Uji terhadap koefisien regresi β1 Bentuk uji hipotesanya adalah sebagai berikut : H0 : β1 = 0 ( koefisien regresi x1 tidak signifikan terhadap model regresi / tidak ada pengaruh nilai IQ terhadap nilai alpro) H1 : β1 ≠ 0 ( koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh nilai IQ terhadap nilai alpro) Tingkat signifikansi α Statistik uji : p-value = 1,061 x 10-15 Daerah Kritis : H0 ditolak jika p-value < α Kesimpulan p_value = 1,061 x 10-15 < α maka H0 ditolak. Jadi koefisien regresi x1 signifikan terhadap model regresi / ada pengaruh nilai IQ terhadap nilai alpro. Sehingga diperoleh model regresinya : Nilai alpro = 0,78 (nilai IQ). Besarnya pengaruh nilai IQ terhadap nilai alpro ( silahkan melhiat nilai dari Multiple R-Squared ) yaitu sebesar 99,98% dan sisanya dipengaruhi oleh faktor lain diluar pengamatan.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
102
11.5. Latihan 1. Seorang distributor kendaraan bermotor melakukan penelitian untuk menentukan hubungan harga dengan umur motor bekas. Data yang digunakan diperoleh untuk satu jenis kendaraan terlihat pada tabel berikut : Umur (tahun) 1 4 10 2 5 6 8 1
Harga (ribuan rupiah) 1795 985 295 1295 795 995 845 1625
Kesimpulan apa yang dapat Anda sampaikan dari kasus di atas?
2. Ingin diketahui hubungan antara nilai tes masuk dengan nilai akhir kuliah matematika pada mahasiswa baru. Diperoleh data dari 20 mahasiswa yang mengikuti kuliah matematika sebagai berikut : Nilai Tes 50 35 35 40 55 65 35 60 90 35
Nilai Akhir 53 41 61 56 68 36 11 70 79 59
Nilai Tes 90 80 60 60 60 40 55 50 65 50
Nilai Akhir 54 91 48 71 71 47 53 68 57 79
Kesimpulan apa yang dapat Anda sampaikan dari kasus di atas?
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
103
DAFTAR PUSTAKA Dalgaard, Peter. 2002. Statistics and Computing: Intoductory Statistics with R. Springer. New York. Gunardi dan Rakhman, A. 2003. Metode Statistika. Fakultas MIPA UGM. Yogyakarta. NN. 2007. Modul Praktikum Analisis Data Eksploratif. Program Studi Statistika FMIPA UGM. Yogyakarta. Rosadi, Dedi. 2005. Praktikum Komputasi Statistika: Pengantar Analisa Statistika dengan R. Program Studi Statistika FMIPA UGM. Yogyakarta. Zulaela. 2004. Modul Praktikum Analisis Regresi Terapan. Program Studi Statistika FMIPA UGM. Yogyakarta. Zulaela. Gunardi. Rakhman, A. Utami, Herni. 2004. Program Studi Statistika FMIPA UGM. Yogyakarta.
Praktikum Statistika dan Penyajian Data – Labkomsi SV UGM (2014)
104