MODUL STATISTIKA II
LEMBAR PENGESAHAN MODUL PRAKTIKUM STATISTIKA II SEMESTER GANJIL 2014 FAKULTAS EKONOMI DAN BISNIS UNIVERSITAS PADJADJARAN
Disusun Oleh: Tim Asisten Dosen Statistika FEB UNPAD
Mengetahui dan Menyetujui,
Ketua Program Studi IESP UNPAD Dr. Mohammad Fahmi, S.E., M.T. NIP. 197312302000121001
Anita Kezia Zonebia
Lois Jessica Imanuel
Karina Megasari
Farhatunisa
Nurul Fatimah
Indriana Oktavia
Shafira Nurhasna R.
Rizki Rahmawati
Pebriantara
Widya Amira H.
Riri Ardyaningtyas
Tio Maranatha
Eiffel Nindya H
Yuki Sakura Kristi
Umar Harredy
DAFTAR ISI
DISTRIBUSI SAMPLING RATA-RATA DAN PROPORSI .......................................................... 1 DISTRIBUSI SAMPLING SELISIH RATA-RATA DAN SELISIH PROPORSI ........................ 17 PENAKSIRAN RATA-RATA DAN PROPORSI .......................................................................... 29 PENAKSIRAN SELISIH RATA-RATA DAN SELISIH PROPORSI .......................................... 41 UJI HIPOTESIS RATA-RATA DAN PROPORSI ........................................................................ 56 UJI HIPOTESIS SELISIH RATA-RATA DAN PROPORSI ........................................................ 75 REGRESI DAN KORELASI SEDERHANA ................................................................................. 91 REGRESI DAN KORELASI BERGANDA................................................................................. 122 CHI-SQUARE............................................................................................................................... 166 STATISTIK NON PARAMETRIK .............................................................................................. 183 NON-PARAMETRIK I ................................................................................................................ 190 NON-PARAMETRIK II ............................................................................................................... 226 APPENDIX ................................................................................................................................... 252
DISTRIBUSI SAMPLING RATA-RATA DAN PROPORSI
PENDAHULUAN Populasi adalah kumpulan dari seluruh kemungkinan orang-orang, benda-benda, dan ukuran lain yang menjadi objek perhatian atau kumpulan seluruh objek yang menjadi perhatian.
Populasi Terbatas adalah suatu populasi yang unsurnya terbatas berukuran N. Contoh : populasi bank, populasi mahasiswa FEB Unpad, dsb.
Populasi Tidak Terbatas adalah suatu populasi yang mengalami proses secara terus menerus sehingga ukuran N menjadi tidak terbatas perubahan nilainya. Contoh : populasi bintang di langit.
Sampel adalah suatu bagian dari populasi tertentu yang menjadi perhatian.
Sampel Probabilitas atau Random Sample merupakan suatu sampel yang dipilih sedemikian rupa dari populasi sehingga masing-masing anggota populasi memiliki probabilitas atau peluang yang sama untuk dijadikan sampel.
Sampel Nonprobabilitas atau Nonrandom Sample meerupakan suatu sampel yang dipilih sedemikian rupa dari populasi sehingga setiap anggota tidak memiliki probabilitas atau peluang yang sama untuk dijadikan sampel.
SAMPLING Sampling adalah cara pengambilan atau pengumpulan data hanya sebagian elemen atau anggota dari populasi, atau cara pemilihan sampel dari populasi yang akan diteliti. Alasan melakukan sampling adalah :
Mengenai biaya atau faktor ekonomis
Ketelitian dalam penyelidikan
Penghematan waktu
Sifat dari objek yang diteliti
Macam dari populasinya
METODE SAMPLING Teknik Sampling Dengan Pengembalian adalah metode sampling dimana setiap anggota dari suatu populasi dapat dipilih lebih dari satu kali. Teknik Sampling Tanpa Pengembalian adalah metode sampling dimana setiap anggota dari suatu populasi tidak dapat dipilih lebih dari satu kali. DISTRIBUSI SAMPLING Distribusi Sampling merupakan kumpulan nilai-nilai statistika yang sejenis lalu disusun dalam suatu daftar sehingga terdapat hubungan antara nilai statistik dan frekuensi statistika. (Sudjana, 2001 : 87). Distribusi Sampling terdiri dari :
Distribusi Sampling Rata-rata
Distribusi Sampling Proporsi
Distribusi Sampling Selisih Rata-rata
Distribusi Sampling Selisih Proporsi
DISTRIBUSI SAMPLING RATA-RATA Distribusi Sampling Rata-rata adalah kumpulan dari bilangan-bilangan yang masing-masing merupakan rata-rata hitung dari sampelnya. (Sudjana, 2001 : 87). Rumus Distribusi Sampling Rata-rata :
Populasi tidak terbatas
Rata-rata Standar Deviasi
Populasi terbatas
𝑛 ≤ 5% 𝑁
𝑛 > 5% 𝑁
𝜇x =𝜇
𝜇x =𝜇
𝜎x =
Nilai Baku 𝑧=
𝜎 √𝑛
𝜎x =
x − µ x
𝑧=
x
𝜎
𝑁−𝑛 𝑥√ 𝑁−1 √𝑛
x − µ x
x
Keterangan : n
: ukuran sampel
x
: rata-rata sampel
s
: standar deviasi sampling
N : ukuran populasi µ : rata-rata populasi
: standar deviasi populasi µ
x
: rata-rata pada distribusi sampling rata-rata
x
: standar deviasi pada distribusi sampling rata-rata
𝑁−𝑛 𝑁−1
√
: faktor koreksi
Contoh Soal ABC Company memproduksi ‘Remote Control’ dengan menggunakan dua baterai. Rata-rata umur baterai yang digunakan di produk ini adalah 35 jam. Distribusi umur baterai mendekati distribusi probabilitas normal dengan standar deviasi 5,5 jam. Sebagai bagian dari program pengujian, diambil sampel sebanyak 25 baterai. Hitunglah probabilitas umur baterai lebih dari 36 jam? Penyelesaian
Dik
: µ = 35 = 5,5 n = 25
Dit
: P( x >36)?
Jawab : µ
x
= µ = 35
x
=
x z=
√𝑛
=
−µ
x
5,5 √25
= 1,1
x = 36−35 = 0,91 1,1
0
z
Lihat tabel z: luas sebelah kanan 0
=
0,5000
luas antara 0 - z
=
0,3186 -
luas sebelah kanan z
=
0,1814
Kesimpulan :
Jadi, dari 25 baterai yang dipilih, probabilita umur baterai lebih dari 36
jam adalah sebesar 0,1814 atau 18,14%.
DISTRIBUSI SAMPLING PROPORSI Distribusi Sampling Proporsi adalah kumpulan atau distribusi semua perbandingan sampelnya untuk suatu peristiwa. (Sudjana, 2001 : 95). Rumus Distribusi Sampling Proporsi :
Populasi tidak terbatas
Rata-rata
𝑛 ≤ 5% 𝑁
𝑛 > 5% 𝑁
𝜇𝑥 = 𝜋
𝜇𝑥 = 𝜋
𝜋(1 − 𝜋) 𝜎𝑥 = √ 𝑛 𝑛
𝜋(1 − 𝜋) 𝑁 − 𝑛 𝜎𝑥 = √ 𝑥√ 𝑛 𝑁−1 𝑛
𝑥 𝑥 𝑛 − 𝜇𝑛 𝑧= 𝜎𝑥
𝑥 𝑥 𝑛 − 𝜇𝑛 𝑧= 𝜎𝑥
𝑛
Standar Deviasi
Nilai Baku
Populasi terbatas
𝑛
𝑛
𝑛
Keterangan : n
: ukuran sampel
N
: ukuran populasi
𝑥 𝑛
: proporsi sampel
𝜋
: proporsi populasi
𝜇𝑥
: rata-rata pada distribusi sampling proporsi
𝜎𝑥
: standar deviasi pada distribusi sampling proporsi
𝑛
𝑛
𝑁−𝑛 𝑁−1
√
: faktor koreksi
Jika nilai 𝜋 dari populasi tidak diketahui, dalam hal ini 𝜋 dianggap sama dengan 0,5 yaitu nilai 𝜋(1 − 𝜋) yang maksimum. Contoh Soal Sebuah Bakery Store “Bear” menemukan bahwa pembelian dilakukan oleh 20% dari pelanggan yang memasuki tokonya. Suatu pagi terdapat sampel acak sebanyak 180 orang memasuki toko. Berapa probabilita pelanggan yang membeli kurang dari 15%?
Penyelesaian: Dik
: n = 180 π(membeli)= 20% = 0,20
Dit
𝑥
: P ( 𝑛< 15%)?
Jawab : µ𝑥 = π = 0,20 𝑛
𝜋(1−𝜋) 𝑛
𝑥 = √ 𝑛
z=
x −µ 𝑥 n 𝑛
𝑥
𝑛
=√
0,20(0,80) 180
= 0,029814239
0,15−0,20
= 0,029814239 = -1,68
z
0
lihat tabel z: luas sebelah kiri 0
=
0,5000
luas antara
=
0,4535-
=
0,0465
z-0
luas sebelah kiri z
Kesimpulan: Jadi, probabilita bahwa diantara 180 orang yang masuk ke toko, pelanggan yang membeli kurang dari 15% adalah sebesar 0,0465 atau 4,65%.
SOAL DISTRIBUSI SAMPLING RATA-RATA DAN PROPORSI 1. Sebuah lift didesain dengan batas muatan sebesar 1000 kg. Teknisi menganggap bahwa lift tersebut memiliki kapasitas muat untuk 18 orang. Jika berat badan dari semua orang yang menggunakan lift tersebut berdistribusi normal dengan rata-rata 980 kg dan standar deviasi sebesar 37 kg, berapakah probabilita sekelompok yang terdiri dari 18 orang yang menggunakan lift tersebut akan melampaui batas muatan lift di atas? Jawab : Dik
: n = 18 µ = 980 = 37
Dit
: P( x > 1000)
Jawab : µ
x = µ = 980
37
x = √𝑛 = √18 = 8,72 x −µ
Z=
x
x
=
1000−980 8,72
0
= 2,29
Z
lihat tabel z: luas sebelah kanan 0
=
0,5000
luas antara
=
0,4890-
=
0,0110
0-z
luas sebelah kanan z
Kesimpulan : Jadi, probabilitas sekelompok yang terdiri dari 18 orang yang menggunakan lift tersebut akan melampaui batas muatan lift adalah sebesar 0,0110 atau 1,1%.
2. Cravy Company has just received 4850 cristal bottles. Before accepting the bottles, the manager insists that 18 of the cristal bottles be randomly selected for testing. He intends to measure the maximum capability of each bottle and reject the shipment if the mean capability for the sample is greater than the 413 newton listed on the product label. Based on the manager, the bottles on the truck require an average 405 newton, with a standard deviation of 13 newton. Determine the probability ha the cristal bottles will be rejected. Jawab : Dik
: N = 4850 µ = 405 n = 18 = 13
Dit
: The probability that the cristal bottles will be rejected, P( x > 413)
Jawab : 𝑛 = 𝑁
18 4850
= 0,003711 < 5% (tidak menggunakan faktor koreksi)
µ
x = µ = 405
x =
√𝑛
x −µ Z=
=
x
13 =4,2 √18
=
x
413−405 4,24
= 1,89
lihat tabel z:
0
Conclusion:
luas sebelah kanan 0
=
0,5000
luas antara 0 - z
=
0,4706 -
luas sebelah kanan z
=
0,0294
Z
so, the probability that the cristal bottles will be rejected is 0,0294 or 2,94%
3. Wormy adalah perusahan tekstil yang mempunyai 50 pabrik di seluruh Indonesia. Dalam satu hari, satu pabrik dapat menghasilkan rata-rata 1600 baju dengan standar deviasi 270 baju. 17 pabrik dipilih secara acak untuk memenuhi pesanan dari luar negeri. a. Berapa probabilita pabrik yang memenuhi pesanan dari luar negeri menghasilkan 1890 baju dalam sehari? b. Berapa probabilita pabrik yang memenuhi pesanan dari luar negeri mengahasilkan tidak lebih dari 1775 baju dalam sehari? Jawab : Dik : N = 50 n = 17 μ = 1600 = 270 Dit : a. P ( x = 1890) b. P ( x ≤ 1775) : a. 𝑛 =
Jawab
𝑁
17 50
= 0,34 > 5% (menggunakan faktor koreksi)
µ
x = µ = 1600
√ √ x = √𝑛 . 𝑁−1 = √17 . 50−1 = 65,53 . 0,82 = 53,735
x Z=
−µ
𝑁−𝑛
x
=
x
0
270
1890−1600 53,735
50−17
= 5,4
Z
Kesimpulan : Jadi, probabilitas pabrik yang memenuhi pesanan dari luar negeri menghasilkan 1890 baju dalam sehari adalah 50%. b. µ
x = µ = 1600
𝑁−𝑛
270
50−17
x = √𝑛 . √𝑁−1 = √17 . √ 50−1 = 65,53 . 0,82 = 53,735
x −µ Z=
x
=
x
1775−1600 53,735
= 3,26
0
Z
Lihat tabel z: luas sebelah kiri 0
=
0,5000
luas antara 0 - z =
0,4994 +
luas sebelah kiri z
=
0,9994
Kesimpulan : Jadi, probabilitas pabrik yang memenuhi pesanan dari luar negeri menghasilkan tidak lebih dari 1775 baju dalam sehari adalah sebesar 0,9994 atau 99,94% 4. The rent for one-bedroom apartment in Southern California follows the normal distribution with a mean of $3,400 per month and a standard deviation of $375 per month. The manager selects a random sample of 75 one-bedroom apartments. a. What is the probability that the sample mean is between $3,350 and $3,500? b. What is the probability that the sample mean is greater than $3,330? Jawab : Dik
: μ = 3400 = 375 n = 75
Dit
: a. P(3350 < x < 3500) b. P( x > 3330)
Jawab : a. µ
x = µ = 3400
375
x = √𝑛 = √75 = 43,30
x −µ Z1 =
Z1
0
=
3350−3400 43,30
= -1,15
=
3500−3400 43,30
= 2,31
x
x −µ Z2 =
x
x
x
Z2
Lihat tabel z : Luas antara Z1-0
= 0,3749
Luas antara 0-Z2
= 0,4896
Luas antara Z1-Z2
= 0,8645
Kesimpulan : Jadi, probabilitas harga sewa apartemen di Southern California berkisar antara $3350 sampai dengan $3500 adalah sebesar 0,8645 atau 86,45%. b. µ
x = µ = 3400
375
x = √𝑛 = √75 = 43,30 x −µ
Z=
x
=
x
3330−3400 43,30
= -1,62
Lihat tabel Z :
Z
0
Luas Z-0
= 0,4474
Luas kanan 0
= 0,5000 +
Luas kanan Z
= 0,9474
Kesimpulan : Jadi, probabilitas harga sewa apartemen di Southern California lebih dari $3330 adalah sebesar 0,9474 atau 94,74%.
5. Sebuah perusahaan makanan membuka lowongan pekerjaan untuk 200 orang lulusan perguruan tinggi. Diambil 100 orang pelamar sebagai sampel acak. Menurut manager HRD perusahaan tersebut,
tahun lalu, 45% pelamar adalah laki-laki. Berapakah
probabilita bahwa maksimal 46% dari sampel adalah wanita? Jawab : Dik
: n = 100 N = 200 π = 55%
Dit
𝑥
: P(𝑛 ≤ 46%) 𝑛
100
Jawab : 𝑁 = 200 = 0,5 > 5% (menggunakan faktor koreksi) µ𝑥 = π = 0,55 𝑛
𝜋(1−𝜋) 𝑁−𝑛 . √ 𝑁−1 𝑛
𝑥 = √ 𝑛
z=
x −µ 𝑥 n 𝑛
𝑥
=
𝑛
Z
0,46−0,55 0,0355
0,55(0,45) 200−100 . √ 200−1 100
=√
= 0,05 . 0,71 = 0,0355
= -2,54
0
lihat tabel z: luas sebelah kiri 0
=
0,5000
luas antara z-0 =
0,4945 –
luas sebelah kiri z
=
0,0055
Kesimpulan : Jadi, probabilita maksimal 46% pelamar wanita adalah sebesar 0,0055 atau 0,55%.
6. First company has a plan to open a recquirement for new employee in 2014 for 1048 persons. 456 persons from that amount, ever had experiences in working before and the residual is fresh graduated. 300 employees is taken randomly to be a sample. a. Determine proportion of deviation standard b. Determine probability that the new employees who had working experience is between 35% and 55%
Jawab : Dik
: n = 300 N = 1048 𝑥 𝑛
Dit
456 1048
=
= 0,435
: a. 𝑥
𝑛
𝑥 𝑛
b. P(35% < < 55%) 𝑛
300
Jawab : a. 𝑁 = 1048 = 0,29 > 5% (Menggunakan faktor koreksi) µ𝑥 = π = 0,435 𝑛
𝑥 = √ 𝑛
b. Z1 =
𝜋(1−𝜋) 𝑁−𝑛 . √ 𝑁−1 𝑛
x −µ 𝑥 n 𝑛
𝑥
=
0,35−0,435 0,0245
= -3,47
=
0,55−0,435 0,0245
= 4,69
𝑛
Z2 =
x −µ 𝑥 n 𝑛
𝑥
𝑛
Z1
0
Z2
Lihat tabel z : Luas antara Z1-0
0,435(0,565) 1048−300 . √ 1048−1 300
=√
= 0,4997
= 0,029 . 0,845 = 0,0245
Luas antara 0-Z2
= 0,5000
Luas antara Z1-Z2
= 0,9997
Kesimpulan : Jadi, probabilitas bahwa pelamar yang sudah memiliki pengalaman kerja antara 35% sampai dengan 55% adalah sebesar 0,9997 atau 99,97%. 7. Tentukanlah probabilita bahwa diantara 50 orang yang datang ke supermarket S, terdapat : a. Maksimal 43% adalah wanita? b. Lebih dari 57% adalah laki-laki? Asumsi : probabilita kedatangan wanita dan laki-laki ke supermarket S adalah 6:4. Jawab : Dik
: n = 50 π (wanita) = 60% π (laki-laki) = 40%
`
Dit
𝑥
: a. P(𝑛 ≤ 43% 𝑤𝑎𝑛𝑖𝑡𝑎) 𝑥 𝑛
b. P( > 57% 𝑙𝑎𝑘𝑖 − 𝑙𝑎𝑘𝑖) Jawab : a. µ𝑥 = π = 0,60 𝑛
𝑥 = √ 𝑛
z=
𝜋(1−𝜋) 𝑛
x −µ 𝑥 n 𝑛
𝑥
𝑛
Z
=
0,60(0,40) 50
=√
0,43−0,60 0,07
0
lihat tabel z: luas sebelah kiri 0
=
0,5000
luas antara z-0 =
0,4925 –
luas sebelah kiri z
=
0,0075
= 0,07
= -2,43
Kesimpulan : Jadi, probabilitas pengunjung yang datang ke Supermarket S terdapat maksimal 43% wanita adalah sebesar 0,0075 atau 0,75% b. µ𝑥 = π = 0,40 𝑛
𝜋(1−𝜋) 𝑛
𝑥 = √ 𝑛
z=
x −µ 𝑥 n 𝑛
𝑥
𝑛
=
0,40(0,60) = 50
=√
0,57−0,40 0,07
0,07
= 2,43
0
Z
lihat tabel z: luas sebelah kanan 0
=
0,5000
luas antara 0 - z
=
0,4925 -
luas sebelah kanan z
=
0,0075
Kesimpulan : Jadi, probabilitas pengunjung yang datang ke Supermarket S terdapat lebih dari 57% laki-laki adalah sebesar 0,0075 atau 0,75%. 8. Dalam festival kuliner, 250 orang dijadikan sampel dan diminta untuk mencicipi sebuah makanan yang telah disediakan. Jika panitia memperkirakan 30% menyatakan bahwa makanannya tidak enak, berapakah probabilita bahwa akan terdapat antara 25% sampai dengan 35% dari sampel tersebut benar-benar menyatakan bahwa makanannya tidak enak? Jawab : Dik
: n = 250 π (tidak enak) = 30%
Dit
𝑥
: P(25% < 𝑛 < 35%)
Jawab : µ𝑥 = π = 0,30 𝑛
𝜋(1−𝜋) 𝑛
𝑥 = √ 𝑛
𝑧1 =
x −µ 𝑥 n 𝑛
𝑥
=
𝑛
𝑧2 =
x −µ 𝑥 n 𝑛
𝑥
𝑛
0,30(0,70) 250
=√
0,25−0,30 0,028982753
=
= 0,028982753
= -1,73
0,35−0,30 0,028982753
= 1,73
Lihat tabel z: luas antara 𝑧1 -0 = 0,4582 luas antara 0-𝑧2 = 0,4582 + luas antara 𝑧1 − 𝑧2 Z1
0
= 0,9164
Z2
Kesimpulan : Jadi, probabilita bahwa akan terdapat antara 25% sampai dengan 35% dari sampel benar-benar menyatakan bahwa makanan yang disediakan tidak enak adalah sebesar 0,9164 atau 91,64%
DISTRIBUSI SAMPLING SELISIH RATA-RATA DAN SELISIH PROPORSI
Distribusi Sampling merupakan kumpulan nilai-nilai statistika yang sejenis lalu disusun dalam suatu daftar sehingga terdapat hubungan antara nilai statistik dan frekuensi statistika. (Sudjana, 2001 : 87). DISTRIBUSI SAMPLING SELISIH RATA-RATA Distribusi Sampling Selisih Rata-rata adalah kumpulan bilangan-bilangan yang merupakan selisih rata-rata dari dua sampel yang berbeda berdasarkan pada dua sampl tertentu dari ukuran parameter dua populasinya. Untuk ukuran sampel n1 dan n2yang cukup besar (n1, n2> 30), maka distribusi sampling selisih ratarata sangat mendekati distribusi normal, untuk mengubahnya ke dalam bentuk normal standar maka diperlukan rumus : 𝑍=
(𝑥̅1 − 𝑥̅2 ) − 𝜇𝑥̅1 −𝑥̅2 𝜎𝑥̅1 −𝑥̅2
Dimana : a. Rata-rata ( Means ) 𝜇𝑥̅1 −𝑥̅ 2 = 𝜇1 − 𝜇2 b. Simpangan baku ( standard deviation ) 𝜎12 𝜎22 𝜎𝑥̅1 −𝑥̅ 2 = √ + 𝑛1 𝑛2 Jika 𝜎12 dan 𝜎22 tidak diketahui, maka dapat menggunakan standar deviasi dari sampel.
Contoh soal : Pegawai perusahaan Global Network Inspection pada Divisi Inspeksi Pembongkaran mempunyai gaji rata-rata sebesar$4300/bulan, sedangkan Divisi Inspeksi Pengangkutan mempunyai gaji $3750/bulan. Setelah dihitung, diperoleh rata-rata hitung dari deviasi kuadrat setiap gaji terhadap gaji rata-rata Divisi Inspeksi Pembongkaran $52.000, sedangkan Divisi Inspeksi Pengangkutan sebesar $19.500. Bila diasumsikan diambil sampel random pada Divisi Inspeksi Pembongkaran sebanyak 90 orang dan Divisi Inspeksi Pengangkutan75, berapakah probalilita selisih rata-rata gaji dari dua sampel lebih besar dari $ 500 ?
Jawab : Dik
:
Divisi Inspeksi Pembongkaran:
μ1 = $ 4300 𝜎1 2= $ 52.000
n1 = 90
Divisi Inspeksi Pengangkutan:
μ2= $ 3750 𝜎2 2= $ 37.000
n2 = 75
Dit
: (𝑥1 − 𝑥̅2 > 500) ?
Jawab : µx̅1 −x̅2 = µ1 − µ2 =4300 – 3750= 550 σ12 σ22 52.000 37.000 σx̅1 −x̅2 = √ + = √ + = 32,72783389 n1 n2 90 75 Z=
(x̅1 − x̅2 ) − µx̅1 −x̅2 500 − 550 = = −1,52775 ≈ −1,53 σx̅1 −x̅2 32,72783389
Z
0
Luas kanan 0 = 0,5000 Luas 0 - Z
= 0,4370 +
Luas kanan Z = 0,9370
Kesimpulan : Jadi, probabilita selisih rata-rata gaji dari dua sampel lebih besar dari $ 500 adalah 0,9370 atau 93,70 %.
DISTRIBUSI SAMPLING SELISIH PROPORSI Distribusi Sampling Selisih Proporsi adalah kumpulan bilangan-bilangan yang merupakan selisih proporsi dua sampel yang berbeda berdasarkan pada dua sampel tertentu dari ukuran parameter dua populasinya, adapun rumus distribusi sampling selisih proporsi dinyatakan dalam : a. Rata-rata proporsi 𝜇𝑥1 −𝑥2 = 𝜋1 − 𝜋2 𝑛1 𝑛2
b. Simpangan baku proporsi 𝜋1 (1 − 𝜋1 ) 𝜋2 (1 − 𝜋2 ) 𝜎 𝑥1 −𝑥2 = √ + 𝑛1 𝑛2 𝑛1 𝑛2 Distribusi sampling selisih proporsi inipun akan mendekati distribusi normal bila ukuran-ukuran sampel cukup besar (n1, n2> 30), maka untuk merubahnya menjadi bentuk normal standar diperlukan rumus : 𝑍=
𝑥 𝑥 (𝑛1 − 𝑛2 ) − 𝜇𝑥1 −𝑥2 1 2 𝑛1 𝑛2 𝜎 𝑥1 −𝑥2
𝑛1 𝑛2
Jika π1 danπ2 tidak diketahui dan dianggap sama maka nilai : 𝜋1 = 𝜋2 = p =
𝑋1 +𝑋2 𝑛1 +𝑛2
sehingga standar baku proporsinya menjadi : 1 1 𝜎 𝑥1 −𝑥2 = √𝑝 ∗ (1 − 𝑝 ) ∗ ( + ) 𝑛1 𝑛2 𝑛1 𝑛2
Contoh soal Alya dan Deasy akan melakukan sebuah pertandingan pelemparan sekeping uang logam, Deasy akan menangbila memperoleh 8 sisi gambar lebih banyak dari pada Alya, jika diasumsikan mereka diberi kesempatan masing-masing melempar uang logam sebanyak 40 kali, berapa peluang Deasy memenangkan pertandingan ini ? Berilah saran apakah Deasy akan ikut dalam pertandingan atau tidak, jika harapan kemenangannya harus sebesar 15% atau lebih?
Jawab :
Dik
: π1 =π2 = 50% n1=n2 = 40 x1 n1
−
x2 n2
Dit
: P(
> 15 %)
Jwb
: µx1 −x2 = π1 − π2 = ( 0,5 – 0,5 ) = 0 n1 n2
σx1 −x2 = √ n1 n2
π1 (1−π1 ) π (1−π2 ) + 2 n1 n2 (0,5)(1−0,5)
= √
Z=
40
+
x x (n1 − n2 ) − µ x1 − x2 1 2 n1 n2 σ x1 − x 2
n1 n2
(0,5)(1−0,5)
=
40
0.15 − 0 = 1,34 0,1346291202
0
Luas kanan 0 = 0,5000 Luas 0- Z
= 0,111803398874989
= 0,4099 –
Luas kanan Z = 0,0901
Z
Kesimpulan : Jadi, peluang Deasy memenangkan pertandingan ini adalah 0,0901 atau 9,01%. Karena peluang Deasy menang kurang dari harapan menangnya (9,01% <15%), maka Deasy disarankan tidak mengikuti pertandingan ini.
SOAL DISTRIBUSI SAMPLING SELISIH RATA-RATA DAN SELISIH PROPORSI 1. PT Indigo dan PT Violet are two companies engaged in banking and insurance. These two companies operate four weeks a month and five days a week. PT Indigo daily average customers visited as many as 100 customers and 78 customers visited PT Violet for each day. With the standard deviation of each at 13 and 9 for PT Indigo and PT Violet, if sample is taken as many as 90 customers for PT Indigo and 95 customers for PT Violet, determine the average possible number of customers who visited PT Indigo differ between 20 to 25 customers over PT Violet? Jawab : Dik
Violet : μ2 = Dit
𝜎1 = 13 n1 = 90
: Indigo : μ1 = 100
𝜎2 = 9 n2 = 95
78
: P(20 < x1 − x̅2 < 25)
Jawab : P(20 < x1 − x̅2 < 25) µx̅1 −x̅2 = µ1 − µ2 = 100 – 78= 22 σ21 n1
σx̅1 −x̅2 = √ Z1 = Z2 =
+
σ22 n2
(x̅1 −x̅2 )−µx̅1−x̅2 σx̅1 −x̅2 (x̅1 −x ̅ 2 )−µx̅1−x̅2
Z1
σx̅1 −x̅2
0
132 90
= √
+
92 95
= 1,652395037
=
20−22 1,266
= -1,21
=
25−22 1,266
= 1,82
Z2
Luas Z1 - 0
= 0,3869
Luas 0 – Z2
= 0,4656 +
Luas Z1 - Z2
= 0,8525
Kesimpulan : Jadi, kemungkinan rata-rata jumlah nasabah yang mengunjungi PT Indigo berbeda antara 20 sampai dengan 25 nasabah lebihnya dari PT Violet adalah sebesar 0,8525 atau 85,25% 2. Coco Candy memperkerjakan 1200 pegawai yang terdiri dari 75% pegawai pria dan sisanya pegawai wanita. Berdasarkan catatan bagian HRD, rata-rata waktu terlambat masuk kerja pegawai pria adalah 34 menit dan simpangan baku 8,7 menit. Sedangkan ratarata waktu terlambat masuk kerja pegawai wanita adalah 26 menit dengan simpangan baku 11 menit. Suatu ketika, pimpinan perusahaan melakukan sidak, dengan mengambil secara acak 40% pegawai pria dan 50% pegawai wanita. Tentukan probabilita: a. Waktu terlambat pegawai pria berbeda paling sedikit 10 menit dari pegawai wanita b. Waktu terlambat pegawai pria berbeda kurang dari 7 menit dari pegawai wanita c. Waktu terlambat pegawai pria berbedaantara 5 hingga 11 menit dari pegawai wanita Jawab : Dik
: N = 1200 N1 = 75% N = 900
n1 = 40%N1 = 360
μ1 = 34
n2 = 50%N2 = 150
μ2= 26
𝜎1 = 8,7 N2 = 25% N = 300 𝜎2 = 11 Dit
: a. P(x1 − x̅2 ≥ 10) b. P(x1 − x̅2 < 7) c. P(5 < x1 − x̅2 < 11)
Jawab : a. P(x1 − x̅2 ≥ 10) µx̅1 −x̅2 = µ1 − µ2 =34 – 26= 8 σ2
σ2
1
2
8,72
112
σx̅1 −x̅2 = √n1 + n2 = √ 360 + 150 = 1,008422861 Z=
(x̅1 −x̅2 )−µx̅1−x̅2 σx̅1 −x̅2
=
10−8 1,008422861
= 1,98
Luas kanan 0 = 0,5000 Luas 0- Z
= 0,4761 –
Luas kanan Z = 0,0239
0
Z
Kesimpulan : Jadi, probabilita waktu terlambat pegawai pria berbeda paling sedikit 10 menit dari pegawai wanita adalah sebesar 0,0239 atau 2,39%. b. P(x1 − x̅2 < 7) µx̅1 −x̅2 = µ1 − µ2 = 34 – 26= 8 σ2
σ2
1
2
8,72
112
σx̅1 −x̅2 = √n1 + n2 = √ 360 + 150 = 1,008422861 Z=
(x̅1 −x̅2 )−µx̅1 −x̅2 σx̅1 −x̅2
=
7−8 1,008422861
Z
= −0,99
0
Luas Kiri 0
= 0,5000
Luas Z - 0
= 0,3389 –
Luas kiri Z
= 0,1611
Kesimpulan : Jadi, probabilita waktu terlambat pegawai pria berbeda kurang dari 7 menit dari pegawai wanita adalah sebesar 0,1611 atau 16,11%. c. P(5 < x1 − x̅2 < 11) µx̅1 −x̅2 = µ1 − µ2 = 34 – 26= 8 σ2
σ2
1
2
8,72
112
σx̅1 −x̅2 = √n1 + n2 = √ 360 + 150 = 1,008422861
Z1 =
(x̅1 −x̅2)−µx̅1−x̅2 σx̅1−x̅2
=
5−8 1,008422861
= −2,97
24
Z2 =
(x̅1 −x̅2 )−µx̅1−x̅2 σx̅1−x̅2
=
11−8 1,008422861
Z1
= 2,97
0
Z2
Luas Z1 - 0
= 0,4985
Luas 0 – Z2
= 0,4985 +
Luas Z1 - Z2
= 0,9970
Kesimpulan : Jadi, probabilita waktu terlambat pegawai pria berbeda antara 5 hingga 11 menit dari pegawai wanita adalah sebesar 0,9970 atau 99,70%. 3. Brightman Co. and Fulton Co., enganging in property business in Jakarta. These two companies have been finished their expansion in Bandung. Around this year, Brightman’s real estate collected USD 67.930 monthly average collection for their customers with standard error of USD 103. Fulton’s Apartment reached USD 85.140 monthly average collection with USD 146 standard error. If we take 35 real estate’s customers and 40 apartement’s customer, find out : a. The difference of monthly average collection of Fulton’s and Brightman’s samples, if we need to know its value in our currency b. The likelihood that the monthly average collection of Fulton Co. will be differ at least Rp 171.095.620over Brightman Co. (Assume the spot exchange rate is Rp 9959/USD)
Jawab : Dik
: n1 = 40
μ1 =USD 85.140
𝜎1 = 146
n2 = 35
μ1 = USD 67.930
𝜎2 = 103 25
Dit
: a. µx̅1 −x̅2 in Rupiah b. P(x1 − x̅2 ≥ Rp171.095.620)
Jawab : a. µx̅1 −x̅2 = µ1 − µ2 =USD 85.140 – USD 67.930 = USD 17.210 Convert USD to Rupiah = USD 17.210 x Rp 9959 / USD = Rp 171.394.390 So, the difference of monthly average collection of Fulton’s and Brightman’s samples is USD 17.210, and its value in our currency is Rp 171.394.390, if we assume that the spot exchange rate is Rp 9959/USD. b. P(x1 − x̅2 ≥ Rp171.095.620 ) Covert Rupiah to USD = Rp 171.095.620 / Rp 9959 / USD = USD 17.180 P(x1 − x̅2 ≥ Rp171.095.620 )P(x1 − x̅2 ≥ RpUSD 17.180 ) σ2
σ2
1
2
1462 40
σx̅1 −x̅2 = √n1 + n2 = √ Z=
(x̅1 −x̅2 )−µx̅1−x̅2 σx̅1 −x̅2
=
+
1032 35
17.180−17.210 28,91391163
= 28,91391163
= −1,04
Luas kanan 0 = 0,5000 Luas Z - 0
= 0,3508 +
Luas kanan Z = 0,8508
Z
0
Kesimpulan : So, the likelihood that the monthly average collection of Fulton Co. will be differ at least Rp 171.095.620 over Brightman Co. is 0,8508 or 85,08%. 4. Gary dan Shamira bekerja di sebuah perusahaan yang menerapkan sistem gaji berdasarkan produktivitas para pekerjanya. Gaji Gary rata-rata sebesar Rp. 5.750.000,00 per bulan, sedangkan gaji Shamira rata-rata Rp. 5.400.000,00 perbulan. Standar deviasi untuk gaji
26
Gary dan Shamira adalah Rp. 250.000,00 dan Rp. 550.000,00. Bila diambil sampel gaji Gary dan Shamira masing-masing 12 bulan, berapakah probabilitas selisih rata-rata gaji dari Gary dan Shamira lebih besar dari Rp. 300.000,00? Jawab : Dik
: Gary Shamira
: μ1 = 5.750.000 𝜎1 = 250.000
n1 = 12
: μ2 = 5.400.000 𝜎2 = 550.000
n2 = 12
: P(x1 − x̅ 2 > 300.000)
Dit
Jawab : µx̅1 −x̅2 = µ1 − µ2 = 350.000 σ21 n1
σx̅1 −x̅2 = √ Z=
+
σ22 n2
(x̅1 −x̅2 )−µx̅1−x̅2 σx̅1 −x̅2
250.0002 12
= √ =
+
550.0002 12
300.000−350.000 174.403,746
= 174.403,746
= -0,29
Luas kanan 0 = 0,5000 Luas Z - 0
= 0,1141 +
Luas kanan Z = 0,6141 Z
0
Kesimpulan : Jadi, probabilitas selisih rata-rata gaji dari Gary dan Shamira lebih besar dari Rp. 300.000,00 adalah sebesar 0,6141 atau 61,41%.
5. Vivi dan Vina mengikuti pertandingan pelemparan sebuah dadu. Vivi akan menang apabila memperoleh minimal 9 sisi angka
genap lebih banyak daripada Vina. Jika
diasumsikan mereka diberi kesempatan masing-masing percobaan melempar dadu tersebut sebanyak 45 kali, berapakah peluang Vina memenangkan pertandingan ini jika harapan kemenangannya harus sebesar 20% atau lebih?
Jawab :
27
Dik
: 𝜋1 = 𝜋2 = 50%
n1 = n2 = 45 Dit
x
x
: P (n1 − n2 ≥ 20%) 1
2
Jawab : µ x1 −x2 = π1 − π2 = (0,5 – 0,5) = 0 n1 n2
π1 (1−π1 ) π (1−π ) + 2n 2 n1 2
σx1 −x2 = √ n1 n2
(0,5)(1−0,5)
=√
Z=
45
x x ( 1 − 2 )−µx1 x2 n n 1
− n1 n2
2
σx1 x2 −
n1 n2
=
+
(0,5)(1−0,5)
0,20−0 0,105
45
= 0,105
=1,90
Luas kanan 0 = 0,5000 Luas 0- Z
= 0,4713 –
Luas kanan Z = 0,0287
0
Z
Kesimpulan : Jadi, peluang Vina memenangkan pertandingan ini adalah sebesar 0,0287 atau 2,87% 6. In the competitive area of retail consumer goods, advertising serves to clarify product distinctiveness and increase market penetration. Before adopting a new advertising campaign, large-volume vintner conducted a product preference survey among 1000 regular buyers of wine in the supermarket chain that serves his primary channel of distribution. From that survey, they found that 33% of those contacted were regular purchasers of his wine. Six months after the institution of a revised advertising campaign, 1200 buyers were surveyed, with 44% indicating preference for the vintner’s product. Find 28
the percentage of customer’s preference for the vintner’s product after advertising campaign less than the percentage of customer’s preference for the vintner’s product before advertising campaign, if the left area of Z score is 0,9997. Jawab : Dik
𝑥2 𝑛2
: n1 = 1200
n2 = 1000
𝜋1 = 44%
𝜋2 = 33%
𝑥
P (𝑛1 − 1
> X) = 0,9997 Dit
:X?
Jawab :
0
Luas Kiri Z
= 0,9997
Luas Kiri 0
= 0,5000 -
Luas 0 - Z
= 0,4997
Z
Z = 3,39
µx1 −x2 = π1 − π2 = 0,44 – 0,33 = 0,11 n1 n2
π1 (1 − π1 ) π2 (1 − π2 ) σ x1 − x2 = √ + n1 n2 n1 n2 (0,44)(1 − 0,44) (0,33)(1 − 0,33) = √ + = 0,0206502631 1200 1000
29
Z=
x x (n1 − n2 ) − µ x1 − x2 1 2 n1 n2 σ x1 − x2
n1 n2
3,39 =
X − 0,11 0,0206502631
X = 0,11 + 0,07 = 0,18 Kesimpulan :So, the percentage of customer’s preference for the vintner’s product after advertising campaign less than the percentage of customer’s preference for the vintner’s product before advertising campaign, if the left area of Z score is 0,9997, is 0,18 or 18%. 𝑥
𝑥
[P (𝑛1 − 𝑛2 > 18%)] 1
2
7. Pengamatan yang dilakukan selama setahun terakhir menunjukkan bahwa investor yang memegang saham sektor properti memiliki probabilita kenaikan harga saham sebesar 88%. Sedangkan investor lain yang memegang saham sektor barang konsumsi memilik peluang kenaikan harga saham sebesar 44%. Apabila investor memiliki 500 lot saham sektor properti dan 450 lot saham sektor barang konsumsi, berapa peluang beda persentase harga saham sektor properti meningkat 50% lebih kecil dibandingkan dengan kenaikan harga saham sektor barang konsumsi? Jawab : Dik
:π1 = 88%
π2 = 44%
n1 = 500
n2 = 450
x1 n1
Dit: P (
−
x2 n2
< 50%)
Jawab : µx1 −x2 = π1 − π2 = ( 0,88 – 0,44 ) = 0,44 n1 n2
π1 (1−π1 ) π2 (1−π2 ) + n1 n2
σx1 −x2 = √ n1 n2
(0,88)(1−0,88)
=√
500
+
(0,44)(1−0,44) 450
= 0,02754551789
30
Z=
x x ( 1 − 2 )−µ x1 x2 n n 1
− n1 n2
2
σ x1 x2
− n1 n 2
0,50−0,44
= 0,02754551789 = 2,18
0
Luas Kiri 0
= 0,5000
Luas 0 – Z1
= 0,4854+
Luas kiri Z
= 0,9854
Z
Kesimpulan : Jadi, peluang beda persentase harga saham sektor properti meningkat 50% lebih kecil dibandingkan dengan kenaikan harga saham sektor barang konsumsi adalah sebesar 0,9854 atau 98,54%.
8. Zivi’s Corporation has two different departments in the Corporate Finance, Department of Investing and Department of Budgeting. Every year an estimated mistakes in each department doing their job are 12% and 6% for Investing and Budgeting Department. The Chief of Financial Officer want to analyze it, and took 320 people from each department as a sample. Determine the difference of mistakes doing their job of Investing and Budgeting Department less than 1%? Jawab : Dik
: π1 = 12% π2 = 6% n1 = n2 = 320
Dit
x1 n1
: P(
−
x2 n2
< 1%)
Jawab : µ x1 −x2 = π1 − π2 = (0,12 – 0,06) = 0,06 n1 n2
π1 (1−π1 ) n1
σx1 −x2 = √ n1 n2
+
(0,12)(0,88)
=√
320
π2 (1−π2 ) n2
+
(0,06)(0,94) 320
= 0,0225
31
Z=
x x ( 1 − 2 )−µ x1 x2 n n 1
− n1 n2
2
σx1 x2 −
n1 n2
=
0,01−0,06 0,0225
= -2,22
Luas Kiri 0
= 0,5000
Luas Z - 0
= 0,4868 –
Luas Kiri Z
= 0,0132
Kesimpulan : Jadi, probabilitas kesalahan dalam mengerjakan pekerjaan di Department of Investing dan Department of Budgeting berbeda kurang dari 1 persen adalah sebesar 0,0132 atau 1,32%.
PENAKSIRAN RATA-RATA DAN PROPORSI
1.
Pengertian Penaksiran adalah keseluruhan proses menduga suatu parameter pada
populasi yang tidak diketahui nilainya dengan menggunakan statistik sampel (Statistika Untuk Ekonomi dan Keuangan Modern, Suharyadi). Pada penaksiran, kita mengambil sample untuk dianalisis, sehingga hasil analisis tersebut dapat digunakan untuk memperkirakan ukuran populasi 2.
( parameter populasi).
Jenis Penaksiran Statistik Ada 2 jenis penaksiran/pendugaan yang dilakukan terhadap populasi, yaitu: a. Pendugaan Titik (Point Estimation) Contoh : Dari sample acak rata – rata berat badan mahasiswa FEB Unpad ialah 65kg b. Pendugaan Interval (Interval Estimation). Contoh : Dari sample acak rata – rata berat badan mahsiswa FEB unpad ialah 65 ± 1 kg
3.
Kriteria Penaksir yang Baik Statistik sampel yang digunakan untuk menduga parameter populasi harus memenuhi tiga kriteria berikut, yaitu: Tidak bias (unbias) Statistik sampel yang digunakan sebagai penduga (penaksir) harus sama atau mendekati parameter populasi yang diduga. Efisien Statistik sampel memiliki standar deviasi yang kecil. Konsisten Jika ukuran sampel meningkat, maka statistik sampel akan semakin mendekati parameter populasinya.
4.
Penaksiran Titik (Point Estimation)
Pada penaksiran titik, kita menggunakan suatu nilai untuk menduga parameter populasi. Contoh: Mahasiswa
Berat Badan
Kara
85
Farhat
87
Evan
98
Lois
83
Anita
77
Untuk menduga rata-rata berat badan Statistics Teaching Assistant diambil 5 orang assistant statistik sebagai sample 𝑥̅ =
𝛴𝑥 87 + 85 + 98 + 83 + 77 = = 86 𝑛 5
Maka dugaan untuk rata – rata berat badan assistant statistik adalah 86 5.
Penaksiran Interval (Interval Estimation) Macam-macam penaksiran interval:
1. Penaksiran Rata-rata Ada 3 rumus pendugaan interval rata-rata µ.
a.
̅ − 𝒁𝜶/𝟐 𝒙
𝝈 √𝒏
̅ + 𝒁𝜶/𝟐 <µ<𝒙
𝝈 √𝒏
𝒁𝜶/𝟐 =
𝟏−𝜶 𝟐
Rumus ini berlaku untuk sampel besar (n ≥ 30) dari populasi yang tak terbatas (infinite population) atau dari populasi terbatas (finite population) 𝑛
namun 𝑁 ≤ 0,05.
b.
̅ 𝒙 − 𝒁𝜶/𝟐
𝝈 𝑵−𝒏 √ √𝒏 𝑵−𝟏
<µ<̅ 𝒙 + 𝒁𝜶/𝟐
𝝈 𝑵−𝒏 √ √𝒏 𝑵−𝟏
Rumus ini berlaku untuk sampel besar (n ≥ 30) dari populasi terbatas 𝑛
dengan 𝑁 > 0,05.
c.
̅ − 𝒕𝜶/𝟐 𝒙
𝒔 √𝒏
̅ + 𝒕𝜶/𝟐 <µ<𝒙
𝒔 √𝒏
𝜶
𝒕𝜶/𝟐 = 𝟐 ; 𝒅𝒇 = 𝒏 − 𝟏
Rumus ini berlaku untuk sampel kecil (n < 30), dengan menambahkan 𝑵−𝒏
faktor koreksi √𝑵−𝟏 di kedua sisi jika sampel dari populasi terbatas 𝑛
dengan 𝑁 > 0,05. Contoh Soal : Sebanyak 400 perusahaan swasta asing di Indonesia, seorang researcher menyatakan bahwa dari 80 perusahaan swasta asing di Indonesia yang ia teliti, modal perusahaan swasta asing yang berasal dari penjualan saham di bursa Rp 900 juta. Standar deviasi modal tersebut sebesar Rp 20 juta. Dengan tingkat signifikansi sebesar 5%, berapakah taksiran rata-rata modal perusahaan swasta asing dari penjualan saham di bursa? Dik:
N = 400 n = 80 𝑥̅ = 900 s = 20 𝑛 𝑁
80
= 400 = 0,2 (menggunakan faktor koreksi)
Zα/2 = Z(1-α)/2 = Z0,475 = 1,96 Dit: P(𝑥̅ − 𝑍𝛼/2
𝑠 𝑁−𝑛 √ √𝑛 𝑁−1
< µ < 𝑥̅ + 𝑍𝛼/2
𝑠 𝑁−𝑛 √ ) √𝑛 𝑁−1
= 0,95
Jawab:
900 − 1,96
20
400 − 80 20 400 − 80 √ √ < µ < 900 − 1,96 √80 400 − 1 √80 400 − 1
900 – 3,92490921 < µ < 900 + 3,92490921 896,075091 < µ < 903,92490921
Jadi, dengan tingkat signifikansi 5% rata-rata modal perusahaan swasta asing dari penjualan saham di bursa berkisar antara Rp 896,075091 juta sampai Rp 903,92490921 juta.
2. Penaksiran Proporsi Kata proporsi menunjukkan persentase dari suatu bagian atau unsur dari suatu bagian. Proporsi menunjukkan jumlah bagian tertentu dari suatu kelompok. Rumus penaksiran proporsi:
𝑥 𝑛
𝑥
𝑥 𝑛
(1− )
− 𝑍𝛼/2 √𝑛
𝑛
𝑥
𝑥
𝑥 𝑛
(1− )
< 𝜋 < 𝑛 + 𝑍𝛼/2 √𝑛
𝒁𝜶/𝟐 =
𝑛
𝟏−𝜶 𝟐
Rumus ini berlaku untuk sampel besar (n ≥ 30) dari populasi yang tak terbatas (infinite population) atau dari populasi terbatas (finite population) namun
Jika
𝑛 𝑁
𝑥 𝑛
𝑛 𝑁
≤ 0,05. 𝑁−𝑛
> 0,05, gunakan faktor koreksi √ 𝑁−1 𝑥
𝑥 𝑛
(1− )
− 𝑍𝛼/2 √𝑛
𝑛
𝑁−𝑛 𝑁−1
√
𝑥
𝑥
𝑥 𝑛
(1− )
< 𝜋 < 𝑛 + 𝑍𝛼/2 √𝑛
𝑛
√
𝑁−𝑛 𝑁−1
Jika sampel kecil (n < 30), ganti Zα/2 menjadi tα/2.
𝑥 𝑛
𝑥
𝒏−𝟏
𝑥 𝑛
(1− )
− 𝑡𝛼/2 √𝑛
𝑛
𝑥
𝑥
𝑥 𝑛
(1− )
< 𝜋 < 𝑛 + 𝑡𝛼/2 √𝑛
𝑛
𝜶
𝒕𝜶/𝟐 = 𝟐 ; 𝒅𝒇 =
Contoh Soal : Survey terhadap 22 calon pemilih menunjukkan bahwa 70% akan memilih Jokowi. Buatlah dugaan sebesar 99% confident level untuk proporsi calon yang akan memilih Jokowi! Dik:
n = 22 tα/2 = t0,005; 21 = 2,831 𝑥 𝑛
𝑥
= 0,7
𝑥
Dit: P( 𝑛 − 𝑡𝛼/2 √𝑛
𝑥 𝑛
(1− ) 𝑛
𝑥
𝑥
𝑥 𝑛
(1− )
< 𝜋 < 𝑛 + 𝑡𝛼/2 √𝑛
𝑛
) = 0,99
Jawab: 0,7(0,3) 0,7(0,3) 0,7 − 2,831√ < 𝜋 < 0,7 + 2,831√ 22 22 0,7 – 0,27659108 < π < 0,7 + 0,27659108 0,42340829 < π < 0,97659108 Jadi, dengan tingkat signifikansi 1% proporsi calon yang akan memilih Jokowi berkisar antara 42,340829% dan 97,659108%.
SOAL PENAKSIRAN RATA-RATA DAN PROPORSI 1. Untuk mengetahui rata – rata IPK mahasiswa Fakultas Audio Engineering Universitas Padjadjaran, tim peneliti memilih 21 mahasiswa dari 450 mahasiswa aktif Fakultas Audio Engineering. Ternyata rata – rata IPK dari 45 mahasiswa tersebut ialah 3,180 dengan simpangan baku 0,80. Buatlah pendugaan rata – rata IPK mahasiswa FEB Unpad yang sebenarnya dengan tingkat keyakinan 90%. Dik:
N = 450
n = 21
n/N = 0.04666667 < 0.05 𝑥̅ = 3,180
s = 0,80
tα/2 = t0,05; 20 = 1,725 Dit: P (𝑥̅ − 𝑡𝛼/2
𝑠 √𝑛
< µ < 𝑥̅ + 𝑡𝛼/2
𝑠 ) √𝑛
= 0,90
Jawab: 3,18 − 1,725
0,80 √21
< µ < 3,18 + 1,725
0,80 √21
2,87885931 < µ < 3.48114069 Jadi, dengan tingkat signifikansi 10% rata-rata IPK mahasiswa FE Unpad ialah antara 2,12600759 sampai dengan 4,23399241
2. PT United Tractor memiliki 4000 pekerja di bagian head office. Masing-masing pekerja memiliki gaji berdasarkan jabatan atau posisinya. Dari 4000 pekerja tersebut, terdapat 2500 orang yang bekerja dengan jabatan staff. Staff-staff ini juga memiliki gaji yang bervariasi tergantung pada departemennya. Dalam penelitiannya, Vincent bertanya kepada 200 staff mengenai gaji yang mereka peroleh sebagai sample penelitiannya, sehingga diperoleh rata-rata gaji dari 200 staff tersebut 5325 (dalam ribuan rupiah) perbulan, dengan standar deviasi 1500
(dalam ribuan rupiah). Hitunglah taksiran interval rata – rata gaji staff PT United Tractor dengan tingkat signifikansi 1%.
Dik :
N = 2500
n = 200
n/N = 0.08 > 0.05
𝑥̅ = 5325
s = 1500
Zα/2 = Z(1-α)/2 = Z0,495 = 2,575 Dit : P(𝑥̅ − 𝑍𝛼/2
𝑠 𝑁−𝑛 √ √𝑛 𝑁−1
< µ < 𝑥̅ + 𝑍𝛼/2
𝑠 𝑁−𝑛 √ ) √𝑛 𝑁−1
= 0,99
Jawab :
5325 − 2,575
1500 2500 − 200 1500 2500 − 200 √ √ < µ < 5325 − 2,575 √200 2500 − 1 √200 2500 − 1
5325 – 262,0199048 < µ < 5325 + 262,0199048 5062,980095 < µ < 5587,019905 Jadi, dengan tingkat signifikansi 1%., taksiran interval rata – rata gaji staff PT United Tractor antara Rp 5.062.980,095 sampai dengan Rp 5.587.019,905 3.
Ibu Jari Corporation yang bergerak di industri garmen memproduksi 700 pakaian setiap minggunya untuk didistribusikan ke berbagai macam toko pakaian di Bandung. Dari 220 pakaian yang diambil, terdapat 187 pakaian yang lolos uji kualitas standar, sedangkan sisanya ditolak untuk didistribusikan karena tidak memenuhi spesifikasi standar. Dengan tingkat keyakinan 95%, tentukan interval estimasi proposi pakaian yang reject.
Dik :
N = 700
n = 220 n/N = 0.3143 > 0.05 𝑥 𝑛
x = (220-187) = 33 α)/2
=
33 220
= 0.15
Zα/2 = Z(1-
= Z0,475 = 1,96 𝑥
𝑥
Jawab :
𝑥 𝑛
(1− )
Dit : P( 𝑛 − 𝑍𝛼/2 √𝑛
𝑛
𝑁−𝑛 𝑁−1
√
𝑥
𝑥
𝑥 𝑛
(1− )
< 𝜋 < 𝑛 + 𝑍𝛼/2 √𝑛
𝑛
𝑁−𝑛
)√ 𝑁−1 = 0,95
𝑥 𝑥 𝑥 𝑥 (1 − 𝑛) 𝑁 − 𝑛 (1 − 𝑛) 𝑁 − 𝑛 𝑥 𝑥 𝑛 𝑛 √ √ − 𝑍𝛼/2 √ < 𝜋 < + 𝑍𝛼/2 √ 𝑛 𝑛 𝑁−1 𝑛 𝑛 𝑁−1 0,15(0,85) 700 − 220 √ 0,15 − 1,96√ <𝜋 220 700 − 1 0,15(0,85) 700 − 220 √ < 0,15 + 1,96√ 220 700 − 1 0,1108995411 < π < 0,1891004589 Jadi, dengan tingkat keyakinan 95%, interval estimasi proporsi pakaian yang reject berkisar antara 11,08995411% sampai dengan 18,91004589%.
4.
Abigail ingin melihat efektivitas penggunaan internet pada penjualan. Dari 120 toko yang diambil sebagai sample, 95 toko menunjukkan peningkatan penjualan sebesar rata-rata 15 % dibandingkan ketika toko tersebut tidak melibatkan e-commerce dalam lingkup bisnisnya. Buatlah dugaan interval proporsi toko yang mengalami peningkatan penjualan dengan tingkat keyakinan 99 %.
Dik : n = 120 α)/2
x = 95
𝑥 𝑛
=
95 120
= 0.79167
= Z0,495 = 2,575 𝑥 𝑛
𝑥
𝑥 𝑛
(1− )
Dit : P( − 𝑍𝛼/2 √𝑛
𝑛
𝑥 𝑛
𝑥
𝑥 𝑛
(1− )
< 𝜋 < + 𝑍𝛼/2 √𝑛
𝑛
) = 0,99
Jawab : 𝑥 𝑥 𝑥 𝑥 (1 − 𝑛) (1 − 𝑛) 𝑥 𝑥 𝑛 𝑛 √ √ − 𝑍𝛼/2 < 𝜋 < + 𝑍𝛼/2 ) 𝑛 𝑛 𝑛 𝑛 0,7917(0,2083) 0,79167 − 2,575√ <𝜋 120 0,7917(0,2083) < 0,79167 + 2,575√ 120
Zα/2 = Z(1-
0,6962121677 < π < 0,8871278323 Jadi, dugaan interval proporsi toko yang mengalami peningkatan penjualan dengan tingkat keyakinan 99 % adalah 69,62121677% sampai 88,71278323 %.
5.
25 students from Unpad will depart to United States to be the delegations of Indonesia in World Music Conference. One of the eligibility is to have IELTS score more than 6,0. James, as one of those selected students wants to find out the average estimation of IELTS score of them. Therefore, he asked the score to 18 of his friends. He obtained that the average of his and 17 friends’ IELTS score is 6,45 with standard deviation of 0,4. With the significance level of 10%, determine the interval estimation of average of those students’ IELTS score. Given :
N = 25
n = 18
n/N = 0.2 > 0.05
𝑥̅ = 6.45
s = 0.4
tα/2 = t0,05; 17 = 1,740
Question : P (𝑥̅ − 𝑡𝛼/2
𝑠 √𝑛
𝑁−𝑛 𝑁−1
√
< µ < 𝑥̅ + 𝑡𝛼/2
𝑠 √𝑛
√
𝑁−𝑛 𝑁−1
) = 0,90
Answer : 𝑁−𝑛 𝑠 𝑁−𝑛 √ √ < µ < 𝑥̅ + 𝑡𝛼 𝑁−1 𝑁−1 2 √𝑛 2 √𝑛
𝑥̅ − 𝑡𝛼
𝑠
6,45 − 1,740
0.4
25 − 18 0.4 25 − 18 √ √ < µ < 6,45 − 1,740 √18 25 − 1 √18 25 − 1
6,361403537 < µ < 6,538596463 So with the significance level of 10%, the interval estimation of average of those selected students’ IELTS score is between 6,361403537 and 6,538596463.
6. The marketing assistant manager of iTunes music store has conducted the customer survey to assess the customer’s preference of 2 options men singers. The options are David Archuleta and Chris Brown. Based on the survey result,
90 of 150 respondents choose David Archuleta, while the rest go on Chris. Estimate the proportion of people choosing David Archuleta with confidence level of 95%. Given : n = 150 α)/2
𝑥 𝑛
x = 90
=
90 150
= 0.6
Zα/2 = Z(1-
= Z0,475 = 1,96 𝑥
𝑥 𝑛
𝑥 𝑛
(1− )
Question : P( − 𝑍𝛼/2 √𝑛
𝑛
𝑥 𝑛
𝑥
𝑥 𝑛
(1− )
< 𝜋 < + 𝑍𝛼/2 √𝑛
𝑛
) = 0,95
Answer : 𝑥 𝑥 𝑥 𝑥 (1 − 𝑛) (1 − 𝑛) 𝑥 𝑥 𝑛 𝑛 √ √ − 𝑍𝛼/2 < 𝜋 < + 𝑍𝛼/2 𝑛 𝑛 𝑛 𝑛 0,6(0,4) 0,6(0,4) 0,6 − 1,96√ < 𝜋 < 0,6 + 1,96√ 150 150 0,5216 < π < 0,6384 Therefore, the proportion of people choosing David Archuleta with confidence level of 95% is among 52,16 % and 63,84 % 7. The Creative Minister of United States conducts research related to music. Taken 21 of 121 companies running in music industry, the average of songs released daily for U.S. residents to listen is 18. This number of songs usually deviate 4 each day. Based on the information retrieved, calculate the interval estimation of average of songs released in United States with the significance level of 2%. Given :
N =121
𝑥̅ = 18
n = 21
tα/2= t0,01 ;20 = 2,528 n/N = 0.173554 > 0.05 Question : P (𝑥̅ − 𝑡𝛼/2 Answer :
𝑠 √𝑛
√
𝑁−𝑛 𝑁−1
< µ < 𝑥̅ + 𝑡𝛼/2
𝑠 √𝑛
𝑁−𝑛 𝑁−1
√
) = 0,98
s=4
𝑥̅ − 𝑡𝛼/2
18 − 2,528
𝑠 √𝑛
√
𝑁−𝑛 𝑁−1
< µ < 𝑥̅ + 𝑡𝛼/2
𝑠 √𝑛
𝑁−𝑛 𝑁−1
√
4
121 − 21 4 121 − 21 √ √ < µ < 18 + 2,528 √21 121 − 1 √21 121 − 1
15,98564138 < µ < 20,01435862 Therefore, with the significance level of 2%, interval estimation of average of songs released in United States is between 15 and 20 songs. 8. The annual scholarship sponsored by United States Ambassador is given to Indonesian and Brunei Darussalam citizens. Each year there are 75 available scholarships to grant. 28 scholarships were taken as sample, 65% of them were granted to Indonesian and the rest to Brunei. With the significant level of 5% compute the interval estimate of proportion of scholarships granted to Brunei. Given :
N = 75
𝑥 𝑛
n = 28
= 35% = 0.35
tα/2= t0,025 ;27 = 2,052 28
n/N = 75 = 0,3733333 > 0.05 𝑥 𝑛
𝑥
𝑥 𝑛
(1− )
Question : P( − 𝑡𝛼/2 √𝑛
𝑛
√
𝑁−𝑛 𝑁−1
𝑥 𝑛
𝑥
𝑥 𝑛
(1− )
< 𝜋 < + 𝑡𝛼/2 √𝑛
𝑛
𝑁−𝑛 ) 𝑁−1
√
= 0,95
Answer : 𝑥 𝑥 𝑥 𝑥 (1 − 𝑛) 𝑁 − 𝑛 (1 − 𝑛) 𝑁 − 𝑛 𝑥 𝑥 𝑛 𝑛 √ √ √ √ − 𝑡𝛼/2 < 𝜋 < + 𝑡𝛼/2 𝑛 𝑛 𝑁−1 𝑛 𝑛 𝑁−1 0,35(0,65) 75 − 28 √ 0,35 − 2,052√ <𝜋 28 75 − 1 0,35(0,65) 75 − 28 √ < 0,35 + 2,052√ 28 75 − 1 0,2025916414 < π < 0,4974083586
Therefore, with the significance level of 5%, interval estimate of proportion of scholarships granted to Brunei is between 20 and 49.
PENAKSIRAN SELISIH RATA-RATA DAN SELISIH PROPORSI
Penaksiran Selisih Rata-Rata Apabila kita hendak menaksir perbedaan rata-rata ( 1 2 ) pada dua populasi, maka kita bisa menaksir rata-rata populasi tersebut dengan menggunakan statistik sampel rata-rata
( x1 x2 ) .
Jika sampel yang diambil dari populasi ke satu
berukuran n1 dan simpangan baku s1 dengan rata-rata
x1
dan sample yang diambil
dari populasi ke dua berukuran n2 dan simpangan baku s2 dengan rata-rata titik taksiran selisih rata-rata populasi 1. Untuk sample besar
( x1 x2 ) Z
12 n1
2
22 n2
2. Untuk sample kecil
12 n1
2
2
( x1 x 2 ) t
2
n1
2
2
22 n2
2
2
*)
(n1 30 & n2 30)
22 n2 2
1 2 ( x1 x 2 ) t
12 n1
2
2
22 n2 ; df n1 n2 2 * *)
2
s1 s 2 s1 s 2 1 2 ( x1 x 2 ) t 2 n1 n2 n1 n2
(n1 1)s1 (n2 1)s2 1 1 (n 1)s (n 1)s 1 1 ( ) 1 2 ( x1 x2 ) t 1 1 2 2 ( ) 2 n1 n2 2 n1 n2 n1 n2 2 n1 n2 2
( x1 x2 ) t 2 Catatan :
1 2 ( x1 x2 ) Z
12
s1 s s1 s 2 1 2 ( x1 x 2 ) Z 2 2 n1 n2 n1 n2
2
( x1 x 2 ) t
(1 2 ) adalah ( x1 x2 ) .
(n1 30 & n2 30)
2
( x1 x 2 ) Z
x 2 , maka
2
2
2
* **)
2 2 *) Digunakan bila 𝜎1 dan 𝜎2 tidak diketahui nilainya 2 2 * *)Digunakan bila 𝜎1 dan 𝜎2
tidak diketahui nilainya dan diketahui 𝜎1 2 ≠
𝜎2 2 2 2 2 2 * **)Digunakan bila 𝜎1 dan 𝜎2 tidak diketahui nilainya dan diketahui 𝜎1 = 𝜎2
Contoh Soal Sekelompok kolektor barang-barang jadul melakukan penelitian terhadap umur 2 merk mobil. Merk STATIS memiliki rata-rata umur 7700 jam dengan simpangan baku 400 jam, sedangkan Merk TIKA memiliki rata-rata umur 5500 jam dengan simpangan baku 300 jam. Apabila diambil sampel acak sebanyak 200 unit, berapakah selisih rata-rata umur kedua merk tersebut dengan Cl 95%? Penyelesaian Dik : 𝑛𝑥 = 200
𝑥̅ = 𝑥̅1 = 7700
𝜎𝑥 2 = 𝜎1 2 = 160.000
𝑛𝑦 = 200
𝑦̅ = 𝑥̅2 = 5500
𝜎𝑦 2 = 𝜎2 2 = 90.000
Dan untuk tingkat kepercayaan 95%, maka: (1 − 𝛼) 0.95 = = 0.475 (𝑙𝑖ℎ𝑎𝑡 𝑡𝑎𝑏𝑒𝑙 𝑍) 2 2 𝑚𝑎𝑘𝑎 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 ⇒ 𝑍𝛼⁄2 = 1.96 Maka selisih rata-ratanya:
( x1 x 2 ) Z
12 2
n1
22 n2
1 2 ( x1 x 2 ) Z
12 2
n1
22 n2
160000 90000 + 200 200
(7700– 5500) – 1.96 √
< µx - µy < (7700– 5500) +1.96
160000 90000 + 200 200
√
2200 – 69.29646456 < µx - µy < 2200 + 69.29646456 2130.703535 < µx - µy < 2269.296465 maka selisih rata -rata umur kedua merk barang tersebut dengan tingkat kepercayaan 95 % adalah 2130.703535 jam sampai dengan 2269.296465 jam. (Komputer dengan software minitab) Langkah-langkahnya : 1. Pilih menu Stat, kemudian basic statistik, kemudian 2 sample t 2. Pilih summarized data, masukkan jumlah sample, mean, standar deviasi masing-masing data kedalam kolom first dan second. Sesuaikan dengan soal. 3. Klik options dan masukkan confidence level 95,0 4. Terakhir klik OK Output: Two-Sample T-Test and CI SE Sample
N Mean StDev Mean
1
200 7700 400 24
2
200 5500 300 16
Difference = mu (1) - mu (2) Estimate for difference: 2200.000 95% CI for difference: (1694.563, 2705.437)
T-Test of difference = 0 (vs not =): T-Value = 23.78 P-Value = 0.000 DF = 259 Penaksiran Selisih Proporsi Hal yang sama untuk taksiran selisih proporsi
( 1 2 ) . Jika sample yang diambil
dari populasi ke satu berukuran n1 dan terdapat 𝑥1 kejadian dari n1 sampel atau percobaan dan sample yang diambil dari populasi ke dua berukuran n2 dan terdapat 𝑥2 kejadian dari n2 sampel atau percobaan, maka titik taksiran selisih proporsi populasi
( 1 2 ) adalah ( p1 p2 )
1. Untuk sample besar
dimana p1
x1 x2 dan p 2 n1 n2
(n1 30 & n2 30)
x1 x1 x 2 x2 x1 x1 x 2 x 2 *) ( 1 ) ( 1 ) ( 1 ) ( 1 )* *) xx11 x 2x2 ) Z n1 (1 n1 )( n12 1n2) 1 2 (xx11 xx2 2 ) Z n1 (1 n1 )( n12 1n2) ( ( n n) Z 2 n n 1 2 ( n n) Z 2 n n 1 n 2 1 n 2 2 2 n11 n2 2 n1 n11 n2 2 n1 2 2
2. Untuk sample kecil (n1 30 & n2 30) *) x1 x x2 x x1 x x2 x (1 1 ) (1 2 ) (1 1 ) (1 2 ) x x n1 n1 n n2 x x n1 n1 n n 2 * *) ( 1 2 ) t 2 1 2 ( 1 2 ) t 2 2 2 n1 n 2 n1 n2 n1 n 2 n1 n2 ; df n1 n2 2
(
x1 x2 x x 1 1 1 1 ) t (1 )( ) 1 2 ( 1 2 ) t (1 )( ) 2 2 n1 n2 n1 n2 n1 n2 n1 n2
Catatan : 1.Bila x1, x2, n1 & n2 masing-masing dinyatakan dengan bilangan bulat positif, persoalan penaksiran tersebut dapat diselesaikan atau dipecahkan dengan menggunakan rumus **).
* *)
2.Akan tetapi bila x1/n1, x2/n2 masing-masing dinyatakan dengan bilangan dalam bentuk rasio atau persen maka hanya digunakan rumus *). Contoh Soal : Perusahaan elektronik IHSG mengambil sampel random produk kamera sebanyak 130 buah dan 26 diantaranya adalah cacat. Sampel yang lain dari perusahaan PUSH yang juga mengambil random produk kamera sebanyak 200 buah dan 30 diantaranya cacat. Dengan mengetahui bahwa kualitas produksi kamera kedua perusahaan ialah sama, berapa beda 2 proporsi kerusakan produk dengan Cl 95%? Penyelesaian (manual) Dik : 𝑛1 = 130
𝑥1 = 26
C.l = 95 %
𝑛2 = 200
𝑥2 = 30
𝑍𝛼⁄2 = 1.96
Solusi:
(
x1 x 2 ) Z 2 n1 n2 26
(130 −
30 ) 200
x1 x x x x1 x x x (1 1 ) 2 (1 2 ) (1 1 ) 2 (1 2 ) n1 n1 n2 n2 x x n1 n1 n2 n2 1 2 ( 1 2 ) Z 2 n1 n2 n1 n2 n1 n2
0.2×0.8 0.15×0.85 + 200 ) 130
√(
0.2×0.8 0.15×0.85 + 200 ) 130
- 1.96 √(
26
< π1 – π2 < (130 −
30 ) 200
+ 1.96
0.05 – 0.084718021 < π1 – π2 < 0.05 + 0.084718021 -0.034718021 < π1 – π2 < 0.134718021 Kesimpulan : Dengan tingkat kepercayaan 95 %, rentang taksiran selisih proporsi kerusakan antara dua produk elektronik tersebut adalah sebesar 3.47% sampai dengan 13.47 %.
SOAL PENAKSIRAN SELISIH RATA-RATA DAN SELISIH PROPORSI 1. Selama 10 tahun terakhir rata-rata curah hujan di suatu daerah selama bulan November adalah 5,08 cm3 dengan standar deviasi 1,15 cm3. Di daerah lain, catatan serupa selama 5 tahun terakhir menunjukkan bahwa rata-rata curah hujan selama bulan November adalah 2,42 cm3 dengan standar deviasi 0,98 cm3. Tentukan CL 95% bagi beda rata-rata curah hujan selama bulan Mei di kedua daerah tersebut! (Asumsi : pengamatan berasal dari dua populasi normal dengan ragam yang berbeda) Penyelesaian Diket
: ̅̅̅ 𝑥1 = 5,08
s1 = 1,15
n1 = 10
̅̅̅ = 2,42 𝑥2
s2 = 0,98
n2 = 5
Jawab :
( x1 x2 ) t
2
s12 s2 2 s12 s2 2 1 2 ( x1 x2 ) t 2 n1 n2 n1 n2 1,3225 0,9604 + 10 5
(5,08 – 2,42) – 2,160 √
< µx - µy < (5,08 – 2,42) +2,160
1,3225 0,9604 + 5 10
√
2,66 – 1,230119526 < µx - µy < 2,66 + 1,230119526 1,429880474 < µx - µy < 3,890119526
Kesimpulan
: Jadi selisih rata-rata curah hujan yang sebenarnya selama
bulan Mei di kedua daerah tersebut berada dalam rentang 1,429880474 cm3 sampai 3,890119526 cm3. 2. Untuk mengetahui apakah ada perbedaan rata-rata jajan bulanan bagi para siswa Sekolah Dasar dari 2 sekolah yaitu SD Pemakmuran dan SD Cinta Damai, maka dilakukan wawancara terhadap 8 siswa SD yang dipilih secara acak sebagai sampel masing-masing sekolah. Hasilnya sebagai berikut : Siswa
1
Jajan/bln
2
3
4
5
6
7
8
Pemakmuran
20 35 45 36 39 25 42 28
(dlm puluhan Cinta Damai
30 26 21 35 19 38 24 39
ribu rupiah) Tentukan penaksiran interval dari selisih rata-rata gaji tersebut dengan derajat kepercayaan 98%! Penyelesaian 𝑥𝐴
270 8
= 33,75 Rp 337.500,-
𝑥𝐵
202 8
= 29 Rp 290.00,-
𝑥̅ 𝐴 = ∑ 𝑛𝐴 = 𝑥̅ 𝐵 = ∑ 𝑛𝐵 = 𝑠𝐴2 = ∑
(𝑋𝐴 −𝑋̅𝐴 )2 𝑛𝐴−1
= 8,68085 Rp 86.808,-
𝑠𝐵2 = ∑
(𝑋𝐵 −𝑋̅𝐵 )2 𝑛𝐵−1
= 7,708993 Rp 77.090,-
( x1 x2 ) t
2
s12 s2 2 s12 s2 2 1 2 ( x1 x2 ) t 2 n1 n2 n1 n2 75,35715672 59,42857307 + 8 8
(33,75 – 29) – 2,624 √
75,35715672 59,42857307 + 8 8
(33,75 – 29) + 2,624 √
< µ 1 - µ2 <
p (-6,086296775 < µ1 - µ2 < 15,58629677) = 98% Jadi dengan Cl 98%, interval rata-rata jajan/bulan siswa SD Pemakmuran dan SD Cinta Damai antara Rp 60.863,00 sampai dengan Rp 155.863,00
3. An Indonesian student studying in Korea trying to do research about Korean people who conduct plastic surgery over their face. She visited hospital in Seoul and found out that out of 300 female patients, 210 were gone plastic, while out of 300 male patient, 126 were classic. Construct and interpret estimate for the difference between the population proportion of who are gone plastic in Korea among the male and female patients. Solution Given
: n1 = 300
n2 = 300
x1 = 210
x2 = 174
Determine : interval estimate for the difference between the population proportion? Answer
:
𝑥1 210 = = 0.70 𝑛1 300
𝑍𝛼⁄2 =
(
𝑥2 174 = = 0.58 𝑛2 300
1 − 5% = 0.475 → 𝑍𝛼⁄2 = 1.96 2
x1 x 2 ) Z 2 n1 n2
x1 x x2 x x1 x x2 x (1 1 ) (1 2 ) (1 1 ) (1 2 ) n1 n1 n n2 x x n1 n1 n n2 2 1 2 ( 1 2 ) Z 2 2 n1 n2 n1 n2 n1 n2
(0.7)(0.3) (0.58)(0.42) (0.70 − 0.58) − 1.96√ + < π1 − π2 300 300 (0.7)(0.3) (0.58)(0.42) < (0.70 − 0.58) + 1.96√ + 300 300 0.12 − 0.07621351061 < 𝜇1 − 𝜇2 < 0.12 + 0.07621351061 0.04378648939 < 𝜇1 − 𝜇2 < 0.1962135106 So, with 5% significance level, the interval estimation for the difference between the population proportion of who are gone plastic in Korea among the male and female patients is between 4.38 % and 19,62 %.
4. During the advertisement project in Avocado Corporation, the project manager would like to know the creativity and innovation created by his employees, taken from two different division. 15 employees from Editor division and 13 from Creative. As the result, 6 ideas from Editor were accepted by the customers and was proved increasing the sales of customers, while 8 ideas obtained from Creative team. Based on the data, help the project manager to determine the interval of difference between proportion of Editor and Creative team about their bright mind with the significance level of 1%. Solution Given: 𝑛𝐴 = 15 𝑥𝐴 𝑛𝐴
6
𝑛𝐵 = 13 𝑥
8
= 15 = 0.4 𝑛𝐵 = 13 = 0.6154 𝐵
𝑡𝛼⁄ = 2.779 2
(manual)
(
x1 x2 ) t 2 n1 n2
x1 x x2 x x1 x x2 x (1 1 ) (1 2 ) (1 1 ) (1 2 ) x x n1 n1 n n2 n1 n1 n n2 2 1 2 ( 1 2 ) t 2 2 n1 n2 n1 n2 n1 n2 (0.4) (0.6) (0.6154) (0.3846) + 15 13
(0.4 − 0.6154) – 2.779 √
(0.4) (0.6) (0.6154) (0.3846) + 15 13
(0.4 − 0.6154) + 2.779 √
< π1 – π2 < or
-0.2154 - 0.5139750719 < π1 – π2 < -0.2154 + 0.5139750719 -0.7293750719 < π1 – π2 < 0,2985750719 So, with the significance level of 1% the interval of difference between proportion of Editor and Creative team about their bright mind is between 29.86 % and 72.94 %.
5. The results of a study conducted as part of a yield-improvement effort at a semiconductor manufacturing facility provided defect data for sample of 500 biscuits. The following contingency table presents a summary of the responses to two questions: ”was a particle found on the process of producing the biscuit?” and “is the biscuit good or bad?”
Quality of water PARTICLES
Good
Bad
Total
Yes
20
40
60
No
355
85
440
Total
375
125
500
Construct and interpret a 90% confidence interval estimate of the difference between the population proportion of good and bad wafers that contain particles!
Solution Given: 𝑛𝐴 = 375
𝑛𝐵 = 125
𝑥𝐵 𝑛𝐵
𝑥𝐴 𝑛𝐴
20
= 60 = 0.3333
40
= 60 = 0.6667
𝑍𝛼⁄2 = 1.645 Jawab:
(
x1 x2 ) Z 2 n1 n2
x1 x x2 x x1 x x2 x (1 1 ) (1 2 ) (1 1 ) (1 2 ) x x n1 n1 n n2 n1 n1 n n2 2 1 2 ( 1 2 ) Z 2 2 n1 n2 n1 n2 n1 n2
(0.6667 − 0.3333) – 1.645 √
(0.3333) (0.6667) (0.3333) (0.6667) + 60 60
< π1 – π2 <
(0.3333) (0.6667) (0.3333) (0.6667) + 60 60
(0.6667 − 0.3333)+ 1.645 √
or
0,191824482 < π1 – π2 < 0,474975518 With 90% confidence level, interval estimate of the difference between the population proportion of good and bad wafers that contain particles is between 19,18 % and 47,50 %, the proportion of bad wafers containing particles is larger than proportion of the good one.
6. Dari hasil sebuah proses produksi dikirim ke lokasi Buah Batu sebanyak 30 buah barang, ternyata rata-rata masa pakainya 200 menit dengan deviasi standar 20 menit. Barang itu juga dikirim ke lokasi Rancaekek sebanyak 20 barang dan ternyata mempunyai rata-rata masa pakainya 180 menit dengan deviasi standar 15 menit. Tentukanlah selisih rata-rata masa pakai barang yang dikirim pada kedua lokasi tsb dengan derajat kepercayaan 1% ? Penyelesaian Dik : 𝑛𝑥 = 31
𝑥̅ = 200
𝜎𝑥 2 = 400
𝑛𝑦 = 20
𝑦̅ = 180
𝜎𝑦 2= 225
Dan untuk tingkat signifikansi 1%, maka: (1 − 𝛼) 0.99 = = 0.495 (𝑙𝑖ℎ𝑎𝑡 𝑡𝑎𝑏𝑒𝑙 𝑍) 2 2 𝑚𝑎𝑘𝑎 𝑑𝑖𝑑𝑎𝑝𝑎𝑡 ⇒ 𝑍𝛼⁄2 = 2,575 Maka selisih rata-ratanya:
( x1 x 2 ) Z
12 2
n1
(200– 180) – 2,575 √
22 n2
1 2 ( x1 x 2 ) Z
400 225 + 30 20
12 2
n1
22 n2
400 225 + 30 20
< µx - µy < (200– 180) +2,575 √
20 – 12,65507736 < µx - µy < 20 + 12,65507736 7,344922645 < µx - µy < 32,65507736 maka selisih rata-rata masa pakai barang yang dikirim kedua lokasi dengan tingkat kepercayaan 99% adalah 7,344922645 menit sampai dengan 32,65507736 menit.
7. Dalam mengerjakan skripsinya, seorang mahasiswa ingin mengadakan sebuah survey dengan tujuan mengetahui waktu tunggu layanan perbankan dan rumah sakit. Untuk itu dilakukan pengamatan pada data-data waktu tunggu setiap pelanggan selama satu periode yang didapat dari dua sektor usaha tersebut. Data berikut merupakan waktu tunggu dari sampel yang dipilih secara acak 10 pelanggan : Waktu tunggu (dalam menit) Perbankan
9,3
5,9
6,2
8,5
5,6
2,7
8.9
7,3
7,9
6,4
Rumah Sakit
4,2
6,3
5,4
8,7
4,4
2,5
4,9
8,8
7,8
6,5
Asumsikan varians populasinya sama, tentukanlah batas-batas taksiran selisih rata-rata waktu tunggu hasil survei mahasiswa tersebut dengan tingkat signifikansi 10%? Jawab : Dik: 𝑛𝑥 = 10
𝑛𝑦 = 10
𝑥̅1 = 6.87
𝑥̅2 = 5.95
𝑆𝑥 2 = 3.837888853 C.l = 90 %
𝑆𝑦 2 = 4.256111101
𝑡𝛼⁄2 = 1.734 (df = 10 + 10 -2 = 18)
Solution
(n1 1)s1 (n2 1)s2 1 1 (n1 1)s1 (n2 1)s2 1 1 ( ) 1 2 ( x1 x2 ) t ( ) 2 n1 n2 2 n1 n2 n1 n2 2 n1 n2 2
( x1 x2 ) t
2
(6.87-5.95) – 1.734√
2
2
(10−1)(3.837889049)+ (10−1)( 7.04890818) 10+10−2
1 10
(
(10−1)(3.837889049)+ (10−1)( 7.04890818)
µ2< (6.87-5.95) + 1.734√
10+10−2
+
2
1 ) 10
< µ1 -
1
1
(10 + 10)
-0.6400218885 < µ1 - µ2 < 2.480021888 Dengan tingkat sigifikansi 10%, maka batas-batas taksiran selisih rata-rata waktu tunggu hasil survei mahasiswa adalah antara 0.6400218885 sampai 2.480021888 menit.
8. David as the musician of United States was testing the piano in Nokia Theatre. 50 pianos were taken as sample, and after the testing, he found that 14 of them were out of pitch. Then he asked the officer to settle up the
pitchy piano. While the day after, he visited Rascal Flatts and found 8 pitchy piano out of 30 he was testing on. Calculate the estimate interval for difference between proportion of pitchy piano in Nokia and Rascal with confidence level of 95%. Solution : Given : 𝑛𝐴 = 50 𝑥𝐴 𝑛𝐴
=
14 50
𝑛𝐵 = 30 = 0.28
𝑥𝐵 𝑛𝐵
=
8 30
= 0.2667
𝑍𝛼⁄2 = 1.96 Jawab:
x1 x x2 x x1 x x2 x (1 1 ) (1 2 ) (1 1 ) (1 2 ) x1 x2 x1 x2 n1 n1 n2 n2 n1 n1 n2 n2 ( ) Z 1 2 ( ) Z 2 2 n1 n2 n1 n2 n1 n2 n1 n2 (0.28) (0.72) (0.2667) (0.7333) + 50 30
(0.28 − 0.2667) – 1.96 √
(0.28) (0.72) (0.2667) (0.7333) + 50 30
(0.28 − 0.2667) + 1.96 √
< π1 – π2 < or
0.0133 – 0.130975178 < π1 – π2 < 0.0133 + 0.130975178 -0.188027752 < π1 – π2 < 0.214627752 Therefore, the estimate interval for difference between proportion of pitchy piano in Nokia and Rascal with significance level of 5% is between 18,8 % and 21,46%.
UJI HIPOTESIS RATA-RATA DAN PROPORSI Hipotesis adalah sebuah dugaan atau referensi yang dirumuskan serta diterima untuk sementara yang dapat menerangkan fakta-fakta yang diamati dan digunakan sebagai petunjuk dalam pengambilan keputusan.(Suharyadi; 2009).
Pengujian Hipotesis Pengujian hipoitesis adalah prosedur yang didasarkan pada bukti sampel yang dipakai untuk menentukan apakah hipotesis merupakan suatu pernyataan yang wajar dan oleh karenanya tidak ditolak atau hipotesis tersebut tidak wajar dan kerena itu ditolak.
Perumusan Hipotesis Perumusan hipotesis dikembangkan menjadi hipotesis nol dan hipotesis alternatif. a. Hipotesis Nol(Ho) - Hipotesis nol dilambangkan dengan Ho dan diformulasikan untuk ditolak sesudah pengujian. - Memprediksi tidak adanya perbedaan antara satu kondisi dengan kondisi yang lain. b. Hipotesis Alternatif (Ha) - Hipotesis alternatif (Ha) merupakan hipotesis yang diterima ketika menolak hipotesis nol (Ho) dan berlaku sebaliknya. - Memprediksi adanya perbedaan antara satu kondisi dengan kondisi lain. Contoh : 1. Ho : Rata-rata nilai Bahasa Inggris mahasiswa kelas A sama dengan ratarata nilai Bahasa Inggris mahasiswa kelas B 2. Ha : Rata-rata nilai Bahasa Inggris mahasiswa kelas A tidak sama dengan rata-rata nilai Bahasa Inggris mahasiswa kelas B
Uji Hipotesis Rata-Rata Adalah pengujian mengenai hipotesis rata-rata suatu populasi yang didasarkan atas informasi sampelnya. Langkah-Langkah Menguji Rata-Rata Populasi(µ):
1.
Rumuskan Hipotesis a. 𝐻0 : 𝜇 = 𝜇0
(pengertian sama/uji 2 pihak)
𝐻𝐴 : 𝜇 𝜇0 b. 𝐻0 : 𝜇 ≤ 𝜇0
(uji 1 pihak kanan/ pengertian max)
𝐻𝐴 : 𝜇>𝜇0 c. 𝐻0 : 𝜇 ≥ 𝜇0
(uji 1 pihak kiri/ pengertian min)
𝐻𝐴 : 𝜇<𝜇0 2. Perhitungan Z stat dan t stat Perhitungan Z stat: bila populasinya terbatas (N dan n diketahui nilainya) dan 𝑛 𝑁
> 0,05, gunakan faktor koreksi √
𝑍=
𝑁−𝑛 𝑁−1
𝑋̅ − 𝜇 𝑁−𝑛 𝜎/√𝑛√ 𝑁−1
bila populasinya terbatas (N dan n diketahui nilainya) dan 𝑛 𝑁
≤ 0,05 atau bila populasinya tidak terbatas (N tidak diketahui
nilainya)
𝑍=
𝑋̅ − 𝜇 𝜎/√𝑛
Bila standar deviasi populasi (𝜎) tidak diketahui dapat diganti dengan standar deviasi sampelnya (s).
Perhitungan t stat, ketika n < 30 bila populasinya terbatas (N dan n diketahui nilainya) dan 𝑛 𝑁
𝑁−𝑛
> 0,05, gunakan faktor koreksi √ 𝑁−1 𝑡=
𝑋̅ − 𝜇 𝑁−𝑛 𝜎/√𝑛√𝑁 − 1
; 𝑑𝑓 = 𝑛 − 1
bila populasinya terbatas (N dan n diketahui nilainya) dan 𝑛 𝑁
≤ 0,05 atau bila populasinya tidak terbatas (N tidak diketahui
nilainya) 𝑡=
𝑋̅ − 𝜇 𝜎/√𝑛
; 𝑑𝑓 = 𝑛 − 1
Bila standar deviasi populasi (𝜎) tidak diketahui dapat diganti dengan standar deviasi sampelnya (s).
3. Menentukan batas daerah penerimaan dan penolakan: a.
n > 30, tentukan nilai Z table Z1/2α =
1−α 2
Ket : Z1/2α =
Zα = 0.5 − α Z table untuk uji 2 pihak
Zα = Z table untuk uji 1 pihak n≤ 30, tentukan nilai t table dengan derajat kebebasan (degree of freedom/df) t1/2α =
t table untuk uji 2 pihak
tα =t table untuk uji 1 pihak df = n -1 b. Gunakan α (tingkat signifikasi)
c. Gambarkan daerah penolakan dan penerimaan hipotesis nol berdasarkan langkah 1 i. Uji 2 pihak
Daerah penolakan H (daerah kritis )
Daerah penolakan H (daerah kritis )
Daerah penerimaan H
?
Z1/2α
-Z1/2α
ii. Uji 1 pihak kanan
Daerah penolakan H (daerah kritis) Daerah penerimaan H
Zα
iii. Uji 1 pihak kiri
Daerah penolakan H (daerah kritis)
Daerah penerimaan H
-Zα
Keterangan : Daerah yang diasir adalah daerah penolakan Ho dan untuk n ≤30, Z diganti dengan t.
4. Menentukan kriteria penerimaan atau penolakan
(1) Untuk uji 2 pihak : Z <- atau Z > 2
Jika ≤ Z ≤ 2
Ho ditolak
2
2
Ho tidak dapat
ditolak (2) Uji 1 pihak kanan : Z > , Ho ditolak Z ≤ , Hotidak dapat ditolak (3) Uji 1 pihak kiri :
Z < Ho ditolak Z ≥ Hotidak dapat ditolak
Nilai Z diganti dengan t jika n ≤ 30.
5. Bandingkan nilai Z atau t (yang diperoleh pada tahap 2) dengan Z atau t table serta simpulkan apakah Ho tidak dapat ditolak atau ditolak berdasarkan kriteria penerimaan/penolakan. 6. Membuat kesimpulan secara komprehensif/lengkap
Contoh Soal: Berat dari ensiklopedia yang diproduksi oleh percetakan Gramedina memiliki ratarata 1900 gram dengan standar deviasi 100 gram. Dengan menggunakan teknik produksi baru, percetakan Gramedina mengklaim bahwa berat ensiklopedia dapat dikurangi. Untuk menguji klaim ini, diambil sampel sebanyak 50 buah ensiklopedia, dan diketahui bahwa rata-rata berat ensiklopedi adalah 1850 gram. Dapatkah klaim dari percetakan Gramedina dibenarkan pada tingkat signifikansi 1%?
Jawab : Dik :
n = 50 = 1850
α = 1% σ = 100
1. Ho : μ = 1900 (Berat ensiklopedia tidak dapat dikurangi menggunakan teknik produksi baru)
Ha : μ < 1900 (Berat ensiklopdia dapat dikurangi menggunakan teknik produksi baru) 2. 𝑍 =
𝑋̅−𝜇 𝑠 √𝑛
=
1850−1900 100/√50
= -3,535
3. = 2,33 4. Kriteria Uji : Uji 1 pihak kiri : Z < Ho ditolak Z ≥ Ho tidak dapat ditolak 5. Daerah penolakan Ho (
Daerah penerimaan Ho
-Zα
6. Ternyata -3,535 < 2,33 maka Ho ditolak Kesimpulan : Pada tingkat signifikansi 1%, percetakan Gramedina mengenai berat ensiklopedia dapat dikurangi dengan menggunakan teknik produksi baru adalah benar. Uji Hipotesis Proporsi Adalah pengujian hipotesis mengenai proporsi/perbandingan suatu populasi yang didasarkan atas informasi sampelnya. Langkah – langkah menguji proporsi populasi (𝝅): a. Rumuskan Hipotesis a.
𝐻0 : 𝜋 = 𝜋0
(uji 2 pihak)
𝐻𝐴 : 𝜋 b.
:
(uji 1 pihak kanan/ pengertian max) :
>
c.
: :
(uji 1 pihak kiri/ pengertian min) <
2) Perhitungan Z stat dan t stat (Z hitung atau t hitung) Perhitungan Z stat: bila populasinya terbatas (N dan n diketahui nilainya) dan , gunakan faktor koreksi
𝑥 𝑛
( )−𝜋
Z=
𝜋(1−𝜋) 𝑛
√
bila populasinya terbatas (N dan n diketahui nilainya) dan atau bila populasinya tidak terbatas (N tidak diketahui nilainya)
Ket : x/n = proporsi sampel π = proporsi populasi
Perhitungan t stat: bila populasinya terbatas (N dan n diketahui nilainya) dan , gunakan faktor koreksi
t=
𝑥 𝑛
( )−𝜋 𝜋(1−𝜋) 𝑛
√
bila populasinya terbatas (N dan n diketahui nilainya) dan atau bila populasinya tidak terbatas (N tidak diketahui nilainya) t=
𝑥 𝑛
( )−𝜋 𝜋(1−𝜋) 𝑛
; df : n – 1
√
3) Menentukan batas daerah penerimaan dan penolakan a. n > 30, tentukan nilai Z table 1−α 2
Z1/2α =
Ket : Z1/2α =
Zα = 0.5 − α Z table untuk uji 2 pihak
Zα = Z table untuk uji 1 pihak n≤ 30, tentukan nilai t table dengan derajat kebebasan (degree of freedom/df) t1/2α =
t table untuk uji 2 pihak
tα = t table untuk uji 1 pihak df = n -1 a. Gunakan tingkat signifikansi ( b. Gambarkan daerah penolakan dan penerimaan hipotesis nol berdasarkan langkah 1.
i. Uji 2 pihak
Daerah penolakan H (daerah kritis )
Daerah penolakan H (daerah kritis )
Daerah penerimaan H
-Z1/2α
?
Z1/2α
ii. Uji 1 pihak kanan
Daerah penolakan H (daerah kritis) Daerah penerimaan H
Zα
iii. Uji 1 pihak kiri
Daerah penolakan H (daerah kritis)
Daerah penerimaan H
-Zα
Keterangan : Daerah yang diasir adalah daerah penolakan Ho dan untuk n ≤30, Z diganti dengan t.
4. Menentukan kriteria penerimaan atau penolakan (1) Untuk uji 2 pihak : Z <- atau Z > 2
Jika ≤ Z ≤ 2
Ho ditolak
2
2
Ho tidak dapat
ditolak (2) Uji 1 pihak kanan : Z > , Ho ditolak Z ≤ , Hotidak dapat ditolak (3) Uji 1 pihak kiri :
Z < Ho ditolak Z ≥ Hotidak dapat ditolak
Nilai Z diganti dengan t jika n ≤ 30. 5. Bandingkan nilai Z atau t (yang diperoleh pada tahap 2) dengan Z atau t table serta simpulkan apakah Ho tidak dapat ditolak atau ditolak berdasarkan kriteria penerimaan/penolakan.
6. Membuat kesimpulan secara komprehensif/lengkap
Contoh Soal: Pelatih Timnas U-19 sangat yakin bahwa dengan adanya Tur Pertandingan di Timur Tengah maka performa pemainnya akan meningkat. Pada tahun 2014 dari 30 pemain yang mengikuti tur, sebanyak 26 pemain menunjukan peningkatan performa dan 4 pemain lainnya mengalami penurunan. Dari data tersebut ujilah pernyataan bahwa 90% lebih pemain mengalami peningkatan performa dengan taraf nyata 5%! α = 5%
Dik : x = 26
π = 90%
n = 30
Dit : Ujilah pernyataan tersebut
Jawab : : π ≥ 0.9
1.
: π < 0.9 2. t =
( 90% lebih pemain mengalami peningkatan performa )
( Tidak 90% lebih pemain mengalami peningkatan performa ) 𝑥 𝑛
( )−𝜋 𝜋(1−𝜋) √ 𝑛
=
(26/30)−0,90 0.90 𝑋 0,10 30
√
t = - 0,6086 3. tα
df : n – 1 = 29
Lihat table t; maka tα = 1,6991
α= 0,05 4. Kriteria uji :
Uji 1 pihak kiri : t < tα ,
ditolak
t
Daerah Penolakan Ho
tα ,
tidak dapat ditolak
Daerah penerimaan Ho
-tα
5. Ternyata : - 0,6086> -1,6691; maka t >tα ,
tidak dapat ditolak
Kesimpulan : Dengan tingkat signifikansi 5%, maka pernyataan bahwa bahwa 90% lebih pemain mengalami peningkatan performa adalah benar.
SOAL UJI HIPOTESIS RATA-RATA DAN PROPORSI 1. Produsen dari suatu obat yang dipatenkan mengklaim bahwa obat tersebut 80% efektif mengobati alergi dalam periode waktu 9 jam. Dari sampel yang terdiri dari 200 orang yang memiliki alergi, obat tersebut menyembuhkan 170 orang. Tentukan apakah klaim dari perusahaan tersebut dapat dibenarkan dengan menggunakan tingkat signifikasi 0,01. Jawaban: Dik : n = 200; α = 1%; X = 170 Dit : Ujilah pertanyaan tersebut. Jawab: Ho : π ≥ 80% Ha : π< 80% (uji pihak kiri) 1. Z =
𝑥 𝑛
( )−𝜋 𝜋(1−𝜋) 𝑛
√
Z=
(
170 )−0.8 200 0.8(1−0.8) 200
√
Z = 1,77 2. Kriteria uji : uji 1 pihak kiri : Z < Zα, Ho ditolak Z ≥ Zα Ho tidak dapat ditolak 3. T e r n y a t a
Daerah penerimaan Ho -Zα = -2,33
1
1,77 > -2,33; Z > Zα Ho tidak dapat ditolak 4. Kesimpulan : pada tingkat signifikasi 1% pernyataan perusahaan obat tersebut bahwa obat tersebut 80% efektif mongobati alergi dalam periode waktu 9 jam adalah benar karena perbendaannya tidak terlalu signifikan. 2. Rata-rata daya tahan dari suatu sampel yang terdiri dari 100 bola lampu yang dihasilkan oleh suatu perusahaan diperkirakan 1670 jam dan standar deviasinya 120 jam. Jika rata-rata dari semua bola lampu yang dihasilkan oleh perusahaan tersebut adalah 1700 jam. Ujilah pernyataan perusahaan tersebut dengan tingkat signifikasi 5%. Jawaban: α = 5%
Dik : n = 100
𝑋̅ = 1670
s = 120
Dit : Ujilah pernyataan tersebut. Jawaban : 1.
Ho : 𝜇 = 1700 jam Ha : 𝜇≠ 1700 jam
2.
𝑍=
𝑋̅−𝜇 𝑠/√𝑛
𝑍=
1670−1700 120/√100
Z = -2,50 3.
Kriteria uji : uji dua pihak : Z <- atau Z > 2
-Z1/2α
= -1,96
2
Z1/2α = 1,96
Ho ditolak
Jika ≤ Z ≤ 2
2
Ho tidak dapat ditolak
4.
Ternyata -2,50 < -1,96, Z <- Ho ditolak
5.
Kesimpulan : pada tingkat signifikasi 5% pernyataan perusahaan
2
tersebut bahwa rata-rata daya tahan lampu adalah 1700 jam adalah salah karena terdapat perbedaan yang signifikan. 3. A car showroom wanted to know wheather the customers who bought cars on credit to pay the credits on the date specified. According to the showroom, customers who pay on time was 50%. To prove an opinion, the showroom has entered into a randomized study of 100 customers who bought cars on credit. a. In this case, what is the null hypothesis and alternative hypothesis? b. Is the alternative hypothesis one-sided or two-sided c. Suppose that this car showroom finds that 43% of the customers in its sample remembered the ad. If alpha is set equal to 5%, should the car showroom conclude that the proportion is less than 0,5? State the decicision rule! Give the formula for the test statistics! Jawaban : α = 5%
Dik : n = 100
Dit : a. Tentukan Ho dan Ha b. Ha uji satu sisi atau dua sisi c. Jika showroom mobil itu menemukan bahwa 43% dari langganan salam sample mengingat pembayaran kredit tersebut. Jika tingkat signifikasi 5%, haruskah showroom mobil menyimpulkan bahwa proporsi populasi kurang
dari
0,5?
perhitungannya! Jawab : a. Ho : 𝜇 = 50% Ha : 𝜇 ≠ 50%
Tentukan
kriteria
ujinya!
Berikan
rumus
b. Uji satu pihak, kareana ingin mengetahui apakah kurang dari 0,5 atau tidak Z < Ho ditolak
c. Kriteria uji:
Daerah penerimaan Ho -Zα = -1,645
Z ≥ Hotidakdapatditolak
d. Ternyata -1,4 > -1,645 Ho tidak dapat ditolak e. Kesimpulan : pada tingkat signifdikasi 5%, jika ditemukan bahwa 43% pelanggan pada sampel mengingat pembayaran kredit tersebut maka showroom mobil tidak dapat menyimpulkan bahwa proporsi populasi kurang dari 0,5. 4. PT. Otomotif Indonesia Jaya melakukan suatu sistem produksi baru dengan tujuan
untuk
mengurangi
masalah
produk
yang
rusak.
Perusahaan
menginginkan bahwa tidak boleh ada lebih dari 10 unit yang rusak dalam sehari. Selama pengamatan 32 hari ternyata rata-rata jumlah produk yang rusak adalah 9 unit, dengan standar deviasi sebesar 2 unit. Dengan menggunakan taraf nyata 1%, apakah target PT. Otomotif Indonesia Jaya tercapai? Dik : n = 32 =9
= 1%
s=2
μ = 10
Dit : Apakah target perusahaan tersebut tercapai? Jawab : : μ ≤ 10
: μ > 10 𝑋̅−𝜇 √𝑛
𝑍 = 𝑠/ 9−10 √32
𝑍 = 2/
Z = -2,828 Zα = 2.33 Kriteria : Z > ,
,
ditolak
tidak dapat ditolak
2.33 Ternyata : -2,828< 2.33, maka Z <
,
tidak dapat ditolak
Kesimpulan : Dengan tingkat signifikansi 1%, maka PT Otomotif Indonesia Jaya dapat menurunkan tingkat produknya yang rusak dengan menggunakan sistem produksi baru.
5. Suatu perusahaan mengklaim bahwa paling sedikit 95% dari peralatan yang dipasok ke suatu pabrik adalah sesuai dengan spesifikasi. Suatu pengujian dari sampel yang terdiri dari 200 buah peralatan menperlihatkan bahwa 22 diantaranya rusak. Ujilah klaim mereka pada tingkat resiko 5%. Dik : n = 200
α = 5%
Dit : ujilah pernyataan tersebut Jawaban :
rusak = 22 buah
x = 178
Ho : π≥ 95% Ha : π< 94% Z=
𝑥 𝑛
( )−𝜋 𝜋(1−𝜋) 𝑛
=
(
√
178 )−0.95 200𝑛 0.95(0.05) 200
= -3,90
√
Uji 1 pihakkiri : Z < Ho ditolak Z ≥ Hotidakdapatditolak Ternyata -3,90 < - 1,645 Ho ditolak.
6. Sebuah Perusahaan yang bergerak dalam bidang pernjualan deterjen ingin menguji kebenaran pendapat mereka bahwa kotak deterjen mereka dijual lebih dari 500 gram deterjen. Berdasarkan pengalaman yang telah lalu, jumlah deterjen dalam kotak berdistribusi normal. Untuk menguji pernyataan tersebut, perusahaan mengambil sampel secara acak sebanyak 25 kotak dan menemukan bahwa rata-ratanya adalah 525 gram dan simpangan bakunya 75 gram dengan tingkat signifdikasi 5%. Ujilah apakah pernyatann perusahaan deterjen tersebut adalah benar. Dik : n = 25
α = 0,05
𝑋 = 525 g
Dit : uji pernyataan tersebut Jawaban : Ho : µ≤ 500 Ha : µ> 500 t=
𝑋̅−𝜇 𝜎 √𝑛
t==
̅̅̅̅̅ 525−500 75/√25
= 1,67
Uji 1 pihakkanan :t>tα, Ho ditolak t ≤ tα, Hotidakdapatditolak
s = 75 g
df = n -1 = 25 -1 = 24; α = 5%
tα = 1,711 Ternyata 1,67 < 1,711 Ho tidak dapat ditolak Kesimpulan : dengan tingkat signifikasi 5% perusahaan deterjen tersebut bahwa kotak deterjen yang diproduksi berisi lebih dari 500g deterjen adalah salah. Kotak yang berisi 500 g deterjen karena perbedaanya tidak signifikan.
7. An inventor has developed a system that allows visitors to museum,
zoos, and other attractions to get information by keying in a digital code on a rented device. For example, zoo patrons can listen to an annoouncement (recorded on a microchip) about each animal they see. It is anticipated that the device would rent for 3 dollar each. The installations cost for the complete system is expected to be about 4 hundred thousand dollar. The Milwauke Zoo is interested in having the system installed, but management is uncertain as to whether to take the risk. A financial analysis of the problem indicates that if more than 10% of the zoo visitors rent the system the zoo will make a profit. To help management make a decision, a random sample of 400 zoo visitors are given details about the system’s capabilities ad the rental charge. If 52 people say that they would rent the device, can the zoo management conclude at the 5% significance level that the investment would result in a profit? Dik : n = 400
α = 5%
X = 52
Dit : Ujilah pernyataan tersebut Jawab : Ho : π≤ 10% Ha : π> 10% Z=
𝑥 𝑛
( )−𝜋 𝜋(1−𝜋) 𝑛
√
=
(
52 )−0,1 400 0,1(0,9) 400
=2
√
Uji 1 pihakkiri : Z < Ho ditolaK Z ≥ Hotidakdapatditolak
Daerah penolakan Ho Daerah penerimaan Ho
zα = 1,645 Ternyata 2 > 1,645 Ho ditolak. Kesimpulan : pada tingkat signifikasi 5% pernyataan bahwa dengan sistem baru tersebut dapat meningkatkan profit lebih dari 10% adalah benar karena perbedaannya signifikan.
UJI HIPOTESIS SELISIH RATA-RATA DAN PROPORSI
A. UJI HIPOTESIS SELISIH RATA-RATA Ketika terdapat dua buah rata-rata hitung pergunakan pengujian hipotesis selisih rata-rata. Pengujian ini dimaksudkan untuk mengetahui: 1. Beberapa populasi mempunyai rata-rata yang sama ataukah berbeda? 2. Beberapa buah sampel berasal dari sebuah populasi yang sama ataukah berlainan? (Prof. Dr. Sudjana, M.A., M.Sc - Statistika Untuk Ekonomi dan Niaga Jilid II) Perumusan Hipotesis:
Uji 2 Pihak 𝐻0 : µ1 = µ2 𝐻𝑎 : µ1 ≠ µ2 Kurva :
−𝑍𝛼/2
𝑍𝛼/2
Kriteria : −𝑍𝛼/2 ≤ Z ≤ 𝑍𝛼/2
𝐻0 tidak dapat ditolak
Z < −𝑍𝛼/2 atau Z > 𝑍𝛼/2
𝐻0 ditolak
n > 30 dimana 𝑍𝛼/2 =
1−𝛼 2
n ≤30 dimana Dimana 𝑡𝛼/2 =
Uji Pihak Kanan 𝐻0 : µ1 ≤ µ2 𝐻𝐴 : µ1 > µ2 Kurva :
𝛼 2
dengan df = n1 + n2 – 2
𝑍𝛼 Kriteria : Z ≤ 𝑍𝛼 𝐻0 tidak dapat ditolak Z > 𝑍𝛼 𝐻0 ditolak n > 30 dimana 𝑍𝛼 = 0.5 − 𝛼 n ≤ 30 dimana Dimana 𝑡𝛼 = 𝛼 dengan df = n1 + n2 – 2
Uji Pihak Kiri 𝐻0 : µ1 ≥ µ2 𝐻𝐴 : µ1 < µ2 Kurva :
−𝑍𝛼 Kriteria : Z ≥ −𝑍𝛼 𝐻0 tidak dapat ditolak Z < −𝑍𝛼 𝐻0 ditolak n > 30 dimana 𝑍𝛼 = 0.5 − 𝛼 dengan df = n1 + n2 – 2 n ≤ 30 dimana Dimana 𝑡𝛼 = 𝛼 dengan df = n1 + n2 – 2 Keterangan: -
Untuk sampel kecil ubah Z menjadi t
-
Untuk proporsi ubah µ menjadi 𝜋
Rumus Z hitung dan t hitung : n>30 (sampel besar) (
Z=
1−
2 )−(μ1 −μ2 )
𝜎 2 𝜎 2 √ 1 + 2 𝑛1 𝑛2
Jika 𝜎1 2 dan 𝜎2 2 tidak diketahui nilainya, maka: (
Z=
1−
2 )−(µ1 −µ2 )
𝑠 2 𝑠 2 √1 + 2 𝑛1 𝑛2
n≤30 (sampel kecil) (
t=
1−
2 )−(μ1 −μ2 )
𝜎 2 𝜎 2 √ 1 + 2 𝑛1 𝑛2
Jika 𝜎1 2 dan 𝜎2 2 tidak diketahui nilainya, tetapi diketahui bahwa 𝜎1 2 ≠ 𝜎2 2 maka : (
t=
y
1−
2 )−(µ1 −µ2 )
𝑠 2 𝑠 2 √1 + 2
2
𝑛1
𝑛2
Jika 𝜎1 dan 𝜎2 2 tidak diketahui nilainya, tetapi diketahui bahwa 𝜎1 2 = 𝜎2 2 maka : (
t=
1−
2 )−(µ1 −µ2 )
(𝑛 −1)𝑠1 2 + (𝑛2 −1)𝑠2 2 1 1 √ 1 ( + ) 𝑛1 +𝑛2 − 2 𝑛1 𝑛2
Contoh soal: Manajer suatu klub sepak bola eropa berpendapat bahwa indikator performa pemain akademi klub yang mendapatkan summer camp training ternyata lebih bagus daripada pemain yang tidak mendapatkannya. Maka dari itu, diambil sampel dari pemain masing-masing 40 dan 30 orang dengan ratarata dan simpangan baku 302 dan 4 untuk pemain yang mendapatkan training serta 300 dan 4.5 untuk pemain yang tidak mendapatkan training. Ujilah pendapat dari Manajer sepak bola tersebut dengan tingkat signifikansi 5%! Dik:
𝑛1 = 40 𝑛2 = 30
Dit:
1=
302
2=
𝑠1 = 4
300 𝑠2 = 4.5
Ujilah pernyataan bahwa bahwa indikator performa para pemain akademi yang mendapatkan summer camp training ternyata lebih bagus daripada pemain yang tidak mendapatkan training tersebut (µ1 > µ2 )!
Jawab:
𝐻0 : µ1 ≤ µ2 (performa para pemain akademi yang mendapatkan summer camp training ternyata tidak lebih bagus daripada pemain yang tidak mendapatkan training tersebut) 𝐻𝐴 : µ1 > µ2 (performa para pemain akademi yang mendapatkan summer camp training ternyata lebih bagus daripada pemain yang tidak mendapatkan training tersebut) (
1−
Z=
2 )−(µ1 −µ2 )
𝑠 2 𝑠 2 √1 + 2 𝑛1
Z=
𝑛2
(302−300)−0 2
2
√4 + 4.5 40
= 1.92897128869 ≈ 1.9289
30
α = 0.05 𝑍𝛼 = 0.5 – 0.05 = 0.45
𝑍𝛼 = 1.645
𝑍𝛼 Kriteria : Z ≤ 𝑍𝛼 𝐻0 tidak dapat ditolak Z > 𝑍𝛼 𝐻0 ditolak Ternyata: 2.4414 > 1.645 Z > 𝑍𝛼 𝐻0 ditolak Kesimpulan: Dengan tingkat signifikansi 5%, pernyataan tersebut benar yaitu performa para pemain akademi yang mendapatkan summer camp training ternyata lebih bagus daripada pemain yang tidak mendapatkan training tersebut.
B. UJI HIPOTESIS SELISIH PROPORSI Pengujian hipotesis selisih proporsi digunakan ketika terdapat dua buah perbandingan. Pengujian ini dimaksudkan untuk mengetahui apakah ada perbedaan presentase yang menyolok ataukah tidak antara dua kelompok yang sedang dipelajari. Di dalam buku-buku statistika seperti : Lind, Teknik-teknik Statistik dalam Ekonomi dan Bisnis Ed. 15, Suharyadi & Purwanto, Statistika, Untuk Ekonomi dan Keuangan Modern, Edisi 2 dan Prof. Dr. Sudjana, M.A., M.Sc - Statistika Untuk Ekonomi dan Niaga Jilid II tidak ditemukannya uji t di uji hipotesis selisih proporsi. Perumusan hipotesis selisih proporsi hampir sama dengan perumusan selisih rata-rata.
Rumus mencari Z hitung: 𝑥 𝑥 ( 1 − 2 )−(π1 −π2 )
𝑛1 𝑛2 π1 (1−π1 ) π2 (1−π2 ) + √ 𝑛 𝑛2 1
Z=
Jika π1 dan π2 tidak diketahui, maka: 𝑍=
𝑥 𝑥 ( 1− 2)
𝑛1 𝑛2 1 1 √𝜋(1−𝜋)(𝑛 +𝑛 ) 1 2
𝑥 +𝑥
dimana, 𝜋 = 𝑛1 +𝑛2 1
2
atau dapat juga digunakan rumus: Z=
𝑥 𝑥 ( 1 − 2 )−(π1 −π2 )
𝑛1 𝑛2 𝑥2 𝑥 x1 x (1− 1 ) (1− 2 ) √n1 n1 + 𝑛2 𝑛2 𝑛1 𝑛2
Contoh Soal : Seorang ahli botani mengadakan percobaan pada dua macam pupuk buatan dan menyatakan bahwa perubahan akibat pupuk buatan pertama dan kedua pada suatu padi adalah sama. Pupuk buatan pertama diberikan pada 100 padi dan ternyata 60 padi menunjukkan perubahan. Pupul buatan kedua diberikan pada 150 padi yang lain dan ternyata 85 padi berubah. Ujilah dengan taraf nyata 5%!
𝑥1 = 60
Dik:
𝑥2 = 85
𝑛1 = 100
𝑛2 = 150
Dit: π1 = π2 Jawab: 𝐻0 : π1 = π2 (perubahan akibat pupuk buatan pertama dan kedua pada suatu padi adalah sama) 𝐻𝐴 : π1 ≠ 𝜋2 (perubahan akibat pupuk buatan pertama dan kedua pada suatu padi adalah tidak sama) 𝜋=
𝑥1 + 𝑥2 𝑛1 +𝑛2
60+ 85
𝜋 = 100+150 = 0.58 𝑍=
𝑍=
𝑥 𝑥 ( 1− 2)
𝑛1 𝑛2 1 1 √𝜋(1−𝜋)(𝑛 +𝑛 ) 1 2
(
60 85 − ) 100 150
√0.58(1−0.58)(
1 1 + ) 100 15𝑍𝑍0
= 0.52419410927 ≈ 0.5241
α = 0.05 𝑍𝛼/2 =
-𝑍𝛼⁄
2
1−𝛼 2
=
1−0.05 2
𝑍𝛼 = 1.96
𝑍𝛼⁄
2
Kriteria : −𝑍𝛼/2 ≤ Z ≤ 𝑍𝛼/2 𝐻0 tidak dapat ditolak Z < −𝑍𝛼/2 atau Z > 𝑍𝛼/2 𝐻0 ditolak Ternyata: -1.96 ≤ 0.5241 ≤ 1.96 𝐻0 tidak dapat ditolak
Kesimpulan: Jadi, dengan taraf nyata 5% dapat disimpulkan bahwa pernyataan perubahan akibat pupuk buatan pertama dan kedua pada suatu padi adalah sama dapat diterima, karena tidak terdapat perbedaan yang signifikan.
SOAL UJI HIPOTESIS SELISIH RATA-RATA DAN PROPORSI
1. Sebuah perusahaan mengadakan pelatihan teknik pemasaran. Sampel 12 orang dengan metode biasa dan 10 orang dengan metode terprogram. Pada akhir pelatihan diberikan evaluasi dengan materi yang sama. Kelas pertama mencapai nilai rata-rata 80 dengan simpangan baku 4 dan kelas kedua nilai rata-rata 75 dengan simpangan baku 4,5. Ujilah hipotesis kedua metode pelatihan, dengan alternatif keduanya tidak sama! Gunakan taraf nyata 10%! Asumsikan kedua populasi menghampiri distribusi normal dengan varians yang sama! Dik : n1 = 12
x1 = 80 s1 = 4
n2 = 10
x2 = 75 s2 = 4,5
Dit : Apakah hasil dari kedua metode palatihan sama atau tidak dengan α = 10% Jawab : Ho : µ1 = µ2 Ha : µ1 ≠ µ2 (
t=
1−
2 )−(µ1 −µ2 )
(𝑛 −1)𝑠1 2 + (𝑛2 −1)𝑠2 2 1 1 √ 1 ( + ) 𝑛1 +𝑛2 − 2 𝑛1 𝑛2
=
(80−75)−(0) (12−1)42 + (10−1)4,52 1 1 ( + ) 12+10− 2 12 10
√
df = n1 + n2 -2 = 20 ; α = 0,1 tα = 1,7247
− 1,72471,7247 Kriteria :
= 2,759123786 ~ 2,76
−𝑍𝛼/2 ≤ Z ≤ 𝑍𝛼/2
𝐻0 tidak dapat ditolak
Z <−𝑍𝛼/2 atau Z >𝑍𝛼/2
𝐻0 ditolak
Ternyata 2,76 > 1,7247 Ho ditolak Kesimpulan : Pada tingkat signfukasi 10%, dapat kita simpulkan bahwa hasil dari kedua metode pelatihan tidak sama.
2. Pejabat BKKBN melakukan suatu penelitian terhadap ibu rumah yangga yang setuju KB di daera pertanian A dan B. Dari penelitian diperoleh data bahwa dari 500 ibu rumah tangga di daerah A, ada 300 orang yang setuju dengan KB, sedangkan dari 500 ibu rumah tangga di daerah B, ada 250 orang yang sutju KB. Dengan menggunakan tingkat signifikasi 5%, dapatkah kita menyatakan bahwa terdapat perbedaan proporsi terhadap ibu rumah tangga yang setuju KB di daerah pertanian A dan B? Dik : n1 = 500 n2 = 500
x1 = 300 x2 = 250
Dit : Apakah terdapat perbedaan proporsi terhadap ibu rumah tangga yang setuju pertanian A dan B dengan α = 5% Ho : π1 = π2 Ha : π1 ≠ π2 Z=
𝑥 𝑥 ( 1 − 2 )−(π1 −π2 )
𝑛1 𝑛2 𝑥2 𝑥 x1 x (1− 1 ) (1− 2 ) √n1 n1 + 𝑛2 𝑛2 𝑛1 𝑛2
=
(
300 250 − )−(0) 500 500
300 300 250 250 √500(1−500)+ 500(1−500) 500 500
= 3,194382825 ~3,19
Ztabel -1,96 dan 1,96 Kriteria : −𝑍𝛼/2 ≤ Z ≤ 𝑍𝛼/2
𝐻0 tidak dapat ditolak
Z <−𝑍𝛼/2 atau Z >𝑍𝛼/2
𝐻0 ditolak
Ternyata 3,19 > 1,96 Ho ditolak Kesimpulan : Pada tingkat signifikasi 5% dapat disimpulkan bahwa terdapat perbedaan proporsi terhadap ibu rumah tangga yang setuju KB di daerah pertanian A dan B, 3. The manager of a package courier service belive that packages shipped at the end of the month ater heavier than those shipped early in the month. As an experiment, he weighted a random sample of 20 packages at begining of the month. He found that the mean weight was 20,25 pounds and the standar deviation was 5,48 pounds. Ten packages randomly selected at the end of the month had a mean weight of 24,80 pounds and the standar deviation of 5,67 pounds. At the 0,05 significance level, can we conclude that the packages shipped at the eng of the mont wieghed more? Dik : n1 = 20 n2 = 10
1 = 20,5 2 = 24,80
s1 = 5,48
s2 = 5,67
Dit: Apakah dapat kita simpulkan bahwa paket dikirimkan pada akhir bulan lebih berat dengan α = 0,05 ?
Jawab : Ho : µ1 ≥ µ2 Ha : µ1 <µ2 (
1−
T hitung =
2 )−(µ1 −µ2 )
𝑠 2 𝑠 2 √1 + 2 𝑛1 𝑛2
=
(20,25−24,8)−0 2
2
√5,48 + 5,67 20
= -2,0951
10
Df = n1 + n2 -2 = 20 + 10 - 2 = 28; α = 0,05 tα = 1,7011
−1,7011 Kriteria: t ≥ −𝑡𝛼 𝐻0 tidak dapat ditolak t<−𝑡𝛼 𝐻0 ditolak Ternyata -2,0951 < -1,7011 Ho ditolak Kesimpulan : Pada tingkat signifikasi 5% dapat kita simpulkan bahwa paket dikirim pada akhir bulan lebih berat. 4. Data di bawah ini menyajikan pertambahan berat dalam dua tahun 20 ekor kucing (dalam gram) dengan rincian bahwa 10 ekor kucing diberi makanan khusus kucing impor dan 10 ekor lainnya diberi makanan kucing lokal. Impor
91
90
86
93
86
93
89
86
74
91
Lokal
85
84
77
89
81
91
87
84
92
88
Apakah makanan kucing impor memiliki efek lebih baik terhadap pertambahan berat badan kucing tersebut. Gunakan tingkat signifikasi level 0,05. Berilah evaluasi! Dik : n1 = 10 n2 = 10
1 = 8,4 2 = 8,1
s1 = 0,6992058988
s2 = 0,5676462122
Dit : Apakah makanan kucing impor memiliki efek terhadap pertambahan berat badan kucing tersebut dengan α = 0,05 ? Jawab : Ho: µ1 ≤ µ2 Ha: µ1 >µ2 (
t hitung =
1−
2 )−(µ1 −µ2 )
𝑠 2 𝑠 2 √1 + 2 𝑛1 𝑛2
=
(8,4−8,1)−0 2 2 √0,6992058988 + 0,5676462122 10 10
= 1,0534 df = n1 + n2 -2 = 10 + 10 – 2 = 18 α = 0,05 t α = 1,7341 Kriteria : t ≤ 𝑡𝛼 𝐻0 tidak dapat ditolak t>𝑡𝛼 𝐻0 ditolak Ternyata 1,0534 < 1,7341 atau Ho tidak dapat ditolak Kesimpulan : Pada tingkat signifikan 5%, dapat kita simpulkan bahwa makanan kucing impor tidak berefek terhadap pertambahan berat badan kucing tersebut.
5. Suatu riset penelitian pemasaran dilakukan di Jakarta dan Surabaya terhadap ibu-ibu rumah tangga yang senang Rinso dibandingkan dengan Daia. Di Jakarta, dari 100 orang ibu rumah tangga yang ditanya, ternyata ada 68 orang yang mengatakan lebih senang Rinso dari pada Daia, sedangkan di Surabaya diantara 300 iorang yang ditanya, ada 213 yang lebih senang Rinso dari pada Daia. Dengan menggunakan tingkat signifikansi 10%, ujilah pendapat bahwa proporsi ibu rumah tangga yang lebih senang Rinso dari pada Daia di Surabaya dan di Jakarta berbeda secara nyata atau tidak? Dik : n1 = 100 n2 = 300
x1 = 68 x2 = 213
Dit : Apakah pendapat bahwa proporsi ibu rumah tangga yang lebih senang Rinso dari pada Daia di Surabaya dan di Jakarta berbeda secara nyata atau tidak dengan α = 1%? Jawab : Ho : π1 = π2 Ha : π1 ≠ π2 Z hitung =
𝑥 𝑥 ( 1 − 2 )−(π1 −π2 ) 𝑛1 𝑛2
𝑥 𝑥 x1 x (1− 1 ) 𝑛2 (1−𝑛2 ) n1 2 + 2 𝑛1 𝑛2
√n1
=
(
68 213 − )−(0) 100 300
68
68
213
213
√100(1−100)+ 300(1−300) 100
300
= - 0,5607395 ~ - 0,56 Z tabel = ± 1,645
−1,6451,645
Kriteria : −𝑍𝛼/2 ≤ Z ≤ 𝑍𝛼/2
𝐻0 tidak dapat ditolak
Z <−𝑍𝛼/2 atau Z >𝑍𝛼/2
𝐻0 ditolak
Ternyata -1,645 < -0,56 < 1,645 Ho tidak dapat ditolak Kesimpulan : Pada tingkat signifikasi 10%, dapat disimpulkan bahwa pendapat bahaw proporsi ibu rumah tangga yang lebih senang rinso dari pada Daia di Surabaya dan di Jakarta tidak berbeda secara signifikan / nyata.
6. Menurut
hasil
penelitian
sebelumnya
terhadap
1580
konsumen,
diperkirakan sekitar 75% dari konsumen tersebut lebih memilih air mineral kemasan merek “Alami”.Pengusaha air mineral tersebut mengadakan promosi besar-besaran melalui iklan dan rekl;ame untuk menarik konsumen lebih banyak lagi. Hasilnya ternyata dari 2350 konsumen, 1833 senang dan berlangganan air mineral tersebut dari pada produk air mineral lain. Pada tingkat signifikansi 5%, dapatkah kita simpulkan bahwa promosi dan reklame yang telah dilakukan sangat berpengaruh? Dik : n1 = 1580
x1 = 1185
n1 = 2350
x2 = 1833
Dit : Dapatkah kita simpulkan bahwa promosi yang telah dilakukan sangat berpengaruh dengan tingkat signifikan 5%? Jawaban : 𝐻0 : µ1 ≥ µ2 𝐻𝐴 : µ1 < µ2 Z hitung =
𝑥 𝑥 ( 1 − 2 )−(π1 −π2 ) 𝑛1 𝑛2
𝑥 𝑥 x1 x (1− 1 ) 𝑛2 (1−𝑛2 ) n1 2 + 2 𝑛1 𝑛2
√n1
=
( 1185
1185 1833 − )−(0) 1580 2350 1185
1833
1833
√1580(1−1580)+ 2350(1−2350) 1580
2350
= -2,1668 ~ -2,17 Z tabel = 1,645 Kurva :
−1,645 Kriteria : Z ≥ −𝑍𝛼 𝐻0 tidak dapat ditolak Z <−𝑍𝛼 𝐻0 ditolak Ternyata -2,17 < -1,645 Ho ditolak Kesimpulan : Pada tingkat signifikasi 5%, dapat disimpulkan bahwa promosi yang berupa iklan dan reklame yang telah dikalkukan lebih berpengaruh karena perbedaanya sangat dignifikan / sangat nyata / sangat berarti. 7. The Roper organization conducted identical surveys in 1975and 1995. One question asked of women was, “are most men basically kind, gentle, and thoughtful?” The 1975 survey revealed that out of the 3000 women surveyed, 2010 said they were. In 1995 1530 out of 3000 women surveyed thought that men were kind, gentle, and thoughtful. At the 0.05 significance level, can we conclude that fewer women thiunk men are kind, gentle and thoughtful in 1995 compared with 1975? 𝐻0 : µ1 ≤ µ2 𝐻𝐴 : µ1 > µ2 Z hitung =
𝑥 𝑥 ( 1 − 2 )−(π1 −π2 )
𝑛1 𝑛2 𝑥2 𝑥 x1 x (1− 1 ) (1− 2 ) √n1 n1 + 𝑛2 𝑛2 𝑛1 𝑛2
=
( 2010
2010 1530 − )−(0) 3000 3000 2010
1530
1530
√3000(1−3000)+ 3000(1−3000) 3000
3000
= 12,76939015 ~ 12,77 Z tabel = 1, 645
1,645 Kriteria : Z ≤ 𝑍𝛼 𝐻0 tidak dapat ditolak Z >𝑍𝛼 𝐻0 ditolak Ternyata 12,77 > 1,645 Ho ditolak Kersimpulan : Pada tingkat signifikansi 5%, dapat disimpulkan bahwa perempuan lebih sedikit berpikir bahwa pria baik hati, lembut, dan bijaksana pada tahun 1995 dibandingkan dengan 1975. .
REGRESI DAN KORELASI SEDERHANA
Analisis regresi digunakan untuk mengetahui besarnya pengaruh satu variabel bebas atau lebih terhadap satu variabel tidak bebas. Data yang dianalisis dengan regresi merupakan data kuantitatif yang memiliki skala pengukuran minimal interval. Analisa korelasi digunakan untuk mengetahui keeratan hubungan dua variabel acak yang memiliki skala pengukuran minimal interval dan berdistribusi normal bivariat. Dalam terminologi regresi, variabel bebas (independent variable) disimbolkan dengan X dan variabel tidak bebas (dependent variable) disimbolkan Y. REGRESI SEDERHANA 1. Pengertian Regresi Persamaan Regresi adalah sebuah persamaan yang menunjukan hubungan linear antara dua variabel. (Lind, Teknik-teknik Statistik dalam Ekonomi dan Bisnis :74) 𝑌̂ = 𝑎 + 𝑏𝑋 Keterangan : 𝑌̂
= Varaibel terikat (variabel yang diprediksi)
X
= Variabel bebas (variabel yang mempengaruhi variabel terikat)
a
= konstanta, secara grafik menunjukan intercept
b
= koefisien regresi yang menunjukkan besarnya pengaruh X terhadap Y, secara grafik menunjukkan slope (kemiringan garis regresi)
2. Metode Pengukuran Regresi Sederhana a. Least Square Method Persamaan Normal :
𝑌̂ = 𝑎 + 𝑏𝑋
Rumus : Σ𝑋𝑌 = 𝑎Σ𝑋 + 𝑏Σ𝑋 2
Σ𝑌 = 𝑎𝑛 + 𝑏Σ𝑋
atau 2
a=
(Σ𝑋 )(ΣY) − (ΣX)(ΣXY) 𝑛Σ𝑋 2 − (Σ𝑋)2
𝑏=
n(ΣXY) − (ΣX)(ΣY) 𝑛Σ𝑋 2 − (Σ𝑋)2
b. Product Moment Method Persamaan Normal : 𝑌̂ = 𝑎 + 𝑏𝑋
Rumus : Σxy = bΣX + bΣX 2
Σxy = ΣXY −
Σ𝑋Σ𝑌 𝑛
atau
Σ𝑥 2 = Σ𝑋 2 −
𝑎=
(Σ𝑋)2 𝑛
b=
Σxy Σx 2
Σ𝑦 2 = Σ𝑌 2 −
(Σ𝑌)2 𝑛
Σ𝑌 Σ𝑋 −𝑏 𝑛 𝑛
KORELASI Analisis korelasi adalah sekumpulan teknik untuk mengukur hubungan antar dua variabel. (Lind, Teknik-teknik Statistika dalam Bisnis dan Ekonomi: 61) 1. Koefisien Korelasi (r) Koefisien korelasi menunjukan kekuatan hubungan antara dua himpunan variabel. Diberi tanda r, dan nilai r dapat berkisar dari -1 sampai +1. Tanda negatif berarti varibel berkorelasi negatif, tanda positif berarti variabel
berkorelasi positif, serta apabila tidak terdapat hubungan sama sekali antar variabel maka r bernilai 0. Kekuatan dari koefisien korelasi menurut Lind: 0 - 0.2
= sangat lemah
0.21 – 0.4 = lemah 0.41 – 0.6 = cukup 0.61 – 0.8 = kuat 0.81 - 1 = sangat kuat Rumus : Pearson : 𝑟=
𝑛Σ𝑋𝑌 − Σ𝑋Σ𝑌 √(𝑛Σ𝑋 2 − (ΣX)2 )(𝑛Σ𝑌 2 − (ΣY)2 )
Product Moment : 𝑟=
Σ𝑥𝑦 √(Σ𝑥 2 − Σ𝑦 2 )
2. Koefisien Determinasi ( r2 ) Koefisien determinasi menunjukkan kemampuan variabel X yang merupakan variabel bebas, menerangkan atau menjelaskan variabel Y yang merupakan variabel terikat. Semakin besar nilai koefisien determinasi, semakin baik kemampuan variabel X menerangkan atau menjelaskan variabel Y. (Suharyadi, 2004 : 217) Rumus :
𝑟 2 × 100%
Koefisien non determinasi adalah perbandingan total variasi terikat Y yang dapat dijelaskan oleh variabel diluar model. Rumus : 1 − 𝑟2
3. Kesalahan Standar Estimasi (Standard Error of Estimate) Adalah suatu ukuran yang menunjukan seberapa tepat prediksi untuk Y berdasarkan X atau sebaliknya, seberapa tidak akuratnya estimasi tersebut. Rumus : Least Square Method
Product Moment Method
Σ𝑌 2 − 𝑎Σ𝑌 − 𝑏Σ𝑋𝑌 𝑆𝑌𝑋 = √ 𝑛−𝑘−1
Σ𝑦 2 − 𝑏Σ𝑥𝑦 𝑆𝑌𝑋 = √ 𝑛−𝑘−1
Keterangan : n = banyaknya pasangan variabel independen x dan variabel dependen y k = banyaknya macam variabel independen x 4. Penaksiran tentang interval α dan interval β Menaksir interval α
Menaksir interval β
(n > 30)
(n > 30)
a – Z1/2α.Sa < konstanta α < a + Z1/2α.Sa
b – Z1/2α.Sb < konstanta β < b + Z1/2α.Sb
(n ≤ 30)
(n ≤ 30)
a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
b – t1/2α.Sb < konstanta β < b + t1/2α.Sb
𝛴𝑋²
Sa = SYX . √𝑛𝛴𝑥²
1
Sb = SYX . √𝛴𝑥²
5. Pengujian tentang Koefisien Regresi Menguji α -
Tentukan Ho dan Ha Ho : Konstanta α = 0 (tidak berpengaruh signifikan) Ha
-
Menguji β
: Konstanta α ≠ 0 (ada pengaruh signifikan) -
Tentukan t1/2α dengan df = n-k-1 -
k = jumlah variabel x
Ha : β ≠ (ada pengaruh signifikan) Tentukan t1/2α dengan df = n-k-1 Tentukan thitung dengan 𝑏−𝛽 𝑆𝑏
Tentukan daerah penolakan yaitu thitung < -t1/2α atau thitung > t1/2α Ho
Tentukan thitung dengan :
-
Ho :β = (tidak berpengaruh signifikan)
t=
n = jumlah sampel
t=
Tentukan Ho dan Ha
ditolak
𝑎−𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝛼 𝑆𝑎
t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat
Tentukan daerah penolakan yaitu
ditolak
thitung < -t1/2α atau thitung > t1/2α Ho ditolak t1/2α ≤ thitung ≤ t1/2α Ho tidak dapat ditolak
Daerah penolakan Ho (daerah kritis )
Daerah penolakan Ho (daerah kritis ) Daerah penerimaanDaerah penolakan ? Ho H o
-t1/2α -
H t1/2αDaerah penerimaan o
Kesimpulan
6. Interval Taksiran Interval taksiran untuk rata-rata taksiran Interval taksiran untuk Y individu µYX
Ŷo – t1/2α SŶ< Y< Ŷo + t1/2α SŶ
Ŷo – t1/2α SŶ< µYX < Ŷo + t1/2α SŶ 1
SŶ = SYX √𝑛 +
1
SŶ = SYX √1 + 𝑛 +
(𝑋𝑜− x )² 𝛴𝑥²
(𝑋𝑜− x )² 𝛴𝑥²
7. Pengujian Korelasi populasi Menguji apakah sampel berasal dari populasi yang berkorelasi. Ho : ρ = 0 (tidak berasal dari populasi yang berkorelasi) Ha : ρ ≠ 0 (berasal dari populasi yang berkorelasi) df = n-k-1 t=
𝑟(√𝑛−2 √1−𝑟 2
Ho ditolak jika -thitung < -t1/2α atau thitung > t1/2α 8. Batas-batas koefisien korelasi populasi ρ jika sampel tidak berasal dari populasi yang berkorelasi tidak perlu dihitung, jika berkorelasi perlu dihitung 1 (1+𝑟) 𝑙𝑛 (1−𝑟) 2
Sr =
1
(1+𝜌)
1
(1+𝑟)
− Z1/2α. Sr < 2 𝑙𝑛 (1−𝜌) <2 𝑙𝑛 (1−𝑟) + Z1/2α.Sr
1 𝑛−3 √
CONTOH SOAL Sebuah perusahaan manufaktur ingin meneliti tentang pengaruh biaya promosi terhadap volume penjualan. Data-data yang di dapat ditabulasikan sebagai berikut: Tabel. Tabulasi Data Penelitian (Data Fiktif) Bulan
Biaya Promosi
Volume
ke-
(Rupiah)
(Buah)
Penjualan
1
12
56
2
13.5
62.43
3
12.75
60.85
4
12.6
61.3
5
14.85
65.825
6
15.2
66.354
7
15.75
65.26
8
16.8
68.798
9
18.45
70.47
10
17.9
65.2
11
18.25
68
12
16.48
64.2
13
17.5
65.3
14
19.56
69.562
15
19
68.75
16
20.45
70.256
17
22.65
72.351
18
21.4
70.287
19
22.9
73.564
20
23.5
75.642
Tentukanlah : a. Persamaan regresi dan interpretasi b. Koefisien korelasi, determinasi, non determinasi serta artinya c. Standard Error of estimate. Jawaban : Biaya
Volume
Promosi
Penjualan
X2
Y2
XY
(X)
(Y)
12.000
56.000
144.000
3136.000
672.000
13.500
62.430
182.250
3897.505
842.805
12.750
60.850
162.563
3702.723
775.838
12.600
61.300
158.760
3757.690
772.380
14.850
65.830
220.523
4333.589
977.576
15.200
66.350
231.040
4402.323
1008.520
15.750
65.260
248.063
4258.868
1027.845
16.800
68.800
282.240
4733.440
1155.840
18.450
70.470
340.403
4966.021
1300.172
17.900
65.200
320.410
4251.040
1167.080
18.250
68.000
333.063
4624.000
1241.000
16.480
64.200
271.590
4121.640
1058.016
17.500
65.300
306.250
4264.090
1142.750
19.560
69.562
382.594
4838.872
1360.633
19.000
68.750
361.000
4726.563
1306.250
20.450
70.256
418.203
4935.906
1436.735
22.650
72.351
513.023
5234.667
1638.750
21.400
70.287
457.960
4940.262
1504.142
22.900
73.564
524.410
5411.662
1684.616
23.500
75.642
552.250
5721.712
1777.587
X = 351.490
Y 1340.402
= X2 6410.592
= Y2 90258.571
a. Persamaan Regresi a= =
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)² (6410,592×1340,402)−(351,490×23850,533) (20×6410,592)−(351,490)²
= 44.90327
= XY 23850.533
=
Dan 𝑏 =
=
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛(∑ 𝑋 2 )−(∑ 𝑋)2 (20×23850,533)−(351,490×1340,402) = (20×6410,592)−(351,490)²
1.258461
Maka persamaan regresinya adalah : Y= 44.90327 + 1.258461X Dari persamaan tersebut dapat diketahui bahwa volume penjualan
tanpa
dipengaruhi oleh variabel apapun adalah sebesar 44.90327. Sedangkan jika dipengaruhi oleh promosi, jika biaya promosi naik sebesar 1 rupiah, maka ratarata vome penjualan akan naik sebesar 1.258461 satuan, ceteris paribus. b.
r=
r=
𝑛𝛴𝑋𝑌−𝛴𝑋𝛴𝑌 √(nΣX2 −(ΣX)2 )(nΣY2 −(ΣY)2 ) (20×23850.533)−(351.490×1340.402)
√((20×6410.592)−(351.490)²)(20(90258.571)−(1340.402)2 )
r = 0.9327980 Artinya, korelasi antara jumlah pengasilan dengan investasi kembali adalah sangat kuat. Koefisien determinasi adalah : R2 X 100% = 0.93279802 X 100% = 87.01120% Artinya, variasi biaya promosi mampu menjelaskan total variasi volume penjualan sebesar 87.01120% dan sisanya dijelaskan oleh variabel lain diluar model. Koefisien non determinasi 1 – R2 = 1 – 87.01120%= 12.98880% 𝛴𝑌²−𝑎𝛴𝑌−𝑏𝛴𝑋𝑌 𝑛−𝑘−1
SYX =√
(90258.571)−(44.90327 ×1340.402)−(1.258461×23850.533)
=√
20−1−1
= 1.750753
Jadi, rata-rata penyimpangan variabel volume penjualan prediksi terhadap variabel volume penjualan sebenarnya adalah 1.750753.
SOAL REGRESI DAN KORELASI SEDERHANA 1. The following data are the monthly salaries y and the grade point averages x for students who obtained a bachelor’s degree in business administration with a major in information systems. GPA
Monthly Salary ($)
2.6
3300
3.4
3600
3.6
4000
3.2
3500
3.5
3900
2.9
3600
Determine : a. What is the regression equation and give the interpretation? b. How much the coeficient corelation for the case and interpretation? c. How much the size of house can explain the selling price and interpretation? d. Determine the standard error of estimate and interpretation? Answer : GPA (X)
Monthly
Salary
($) (Y)
XY
X2
Y2
2.6
3300
8580
6.76
10890000
3.4
3600
12240
11.56
12960000
3.6
4000
14400
12.96
16000000
3.2
3500
11200
10.24
12250000
3.5
3900
13650
12.25
15210000
2.9
3600
10440
8.41
X = 19.2
Y = 21900
XY = 70510
X2 = 62.18
12960000 Y2 80270000
a. Regression equation a=
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)²
=
(62,18)(21900)−(19,2)(70510) 6(62,18)−(19,2)2
=1790.541
=
𝑏=
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛 𝛴𝑋² −(𝛴𝑋)²
=
6(70510)−(19,2)(21900) 6(62,18)−(19,2)2
=581.0811
So, the regression equation is Y = 1790.541 + 581.0811X. It means that average salary if not influenced by anything variabel is about 1790.541 dollars. And if influenced by GPA, increasing in point of GPA will be increasing about 581.0811 dollars, ceteris paribus. b. 𝑟 =
𝑛𝛴𝑋𝑌−𝛴𝑋𝛴𝑌 √(nΣX2 −(ΣX)2 )(nΣY2 −(ΣY)2 )
=
(6×70510)−(19.2×21900) √(6(62.18)−(19.22 )(6(80270000)−(219002 ))
=0.8636349
So, the correlation between GPA and salary is 0.8636349. On the other hand, the corelation is very strong. c. r2 = (0.8636349)2 = 0.7458652 x 100% = 74.58652% k2 + r2 = 100% k 2 = 100% - 74.58652% = 25.41348% so, the variation of GPA can explain total variation of salary about 74.58652% and the residual about 25.41348% is explained by variable out of model. 𝛴𝑌 2 −𝑎𝛴𝑌−𝑏𝛴𝑋𝑌 𝑛−𝑘−1
d. SYX = √
=√
80270000−1790.541( 21900)−(581.0811)(70510) 6−1−1
= 145.8799 So the standard error of estimate is 145.8799. It means that varians of production prediction can explain real production about 145.8799. 2. Diasumsikan ada hubungan linear antara pendapatan dengan belanja konsumsi, dimana modelnya adalah Y= a+bX. Jika diketahui data tentang belanja konsumsi mingguan keluarga dan pendapatan mingguan keluarga (dalam Rp10,000,-), adalah sebagai berikut :
Pendapatan mingguan
80 100
120
140
160
180
200
220
240
260
Belanja konsumsi mingguan
70 65
90
95
110
115
120
140
155
150
nilai-nilai
yang
Dimana dari data diatas diperoleh perhitungan : X= 1700
X2 = 322,000
Y= 1110
Y2 = 132,100
XY = 205,500
Pertanyaannya : a. Tentukan
persamaannya
dan
jelaskan
arti
dari
menggambarkan hubungan antara belanja konsumsi mingguan keluarga dan pendapatan mingguan keluarga. b. Jika pendapatan mingguannya sebesar Rp. 5.000.000,-, berapa perkiraan belanja konsumsinya. c. Dengan α = 10%, dugalah perubahan pendapatan mingguan keluarga terhadap belanja konsumsi mingguan yang sebenarnya. d. Ujilah apakah hubungan antara belanja konsumsi mingguan keluarga dan pendapatan mingguan keluarga berarti (signifikan). e. Jika dari jawaban (e) hasilnya sangat berarti, apakah hubungan antara belanja konsumsi mingguan keluarga dan pendapatan mingguan keluarga untuk data diatas erat, jelaskan. (Sumber : Soal UAS Statistika 2009) Jawaban : Pendapatan mingguan (X)
Belanja Konsumsi (Y)
X2
Y2
XY
80
70
6400
4900
5600
100
65
10000
4225
6500
120
90
14400
8100
10800
140
95
19600
9025
13300
160
110
25600
12100
17600
180
115
32400
13225
20700
200
120
40000
14400
24000
220
140
48400
19600
30800
240
155
57600
24025
37200
260
150
67600
22500
39000
ΣX = 1700
ΣY = 1110
ΣX2
= ΣY2
322000
= ΣXY =
132100
205500
(132100)(1700)−(1110)(205500) 𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 = = 24.4545 𝑛 𝛴𝑋² −(𝛴𝑋)² 10(132100)−(1110)2 𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 10(205500)−(1110)(1700) = = 10(132100)−(1110)2 = 0.5090 𝑛 𝛴𝑋² −(𝛴𝑋)²
a. a = 𝑏
maka persamaan regresinya adalah Y = 24.4545 + 0.5090X. Dari persamaan tersebut dapat diketahui bahwa pendapatan tanpa dipengaruhi oleh variabel apapun adalah sebesar 24.4545 rupiah. Sedangkan jika dipengaruhi oleh biaya konsumsi, jika biaya konsumsi naik sebesar 1 rupiah, maka rata-rata pendapatan akan naik sebesar 0.5090 satuan, ceteris paribus. b. X = 500 Y = 24.4545 + 0.50909X Y = 24.4545 + 0.5090(500) Y = 278.995 Jadi jika pendapatan mingguannya sebesar Rp. 5.000.000,-, maka diperkirakan belanja konsumsinya sebesar Rp. 2.789.950,c. (n ≤ 30) b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 1
Sb = SYX . √𝛴𝑥²
Σx2 = ΣX2 –
(𝛴𝑋)2 𝑛
Σx = 322000 – 2
2890000 10
= 33000
𝛴𝑌² − 𝑎𝛴𝑌 − 𝑏𝛴𝑋𝑌 SYX = √ 𝑛−𝑘−1 =√
132100 − (24.45(1110)) − (0.509)(205500) 10 − 1 − 1
= 6.717514421 1
Maka Sb =6.717514421. √33000 Sb = 0.036978699
df = 10-1-1=8
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 0.509–1,86*0.036978699< Konstanta α < 0.509+1,86*0.036978699 0.4402< Konstanta β < 0.5778 Dengan tingkat signifikansi 10%, perubahan pendapatan mingguan keluarga terhadap belanja konsumsi mingguan yang sebenarnya adalah berkisar pada Rp4,402 sampai Rp5,778. d. Ho: β = 0 (tidak ada pengaruh signifikan) Ha: β ≠ 0 (Ada pengaruh signifikan) α= 0.05 df = 8 t α/2 = 2.3060 t=
𝑏−𝛽ɞ 𝑆𝑏 0.509 −0
t = 0.046978699 t = 13.76 Kriteria
-thitung <-t1/2α atau thitung > t1/2α
→ Ho ditolak
ternyata 13.76> 2.3060 → Ho ditolak Jadi dengan tingkat signifikansi 5%, hubungan antara belanja konsumsi mingguan keluarga dan pendapatan mingguan keluarga berarti (mempunyai pengaruh signifikan) e. 𝑟 =
𝑛𝛴𝑋𝑌−𝛴𝑋𝛴𝑌 √(nΣX2 −(ΣX)2 )(nΣY2 −(ΣY)2 )
=
(10×205500)−(1700×1110) √(10(322000)−(170002 )(10(132100)−(17002 ))
=
0,9808474 hubungan antara belanja konsumsi mingguan keluarga dan pendapatan mingguan keluarga sangat kuat. 3. An important application of regression analysis in accounting is in the estimation of cost. By collecting data on volume and cost and using the least squares method to develop an estimated regression equation relating volume and cost, an accountant can estimate the cost associated with a particular manufacturing volume. Consider the following sample of production volumes and total cost data for a manufacturing operation. Production
Volume Total Cost ($)
(units) 400
4000
450
5000
550
5400
600
5900
700
6400
750
7000
Determine : a. The regression equation and give the interpretation! b. How much r and 𝑟 2 and give the interpretation! c. The standard error of estimation and interpretation!
d. With significance 5%, estimate interval constanta α! e. With significance 5%, estimate interval constanta β and test constanta β can influence the regression model significantly! f.
At significance 5%, can we conclude that the sample comes from population which have correlation? Answer :
Production (X)
Cost (Y)
X2
Y2
XY
400
4000
160000
16000000
1600000
450
5000
202500
25000000
2250000
550
5400
302500
29160000
2970000
600
5900
360000
34810000
3540000
700
6400
490000
40960000
4480000
750
7000
562500
49000000
5250000
ΣX = 3450
ΣY = 33700
Σ
X
2
2077500
= Σ
= Σ
2
Y
194930000
XY
=
20090000
a. Regression equation a=
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)²
𝑏=
=
(2077500)(33700)−(3450)(20090000)
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛 𝛴𝑋² −(𝛴𝑋)²
6(2077500)−(3450)2
=
6(20090000)−(3450)(33700) 6(2077500)−(3450)2
= 1246.667
=7.6
So, the regression equation is Y = 1246.667+ 7.6X. It means that average production if not influenced by anything variabel is about 1246.667 units. And if influenced by cost, in one US $/unit increasing in cost then average production will be increasing about 7.6US $/unit, ceteris paribus.
b. 𝑟=
𝑛𝛴𝑋𝑌−𝛴𝑋𝛴𝑌 √(nΣX2 −(ΣX)2 )(nΣY2 −(ΣY)2 )
=
(6×20090000)−(3450x33700) √(6(2077500)−(337002 )(6(194930000)−(337002 ))
=0.9791271
So, the correlation between production and cost is 0.9791271. On the other hand, the corelation is very strong and positive, because the value close to +1. r2 = (0.9791271)2 = 0.9586899 x 100% = 95.86899% k2 + r2 = 100% k 2 = 100% - 95.86899% = 4.131012% so, the variation of production can explain total variation of cost about 95.86899% and the residual about 4.131012%is explained by variable out of model. 𝛴𝑌 2 −𝑎𝛴𝑌−𝑏𝛴𝑋𝑌 𝑛−𝑘−1
c. SYX = √
=√
194930000−(1246.667)(33700)−(7.6)(20090000) 6−1−1
= 241.517139 So the standard error of estimate is 241.517139. It means that varians of production prediction can explain real production about 241.51713999. 𝛴𝑋 2
d. Sa = SYX . √𝑛𝛴𝑥 2 → Σx2 = ΣX2 –
(𝛴𝑋)² 𝑛
2077500
Sa =241.517139 . √6×93750 Sa = 464.1487746 df = 6-1-1=4 a – t1/2α.Sa < konstanta α < a + t1/2α.Sa
=2077500 –
( 3450)² 6
= 93750
1246.667–2,776*464.1487746 < Konstanta α < 1246.667+ 2.776*464.1487746 -41.809 < Konstanta α < 2535.144 So, with significance 5% the limits of estimated α are constant in the population regression -41.809 to 2535.144. e. (n ≤ 30) b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 1 𝛴𝑥²
Sb = SYX . √
Σx2 = ΣX2 – Σx2 = ΣX2 –
(𝛴𝑋)² 𝑛 (𝛴𝑋)² 𝑛
=2077500 –
( 3450)² 6
= 93750
1
Maka Sb =241.517139 . √93750 Sb = 0.7888
df = 6-1-1=4
b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 7.6 – 2,776*0.7888< Konstanta β <7.6 + 2,776*0.7888 5.410< Konstanta β < 9.789 With significance 5%, interval estimation constanta β for regression of population is between 5.410 to 9.789 Uji t Ho: β = 0 (tidak ada pengaruh signifikan) Ha: β ≠ 0 (Ada pengaruh signifikan)
α= 0,05
df = 4
t α/2 = 2.776 t=
𝑏−𝛽ɞ 𝑆𝑏
t=
7.6 −0 0.7888
t = 9,6348 criteria
-thitung <-t1/2α atau thitung > t1/2α
→ Ho ditolak
evidently 9,6348 > 2.7764→ Ho rejected so, with significance 5%, the test shows that constanta β ≠ 0. It means that constanta β influence significantly.
f.
Ho
: ρ = 0 (no correlation)
Ha
: ρ ≠ 0 (correlation)
df = 6-1-1 = 4 t 1/2α = 2,7764 t=
𝑟(√𝑛−2 √1−𝑟²
=
t = 9,634761 criteria :
0.9791271 √6−2 √1−0.9586899
Ho rejected if -thitung < -t1/2α or thitung > t1/2α 9,634761> 2,7764 then Ho is rejected So, at significance 5%, there are positif correlation between production and price.
4. A marketing professor at Givens College is interested in the relationship between hours spent studying and total points earned in a course. Data collected on 10 students who took the course last quarter follow. Hours
Spent Total Points
Studying
Earned
45
40
30
35
90
75
60
65
105
90
65
50
90
90
80
80
55
45
75
65
a. Develop an estimated regression equation showing how total points earned is related to hours spent studying. b. Test the significance of the model with α =0 .05. c. Predict the total points earned by Mark Sweeney. He spent 95 hours studying. d. Develop a 95% prediction interval for the total points earned by Mark Sweeney.
Answer : Hours Total Spent Points Studying Earned
X2
Y2
XY
45
40
2025
1600
1800
30
35
900
1225
1050
90
75
8100
5625
6750
60
65
3600
4225
3900
105
90
11025
8100
9450
65
50
4225
2500
3250
90
90
8100
8100
8100
80
80
6400
6400
6400
55
45
3025
2025
2475
75
65
5625
4225
4875
ΣX2 = 53025
ΣY2 = 44025
ΣXY = 48050
ΣX
= ΣY = 635
695 a. Regression equation a=
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)²
𝑏=
=
(53025)(635)−(695)(48050)
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛 𝛴𝑋² −(𝛴𝑋)²
10(53025)−(695)2
=
= 5.847009
10(48050)−(695)(635) 10(53025)−(695)2
= 0.8295394
So, the regression equation is Y = 5.847009 + 0.8295394X. It means that total points earned if not influenced by anything variabel is about 5.847009 points. And if influenced by hours spent studying, in one hour increasing then total points earned will be increasing about 0.8295394 point, ceteris paribus.
𝛴𝑌 2 −𝑎𝛴𝑌−𝑏𝛴𝑋𝑌 𝑛−𝑘−1
b. SYX = √
=√
44025−(5.847009)(635)−(0.8295394)(48050) 10−1−1
= 7.523140 1
Sb = SYX . √𝛴𝑥² Σx2 = ΣX2 –
(𝛴𝑋)² 𝑛
Σx2 = 53025 –
( 695)² 10
= 4722.5 1
Maka Sb =7.523140. √4722.5 Sb = 0.1094745 Uji t Ho: β = 0 (tidak ada pengaruh signifikan) Ha: β ≠ 0 (Ada pengaruh signifikan) α= 0,05
df = 8
t α/2 = 2.3060 t=
𝑏−𝛽ɞ 𝑆𝑏
t=
0.8295394 −0 0.10947455
t = 7.577464 criteria
-thitung <-t1/2α atau thitung > t1/2α
→ Ho ditolak
evidently 7.577464 > 2.3060→ Ho rejected so, with significance 5%, the test shows that constanta β ≠ 0. It means that constanta β influence significantly. c. Y = 5.847009 + 0.8295394X
Y = 5.847009 + 0.8295394(95) Y = 84.65325 So, the total points earned by Mark Sweeney if he spent 95 hours studying is 84,65325 point. d. b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 0.8295394–2.3060*0.10947455< Konstanta β < 0.8295394+ 2.3060*0.10947455 0.5770911 < Konstanta β < 1.081988 With significance 5%, interval estimation constanta β for regression of population is between 0.5770911 to 1.081988.
5. Dibawah ini merupakan data yang digunakan Manajer Perusahaan untuk mengetahui hubungan biaya pelatihan karyawan dengan total produksi tiap bulannya selama satu tahun. (dalam juta rupiah) Biaya pelatihan
12
14
17
19
18
21
22
24
25
25
26
26
50
52
54
53
55
56
57
57
58
59
60
60
karyawan Total penjualan Tentukan : a. Persamaan regresi dari kedua variabel tersebut. b. Dengan tingkat signifikansi 5%, berapa perubahan total penjualan terhadap biaya pelatihan karyawan yang sebenarnya. Jawab : Biaya Total Pelatihan Penjualan X2 Karyawan (X) 12
Y2
XY
2500
600
(Y) 50
144
14
52
196
2704
728
17
54
289
2916
918
19
53
361
2809
1007
18
55
324
3025
990
21
56
441
3136
1176
22
57
484
3249
1254
24
57
576
3249
1368
25
58
625
3364
1450
25
59
625
3481
1475
26
60
676
3600
1560
26
60
676
3600
1560
ΣX = 249
ΣY = 671
ΣX2 5417
ΣY2 = 37633
ΣXY 14086
=
=
a. Persamaan regresi a=
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)²
𝑏=
=
(5417)(671)−(249)(14086)
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛 𝛴𝑋² −(𝛴𝑋)²
12(5417)−(249)2
=
= 42.42191
12(14086)−(249)(671) 12(5417)−(249)2
= 0.6503497
maka persamaan regresinya adalah Y = 42.42191 + 0.6503497X Dari persamaan tersebut dapat diketahui bahwa total penjualan tanpa dipengaruhi oleh variabel apapun adalah sebesar 42.42191 juta rupiah. Sedangkan jika dipengaruhi oleh biaya pelatihan karyawan , jika biaya tersebut naik sebesar 1 rupiah, maka rata-rata pendapatan akan naik sebesar 0.6503497 juta rupiah, ceteris paribus. b. b – t1/2α.Sb < konstanta β< b + t1/2α.Sb
Sb = SYX . √
1 𝛴𝑥²
Σx2 = ΣX2 –
(𝛴𝑋)2
Σx2 = 5417 –
𝑛 ( 249)² 12
= 250.25
𝛴𝑌² − 𝑎𝛴𝑌 − 𝑏𝛴𝑋𝑌 SYX = √ 𝑛−𝑘−1 37633 − (42.42191(671)) − (0.6503497)(14086) =√ 12 − 1 − 1 = 0.84098252 1
Maka Sb =0.84098252 √250.25 Sb = 0.05316183 df = 12-1-1=10 b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 0.6503497–2.228*0.05316183<
Konstanta
α
<
0.6503497+
2.228*0.05316183 0.531905142< Konstanta β < 0.768794257 Dengan tingkat signifikansi 5%, perubahan total penjualan terhadap biaya pelatihan karyawan yang sebenarnya adalah berkisar pada 0.531905142 Juta sampai 0.768794257 Juta rupiah
6. Jensen Tire & Auto is in the process of deciding whether to purchase a maintenance contract for its new computer wheel alignment and balancing machine. Managers feel that maintenance expense should be related to usage, and they collected the following information on weekly usage (hours) and annual maintenance expense (in hundreds of dollars). Weekly (hours)
Usage Annual Maintenance Expense
13
17.0
10
22.0
20
30.0
28
37.0
32
47.0
17
30.5
24
32.5
31
39.0
40
51.5
38
40.0
a. Develop the estimated regression equation that relates annual maintenance expense to weekly usage. b. Test the significance of the relationship in part (a) at a 0.05 level of significance. c. Jensen expects to use the new machine 30 hours per week. Develop a 95% prediction interval for the company’s annual maintenance expense. Answer : Weekly Usage (hours) (X)
Annual Maintenance X2 Expense (Y)
Y2
XY
13
17
169
289
221
10
22
100
484
220
20
30
400
900
600
28
37
784
1369
1036
32
47
1024
2209
1504
17
30,5
289
930,25
518,5
24
32,5
576
1056,25
780
31
39
961
1521
1209
40
51,5
1600
2652,25
2060
38
40
1444
1600
1520
ΣX = 253
ΣY = 346,5
ΣX2
= ΣY2
7347
= ΣXY
13010,75
=
9668,5
a. Regression equation a=
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)²
𝑏=
=
(7347)(346,5)−(253)(9668,5) 10(7347)−(253)2
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛 𝛴𝑋² −(𝛴𝑋)²
=
= 10.52796
10(9668,5)−(253)(346,5) 10(7347)−(253)2
= 0.9534404
So, the regression equation is Y = 10.52796 + 0.9534404X. It means that annual maintenance expense if not influenced by anything variabel is about 10.52796 hundreds of dollars. And if influenced by weekly usage, in one hour increasing then annual maintenance expense will be increasing about 0.9534404 hundreds of dollars, ceteris paribus. 𝛴𝑌 2 −𝑎𝛴𝑌−𝑏𝛴𝑋𝑌 𝑛−𝑘−1
b. SYX = √
=√
13010,75−(10,52796)(346,5)−(0,9534404)(9668,5) 10−1−1
= 4.249608 1 𝛴𝑥²
Sb = SYX . √
Σx2 = ΣX2 –
(𝛴𝑋)² 𝑛
Σx2 = 7347 –
( 253)² 10
= 946.1
1 946.1
Maka Sb = 4.249608√ Sb = 0.1381594 Uji t
Ho: β = 0 (tidak ada pengaruh signifikan) Ha: β ≠ 0 (Ada pengaruh signifikan) α= 0.05
df = 8
t α/2 = 2.3060 t=
𝑏−𝛽ɞ 𝑆𝑏
t=
0,9534404 −0 0.1381594
t = 6.901019 criteria
-thitung <-t1/2α atau thitung > t1/2α
→ Ho ditolak
evidently 6.901019 > 2.3060→ Ho rejected so, with significance 5%, the test shows that constanta β ≠ 0. It means that constanta β influence significantly. c. b – t1/2α.Sb < konstanta β< b + t1/2α.Sb 0.9534404–2.3060*0.1381594
<
Konstanta
β
<
0.9534404+
2.3060*0.1381594 0.6348448 < Konstanta β < 1.272036 With significance 5%, interval estimation constanta β for regression of population is between 0.6348448 to 1.272036
7. Berikut ini merupakan data mengenai total gaji dan jam kerja lembur yang didapatkan melalui survey terhadap 10 responden. Total Gaji
Jam
kerja
(dalam
juta Lembur
rupiah) 1
5
1.5
5
1.2
4
1.4
6
1.8
7
2
8
2.1
8
1.6
5
1.7
7
1.9
7
Tentukan : a. Persamaan regresi dan interpretasi! b. Hitunglah standard error estimasinya! c. Taksirlah berapa total gaji, apabila jam kerja lembur yang digunakan selama 8 jam? Jawab :
total gaji Y
Jam kerja X2 Lembur X
Y2
XY
1
5
25
1
5
1.5
5
25
2.25
7.5
1.2
4
16
1.44
4.8
1.4
6
36
1.96
8.4
1.8
7
49
3.24
12.6
2
8
64
4
16
2.1
8
64
4.41
16.8
1.6
5
25
2.56
8
1.7
7
49
2.89
11.9
1.9 ΣY 16.2
a. a = 𝑏=
7
49
ΣX = 62
ΣX = 402
=
𝛴𝑋²𝛴𝑌−𝛴𝑋𝛴𝑋𝑌 𝑛 𝛴𝑋² −(𝛴𝑋)²
=
2
3.61 ΣY2 27.36
(402)(16,2)−(62)(104,3)
𝑛(∑ 𝑋𝑌)−(∑ 𝑋)(∑ 𝑌) 𝑛 𝛴𝑋² −(𝛴𝑋)²
10(402)−(62)2
=
13.3 = ΣXY = 104.3
= 0.2602273
10(104,3)−(62)(16,2) 10(402)−(62)2
= 0.2193182
maka persamaan regresinya adalah Y = 0.2602273 + 0.2193182X. Dari persamaan tersebut dapat diketahui bahwa total gaji tanpa dipengaruhi oleh variabel apapun adalah sebesar Rp260227.3. Sedangkan jika dipengaruhi oleh jam kerja lembur, jika naik sebesar 1 jam, maka rata-rata total gaji akan naik sebesar Rp219318.2, ceteris paribus.
𝛴𝑌²−𝑎𝛴𝑌−𝑏𝛴𝑋𝑌 𝑛−𝑘−1
b. SYX =√
27,36−(0,2602273)(16,2)−(0,2193182)(104,3) 10−1−1
=√
= 0.1835175 Jadi, rata-rata penyimpangan variabel total gaji prediksi terhadap variabel total gaji sebenarnya adalah 0.1835175. c. Y = 0.2602273 + 0.2193182X Y = 0.2602273 + 0.2193182(8) Y = 2.014773 Jadi, ketika mendapatkan jatah lembur sebanyak 8 jam, maka total gaji yang akan didapat adalah sebesar Rp2.014.773.
REGRESI DAN KORELASI BERGANDA
REGRESI LINEAR BERGANDA Analisis Regresi Linear Berganda digunakan untuk mengukur pengaruh antara lebih dari satu variabel prediktor (variabel bebas) terhadap variabel terikat. Misalnya, hubungan antara hasil penjualan dengan harga dan daya beli, hubungan antara rata-rata harga beras dengan dengan jumlah penduduk, pendapatan, dan jumlah uang beredar, atau hubungan antara produksi padi dengan bibit, pupuk, luas sawah, dan curah hujan. (Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua).Friedman (1962) menyatakan bahwa keputusan seseorang untuk mengonsumsi sesuatupada dasarnya tidak hanya dipengaruhi oleh faktor pendapatannya, tetapi juga perkiraan pendapatannya pada masa akan dating, selain faktor suku bunga, pajak, distribusi pendapatan, dan lainnya. Persamaan regresi linear berganda : 𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐 + ⋯ + 𝒃𝒌 𝑿𝒌 Keterangan : Y
= variabel dependen
X1, X2, Xk
= variabel independen
a
= bilangan konstan (konstanta)
b1, b2, bk
= koefisien variabel
Bentuk umum persamaan regresi linear berganda : a.
Bentuk Stokastik 𝑌̂= a + b1X1 + b2X2+ ... +bkXk + e
b.
Bentuk Nonstokastik (Deterministik) 𝑌̂= a + b1X1 + b2X2+ ... +bkXk
Keterangan:
𝑌̂
= variabel terikat / dependen (nilai duga Y)
X1, X2, ..., Xk
= variabel bebas / independen
a
= bilangan konstan (konstanta)
b1, b2, ..., bk
= koefisien regresi (parameter)
e
̂) = nilai residual / error / pengganggu (Y-Y
Persamaan Regresi Linear Berganda dengan Dua Variabel Bebas Bentuk umum persamaan regresi linear berganda dengan dua variabel bebas adalah sebagai berikut: 𝐘 = a + b1X1 + b2X2 Keterangan: Y
= variabel terikat / dependen (nilai duga Y)
X1, X2
= variabel bebas / independen
b1,b2
=koefisien regresi linear berganda disebut juga sebagai koefisien regresi parsial (partial coefficient regression)
a
= konstanta (nilai Y, apabila X1 = X2 = 0)
b1
= besarnya kenaikan/penurunan Y dalam satuan, jika X1naiksatu satuan dan X2 konstan
b2
= besarnya kenaikan/penurunan Y dalam satuan, jika X2naik satu satuan dan X1 konstan
+ atau -
= tanda yang menunjukkan arah hubungan antara Y dan X1atau X2
Nilai dari koefisien a, b1, b2 dapat ditentukan salah satunya dengan metode kuadrat terkecil atau Ordinary Least Square Method. Metode Kuadrat Terkecil
Metode Kuadrat terkecil atau Ordinary Least Square Method pada prinsipnya adalah meminimumkan jumlah kuadrat deviasi di sekitar garis regresi. Dan nilai koefisien regresi a, b1, dan b2 dapat dipecahkan secara simultan dari tiga persamaan berikut : ∑Y = na + b1∑X1 + b2∑X2 ∑X1Y = a∑X1 + b1∑X12 + b2∑X1∑X2 ∑X2Y = a∑X2 + b1∑X1∑X2 + b2∑X22 Untuk mendapatkan koefisien regresi a, b1, dan b2 dengan menggunakan persamaan di atas, diperlukan perhitungan yang cukup panjang, oleh karena itu, dikembangkan beberapa cara yang lebih mudah, sebagai berikut : A = n∑X1Y – ∑X1∑Y B = n∑X22– (∑X2)2 C = n∑X1X2 - ∑X1∑X2 D = n∑X2Y - ∑X2∑Y E = n∑X12– (∑X1)2 F = EB – C2 Dari beberapa persamaan tersebut, nilai koefisien regresi untuk a, b1, dan b2dapat diperoleh dengan cara berikut : 𝐴𝐵 − 𝐶𝐷 𝐷𝐸 − 𝐴𝐶 𝑏2 = 𝐹 𝐹 ∑𝑦 − 𝑏1 ∑𝑥1 − 𝑏2 ∑𝑥2 𝑎= 𝑛
𝑏1 =
PENGUJIAN KOEFISIEN REGRESI 1. Standard Error of Estimate / KesalahanBaku dalam Penaksiran (SE) Kesalahan baku dalam penaksiran melihat seberapa jauh nilai penduga, yaitu b1 dan b2 dari nilai sebenarnya, yaitu B1 dan B2 (parameter populasi). Oleh karena nilai ini menunjukkan besarnya penyimpangan atau error, maka semakin kecil
nilainya dianggap akan lebih baik. Untuk menghitung kesalahan baku ini dapat digunakan rumus berikut
: 𝒔 = √𝒔𝟐
𝑠𝑏1 2 = 𝑠 2
∑ 𝑥2 2 ∑ 𝑥1 2 ∑ 𝑥2 2 − (∑ 𝑥1 𝑥2 )2
𝑠𝑏2 2 = 𝑠 2
∑ 𝑥1 2 ∑ 𝑥1 2 ∑ 𝑥2 2 − (∑ 𝑥1 𝑥2 )2
df = n – k – 1 = n – 3 𝑠2 =
∑ 𝑒2 𝑛−𝑘−1
∑ 𝑒 2 = ∑(𝑌𝑖 − 𝑎 − 𝑏1 𝑋1 − 𝑏2 𝑋2 )2
2.
Pendugaan Hipotesis Koefisien Regresi Berganda (Parameter 𝛃1 dan 𝛃1) a. Pengujian Hipotesis Simultan (F statistik) Digunakan
untuk
melihat
signifikansi
variabel
independent
(𝑋1 , 𝑋2 , … , 𝑋𝑘 )secara keseluruhan / bersama–sama dalam mempengaruhi nilai variabel dependen (Y).Langkah-langkah pengujiannya adalah sebagai berikut : i.
Menentukan formulasi hipotesis 𝐻0 : 𝛽1 , 𝛽2 , … , 𝛽𝑘 = 𝑂
(X1 dan X2 secara bersama-sama
tidak
mempengaruhi Y) 𝐻𝑎 : 𝛽1 , 𝛽2 , … , 𝛽𝑘 ≠ 𝑂 (X1 dan X2 secara bersama-sama mempengaruhi Y atau paling sedikit ada satu X yang mempengaruhi Y) ii.
Menentukan Taraf nyata (α) dan nilai F
Taraf nyata (α) dan nilai F tabel ditentukan dengan derajat kebebasan v1 = k - 1 dan v2 = n – k. iii.
Menentukan nilai F stat
SSR df1
MSR SST = ΣY2 – n Y
MSE
SSE df 2
2
SSR = b1 ΣX1Y + b2 ΣX2Y SSE = SST – SSR iv.
Menentukan Kriteria Pengujian F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak atau Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak
v.
Membuat Kesimpulan Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
b. Pengujian Hipotesis Individual / Parsial (t statistik) Digunakan untuk melihat signifikansi variabel independent (𝑋1 , 𝑋2 , … , 𝑋𝑘 ) secara parsial dalam mempengaruhi variabel dependen (Y).Langkah-langkah pengujiannya adalah sebagai berikut : i.
Menentukan formulasi hipotesis Ho
: 𝛃i = 0 ( tidak ada pengaruh Xi secara parsial terhadap Y)
Ha
: 𝛃i > 0 ( ada pengaruh positif Xi secara parsial terhadap Y) 𝛃i < 0 ( ada pengaruh negatif Xi secara parsial terhadap Y) 𝛃i ≠ 0 ( ada pengaruh Xi secara parsial terhadap Y)
ii.
Menentukan Taraf nyata (α) dan nilai t tabel Taraf nyata dari t tabel ditentukan dengan derajat kebebasan : df = n – k – 1, (k = banyaknya jumlah variabel X)
iii.
Menentukan nilai t stat
iv.
Menentukan KriteriabPengujian B
t stat
i
i
, i 2,3
-ttabel ≤ tstat ≤ ttabel→ Ho tidak Sbi dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak atau Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak v.
Membuat Kesimpulan Menyimpulkan apakah Ho tidak dapat ditolak atau ditolak.
KORELASI LINEAR BERGANDA Korelasi linear berganda merupakan alat ukur mengenai hubungan yang terjadi antara variabel terikat (variabel Y) dan dua atau lebih variabel bebas (X 1, X2, ..., Xk). Analisis korelasinya menggunakan tiga koefisien korelasi, yaitu koefisien determinasi berganda, koefisien korelasi berganda dan koefisien korelasi parsial.(Ir. M. Iqbal Hasan, M.M., Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), edisi kedua ) a. Koefisien Determinasi Berganda (R2) Koefisien Determinasi Berganda, dilambangkan dengan R2, merupakan ukuran kesesuaian garis regresi linear berganda terhadap suatu data. Koefisien determinasi tersebut digunakan untuk :
Mengukur besarnya kontribusi variasi X1 dan X2 (variable independen) terhadap variasi Y dalam hubungnnya dengan persamaan garis regresi linear berganda 𝑌𝑖 = a + b1X1 + b2X2.
Menentukkan apakah garis regresi linear berganda Y terhadap X 1 dan X2 sudah cocok untuk dipakai sebagai pendekatan hubungan linear antar variabel berdasarkan hasil observasi (goodness of fit).
Nilai koefisien determinasi berganda terletak antara 0 dan 1 (0 ≤ R2 ≤ 1). Koefisien determinasi berganda dirumuskan:
b x1 y b2 x2 y 2 (Ir. M. Iqbal Hasan, M.M., R Pokok-Pokok Materi Statistik 2 (Statistik Inferensif), 1 y2 edisi kedua ) b. Koefisien Korelasi Berganda (R) Koefisien korelasi berganda, disimbolkan Ry.12, merupakan ukuran keeratan hubungan antara variabel terikat dan semua variabel bebas secara bersama-sama.
R y.12
b1 x1 y b2 x2 y
y
2
c. Koefisien Korelasi Parsial (r) Koefisien korelasi parsial merupakan koefisien korelasi antara dua variabel jika variabel lainnya konstan, pada hubungan yang melibatkan lebih dari dua variabel. Sebelum menghitung koefisien korelasi parsial, dilakukan terlebih dahulu perhitungan koefisien korelasi sederhana, yaitu: 𝑟𝑦1 =
𝑟𝑦2 =
𝑟𝑦12 =
𝑛∑𝑌𝑋1 − ∑𝑌∑𝑋1 √[𝑛∑𝑌 2 − (∑𝑌)2 ][𝑛∑𝑋1 2 − (∑𝑋1 )2 ] 𝑛∑𝑌𝑋2 − ∑𝑌∑𝑋2 √[𝑛∑𝑌 2 − (∑𝑌)2 ][𝑛∑𝑋2 2 − (∑𝑋2 )2 ] 𝑛∑𝑋1 𝑋2 − ∑𝑋1 ∑𝑋2 √[𝑛∑𝑋1 2 − (∑𝑋1 )2 ][𝑛∑𝑋2 2 − (∑𝑋2 )2 ]
Koefisien Korelasi Parsial antara Y dan X1, apabila X2 konstan
𝑟𝑦1.2 =
𝑟𝑦1 − 𝑟𝑦2 𝑟12 √(1 − 𝑟𝑦2 2 )(1 − 𝑟12 2 )
Koefisien Korelasi Parsial antara Y dan X2, apabila X1 konstan 𝑟𝑦2 − 𝑟𝑦1 𝑟12 𝑟𝑦2.1 = √(1 − 𝑟𝑦1 2 )(1 − 𝑟𝑦2 2 )
Koefisien Korelasi Parsial antara X1 dan X2, apabila Y konstan 𝑟12 − 𝑟𝑦1 𝑟𝑦2 𝑟12.𝑦 = √(1 − 𝑟𝑦1 2 )(1 − 𝑟𝑦2 2 )
(Suharyadi & Purwanto, Statistika, Untuk Ekonomi dan Keuangan Modern, Edisi 2)
CONTOH SOAL :
STA, pemilik perkebunan tembakau yang relatif besar di Sumedang, selama 2 tahun terakhir, Deasy melakukan uji coba pemberian 2 jenis pupuk pada tanaman tembakaunya demi mendapatkan tembakau dengan kualitas terbaik, yaitu pupuk jenis Zwazelzure Kali (ZK) dan pupuk jenis Zwazelzure Amoniak (ZA). Tembakau jenis ini dipanen setiap 4 bulan sekali, sehingga didapat 8 data penggunaan kedua jenis pupuk terhadap hasil panen tembakau. Berikut data yang berhasil diperoleh : Hasil Panen
Pupuk ZK
Pupuk ZA
(Kw)
(Kg)
(Kg)
Panen I
160
75
60
Panen II
200
125
100
Panen III
250
130
125
Panen IV
185
100
97
Panen V
300
170
156
Panen VI
325
175
160
Waktu Panen
Panen VII
400
230
218
Panen VIII
500
200
230
a. Tentukan persamaan regresinya dan interpretasikan ! b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial ! Interpretasikan ! c. Lakukan pengujian secara parsial antar variabel hasil panen dan jumlah pupuk ZK yang digunakan, juga variabel hasil panen dan jumlah pupuk ZA yang digunakan, dengan tingkat signifikansi 5% ! d. Lakukan pengujian simultan antara variabel jumlah pupuk ZK dan variabel jumlah pupuk ZA yang digunakan terhadap variabel hasil panen tembakau ! e. Jika anda juga memiliki perkebunan tembakau, apakah anda harus menambah pupuk ZK saja, pupuk ZA saja, atau keduanya ?
Penyelesaian: Langkah – langah dengan menggunakan softwareSPSS : 1. Buka SPSS, masukkan nama variabel pada variable view, dan masukkan data pada data view 2. pada menu bar, pilih analyze, sub menu regression, lalu klik linear 3. masukkan variabel Y ke dalam kotak dependent dan X1 dan X2 ke dalam kotak independent 4. Klik Statistics
Regression Coefficient → aktifkan estimates
Aktifkan model fit, descriptives, dan part and partial correlations
5.
Klik Continue
Klik Option
Pilih Stepping Method Kriteria → entry 0.05
Aktifkan Include Constant in Equation
Pada box missing value pilih exclude cases pairwise
Klik Continue
Lalu klik OK
6. Outputnya adalah sebagai berikut : Coefficientsa
Model
1
Unstandardized
Standardized
Coefficients
Coefficients
B
Std. Error
(Constant)
54.154
27.025
X1
-1.286
.586
X2
2.998
.513
Correlations T
Sig.
Beta
Zero-order
Partial
Part
2.004
.101
-.576
-2.195
.080
.902
-.700
-.152
1.532
5.839
.002
.976
.934
.403
a. Dependent Variable: Y a. Persamaan regresi : Y = 54,154–1,286 X1 + 2,998 X2 Interpretasi : a = 54,154 Tanpa dipengaruhi oleh variabel apapun, rata – rata hasil panen yang dihasilkanadalah sebanyak 54,154 Kwintal. b1 = -1,286
Artinya, setiap kenaikan penggunaan pupuk ZK sebanyak 1 Kg, maka rata – rata hasil panen akan turun sebesar 1,286 Kwintal dengan variabel penggunaan pupuk ZA dianggap konstan. b2 = 2,998 Artinya, setiap kenaikan penggunaan pupuk ZA sebanyak 1 miliar rupiah, maka rata – rata hasil panen akan naik sebanyak2,998 Kwintal dengan variabel penggunaan pupuk ZK dianggap konstan. Model Summary Model
R
1
.988a
R Square Adjusted R Square Std. Error of the Estimate .976
.967
21.29678
a. Predictors: (Constant), X2, X1 b. Koefisien determinasi : R2 = 0,967 (Adjusted R2) Koefisien nondeterminasi : K2 = 1 - R2 = 1 – 0,967 = 0,033 Artinya, variabel penggunaan pupuk ZK dan variabel penggunaan pupuk ZA mampu menjelaskan variasi dari hasil panen Tembakau sebesar 96,7%, dan sisanya sebesar 3,3% dijelaskan oleh faktor lain di luar model.
c. Standard Error of Estimate (SE) SE = 21,29678 Artinya, rata-rata penyimpangan variabel hasil panen tembakau yang diprediksi dengan variabel hasil panen tembakau yang sebenarnya adalah sebanyak 21,29678 Kwintal.
d. Koefisien korelasi berganda (R) = 0,988 Artinya, hubungan keseluruhan antara variabel hasil panen tembakau, variabel penggunaan pupuk ZK, dan variabel penggunaan pupuk ZA adalah searah dan sifatnya sangat erat yaitu sebesar 0,988.
Correlations
Pearson Correlation
Sig. (1-tailed)
N
Y
X1
X2
Y
1.000
.902
.976
X1
.902
1.000
.965
X2
.976
.965
1.000
Y
.
.001
.000
X1
.001
.
.000
X2
.000
.000
.
Y
8
8
8
X1
8
8
8
X2
8
8
8
Koefisien Korelasi Parsial : ry1.2 = 0,902 Artinya hubungan antara variabel penggunaan pupuk ZK secara parsial terhadap variabel hasil panen tembakau adalah searah dan sifatnya sangat erat dengan nilai sebesar 0,902, dengan menganggap variabel penggunaan pupuk ZA ekspor konstan. ry2.1 = 0,976 Artinya hubungan antara variabel penggunaan pupuk ZA secara parsial terhadap variabel hasil panen tembakau adalah searah dan sifatnya sangat erat dengan nilai sebesar 0,976, dengan menganggap variabel penggunaan pupuk ZK konstan. r12.y = 0,965
Artinya hubungan antara variabel penggunaan pupuk ZK dan variabel penggunaan pupuk ZA secara parsial adalah searah dan sifatnya sangat erat dengan nilai sebesar 0,965, dengan menganggap variabel hasil panen tembakau konstan.
e. Uji t statistik : 1. Uji Parsial variabel Hasil Panen terhadap Variabel Penggunaan Pupuk ZK Hipotesis : 𝐻0 : 𝛽1 = 𝑂 (variabel penggunaan pupuk ZK secara parsial tidak berpengaruh signifikan terhadap variabel hasil panen tembakau) 𝐻𝑎 : 𝛽1 ≠ 𝑂 (variabel penggunaan pupuk ZK secara parsial berpengaruh signifikan terhadap variabel hasil panen tembakau) Nilai t stat dan t tabel : t stat = -2,195 t tabel = 2,571 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05 Kriteria uji : i. Uji tabel t -ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,571< -2,195 <2,571 maka Ho tidak dapat ditolak ii. Uji sig. Sig. ≥ α → 𝐻0 tidak dapat ditolak
Sig. < α → 𝐻0 ditolak Sig. = 0,08 dan α = 0,05 Ternyata Sig. ≥ α, yaitu 0,08≥ 0,05 maka 𝑯𝟎 tidak dapat ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZK secara parsial tidak berpengaruh signifikan terhadap variabel hasil panen tembakau
2. Uji Parsial Variabel Hasil PanenTerhadap Variabel Penggunaan Pupuk ZA Hipotesis : 𝐻0 : 𝛽2 = 𝑂
(variabelpenggunaan pupuk ZA
secara
parsial
tidak
berpengaruh signifikanterhadap variabel hasil panen tembakau) 𝐻𝑎 : 𝛽2 ≠ 𝑂 (variabelpenggunaan pupuk ZA secara parsial berpengaruh signifikan terhadap variabel hasil panen tembakau) Nilai t stat dan t tabel : t stat = 5,839 t tabel = 2,571 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05 Kriteria uji : i. Uji tabel t -ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak
Ternyata tstat> ttabel, yaitu 5,839> 2,571 maka Ho ditolak ii. Uji sig. Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak Sig. = 0,002 dan α = 0,05 Ternyata Sig. < α, yaitu 0,008 < 0,05 maka 𝑯𝟎 ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZA secara parsial berpengaruh signifikan terhadap variabel hasil panen tembakau.
f. Uji F statistik ANOVAb Model
1
Sum of Squares
Df
Mean Square
Regression
92882.235
2
46441.118
Residual
2267.765
5
453.553
Total
95150.000
7
F
Sig.
102.394 .000a
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y Hipotesis : 𝐻0 : 𝛽1 = 𝛽2 = 𝑂
(variabel
penggunaan
pupuk
ZKdan
variabel
penggunaan pupuk ZA secara bersama-sama tidak
berpengaruh signifikan terhadap variabel hasil panen tembakau) 𝐻𝑎 : 𝛽1 ≠ 𝛽2 ≠ 𝑂
(variabel penggunaan pupuk ZK dan variabel penggunaan
pupuk ZA
secara
bersama-sama
berpengaruh signifikan terhadap variabel hasil panen tembakau) Nilai F stat dan F tabel : F stat = 102,394
F tabel = 5,99
α = 0,05
v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 8 – 2 = 6 Kriteria uji : i. Uji tabel F F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak Ternyata F stat > F tabel, yaitu 102,394>5,99 maka Ho ditolak ii. Uji Sig. Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak Sig. = 0,000 dan α = 0,05 Ternyata Sig. < α, yaitu 0,000< 0,05, maka 𝑯𝟎 ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk ZK dan variabel penggunaan pupuk ZA secara bersama-sama berpengaruh signifikan terhadap variabel hasil panen tembakau.
SOAL REGRESI DAN KORELASI BERGANDA
1. The owner of Showtime Movie Theaters, Inc., would like to estimate weekly gross revenue as a function of advertising expenditures. Historical data for a sample of eight weeks follow. Weekly Gross
Television
Newspaper
Revenue
Advertising
Advertising
($1000)
($1000)
($1000)
96
5
1,5
90
2
2
95
4
1,5
92
2,5
2,5
95
3
3,3
94
3,5
2,3
94
2,5
4,2
94
3
2,5
a. Develop an estimated regression equation with both television advertising and newspaper advertising as the independent variables. b. What is the estimate of the weekly gross revenue for a week when $3500 is spent on television advertising and $1800 is spent on newspaper advertising? Jawab : Coefficientsa Unstandardized Standardized Coefficients Coefficients Model 1
B
(Constant) 83.230
Std. Error 1.574
Beta
Correlations T 52.882
Sig. .000
Zero-order Partial
Part
television
2.290
.304
1.153
7.532
.001
.808
.959
.958
newspaper
1.301
.321
.621
4.057
.010
-.021
.876
.516
a. Dependent Variable: Gross_revenue a. Regression Equation : Y = 83,23 + 2,29 X1 + 1,301 X2 Interpretation : a = 83,23 Without affected with no variable, the average of weekly gross revenue is about $83,230. b1 = 2,29 Every increasing of $1,000 television advertising, the average of weekly gross revenue will be increase as much as 2,29 or $2,290, considering newspaper advertising variable are constant. b2 = 1,301 Every increasing of $1,000 newspaper advertising, the average of weekly gross revenue will be increase as much as 1,301 or $1,301, considering television advertising variable are constant. b. Estimation : Television Advertising = 3,5 Newspaper Advertising = 1,8 Y = 83,23 + 2,29 X1 + 1,301 X2 Y = 83,23 + 2,29 (3,5) + 1,301 (1,8) Y = 93,58680
So, there would be $93,586.8 weekly gross revenue for a week when $3500 is spent on television advertising and $1800 is spent on newspaper advertising.
2. Data dibawah ini dikumpulkan untuk mengetahui hubungan antara produksi padi dengan penggunaan pupuk dan insektisida dari sebuah daerah di Kabupaten “XYZ”, hasilnya adalah sbb : No. Daerah sebagai sampel
1
2
3
4
5
6
7
8
Produksi Padi (Kwt/Ha)
42
44 46 48
52
58
60
68 74 80
Pupuk (Kg/Ha)
6
8
12 18
20
22
26
28 32 36
Insektisida (Kg/Ha)
4
5
6
9
12
14
20 21 24
8
9
10
Jika persamaan regresinya adalah : Y’ = b0 + b1 X1 + b2 X2 Dan hasil perhitungan maka persamaan regresinya adalah Y’ = 32,78 + 0,86 X1 + 1,25 X2 2
R = 0,9625
dan
Sb1 = 0,22
Sb2 = 0,25
Pertanyaannya : a. Apa arti masing-masing koefisien regresi diatas, jelaskan secara kualitatif dan kuantitatif. b. Dan jelaskan pula arti dari koefisien determinasinya R2 c. Berapa besarnya estimasi dari produksi padi jika diketahui penggunaan pupuk sebanyak 26 Kg per Ha dan insektisida 8 Kg per Ha. d. Ujilah apakah koefisien b1 dan b2 signifikan (berarti) (sumber : Soal Tim Dosen Ujian Akhir Semester tahun 2010/2011) Jawab : a. Interpretasi : Y’ = 32,78 + 0,86 X1 + 1,25 X2 a = 32,78 Tanpa dipengaruhi oleh variabel apapun, rata – rata produksi padi adalah sebesar 32,78 Kwt/Ha. b1 = 0,86
Artinya, setiap kenaikan penggunaan pupuk sebanyak 1 Kg/Ha , maka rata – rata produksi padi akan naik sebesar 0,86 Kwt/Ha dengan variabel insektisida dianggap konstan. b2 = 1,25 Artinya setiap kenaikan penggunaan insektisida sebanyak 1 Kg/Ha, maka rata – rata produksi padi akan naik sebesar 1,25 Kwt/Ha dengan variabel pupuk dianggap konstan. b. Koefisien Determinasi : R2 = 0,9625 Koefisien Non Determinasi : K2 = 1 - R2 = 1 – 0,9625 = 0,0375 Artinya, variabel pupuk dan variabel insektisida mampu menjelaskan variasi dari produksi padi sebesar 96,25%, dan sisanya sebesar 3,75% dijelaskan oleh faktor lain di luar model c. Pupuk = 26 Kg/Ha Insektisida = 8 Kg/Ha Y’ = 32,78 + 0,86 X1 + 1,25 X2 Y’ = 32,78 + 0,86 (26) + 1,25 (8) Y’ = 65,14 Jadi, besarnya estimasi dari produksi padi jika diketahui penggunaan pupuk sebanyak 26 Kg per Ha dan insektisida 8 Kg per Ha adalah 65,14 Kwt/Ha. d. Uji t statistik : Uji Parsial variabel produksi padi terhadap variabel penggunaan pupuk
Hipotesis : 𝐻0 : 𝛽1 = 𝑂 (variabel penggunaan pupuk secara parsial tidak berpengaruh signifikan terhadap variabel produksi padi) 𝐻𝑎 : 𝛽1 ≠ 𝑂 (variabel penggunaan pupuk secara parsial berpengaruh signifikan terhadap variabel produksi padi)
Nilai t stat dan t tabel : 𝑡𝑠𝑡𝑎𝑡 =
𝑏𝑖 − 𝐵𝑖 𝑆𝑏𝑖
𝑡𝑠𝑡𝑎𝑡 =
0,86 − 0 = 3,909091 0,22
t tabel = 2,5706 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05 Kriteria uji : i. Uji tabel t -ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata ttabel ≤ tstat, yaitu 2,5706< 3,909091 maka Ho ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan pupuk secara parsial berpengaruh signifikan terhadap variabel produksi padi Uji Parsial Variabel Hasil PanenTerhadap Variabel Penggunaan Pupuk ZA Hipotesis : 𝐻0 : 𝛽2 = 𝑂 (variabel penggunaan insektisida secara parsial tidak berpengaruh signifikan terhadap variabel produksi padi) 𝐻𝑎 : 𝛽2 ≠ 𝑂 (variabel penggunaan insektisida secara parsial berpengaruh signifikan terhadap variabel produksi padi) Nilai t stat dan t tabel : 𝑡𝑠𝑡𝑎𝑡 =
𝑏𝑖 − 𝐵𝑖 𝑆𝑏𝑖
𝑡𝑠𝑡𝑎𝑡 =
1,25 − 0 =5 0,25
t tabel = 2,5706 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05
Kriteria uji :
Uji tabel t -ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat> ttabel, yaitu 5,000> 2,5706 maka Ho ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel penggunaan insektisida secara parsial berpengaruh signifikan terhadap variabel produksi padi.
3. A 10-year study conducted by the American Heart Association provided data on how age, blood pressure, and smoking relate to the risk of strokes. Assume that the following data are from a portion of this study. Risk is interpreted as the probability (times 100) that the patient will have a stroke over the next 10year period. For the smoking variable, define a dummy variable with 1 indicating a smoker and 0 indicating a nonsmoker. Risk
Age
Pressure
Smoker
12
57
152
No
24
67
163
No
13
58
155
No
56
86
177
Yes
28
59
196
No
51
76
189
Yes
18
56
155
Yes
31
78
120
No
37
80
135
Yes
15
78
98
No
22
71
152
No
36
70
173
Yes
15
67
135
Yes
48
77
209
Yes
15
60
199
No
36
82
119
Yes
8
66
166
No
34
80
125
Yes
3
62
117
No
37
59
207
Yes
a. Develop an estimated regression equation that relates risk of a stroke to the person’s age, blood pressure, and whether the person is a smoker. b. Is smoking a significant factor in the risk of a stroke? Explain. Use α = 0.05. c. What is the probability of a stroke over the next 10 years for Art Speen, a 68-year-old smoker who has blood pressure of 175? What action might the physician recommend for this patient? Coefficientsa Unstandardized Coefficients
Model 1
B
(Constant -91.759 ) Age Pressure
Std. Error
Standardized Coefficients
Beta
Correlations
t
Partia Sig. Zero-order l Part
15.223
.000 6.028
1.077
.166
.697 6.488 .000
.650 .851 .577
.252
.045
.553 5.568 .000
.388 .812 .495
Smoker
8.740
3.001
.302 2.912 .010
.680 .589 .259
a. Dependent Variable: risk
a. Regression Equation : Y = -91,759 + 1,077 X1 + 0,252 X2 + 8,740 X3 Interpretation : a = 91,759 Without affected with no variable, the risk of strokes is about 91,759. b1 = 1,077 Every increasing of 1 years old of age, the risk of strokes will be increase as much as 1,077, considering blood pressure variable and smoke variable are constant. b2 = 0,252 Every increasing of 1 blood pressure, the risk of strokes will be increase as much as 0,252, considering age and smoke variable are constant. b3 = 8,740 Everyone who smoking, the risk of strokes will be increase as much as 8,74, considering age and blood pressure variable are constant.
b. Partial Test of Smoker Variable to The Risk of Strokes
Hypothesis : 𝐻0 : 𝛽3 = 𝑂 (smoker variable partially doesn’t affect significantly to the risk of strokes variable) 𝐻𝑎 : 𝛽3 ≠ 𝑂 (smoker variable partially affects significantly to the risk of strokes variable)
Value of t-stat and t-table : t stat = 2,912
t table = 2,1199 df = n – k – 1 = 20 – 3 – 1 = 16 α = 0,05
Criteria : i. t-Table Test -ttable ≤ tstat ≤ ttable→ Ho cannot rejected tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected -ttable ≤ tstat ≤ ttable, or 2,1199 < 2,912, so Ho rejected ii. Sig. Test Sig. ≥ α → 𝐻0 cannot rejected Sig. < α → 𝐻0 rejected Sig. = 0,010 and α = 0,05 Sig. ≥ α, or 0,010< 0,05 so 𝑯𝟎 rejected
Conclusion : Using 5% significance level, smoker variable partially affects significantly to the riks of strokes.
c. Age = 68+next 10 years = 78 Blood pressure = 175 Smoker Y = -91,759 + 1,077 X1 + 0,252 X2 + 8,740 X3 Y = -91,759 + 1,077 (78) + 0,252 (175) + 8,740 (1) Y = 45,087 So, the probability of a stroke over the next 10 years for Art Speen, a 68year-old smoker who has blood pressure of 175 is 45,087%. The patient should stop smoking because of the possibility of stroke is large enough.
4. Berikut adalah data tentang tingkat kehadiran di kelas dan skor IQ mahasiswa yang diperkirakan mempengaruhi nilai akhir yang diperoleh! Kehadiran di kelas (%)
Skor IQ
Nilai akhir
1.
60
110
65
2.
70
120
70
3.
75
115
75
4.
80
130
75
5.
80
110
80
6.
90
120
80
7.
95
120
85
8.
95
125
95
9.
100
110
90
10.
100
120
98
a. Tentukan persamaan regresinya dan interpretasikan! b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial! Interpretasikan! c. Berapa besar penyimpangan variabel nilai akhir yang diprediksi terhadap variabel nilai akhir yang sebenarnya? d. Lakukan pengujian secara parsial antar variabel nilai akhir dan kehadiran, juga variabel nilai akhir dan skor IQ, dengan tingkat signifikansi 5%!
e. Lakukan pengujian simultan antara variabel kehadiran di kelas dan variabel skor IQ terhadap variabel nilai akhir! Jawab : Coefficientsa Unstandardized Coefficients
Model 1
B
Std. Error
(Constant)
23.054
25.572
Kehadiran
.737
.109
-.034
.221
Skor_IQ
Standardized Coefficients
Beta
Correlations
t
Sig.
Zeroorder
Partial
.902
.397
.938
6.752
.000
.934
.931
.913
-.022
-.156
.881
.194
-.059
-.021
a. Dependent Variable: Nilai_akhir
a. Persamaan regresi : Y = 23,054 + 0,737 X1 0,034 X2 Interpretasi : a = 23,054 Tanpa dipengaruhi oleh variabel apapun, rata – rata nilai akhir yang didapatkan mahasiswa adalah sebesar 23,054. b1 = 0,737 Artinya, setiap kenaikan kehadiran di kelas sebanyak 1 kali, maka rata – rata nilai akhir mahasiswa akan naik sebesar 0,737 dengan variabel skor IQ dianggap konstan.
Part
b2 = 0,034 Artinya setiap kenaikan skor IQ sebanyak 1 satuan, maka rata – rata nilai akhir akan turun sebesar 0,034 dengan variabel kehadiran dikelas dianggap konstan. Model Summary
Model 1
R
R Square
.934a
Adjusted R Square
.872
.835
Std. Error of the Estimate 4.34592
a. Predictors: (Constant), Skor_IQ, Kehadiran
Correlations Nilai_akhir Kehadiran Pearson Correlation Nilai_akhir
Sig. (1-tailed)
N
Skor_IQ
1.000
.934
.194
Kehadiran
.934
1.000
.229
Skor_IQ
.194
.229
1.000
.
.000
.296
Kehadiran
.000
.
.262
Skor_IQ
.296
.262
.
Nilai_akhir
10
10
10
Kehadiran
10
10
10
Nilai_akhir
Correlations Nilai_akhir Kehadiran Pearson Correlation Nilai_akhir
Sig. (1-tailed)
N
Skor_IQ
1.000
.934
.194
Kehadiran
.934
1.000
.229
Skor_IQ
.194
.229
1.000
.
.000
.296
Kehadiran
.000
.
.262
Skor_IQ
.296
.262
.
Nilai_akhir
10
10
10
Kehadiran
10
10
10
Skor_IQ
10
10
10
Nilai_akhir
b. Koefisien Determinasi : R2 = 0,835 (Adjusted R2) Koefisien Non Determinasi : K2 = 1 - R2 = 1 – 0,835 = 0,165 Artinya,variabel kehadiran di kelas dan variabel skor IQ mampu menjelaskan variasi dari nilai akhir mahasiswa sebesar 83,5%, dan sisanya sebesar 16,5% dijelaskan oleh faktor lain di luar model.
Koefisien Korelasi Berganda (R) = 0,934 Artinya, hubungan keseluruhan antara variabel nilai akhir mahasiswa, variabel kehadiran di kelas, dan variabel skor IQ adalah searah dan sifatnya sangat erat yaitu sebesar 0,934 atau 93,4%.
Koefisien Korelasi Parsial (r)
ry1.2 = 0,934 Artinya hubungan antara variabel kehadiran di kelas secara parsial terhadap variabel nilai akhir mahasiswa adalah searah dan sifatnya sangat erat dengan nilai sebesar 0,934, dengan menganggap variabel skor IQ konstan. ry2.1 = 0,194 Artinya hubungan antara variabel skor IQ secara parsial terhadap variabel nilai akhir mahasiswa adalah searah dan sifatnya kurang erat dengan nilai sebesar 0,194, dengan menganggap variabel kehadiran di kelas konstan. r12.y = 0,229 Artinya hubungan antara variabel kehadiran di kelas dan variabel skor IQ secara parsial adalah searah dan sifatnya lemah dengan nilai sebesar 0,2 29, dengan menganggap variabel nilai akhir mahasiswa konstan. c. Standard Error of Estimate (SE) SE = 4,34592 Artinya, rata-rata penyimpangan variabel nilai akhir mahasiswa yang diprediksi dengan variabel nilai akhir mahasiswa yang sebenarnya adalah sebesar 4,34592.
d. Uji t statistik : 1. Uji Parsial Variabel Nilai Akhir Mahasiswa Terhadap Variabel Kehadiran di kelas Hipotesis :
𝐻0 : 𝛽1 = 𝑂 (variabel kehadiran di kelas secara parsial tidak berpengaruh signifikan terhadap variabel nilai akhir mahasiswa) 𝐻𝑎 : 𝛽1 ≠ 𝑂 (variabel kehadiran di kelas secara parsial berpengaruh signifikan terhadap variabel nilai akhir mahasiswa) Nilai t stat dan t tabel : t stat = 6,752 t tabel = 2,3646 df = n – k – 1 = 10 – 2 – 1 = 7 α = 0,05 Kriteria uji : i. Uji tabel t -ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata tstat> ttabel, yaitu 6,752 ˃ 2,3646 maka Ho ditolak ii. Uji sig. Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak Sig. = 0,000 dan α = 0,05 Ternyata Sig. < α, yaitu 0,000< 0,05 maka 𝑯𝟎 ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel kehadiran di kelas secara parsial berpengaruh signifikan terhadap variabel nilai akhir mahasiswa.
2. Uji Parsial Variabel Nilai akhir mahasiswa Terhadap Variabel Skor IQ Hipotesis : 𝐻0 : 𝛽2 = 𝑂 (variabel skor IQ secara parsial tidak berpengaruh signifikan terhadap variabel nilai akhir mahasiswa) 𝐻𝑎 : 𝛽2 ≠ 𝑂 (variabel skor IQ secara parsial berpengaruh signifikan terhadap variabel nilai akhir mahasiswa) Nilai t stat dan t tabel : t stat = 0,156 t tabel = 2,3646 df = n – k – 1 = 10 – 2 – 1 = 7 α = 0,05 Kriteria uji : i. Uji tabel t -ttabel ≤ tstat ≤ ttabel→ Ho tidak dapat ditolak tstat< -ttabel→ Ho ditolak tstat> ttabel→ Ho ditolak Ternyata -ttabel ≤ tstat ≤ ttabel, yaitu -2,3646<0,156< 2,3646 maka Ho tidak dapat ditolak ii. Uji sig. Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak Sig. = 0,881 dan α = 0,05 Ternyata Sig. > α, yaitu 0,881 > 0,05 maka 𝑯𝟎 tidak dapat ditolak
Kesimpulan : Pada tingkat signifikansi 5%, variabel skor IQ secara parsial tidak berpengaruh signifikan terhadap variabel nilai akhir mahasiswa. ANOVAb Sum of Squares
Model 1
df
Mean Square
Regression
899.891
2
449.946
Residual
132.209
7
18.887
1032.100
9
Total
F
Sig.
23.823
.001a
a. Predictors: (Constant), Skor_IQ, Kehadiran b. Dependent Variable: Nilai_akhir Hipotesis : 𝐻0 : 𝛽1 = 𝛽2 = 𝑂 (variabel kehadiran di kelas dan variabel skor IQ secarabersama-sama signifikan
terhadap
tidak variabel
berpengaruh nilai
akhir
mahasiswa) 𝐻𝑎 : 𝛽1 ≠ 𝛽2 ≠ 𝑂 (variabel kehadiran di kelas dan variabel skor IQ secara bersama-sama berpengaruh signifikan terhadap variabel nilai akhir mahasiswa) Nilai F stat dan F tabel : F stat = 23,823 v1 = k – 1 = 2 – 1 = 1 v2 = n – k = 10 – 2 = 8 Kriteria uji :
F tabel =
α = 0,05
i. Uji tabel F F stat ≤ F tabel → Ho tidak dapat ditolak F stat > F tabel → Ho ditolak Ternyata F stat > F tabel, yaitu 23,823> 5,32 maka Ho ditolak ii. Uji Sig. Sig. ≥ α → 𝐻0 tidak dapat ditolak Sig. < α → 𝐻0 ditolak Sig. = 0,001 dan α = 0,05 Ternyata Sig. < α, yaitu 0,001< 0,05, maka𝑯𝟎 ditolak Kesimpulan : Pada tingkat signifikansi 5%, variabel kehadiran di kelas dan variabel skor IQ secara bersama-sama berpengaruh signifikan terhadap variabel nilai akhir mahasiswa.
5. The owner of a large chain of health spas has selected eight of her smaller clubs for a test in which she varies the size of the newspaper ad and the amount of the initiation fee discount to see how this might affect the number of prospective members who visit each club during the following week. The results are shown in the table below.
Club
New Visitors
Ad ColumnInches
Discount Amount
1
23
4
$100
2
30
7
20
3
20
3
40
4
26
6
25
5
20
2
50
6
18
5
30
7
17
4
25
8
31
8
80
a. Determine the least-squares multiple regression equation. b. Interpret partial regression coefficients. c. What is the estimated number of new visitors to a club if the size of the ad is 5 column-inches and a $75 discount is offered? Jawab : Coefficientsa Unstandardized Standardized Coefficients Coefficients
Model 1
Std. Error
B
Beta
Correlations
T
Sig.
Zeroorder
Partial Part
(Constant 10.68 ) 7
3.875
2.758
.040
ad_colum 2.157 n
.628
.818 3.434
.019
.816
.838 .818
Discount
.044
.226 .949
.386
.219
.391 .226
.042
a. Dependent Variable: New_visitor
a. Regression Equation : Y = 10,687 + 2,157 X1 + 0,042 X2 Interpretation : a = 10,687 Without affected with no variable, the number of new visitors is about 10,687, or 11 people.
b1 = 2,157 Every increasing of 1 inches size of the newspaper ad, the number of new visitors will be increase as much as 2,157, considering discount variable are constant. b2 = 0,042 Every increasing of 1 dollar discount amount, the number of new visitors will be increase as much as 0,042, considering ad column-inches variable are constant. b. Partial Test of Ad Column-Inches Variable to The New Visitor
Hypothesis : 𝐻0 : 𝛽3 = 𝑂 (ad column variable partially doesn’t affect significantly to the new visitors variable) 𝐻𝑎 : 𝛽3 ≠ 𝑂 (ad column variable partially affects significantly to the new visitors variable)
Value of t-stat and t-table : t stat = 3,434 t table = 2,5706 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05
Criteria : i. t-Table Test -ttable ≤ tstat ≤ ttable→ Ho cannot rejected tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected tstat > ttable, or 3,434 > 2,5706, so Ho rejected ii. Sig. Test Sig. ≥ α → 𝐻0 cannot rejected Sig. < α → 𝐻0 rejected Sig. = 0,019 and α = 0,05
Sig. ≥ α, or 0,019< 0,05 so 𝑯𝟎 rejected
Conclusion : Using 5% significance level, ad column variable partially affects significantly to the number of new visitors.
Partial Test of Discount Amount Variable to The New Visitor
Hypothesis : 𝐻0 : 𝛽3 = 𝑂 (discount amount variable partially doesn’t affect significantly to the new visitors variable) 𝐻𝑎 : 𝛽3 ≠ 𝑂 (discount amount variable partially affects significantly to the new visitors variable)
Value of t-stat and t-table : t stat = 0,949 t table = 2,5706 df = n – k – 1 = 8 – 2 – 1 = 5 α = 0,05
Criteria : i. t-Table Test -ttable ≤ tstat ≤ ttable→ Ho cannot rejected tstat< -ttable→ Ho rejected tstat> ttable→ Ho rejected -ttable ≤ tstat ≤ ttable, or -2,5706< 0,949 < 2,5706, so Ho cannot rejected ii. Sig. Test Sig. ≥ α → 𝐻0 cannot rejected Sig. < α → 𝐻0 rejected Sig. = 0,386 and α = 0,05 Sig. ≥ α, or 0,386> 0,05 so 𝑯𝟎 cannot rejected
Conclusion : Using 5% significance level, discount amount variable partially doesn’t affect significantly to the number of new visitors.
c. Ad = 5 Discount = 75 Y = 10,687 + 2,157 X1 + 0,042 X2 Y = 10,687 + 2,157 (5) + 0,042 (75) Y = 24,622 So, the estimated number of new visitors to a club if the size of the ad is 5 column-inches and a $75 discount is offered is about 25 people.
6. Berikut ini adalah data harga jual, ukuran rumah, dan kondisi rumah hasil survei sebuah lembaga “appraisal” pada suatu “real estate”. Satuan harga jual adalah ratus juta rupiah, ukuran rumah dalam ratus meter persegi, dan kondisi rumah berskala 1 sampai 10. Harga Jual 71 41 66 56 57 65 Ukuran Rumah
22
10
20
17
15
21
Kondisi Rumah
5
2
9
3
8
4
a. Tentukan persamaan regresi dan berikan interpretasinya! b. Tentukan koefisien determinasi, korelasi berganda, dan korelasi parsial untuk
setiap
variabel
independen
Interpretasikan Jawab : Coefficientsa
terhadap
variabel
dependen
!
Unstandardized Standardized Coefficients Coefficients
Model 1
B
(Constant 18.083 ) Ukuran
Kondisi
Std. Error
Beta
Correlations
t
3.138
Sig. Zero-order Partial Part
5.763 .010
2.150
.186
.911
11.58 .001 5
.977
.989 .850
.703
.300
.184 2.344 .101
.511
.804 .172
a. Dependent Variable: Harga_jual
a. Persamaan regresi : Y = 18,083 + 2,150 X1 + 0,703 X2 Interpretasi a = 18,083 Tanpa dipengaruhi oleh variabel apapun, rata – rata harga jual adalah sebesar 18,083 juta rupiah. b1 = 2,150 Artinya, setiap kenaikan ukuran rumah sebanyak 100 meter persegi, maka rata – rata harga jual akan naik sebesar 2,15 juta rupiah dengan variabel kondisi rumah dianggap konstan. b2 = 0,703
Artinya setiap kenaikan kondisi rumah sebesar 1 satuan, maka rata – rata harga jual akan naik sebesar 0,703 juta rupiah dengan variabel ukuran rumah dianggap konstan. Model Summary
Model 1
R
R Square
.992a
Adjusted R Square
.984
Std. Error of the Estimate
.973
1.74516
a. Predictors: (Constant), kondisi, ukuran b. Koefisien determinasi : R2 = 0,973 (Adjusted R2) Koefisien nondeterminasi : K2 = 1 - R2 = 1 – 0,973 = 0,027 Artinya, variabel ukuran rumah dan variabel kondisi rumah mampu menjelaskan variasi dari harga jual rumah sebesar 97,3%, dan sisanya sebesar 2,7% dijelaskan oleh faktor lain di luar model.
Koefisien korelasi berganda (R) = 0,992 Artinya, hubungan keseluruhan antara variabel harga jual, variabel ukuran rumah, dan variabel kondisi rumah adalah searah dan sifatnya sangat erat yaitu sebesar 0,992. Correlations Harga_jual Pearson Correlation Harga_jual
Sig. (1-tailed)
ukuran
kondisi
1.000
.977
.511
Ukuran
.977
1.000
.358
Kondisi
.511
.358
1.000
.
.000
.150
Harga_jual
N
Ukuran
.000
.
.243
Kondisi
.150
.243
.
Harga_jual
6
6
6
Ukuran
6
6
6
Kondisi
6
6
6
Koefisien Korelasi Parsial : ry1.2 = 0,977 Artinya hubungan antara variabel ukuran rumah secara parsial terhadap variabel harga jual adalah searah dan sifatnya sangat erat dengan nilai sebesar 0,977, dengan menganggap variabel kondisi rumah konstan. ry2.1 = 0,511 Artinya hubungan antara variabel kondisi rumah secara parsial terhadap variabel harga jual adalah searah dan sifatnya cukup erat dengan nilai sebesar 0,511, dengan menganggap variabel ukuran rumah konstan. r12.y = 0,358 Artinya hubungan antara variabel ukuran rumah dan variabel kondisi rumah secara parsial adalah searah dan sifatnya lemah dengan nilai sebesar 0,358, dengan menganggap variabel harga jual konstan. 7. A university placement director is interested in the effect that grade point average (GPA) and the number of university activities listed on the resume might have on the starting salaries of this year’s graduating class. He has collected these data for a sample of 10 graduates: Starting Salary Graduate
(Thousand dollars)
1
40
Grade Point
Number of
Average
Activities
3,2
2
2
46
3,6
5
3
38
2,8
3
4
39
2,4
4
5
37
2,5
2
6
38
2,1
3
7
42
2,7
3
8
37
2,6
2
9
44
3,0
4
10
41
2,9
3
a. Determine the multiple regression equation and interpret the partial regression coefficients. b. Dave has a 3.6 grade point average and 3 university activities listed on his resume. What would be his estimated starting salary? Jawab : Coefficientsa Standardize d Unstandardized Coefficient Coefficients s Model 1
B
Std. Error
Beta
Correlations t
Sig. Zero-order Partial Part
(Constant 24.309 )
3.192
7.616
.000
GPA
3.842
1.234
.537 3.113
.017
.756
.762 .493
activities
1.681
.529
.548 3.177
.016
.763
.768 .503
Coefficientsa Standardize d Unstandardized Coefficient Coefficients s Model 1
B
Std. Error
Beta
Correlations t
Sig. Zero-order Partial Part
(Constant 24.309 )
3.192
7.616
.000
GPA
3.842
1.234
.537 3.113
.017
.756
.762 .493
activities
1.681
.529
.548 3.177
.016
.763
.768 .503
a. Dependent Variable: salary a. Regression Equation : Y = 24,309 + 3,842 X1 + 1,681 X2 Interpretation : a = 24,309 Without affected with no variable, the average of starting salary is about $24,309. b1 = 3,842 Every increasing of 1 point of GPA, the average of starting salary will be increase as much as 3,842, considering number of activities are constant. b2 = 1,681 Every increasing of 1 number of activities, the average of starting salary will be increase as much as 1,681, considering GPA variable are constant.
b. GPA = 3,6
Activities = 3 Y = 24,309 + 3,842 X1 + 1,681 X2 Y = 24,309 + 3,842 (3,6) + 1,681 (3) Y = 43,183.2 So, the estimate starting salary for Dave who has a 3.6 grade point average and 3 university activities listed on his resume is about $43,183.2.
CHI-SQUARE
Bila kita mempunyai dua macam proporsi dan kita ingin menguji apakah perbedaan antar kedua proporsi itu signifikan atau tidak, maka disini kita menggunakan pengujian hipotesa mengenai beda dua proporsi. Perluasan dari pada pengujian selisih proporsi (beda antara dua proporsi) adalah pengujian Chi Kuadrat, karena didalam pengujian ini kita mengadakan pengujian hipotesa tentang perbedaan proporsi dari proporsi yang banyaknya lebih dari dua. Dengan perkataan lain, pengujian 2 ada-lah pengujian hipotesa mengenai perbe-daan k proporsi dimana k 2 proporsi. Chi square merupakan suatu ukuran yang menyangkut perbedaan yang terdapat di antara frekuensi pengamatan dengan frekuensi teoritis/frekuensi harapan (Schaum’s). Maksud dari pengujian chi square adalah untuk membandingkan fakta yang diperoleh berdasarkan hasil observasi dan fakta yang didasarkan secara teoritis (Drs. Andi Supangat, M.Si.) Dalam statistik, distribusi chi-square (dilambangkan dengan χ2 BUKAN X2) termasuk dalam statistik nonparametrik. Distribusi nonparametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui. Distribusi ini sangat bermanfaat dalam melakukan analisis statistik jika kita tidak memiliki informasi tentang populasi atau jika asumsi-asumsi yang dipersyaratkan untuk penggunaan statistik parametrik tidak terpenuhi. Berikut ini beberapa hal yang berhubungan dengan chi square: a.
Adanya derajat kebebasan/ degree of freedom (df). Besarnya df menunjukan banyak observasi yang bebas untuk bervariasi sesudah batasan-batasan tertentu dikenakan pada data. (Sidney Siegel)
b.
Chi-square tidak pernah bernilai negatif. Hal ini dikarenakan selisih antara frekuensi data observasi ( f o ) dengan frekuensi data yang diharapkan dikuadratkan, yaitu f o f e 2
fe
c.
Jika χ2= 0 maka frekuensi-frekuensi teoritis sama dengan frekuensi pengamatan. Jika χ2>0 maka frekuensi-frekuensi teoritis tidak tepat sama dengan frekuensi pengamatan. Semakin besar nilai χ2 semakin besar pula perbedaan antara frekuensi yang diobservasi dan frekuensi teoritis.
d.
Distribusi chi-square adalah menceng kanan. Jika n nya sangat besar maka distribusi χ2 ini mendekati distribusi normal.
1. Penaksiran Standar Deviasi Dalam pembahasan sebelumnya telah di sampaikan bahwa pada umumnya ada dua cara menaksir, yakni titik taksiran dan interval taksiran. Titik taksiran untuk σ2 digunakan varians dari sampel yang dipakai sebagai bahan untuk menaksir. Guna mendapatkan interval taksiran parameter σ maka:
rumus :
s 2 (n 1)
2 / 2
dimana:
s 2 (n 1)
12 / 2
; df = n-1
s = standar deviasi n = banyaknya data yang diobservasi α = tingkat signifikansi
2 / 2 dan 12 / 2 didapat dari daftar distribusi chi-square dengan df = n-1 dan p masing-masing sama dengan dan 1- . 2
2
Uji Hipotesis Standar Deviasi Langkah-langkah pengujian standar deviasi: 1. Tentukan hipotesis awal dan alternatifnya Uji dua pihak
Uji pihak kanan
Uji pihak kiri
Ho : a
Ho : a
Ho : a
Ha : a
Ha : a
Ha : a
2. Tentukan uji kriteria distribusi χ dengan df = n-1 dan tingkat signifikansi α 3. Lakukan uji statistik pada data yang diobservasi dengan menggunakan rumus:
s n 1
4.
; df = n-1
Bandingkan nilai χ dengan nilai distribusi χ yang telah didapat pada langkah sebelumnya sesuai kriteia uji yang digunakan
5. Buat kesimpulan
Ho
tidak
dapat
ditolak Ho ditolak
Uji dua pihak
Uji pihak kanan
Uji pihak kiri
1 / 2 / 2
1
/ 2 1 / 2
1
2. Uji Chi-Square Dari Data Multinomial Uji ini dilakukan untuk meneliti peristiwa yang terdiri lebih dari dua golongan. Eksperimen yang dilakukan sebanyak n kali dan hasilnya dicatat, dikumpulkan menrut golongan atau kategorinya masing-masing lalu diperoleh sebuah data, data yang diperoleh demikian dinamakan data multinomial.(Sudjana) Langkah-langkah: 1. Tentukan hipotesis awal dan hipotesis alternatifnya Ho : 1 2 3 ... c Ha : terdapat paling sedikit satu tanda ≠ 2.
Tentukan nilai 2 pada distribusi chi-square dengan df = c-1 dan tingkat signifikansi α dimana c adalah banyaknya kolom dari data.
3.
Lakukan uji statistik dengan menggunakan rumus
2
Dimana:
( oi e j ) 2 ej
oi = data hasil observasi ej = data yang diharapkan atau diestimasikan lakukan uji kriteria dengan membandingkan nilai 2 dan 2 , yaitu:
4.
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak 5.
Buat kesimpulan
3. Uji Chi-Square dari Tabel Kontingensi Tabel kontingensi merupakan tabel klasifikasi dua arah yang terdiri dari banyak kolom dan banyak baris yang merupakan pengambangan konsep dari uji chi-square data multinomial yang menggunakan tabel klasifikasi satu arah atau hanya sebuah variabel saja. Langkah-langkah: 1. Tentukan hipotesis awal dan alternatifnya Ho : 11 12 13 ... 1c
21 22 23 ... 2c 31 32 33 ... 3c Ha : terdapat paling sedikit satu tanda ≠ 2. Tentukan nilai 2 dari distribusi chi-square dengan tingkat signifikansi α dan df = (r-1).(c-1), dimana r adalah banyaknya baris dari data dan c adalah banyaknya kolom dari data. 3. Lakukan uji statistik dengan menggunakan rumus:
2
o
eij
2
ij
eij
Dimana: oij= data hasil observasi dari baris ke-i kolom ke-j eij= data hasil estimasi dari baris ke-i kolom ke-j 4. Tentukan uji kriterianya
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak 5. Buat kesimpulan
Koefisien Kontingensi (C) Koefisien kontingensi yaitu bilangan yang digunakan untuk menentukan derajat hubungan antara dua faktor yang telah disusun dalam daftar kontingensi. Rumus: C
2 n 2
dengan nilai maksimum
Cmax
m 1 m
Dimana: n = banyaknya data m = banyaknya baris atau kolom minimal keterangan: Cmax-C < C, hubungan erat Cmax-C = C, hubungan cukup erat Cmax-C > C, hubungan kurang erat Tambahan Materi Lab 1. Interpolasi Berfungsi untuk mencari nilai 2𝛼 yang df atau v nya tidak ada nilai tepatnya dalam tabel (biasanya df atau v yang bernilai di atas 30). (C1−C0)
C = Co + (B1−B0) x (B − B0) Contoh : Mencari nilai 20,05 dengan nilai v = 55 dan jumlah sample (n = 5). maka, C0 = 67,5 ; C1 = 79,1 ; B0 = 50 ; B1 = 60 ; B = 55 C = 67,5 +
(79,1−67,5) (60−50)
x (55 − 50) = 73,3
Jadi, nilai 20,05 dengan v = 55 adalah 73,3. 2. Goodness of Fit Berfungsi untuk menguji, apakah proporsi yang dihasilkan dari perhitungan sama atau sesuai dengan proporsi yang seharusnya (dari data mentah). Hipotesis Ho : 1 2 ... n Ha : minimal ada satu tanda ≠ Menentukan nilai 2 Tentukan nilai 2 dari distribusi chi-square dengan tingkat signifikansi α dan df = c-1, dimana c adalah jumlah kolom pada data atau jumlah kelompok data. Menentukan nilai 2 :
2
(oi e j ) 2 ej
Bandingkan nilai 2 dengan 2 dengan kriteria :
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak Buat kesimpulan
Contoh Soal Materi Chi-Square Dilakukan suatu penelitian terhadap seorang penjual sepatu untuk mengetahui apakah ada pengaruh warna sepatu terhadap banyaknya sepatu yang
terjual. Berikut adalah hasil pengamatan sepatu berbagai warna selama satu periode tertentu:
Warna Sepatu Sepatu
Hitam
yang 90
Putih
Biru
Coklat
Total
55
25
30
200
terjual (unit)
Pada tingkat signifikansi 1% dapatkah disimpulkan bahwa warna sepatu tersebut berpengaruh terhadap banyaknya sepatu yang terjual?
Jawab: Ho: 1 2 3 4 Ha: terdapat paling sedikit satu ≠ df = c-1= 4-1 = 3 α = 1%
2 = 11, 3449 Uji statistik:
ej
o 200 50 e
2
4
o e2 e
2 2 2 2 90 50 55 50 25 50 30 50
50
50
Uji kriteria:
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak Ternyata 53>11,3449 atau 2 2 → Ho ditolak
50
50
53
Pada tingkat signifikansi 1% hasil pengamatan diatas menunjukkan bahwa warna sepatu mempengaruhi banyaknya sepatu yang terjual karena perbedaannya signifikan.
SOAL CHI-SQUARE 1. The Federal Correction Agency wants to investigate the question citied below : Does a male released from federal prison make a different adjustment to civilian life if he returns to his hometown or if he goes elsewhere to live? The agency’s psychologist interviewed 200 randomly selected former prisoners. Adjustment to civilian life Residence after released Outstanding
Good
Fair
Unsatisfactory
27
35
33
25
13
15
27
25
from prison Hometown Not hometown
To put it another way, is there a relationship between adjustment to civilian life and place of residence after released from prison? Jawab : Dik
: 𝛼 = 1% df = (r-1)(c-1) = (2-1)(4-1) = 3 𝜒𝛼2 = 11,345
Dit
: is there a relationship between adjustment to civilian life and place
of residence after released from prison? Jawab :
Residence after released from prison
Outstanding
Good
Fair
Unsatisfactory
Total
Hometown Not hometown Total
27
35
33
25
120
13
15
27
25
80
40
50
60
50
200
Ho : There is no relationship between adjustment to civilian life and place of residence after released from prison Ha : There is a relationship between adjustment to civilian life and place of residence after released from prison ∑𝑜𝑖𝑜 𝑥∑𝑜𝑜𝑗
𝑒𝑖𝑗 =
∑0
𝑒11 =
120 𝑥 40 200
= 24
𝑒21 =
80 𝑥 40 200
= 16
𝑒12 =
120 𝑥 50 200
= 30
𝑒22 =
80 𝑥 50 200
= 20
𝑒13 =
120 𝑥 60 200
= 36
𝑒23 =
80 𝑥 60 200
= 24
𝑒14 =
120 𝑥 50 200
= 30
𝑒24 =
80 𝑥 50 200
= 20
𝜒 2 = ∑∑ 𝜒2 = (27−24)2 24
+
(𝑜𝑖𝑗 −𝑒𝑖𝑗 )2 𝑒𝑖𝑗
(27−24)2 24
+
(35−30)2 30
+
(33−36)2 36
+
(25−30)2 30
+
(13−16)2 16
+
(15−20)2 20
(25−20)2 20
𝜒 2 = 5,729 𝜒 2 ≤ 𝜒 2 𝛼 Ho tidak dapat ditolak 𝜒 2 > 𝜒 2 𝛼 Ho ditolak Ternyata, 5,729 < 11,345 maka 𝜒 2 ≤ 𝜒 2 𝛼 Ho tidak dapat ditolak
+
Kesimpulan : At 1% significance level there is no relationship between adjustment to civilian life and place of residence after released from prison. 2. Simpangan baku dari kekuatan kabel yang dihasilkan oleh perusahaan Shiho adalah 100 kg. Didapat data dari industri penjualan kabel bahwa berdasarkan 8 sampel kabel yang diteliti, nilai simpangan bakunya adalah 120 kg. Telitilah, apakah proses dalam pembuatan kabel perusahaan Shiho mengalami perubahan variasi kekuatan kabel yang berarti atau tidak? Ujilah dengan tingkat signifikansi 1%! Jawab : Dik
: s = 100
df = n-1 = 8-1 = 7 𝛼 = 1%
n=8 𝜎 = 120 Dit
: apakah proses dalam pembuatan kabel perusahaan Shiho
mengalami perubahan variasi kekuatan kabel yang berarti atau tidak Jawab : Ho : 𝜎 = 120 Ha : 𝜎 ≠ 120 𝜒1−𝛼 = √0,989265 = 0,99462 2
𝜒𝛼 = √20,2777 = 4,50308 2
𝜒=
𝑠√𝑛−1 𝜎
𝜒=
100√8−1 120
𝜒 = 2,2048 Uji Kriteria
: 𝜒1−𝛼 ≤ 𝜒 ≤ 𝜒𝛼 Ho tidak dapat ditolak 2
2
𝜒 > 𝜒𝛼 Ho ditolak 2
𝜒 < 𝜒1−𝛼 Ho ditolak 2
Ternyata, 0,99462 < 2,2048 < 4,50308 maka 𝜒1−𝛼 ≤ 𝜒 ≤ 𝜒𝛼 Ho tidak 2
2
dapat ditolak Kesimpulan : Dengan tingkat signifikansi 1 %, maka proses dalam pembuatan kabel perusahaan Shiho tidak mengalami perubahan variasi kekuatan kabel yang berarti. 3. Simpangan baku dari masa hidup lampu pijar adalah 36 jam dengan sampel 26 buah. Tentukan batas-batas taksiran simpangan baku dari masa hidup seluruh produksi lampu, dengan menggunakan tingkat kepercayaan 95%! Jawab : Dik
𝛼 = 5%
: s = 36 n = 26
Dit
: taksiran simpangan baku
Jawab : df = n-1 = 26-1 = 25 𝜒 2 𝛼/2 = 40,6465 𝜒 21−𝛼/2 = 13,1197 𝑠2 (𝑛−1) 𝜒2 𝛼/2
√
362 (26−1) 40,6465
√
𝑠2 (𝑛−1)
< 𝜎 < √ 𝜒2 <𝜎<√
1−𝛼/2
362 (26−1) 13,1197
28,2325349 < 𝜎 < 49,69475489
Kesimpulan : Dengan tingkat signifikansi 5%, maka batas-batas taksiran simpangan baku dari masa hidup seluruh produksi lampu adalah antara 28,2325349 jam sampai dengan 49,69475489 jam.
4. In Indonesia radio market, there are four commercial radio station, each with its own morning quiz program from 08.00 to 09.00 am. According to report on today local newspaper, a random sample of 180 viewers last morning revealed 53 listened the quiz on Bee Radio, 64 listened on Hype Radio, 33 on Ixu Radio, and 30 listened on Boom Radio. At the 5% significance level, is there a difference in the proportion of listeners of four radio? Jawab : Radio
Bee
Hype
Ixu
Boom
Listeners
53
64
33
30
Dik
: 𝛼 = 5%
Dit
: is there a difference in the proportion of listeners of four radio?
Jawab : Ho : there is no difference in the proportion of listeners of four radio Ha : there is difference in the proportion of listeners of four radio 𝜒2 = ∑ 𝜒2 =
(𝑜𝑖 −𝑒𝑗 )2 𝑒𝑗
(53−45)2 45
+
(64−45)2 45
+
(33−45)2 45
+
(30−45)2 45
2
𝜒 = 1,42 + 8,02 + 3,2 + 5 = 17,64 df = 4-1 = 3 𝜒 2 𝛼 = 7,81473 𝜒 2 ≤ 𝜒 2 𝛼 Ho tidak dapat ditolak 𝜒 2 > 𝜒 2 𝛼 Ho ditolak Ternyata 17,64 > 7,81437 atau 𝜒 2 > 𝜒 2 𝛼 Ho ditolak Kesimpulan : At 5% significance level, there is difference in the proportion of listerners of the four radio.
5. Suatu penelitian diadakan untuk mengetahui apakah ada hubungan antara umur seseorang yang digolongkan dalam 3 kategori yaitu anak-anak, remaja, dan dewasa, dengan makanan kegemarannya. Makanan yang dapat dipilih ada tiga, yaitu makanan ringan kemasan, jajanan pasar, dan makanan berat. Hasilnya diberikan dalam daftar berikut : Makanan ringan kemasan
Jajanan pasar
Makanan berat
Anak-anak
130
270
16
Remaja
215
214
39
Dewasa
80
28
140
Apakah ada hubungan yang berarti antara golongan umur dan makanan yang digemari? Gunakan tingkat signifikansi 1%. Tentukan pula sifat hubungan tersebut! Jawab : Dik
: Makanan ringan kemasan
Jajanan
Makanan
pasar
berat
Jumlah
Anak-anak
130
270
16
416
Remaja
215
214
39
468
Dewasa
80
28
140
248
Jumlah
425
512
195
1132
df = (r-1)(c-1) = (3-1)(3-1) = 4 𝛼 = 1% Dit
: Apakah ada hubungan yang berarti antara golongan umur dan
makanan yang digemari? Jawab : Ho :
𝜋11 = 𝜋12 = 𝜋13
𝜋21 = 𝜋22 = 𝜋23 𝜋31 = 𝜋32 = 𝜋33 terdapat paling sedikit satu tanda ≠
Ha :
𝜒 2 𝛼 = 13,3
eij
o o o io
oj
416 425 156,183 1132 416 512 e12 188,155 1132 416 195 e13 71,661 1132 468 425 e21 175,707 1132 e11
e22 e23 e31 e32 e33
2
2 =
o
468 512 211,675 1132 468 195 80,618 1132 248 425 93,110 1132 248 512 112,170 1132 248 195 42,721 1132
eij
2
ij
eij
(130 − 156,183)2 (270 − 188,155)2 (16 − 71,661)2 + + 156,183 188,155 71,661 +
(215 − 175,707)2 (214−211,675)2 (39 − 80,618)2 + + 175,707 211,675 80,618
+
(80 − 93,110)2 (28 − 112,170)2 (140 − 42,721)2 + + 93,110 112,170 42,721
2 = 400,0387 2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak
Ternyata 400,0387 > 13,3
maka 2 2 → Ho ditolak
Kesimpulan : Dengan tingkat signifikansi 1% maka terdapat hubungan antara golongan umur dan makanan yang digemari.
C
2
Cmax
n 2
400,0387
C= √400,0387+1132 = 0,511
m 1 m
C max= √
3−1 3
= 0,8165
Kriteria : Cmax-C < C, erat Cmax-C = C, cukup erat Cmax-C > C, kurang erat Cmax-C = 0,8165 – 0,5111 = 0,3055 C = 0,5111 Ternayata 0,5111 > 0,3055, maka C > Cmax-C, erat Kesimpulan : Maka sifat hubungan antara golongan umur dan makanan yang digemari erat. 6. Classic Golf, Inc., manages six courses in the Jacksonville, Florida, area. The director of golf wishes to studt the number of rounds of golf played per 6 day in a week at the six courses. He gathered the following sample information shown below. At the 5% significance level, is there a difference in the number of rounds played by day of the week? Day
Monday
Tuesday
Wednesday Thursday
Friday
Saturday
Rounds
127
112
121
132
149
Jawab : Dik
: df = 6-1 = 5
109
𝛼 = 5% Dit
: is there a difference in the number of rounds played by day of the
week? Jawab : Ho : there is no difference in the number of rounds played by day of the week Ha : there is difference in the number of rounds played by day of the week 𝜒 2 𝛼 = 11,0705 2 2 127 125 112 125
\
2
125
125
2 149 125 ....
125
8,56
Kriteria :
2 2 → Ho tidak dapat ditolak 2 2 → Ho ditolak Ternyata 8,56 < 11,0705 atau 2 2 → Ho tidak dapat ditolak Kesimpulan : At 5% significance level, there is no difference in the number of rounds played by day of the week.
STATISTIK NON PARAMETRIK
Ringkasan Teori Di dalam ilmu statistika dikenal statistik parametrik dan statistik non parametrik. Istilah non parametrik pertama kali digunakan oleh Wolfowitz pada tahun 1942. Statistik nonparametrik merupakan bagian dari statistik inferensia atau induktif atau yang sering disebut juga dengan statistik bebas distribusi, dikarenakan statistik ini tidak memerlukan asumsi – asumsi tertentu tentang bentuk distribusinya dan juga tidak memerlukan uji hipotesis yang berhubungan dengan
parameter
–
parameter
populasinya.
Statistik
non-parametrik
merupakan statistik bebas sebaran (tidak mensyaratkan bentuk sebaran parameter populasi, baik normal atau tidak). Selain itu, statistik non-parametrik biasanya menggunakan skala pengukuran sosial, yakni nominal dan ordinal yang umumnya tidak berdistribusi normalBerikut ini merupakan perbedaan antara statistik parametrik dan non parametrik. Perbedaan
Parametrik
Non-Parametrik
Skala pengukuran
Skala interval dan rasio
Skala nominal dan ordinal
Bentuk distribusi
Harus diketahui bentuk
Tidak mempermasalahkan
distribusinya,
mis. bentuk distribusinya (bebas
berdistribusi normal atau distribusi). bentuk distribusi yang lainnya
(binomial,
poisson, dsb). Jumlah sampel
Jumlah atau sampel
sampel
besar, Sampel
kecilpun
bisa juga jumlah dipergunakan kecil
(misalnya
tetapi sampelnya (n) = 6.
memenuhi asumsi salah
dapat
satu bentuk distribusi.
Keunggulan uji statistika non-parametrik antara lain sebagai berikut: 1. Tidak membutuhkan asumsi normalitas. 2. Secara umum metode statistik non-parametrik lebih mudah dikerjakan dan lebih mudah dimengerti jika dibandingkan dengan statistik parametrik karena
ststistika
non-parametrik
tidak
membutuhkan
perhitungan
matematik yang rumit seperti halnya statistik parametrik. 3. Statistik non-parametrik dapat digantikan data numerik (nominal) dengan jenjang (ordinal). [Contoh data nominal (menurut namanya saja): PAN, PDI, PKS, GOLKAR; contoh data ordinal (terdapat urutan peringkat): memuaskan, sedang, buruk] 4. Kadang-kadang pada statistik non-parametrik tidak dibutuhkan urutan atau jenjang secara formal karena sering dijumpai hasil pengamatan yang dinyatakan dalam data kualitatif 5. Pengujian hipotesis pada statistik non-parametrik dilakukan secara langsung pada pengamatan yang nyata. 6. Walaupun pada statistik non-parametrik tidak terikat pada distribusi normal populasi, tetapi dapat digunakan pada populasi berdistribusi normal. 7. Dapat digunakan pada ukuran sampel yang kecil Kelemahan uji statistika non-parametrik antara lain sebagai berikut:: 1. Statistik non-parametrik terkadang mengabaikan beberapa informasi tertentu.
2. Hasil pengujian hipotesis dengan statistik non-parametrik tidak setajam statistik parametrik. 3. Hasil statistik non-parametrik tidak dapat diekstrapolasikan ke populasi studi seperti pada statistik parametrik. Hal ini dikarenakan statistik nonparametrik mendekati eksperimen dengan sampel kecil dan umumnya membandingkan dua kelompok tertentu Salah satu bagian penting dalam ilmu statistika adalah persoalan inferensi yaitu penarikan kesimpulan secara statistik. Dua hal pokok yang menjadi pembicaraan dalam statistik inferens adalah penaksiran parameter populasi dan uji hipotesis. Teknik inferensi yang pertama dikembangkan adalah mengenai pembuatan sejumlah besar asumsi sifat populasi di mana sampel telah diambil. Teknik yang banyak digunakan pada metode-metode pengujian hipotesis dan penafsiran interval ini kemudian dikenal sebagai statistik parametrik, karena nilainilai distribusi
populasi merupakan
parameter. Distribusi populasi
atau
variabel acak yang digunakan pada teknik inferensi ini mempunyai
bentuk matematik yang diketahui, akan tetapi memuat beberapa parameter yang tidak diketahui. Permasalahan
yang
harus
diselesaikan
adalah
menaksir
parameterparameter yang tidak diketahui tersebut dengan data sampel atau melakukan uji hipotesis tertentu yang berhubungan dengan parameter populasi. Pada kenyataannya sangatlah sulit untuk mendapatkan sampel yang memenuhi asumsi mempunyai distribusi tertentu. Kebanyakan sampel yang diperoleh hanyalah sebatas mendekati tertentu, seperti mendekati normal. Bahkan banyak juga sampel yang distribusinya tidak diketahui sama sekali. Oleh karena itu kemudian dikembangkan suatu teknik inferensi yang tidak memerlukan uji asumsi-asumsi
tertentu
mengenai
distribusi
sampelnya,
dan
juga
tidak
memerlukan uji hipotesis yang berhubungan dengan parameter populasinya. Teknik statistik ini dikenal dengan statistik non-parametrik.
Statistik
non-parametrik
adalah
statistik
yang
tidak
memerlukan
asumsiasumsi yang melandasi metode statistik parametrik, terutama tentang bentuk distribusinya, dan juga tidak memerlukan uji hipotesis yang berhubungan dengan parameter-parameter populasinya, oleh karena itu teknik ini dikenal juga dengan distribution-free statistics dan assumption-free test. Asumsi-asumsi berikut inilah yang harus dipenuhi dalam uji statistik parametrik:
Distribusi sampel diambil dari distribusi populasi yang terdistribusi secara normal
Sampel diperoleh secara random (mewakili populasi)
Skala pengukuran harus kontinyu(rasio/interval) atau skala nominal yang diubah menjadi proporsi
Pada uji t dan uji F untuk dua sampel atau lebih, kedua sampel diambil dari dua populasi yang mempunyai varians sama.
Ukuran
sampel
yang memadai
(direkomendasikan
> 30 per
kelompok) -central limit theorem Jika terjadi pelanggaran terhadap salah satu asumsi di atas, maka lebih baik digunakan
uji
statistik
non-parametrik.
Metode
non-parametrik
memiliki
keunggulan, di antaranya adalah tidak mengharuskan data berdistribusi normal dan syarat skala pengukuran datanya tidak terlalu ketat. Selain itu, dapat digunakan pada level data nominal dan ordinal. Grafik di bawah ini menunjukkan kondisi untuk memilih uji statistik nonparametrik.
Berikut ini adalah beberapa metode statistik non-parametrik yang sering digunakan: Metode
Non- Penjelasan
Parametrik Sign Test
Uji
yang
digunakan
terdapat perbedaan
untuk
yang
nyata
mengetahui atau
apakah
tidak
dari
pasangan data dengan skala ordinal. Data yang akan dianalisis dinyatakan dalam bentuk tanda-tanda yang tanda positif dan negatif. Biasanya digunakan pada kasus “sebelum sesudah”. Wilcoxon Signed Rank Sama seperti sign test tapi lebih menitikberatkan pada
Test
besaran perbedaannya.
Mc Nemar Test
Digunakan untuk menguji hipotesis komparatif dua sampel yang berkorelasi bila datanya nominal/diskrit. Rancangan penelitiannya biasanya berupa “before after”.
Mann-Whitney Test
Digunakan untuk menguji perbedaan dua populasi yang berupa dua sampel yang independen.
Kolmogorov Smirnov
Digunakan untuk goodness of fit test dan menguji dua
Test
sampel independen
(data
berbentuk
ordinal),
khususnya untuk perbedaan varians. Cox and Stuart Test
Digunakan untuk mengetahui tren suatu data yang minimal ordinal.
Spearman Correlation Digunakan untuk mengetahui hubungan atau untuk Test
menguji signifikansi hipotesis asosiatif bila masingmasing variabel berbentuk ordinal dan sumber datanya tidak sama.
Kruskal Wallis Test
Memiliki kegunaan sama seperti Mann Whitney tapi menggunakan lebih dari dua sampel.
Koefisien korelasi
Pada dasarnya mempunyai fungsi yang sama dengan
T-Kendall
koefisien
Spearman
(rs),
mempunyai kelebihan, yaitu
hanya
saja
T-kendall
dapat digeneralisasikan
menjadi koefisien korelasi parsial.
Menurut Ali Muhson (2013), berdasarkan tujuan ujinya, berikut merupakan jenisjenis statistik uji non-parametrik:
Uji Satu Sampel
Uji Dua Sampel Berpasangan
Uji Dua Sampel Independen
Uji k Sampel Berhubungan
Uji k Sampel Independen
Analisis Korelasi
Uji Binomial
Uji McNemar
Uji Fisher
Uji Q Cochran
Uji Chi-Square
Koefisien Kontingensi
Uji Chi-Square
Sign Test
Uji Chi-Square
Analisis Friedman
Uji Median
Korelasi Rank Spearman
Run Test
Uji Wilcoxon
Uji Median
Analisis Varians Ranking
Korelasi Tau Kendall
Uji KolmogorovSmirnov
Uji Walsh
Uji U MannWhitney
KruskallWallis
Korelasi Parsial Kendall
Uji Randomisasi
Uji Reaksi Ekstrem Moses Run Test WaldWolfowitz Uji KolmogorovSmirnov Uji Randomisasi
Koefisien Konkordasi Kendall W
NON-PARAMETRIK I
A. SIGN TEST Apabila kita telah menetapkan pasangan ukuran ordinal yang diambil dari subjek yang sama atau subjek yang dicocokkan, dan apabila kita hanya tertarik pada apakah terdapat perbedaan nyata atau tidak “sebelum dan sesudah” terjadi perlakuan tanpa memperhatikan perbedaan tersebut, maka prosedur uji tanda harus
digunakan. Diberi nama uji tanda karena pengujian dalam prosedur ini
menggunakan tanda tambah (+) dan tanda kurang (-) yang berfungsi mewakili arah perbedaan antara kedua sampel tersebut. Dengan demikian uji tanda tidak menggunakan ukuran kuantitatif untuk melihat perbedaan arah tetapi menggunakan tanda tambah atau kurang untuk menentukan tingkatan kedua responden yang didasarkan pada hubungan antara kedua sampel tersebut. Langkah – Langkah Penyelesaian Sign Test Problems 1. Bandingkanlah nilai dari pasangan data yang tersedia,
jika data
sebelum (x) lebih besar dari data sesudah (y) maka beri tanda “ + ”. Jika sebaliknya nilai x < y maka beri tanda “ – “, Tapi jika nilai data x = y maka data diabaikan atau dihilangkan. Namun ini tergantung pada data yang dibandingkan tetapi harus konsisten 2. Kemudian hitunglah jumlah data yang masuk kedalam masing – masing tanda baik + maupun –, lalu ambil data “ + ” = T 3. Lalu, buatlah Hipotesis untuk : 4. Menentukan kriteria pengujian Two-Tailed test
Lower tailed test
Upper tailed test
Ho : P (+) = P (-)
Ho : P (+) ≥ P (-)
Ho : P (+) ≤ P (-)
Ha : P (+) ≠ P (-)
Ha : P (+) < P (-)
Ha : P (+) > P (-)
Ho Tidak Dapat Ditolak Ho Ditolak
Uji Dua Pihak
Uji Pihak Kiri
Uji Pihak Kanan
t ≤ T ≤ n-t T
n–t
T≥t T
T ≤ n-t T > n-t
5. Menentukan nilai uji statistika Merupakan nilai probabilitas hasil sampel. (lihat tabel probabilitas binomial dengan n, x tertentu dan p = 0,5), dimana x = jumlah tanda yang terkecil 6. Untuk n > 20 maka kita dapat mengunakan distribusi normal.sebagai pendekatan distribsui binomial (gunakan tabel distribusi normal baku) dengan menggunakan faktor koreksi sebagai berikut: 1 (𝑇 ± 0,5) − 𝑛 2 𝑍= 1 2 √𝑛 Note : T + 0,5 jika T < ½ n, danT – 0,5 jika T > ½ n Kriteria:
Z < α maka 𝐻0 ditolak
Z > α maka 𝐻0 tidak dapat ditolak
7. Kesimpulan. Buatlah kesimpulan berdasarkan kepada apakah hipotesa tersebut tidak dapat ditolak atau dapat ditolak Contoh Soal: PT Patri Jasa telah melaksanakan sebuah training berupa English course kepada sejumlah karyawannya guna meningkatkan kemampuan karyawan tersebut dalam berbahasa Inggris. Untuk mengevaluasi hasil dari training tersebut, diambil sebanyak lima belas orang karyawan untuk menjadi sampel yang akan diukur
kemampuannya dalam berbicara bahasa Inggris dengan native speakers sebelum dan sesudah diadakan training tersebut dengan menggunakan skala berikut: 1 luar biasa 2 sangat baik 3 baik 4 cukup baik 5 kurang baik Berikut merupakan hasil penilaiannya: Pegawai
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Sebelum
3
4
2
5
2
3
5
2
3
5
3
4
3
3
5
Sesudah
1
2
3
3
2
1
4
1
5
3
1
2
4
1
3
Dengan tingkat signifikansi 5%, apakah terdapat perubahan yang signifikan pada kemampuan berbahasa Inggris karyawan di PT Patri Jasa tersebut sebelum dan sesudah diadakan training English Course? (Sumber: fiktif) Jawab: Pegawai
Sebelum
Sesudah
Tanda Perbedaan
1
3
1
+
2
4
2
+
3
2
3
-
4
5
3
+
5
2
2
0
6
3
1
+
7
5
4
+
8
2
1
+
9
3
5
-
10
5
3
+
11
3
1
+
12
4
2
+
13
3
4
-
14
3
1
+
15
5
3
+
Hipotesis ( uji 2 pihak ):
Ho: tidak adanya perbedaan kemampuan berbahasa Inggris sebelum dan setelah adanya training.
H1: terdapat perbedaan sebelum dan setelah training.
Pengujian
n = 14,tanda + = 11, tanda - = 3
Nilai T = 11
Nilai tabel untuk n=14 dan p =0,05 berdasarkan tabel binomial maka diperoleh nilai yang mendekati α = 0,05 adalah y = 0,0287 t = 3
Kriteria T < n - t Ho tidak dapat ditolak T ≥ n - t Ho ditolak
Ternyata T < n - t ( 11 ≥ 11 ) maka Ho ditolak
Kesimpulan Jadi,
dengan
taraf
signifikansi
5
%,
tidak
ada
perbedaan
kemampuan berbahasa Inggris karyawan PT Patri Jasa sebelum dan setelah adanya training English course.
B. WILCOXON SIGNED RANK TEST Ringkasan Teori Metode statistik non-parametrik populer lain yang digunakan untuk data berpasangan (matched / paired data), yaitu Wilcoxon Signed Rank Test. Wilcoxon signed rank test pertama sekali diperkenalkan oleh Frank Wilcoxon (1892–1965) pada tahun 1949 sebagai penyempurnaan dari uji tanda. Selain memperhatikan tanda dari perbedaan, uji ini juga memperhatikan besaran perbedaan yang diobservasi. Wilcoxon signed rank test merupakan test atau uji yang sangat berguna untuk ilmu pengetahuan sosial, dengan data sosial (seperti : tingkah laku manusia, sosial, antropologi, psikologi, dan lain lain). Langkah – langkah pengujian Wilcoxon Signes Rank Test: 1. Tentukan formulasi hipotesisnya, apakah uji 2 pihak atau 1 pihak 2. Untuk setiap pasangan tentukanlah selisihnya. 3. Rankinglah nilai selisih tersebut tanpa melihat tanda + atau -. 4. Berilah tanda pada setiap ranking (+ atau -) sesuai dengan tanda selisih yang dihasilkan. 5. Tentukanlah T = jumlah yang terkecil dari kedua kelompok ranking yang memiliki tanda yang sama. 6. Dengan menggunakan tabel uji wilcoxon dan dibantu dengan nilai α dan N hitunglah Tα 7. Tentukanlah N = banyaknya pasangan data yang memiliki selisih / tanpa tanda 0. 8. Pengujian yang dilakukan:
Jika N ≤ 20 menggunakan tabel uji Wilcoxon.
Jika N > 20, melakukan pengujian dengan nilai Z, dengan menggunakan tabel distribusi normal.
Kriteria:
Tolak Ho jika T hasil perhitungan ≤ T dari tabel sesuai dengan α yang telah ditentukan.
Untuk sampel yang besar N
>20, jumlah rangking T mendekati
distribusi normal.
Untuk sampel yang besar N >20. T = jumlah rangking +
(Mathematical statistics with aplication, KM Ramachandran: 615
𝜇𝑇 =
𝑁(𝑁+1) 4
𝑍=
𝑇−𝜇𝑇 𝜎𝑇
𝜎𝑇 = √
𝑁(𝑁+1)(2𝑁+1) 24
Kriteria Untuk N > 30 : Daerah penolakan apabila
z > zα
untuk upper tail
z < - zα untuk lower tail
|z|> zα/2 untuk two tail
9. Membuat kesimpulan Buatlah kesimpulan berdasarkan kepada apakah hipotesa tersebut tidak dapat ditolak atau dapat ditolak. Contoh Soal: Pada suatu universitas negeri di Bandung dilakukan penelitian untuk mengetahui pengaruh pemasangan wi-fi di area kampus dengan produktivitas mahasiswa/i. Pengumpulan data terhadap produktivitas mahasiswa/i dilakukan pada waktu wi-fi
sebelum
dipasang
dan
sesudah dipasang. Data produktivitas kerja
mahasiswa/i sebelum dipasang wi-fi adalah X dan sesudah dipasang adalah Y. Jumlah mahasiswa/i yang dijadikan sampel adalah 10 orang.
Mahasisw
Anit
Loi
Eva
Kar
Farh
Ham
Aly
Nin
Ep
Fau
a/i
a
s
n
a
at
di
a
a
a
zi
Sebelum
100
98
76
90
87
89
77
92
78
82
Sesudah
105
94
78
98
90
85
86
87
80
83
Dengan 𝛼 = 5%, hitunglah apakah ada pengaruh yang berarti bagi produktivitas mahasiswa/i sebelum dan sesudah pemasangan wi-fi di area kampus? (Sumber: fiktif) Jawab: Buatlah tabel seperti tertera di bawah ini kemudian lakukan perhitungan sesuai dengan langkah – langkah yang diberikan diatas.
Mahasiswa/i
X
Y
Beda (Y-X)
Tanda Ranking Ranking
-
+
Anita
100
105
5
7,5
Lois
98
94
-4
5,5
Evan
76
78
2
2,5
2,5
Kara
90
98
8
9,0
9,0
Farhat
87
90
3
4,0
4,0
Hamdi
89
85
-4
5,5
Alya
77
86
9
10,0
Nina
92
87
-5
7,5
Epa
78
80
2
2,5
2,5
Fauzi
82
83
1
1,0
1,0
JUMLAH
T = 18,5 dan n = 10
7,5 5,5
5,5 10,0 7,5
T
=
18,5
36,5
Hipotesis:
H0 = Pemasangan wi-fi di area kampus tidak mempunyai pengaruh terhadap produktivitas mahasiswa/i
H1 = Pemasangan wi-fi di area kampus mempunyai pengaruh terhadap produktivitas mahasiswa/i
Tarif nyata = 5 % dan n = 10 dengan melihat tabel t distribution atau tabel uji wilcoxon maka kita mendapatkan Tα = 11.
Kriteria pengujian :
H0 tidak dapat ditolak apabila T > Tα
H0 ditolak apabila T < Tα
Kesimpulan : Karena T = 18,5 dan Tα = 11, T > Tα, maka H0 tidak dapat ditolak. Jadi dengan taraf kepercayaan 95 % pemasangan wi-fi di area kampus tidak
mempunyai
pengaruh yang berarti terhadap produktivitas
mahasiswa/i.
C. MC NEMAR TEST
Uji
McNemar
digunakan
untuk
penelitian
yang
membandingkan sebelum dan sesudah peristiwa/treatment di mana tiap objek digunakan pengontrol dirinya sendiri. Uji ini dilakukan pada 2 sampel yang berhubungan, skala pengukurannya berjenis nominal (binary respons) dan untuk crostabulasi data 2 x 2. Contoh Soal: Seorang manajer salon ingin meningkatkan penjualan dari salah satu jasa di salonnya yaitu creambath. Untuk itu, dia akan melakukan sebuah penelitian untuk mengetahui perilaku konsumen. Diambil sampel sebanyak 200 orang pengunjung salon, kemudian bersamasama para pelayan salon melakukan promosi dan menawarkan secara
langsung kepada
calon
konsumen yang datang ke salon tersebut.
Diperoleh data konsumen yang ingin creambath sebelum promosi adalah 77 dan sisanya tidak creambath. Setelah dilakukan promosi, jumlah pengunjung sebanyak 13 orang yang tadinya ingin creambath jadi tidak creambath
dan 36 pengunjung
yang tadinya tidak akan
creambath
menjadi creambath. Dapatkah pemilik salon tersebut mengambil simpulan bahwa promosi creambath berpengaruh pada penjualan jasa creambath? (Sumber: Modul Statistika I 2012). Jawab: a. hipotesis:
Ho: P(Xi) = P(Yi) (Tidak ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi)
Ha: P(Xi) ≠ P(Yi) (Ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi) SESUDAH
SEBELUM
Tidak Membeli
Membeli
Jumlah
Tidak Membeli
87
36
123
Membeli
13
64
77
Jumlah
100
100
200
b. pengujian 𝜒2 =
(𝑏−𝑐)2 (𝑏+𝑐)
=
(36−13)2 (36+13)
= 10,79591837
𝑑𝑓 = (𝑟 − 1)(𝑐 − 1) = (2 − 1)(2 − 1) = 1 𝛼 = 5% Lihat tabel Chi-square 𝜒𝛼2 = 3,84146 c. kriteria:
𝜒 2 ≤ 𝜒𝛼2 → 𝐻𝑜 𝑡𝑖𝑑𝑎𝑘 𝑑𝑎𝑝𝑎𝑡 𝑑𝑖𝑡𝑜𝑙𝑎𝑘 𝜒 2 > 𝜒𝛼2 → 𝐻𝑜 𝑑𝑖𝑡𝑜𝑙𝑎𝑘 Ternyata, 𝜒 2 > 𝜒𝛼2 atau 10,79591837 > 3,84146 → Ho ditolak Kesimpulan Jadi, dengan tingkat signifikansi 5% manajer salon tersebut dapat mengambil kesimpulan bahwa promosi jasa creambath berpengaruh pada permintaan jasa creambath karena terdapat perubahan keinginan konsumen sebelum dan sesudah promosi dilakukan. CARA KOMPUTER Langkah-langkah: 1. Buka software SPSS 2. Pada lembar Variable View ketik sebelum pada baris 1 dan sesudah pada baris 2, untuk measure: pilih nominal 3. Masukkan data di Data View. 4. Klik Analyze Non Parametric Tests 2 Related Samples, pada menu maka kotak dialog Two Related Samples Tests akan muncul.
5. Blok sebelum dan sesudah sehingga aktif dan pindahkan ke kotak Test Pair(s) List dengan klik tombol panah sehingga muncul sebelumsesudah pada kotak tersebut. 6. Pada kotak Test Type, pilih McNemar 7. Klik Ok Maka diperoleh output sebagai berikut :
a. Hipotesis
Ho: P(Xi) = P(Yi) (Tidak ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi)
Ha: P(Xi) ≠ P(Yi) (Ada perubahan keinginan konsumen untuk menggunakan jasa creambath sebelum dan sesudah promosi)
b. Exact Sig. (2-tailed) dan Tingkat Signifikansi
Exact Sig. (2-tailed) = 0,002
𝛼 = 5%
c. Kriteria
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak
Exact Sig. (2-tailed) < α : Ho ditolak
d. Ternyata Exact Sig. (2-tailed) < α atau 0,002 < 0,05 Ho ditolak e. Kesimpulan Jadi, dengan tingkat kepercayaan 95% manager salon tersebut dapat
mengambil
kesimpulan
bahwa promosi
jasa
creambath
berpengaruh pada permintaan jasa creambath karena terdapat perubahan keinginan konsumen sebelum dan sesudah promosi dilakukan.
D. PROSEDUR NON PARAMETRIK 1 DENGAN APLIKASI Sebenarnya banyak sekali aplikasi pada komputer yang dapat kita gunakan untuk menguji Sign test, Wilcoxon Rank Test, dan Mc Nemar dengan komputer diantaranya seperti SPSS ( Statistical Program for Social Science), Minitab, E -Views, bahkan kita juga bisa menggunakan Microsoft Excel untuk bagian bagian tertentu yang tentu kita sudah familiar dengan itu, karena program SPSS lebih mudah untuk digunakan maka kita akan menggunakan program ini dalam penyelesaian persoalan Nonparametrik ini. Langkah – langkah : 1. Pada Komputer atau Laptop yang telah di instal program SPSS, klik Program SPSS tersebut. 2.
Pada Lembar Variable View isilah kotak yang tesedia yang nantinya akan menjadi label kolom pada lembar Data view.
3. Masukkan data pada Data view 4. Kemudian Klik Analyze Non Parametric Test 2 Related samples
5. Pindahkan isi kotak sebelah kiri ke kotak test pair(s) list dengan mengklik tombol panah yang berada di tengah – tengah 6. Jika ingin melakukan test sign test maka beri tanda √ pada sign test yang berada di kotak test type, begitu juga jika ingin melakuakn wilcoxon rank test dan Mc Nemar test. Lebih lanjut silahkan lihat contoh dibawah ini. Contoh soal: Universitas Padjadjaran setiap tahunnya menerima Mahasiswa baru melalui jalur – jalur khusus misalnya SMUP dan mahasiswa undangan. Guna mengetahui kualitas mahasiswa yang telah diterima melalui jalur tersebut, dilakukan test matrikulasi dan pihak pelaksana melakukan dua kali ujian yaitu sebelum program matrikulasi dilakukan dan setelahnya untuk mengetahui efektivitas program tersebut. Dan untuk itu diambil sampel sebanyak 15 orang dari IPA untuk mata ujian Statistika, dan diperoleh data ( α = 5 %). Peserta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Sebelum
67
54
67
55
87
60
70
45
54
66
73
88
80
65
75
Sesudah
66
75
80
60
78
89
65
70
68
75
74
85
89
90
75
(Sumber: Modul Statistika II 2012) Analisanya dalam SPSS adalah sebagai berikut ; 1. Buka Software SPSS 2. Pada Variable View ketikkan Sebelum pada Kolom nama baris 1 dan sesudah pada kolom nama baris ke 2 3.
Kemudian pada Data view masukkan data sebagai berikut.
4. Klik Analyze Nonparametric Test 2 Relates samples Aktifan Wilcoxon pada test type jika ingin melakukan wilcoxon rank test dan masukkan variabel yang akan di uji sebagaimana tampak pada kotak dialog :
Kemudian Klik OK maka akan muncul outputnya :
Dari output tersebut diperoleh: Negative Ranks atau selisih antara variabel sebelum dan sesudah yang negatif sebanyak 4 observasi atau dengan kata lain terdapat 4 observasi pada variabel sesudah yang kurang dari observasi pada variabel sebelum. Dan rata-rata rangkingnya = 4 dengan jumlah rangking negatif = 16. Positive Ranks atau selisih variabel sebelum dan sesudah yang positif sebanyak 10 observasi atau denga kata lain terdapat 10 observasi pada variabel sesudah yang lebih dari observasi pada variabel sebelum dengan ratarata rangkingnya = 8,90 dan jumlah rangking positif = 89. Ties atau tidak ada perbedaan antara variabel sebelim dan sesudah sebanyak 1 observasi. Oleh karena jumah rangking negatif lebih kecil dibanding rangking positif maka nilai T yang digunakan adalah jumlah rangking yang negatif. Selanjutnya dilakukan uji hipotesis: 1) Hipotesis
H0 : P = 0 (tidak ada perbedaan nilai tes sebelum matrikulasi dan sesudah matrikulasi)
H1 : P ≠ 0 (ada perbedaan diantara nilai tes sebelum matrikulasi dan sesudah matrikulasi )
Tingkat signifikansi 𝛼 = 0,05
2) Statistik Uji Untuk nilai statistik uji, tinjau tabel output berikut:
Dari tabel diperoleh nilai asymp sig = 0,022. 3) kriteria
H0 ditolak jika nilai asymp sig < α
Ho tidak dapat ditolak jika nilai asymp sign ≥ α
4) Kesimpulan Oleh karena asymp sig < α , (0,022 < 0,05 ) maka Ho ditolak yang berarti bahwa tidak ada perbedaan nilai Statistika calon mahasiswa sebelum dan sesudah mengikuti program matrikulasi.
SOAL NON-PARAMETRIK I 1. Kepala BPS Provinsi
“X” memutuskan untuk mengadakan program
pelatihan komputer bagi para Kepala Sub Bagian Tata Usaha (Kasubag TU) BPS Kab/Kota dengan tujuan untuk meningkatkan pengetahuan mereka tentang penggunaan komputer dalam pengelolaan data keuangan. Beberapa Kesubag TU merasa bahwa program tersebut hanya akan menghabiskan waktu mereka. Meskipun demikian, training tettap dilakukan dan akan diuji efektivitasnya. Data sampel diperoleh dari 15 Kasubag TU yang dipilih secara random. Sebelum training, panitia pelatihan terlebih dahulu telah mengukur kemampuan para Kasubag TU dalam bidang komputer. Dan setelah mengikuti
pelatihan, panitia yang sama kembali mengukur
kemampuan mereka, seperti pada tabel berikut. Lakukan pengujian apakah training efektif atau tidak efektif pada taraf nyata α=10%.
No.
Nama
Sebelum
Sesudah
1
A
Baik
Baik Sekali
2
B
Baik
Cukup
3
C
Kurang
Baik
4
D
Cukup
Baik
5
E
Baik Sekali
Baik
6
F
Cukup
Baik Sekali
7
G
Baik
Baik
8
H
Kurang
Cukup
9
I
Cukup
Baik
10
J
Baik Sekali
Baik
11
K
Baik
Cukup
12
L
Kurang
Baik
13
M
Baik
Baik Sekali
14
N
Cukup
Baik
15
O
Baik
Baik Sekali
Catatan: Tanda
“+”
menandakan
adanya
kemajuan;
menandakan adanya kemunduran, dan tanda “0” perubahan. (Sumber: Sekolah Tinggi Ilmu Statistik Jakarta 2013) Jawab: No.
Nama
Sebelum
Sesudah
Tanda
1
A
Baik
Baik Sekali
+
2
B
Baik
Cukup
-
3
C
Kurang
Baik
+
4
D
Cukup
Baik
+
5
E
Baik Sekali
Baik
-
6
F
Cukup
Baik Sekali
+
7
G
Baik
Baik
0
8
H
Kurang
Cukup
+
9
I
Cukup
Baik
+
10
J
Baik Sekali
Baik
-
11
K
Baik
Cukup
-
12
L
Kurang
Baik
+
13
M
Baik
Baik Sekali
+
14
N
Cukup
Baik
+
15
O
Baik
Baik Sekali
+
Hipotesis ( uji 1 pihak ):
tanda
“-”
tidak ada
Ho: tidak adanya perbedaan kemampuan sebelum dan setelah adanya training.
H1: terdapat perbaikan kemampuan setelah diadakan trainng
Pengujian
n = 14,tanda + = 10, tanda - =4
Nilai T = 10
Nilai tabel untuk n=14 dan p =0,5 berdasarkan tabel binomial maka diperoleh nilai yang mendekati α = 0,10 adalah y = 0,0898 t=4
Kriteria T ≤ n - t Ho tidak dapat ditolak T > n - t Ho ditolak
Ternyata T ≤ n - t ( 10 = 10 ) maka Ho tidak dapat ditolak
Kesimpulan Jadi, dengan taraf signifikansi 5 %, tidak ada perbedaan kemampuan berbahasa Inggris karyawan PT Patri Jasa sebelum dan setelah adanya training English course.
2. Montgomery, Peck, and Vining (2001) report on a study in which a rocket motor is formed by binding an igniter propellant and a sustainer propellant together inside a metal housing. The shear strength of the bond between the two propellant types is an important characteristics. The results of testing 20 randomly selected motors are shown in the table below. We would like to test the hypothesis that the median shear strength is 2000 psi, using 𝛼 = 0,05. Obse rvati on
1
2
3
4
5
6
7
8
9
10
Shear 2158.
1678.
2316.
2061.
2207.
1708.
1784.
2575.
2357.
2256.
Stren
70
15
00
30
50
30
70
10
90
70
11
12
13
14
15
16
17
18
19
20
Shear 2165.
2399.
1779.
2336.
1765.
2053.
2414.
2200.
2654.
1753.
Stren
55
80
75
30
50
40
50
20
70
gth
Obse rvati on
20
gth
(Sumber: Non-parametrics Statistics Chapter XV) Jawab:
Hipotesis ( uji 2 pihak ):
Ho: Median shear strength is 2000 psi
H1: Median shear strength is different from 2000 psi
Pengujian
n = 20,tanda + = 14, tanda - =6
Nilai T = 14
Nilai tabel untuk n=20 dan p =0,5 berdasarkan tabel binomial maka diperoleh nilai yang mendekati α = 0,05 adalah y = 0,0207 t=5
Kriteria T ≤ n - t Ho tidak dapat ditolak T > n - t Ho ditolak
Ternyata T ≤ n - t ( 14 < 20 − 5 ) maka Ho tidak dapat ditolak
Kesimpulan So, with 5% significance level, the median shear strength is not different from 2000 psi.
3. Two professors found the final formulas for their own made analgesic drugs at the same time. The table below shows the hours of relief provided by two analgesic drugs in 12 patients suffering from arthritis. If there is no evidence that one drug provides longer relief than the other, the patent worth $500.000 will be devided and each of them will get the same amount. The other way, the fully amount money will be received by him who found the most durable formula. With 𝛼=5%, please determine, how much money will one of those professors get.
(Sumber: fiktif) Jawab:
CARA KOMPUTER
Hipotesis ( uji 2 pihak ):
Ho: Tidak ada perbedaan lamanya efek obat A dan obat B
H1: Ada perbedaan lamanya efek obat A dan obat B
Kriteria :
Exact sig. (2-tailed) < α maka Ho ditolak
Exact sig. (2-tailed) ≥ α maka Ho tidak dapat ditolak
Kesimpulan : Ternyata 0,146 > 0,05 (Exact sig. (2-tailed) > α) maka Ho tidak dapat ditolak Jadi, dengan tingkat signifikansi 0,05, tidak ada perbedaan lamanya efek obat yang ditemukan profesor satu dan lainnya, sehingga masingmasing akan mendapatkan $250.000.
CARA MANUAL
CASE
Drug A
Drug B
Sign
1
2.0
3.5
+
2
3.6
5.7
+
3
2.6
2.9
+
4
2.6
2.4
-
5
7.3
9.9
+
6
3.4
3.3
-
7
14.9
16.7
+
8
6.6
6.0
-
9
2.3
3.8
+
10
2.0
4.0
+
11
6.8
9.1
+
12
8.5
20.9
+
Pengujian
n = 12,tanda + = 9, tanda - =3
Nilai T = 9
Nilai tabel untuk n=12 dan p =0,5 berdasarkan tabel binomial maka diperoleh nilai yang mendekati α = 0,05 adalah y = 0,0193 t=2
Kriteria T ≤ n - t Ho tidak dapat ditolak T > n - t Ho ditolak
Ternyata T ≤ n - t ( 9 < 10) maka Ho tidak dapat ditolak
Kesimpulan Jadi, dengan tingkat signifikansi 0,05, tidak dapat perbedaan lama efek obat yang ditemukan kedua profesor, sehingga masing-masing profesor mendapat $250.000.
1.
Demi menunjang kompetensi dan produktivitas mahasiswa/i di sebuah perguruan tinggi negeri di Bandung, rektor perguruan tinggi tersebut mengeluarkan aturan baru untuk mengadakan ujian tertulis per bulan untuk setiap mata kuliah. Untuk mengevaluasi kebijakan tersebut, setiap fakultas, tak terkecuali Fakultas Ekonomi dan Bisnis mengadakan penelitian. Penlitian tersebut diadakan dengan mengambil sepuluh orang mahasiswa/i sebagai sampel dan mendata rata-rata nilai UAS mereka pada semester I (sebelum kebijakan ulangan per bulan diadakan) dan semester II (setelah kebijakan diadakan). Apabila ternyata kebijakan tersebut membuat nilai UAS mahasiswa/i lebih baik, maka akan dilanjutkan untuk periode selanjutnya. Dengan tingkat signifikansi sebesar 5%, bantulah rektor universitas tersebut dalam membuat kebijakan bagi kampusnya.
Nama
Mawar Melati Dahlia Lily Tulip Kamboja Anggrek Teratai Lavender Sakura
Sebelum 80
80
80
80
80
80
80
80
80
80
80
75
90
87
85
77
60
70
85
90
Sesudah
(Sumber: Modul Statistika II 2012, diolah kembali) Jawab:
Hipotesis:
H0= ada peningkatan nilai siswa setelah diadakannya ulangan
H1= tidak ada peningkatan nilai setelah diadakanya ulangan
CARA KOMPUTER Uji statistik : Dengan menggunkan prosedur yang telah dijelaskan diatas pada SPSS maka kita mendapatkan outputnya sebagai berikut :
Uji statistik ditunjukkan pada tabel test statistik diatas yaitu Exact sign. (2tailed) =0,765. Nilai uji ini nantinya akan dibandingkan dengan α = 0,05
Kriteria :
Exact sig. (2-tailed) < α maka Ho ditolak
Exact sig. (2-tailed) ≥ α maka Ho tidak dapat ditolak
Kesimpulan : Ternyata 0,765 > 0,05 (Exact sig. (2-tailed)> α) maka Ho tidak dapat ditolak. Jadi dengan taraf signifikansi 5 %, Nilai – nilai mahasiswa/i tidak meningkat setelah adanya kebijakan ulangan per bulan. Sehingga kebijakan tersebut sebaiknya dihapuskan.
CARA MANUAL
Kriteria :
T + / T – terkecil ≤ T tabel H0 ditolak
T + / T – terkecil > T tabel H0 tidak dapat ditolak
T hitung dan T tabel :
T hitung = jumlah ranking terkecil = 20
T tabel = dicari dengan menggunakan tabel wilcoxon dengan n (jumlah sampel tanpa tanda nol ) = 9, α = 5 % maka didapatkan T tabel = 9
Kesimpulan : Karena T hitung > T tabel, 20 > 9, maka H0 tidak dapat ditolak. Jadi dengan taraf signifikansi 5%, Nilai – nilai mahasiswa/i tidak meningkat setelah diadakanya ulangan per bulan. Sehingga kebijakan tersebut sebaiknya dihapuskan.
2. Grahamedia & Co. is one of the most profitable bookstore & publisher in Indonesia. It has many outlets spread around the country. Beside selling its products directly in the bookstores, Grahamedia & Co. has also served their customers who like to order books online. The customers can access its
website and easily pay the books they order via credit cards. The price list is shown in the table below.
As a student who needs books to support your academy process but has limited budget, will purchasing online be more satisfying? (𝛼 = 5%) (Sumber: Wilcoxon Signed Ranks Test: Nonparametric Analysis for Two Related Populations, diolah kembali) Jawab:
Hipotesis H0 = Harga buku di toko buku dan online tidak berbeda H1 = Harga buku di toko buku lebih mahal daripada online Jumlah R+ = 144 Jumlah R- = 46
Kriteria :
T + / T – terkecil ≤ T tabel H0 ditolak
T + / T – terkecil > T tabel H0 tidak dapat ditolak
T hitung dan T tabel :
T hitung = jumlah ranking terkecil = 46
T tabel = dicari dengan menggunakan tabel wilcoxon dengan n (jumlah sampel tanpa tanda nol ) = 19, α = 5 % maka didapatkan T tabel = 54
Kesimpulan : Karena T hitung ≤ T tabel, 46 < 54, maka H0 ditolak. Jadi
dengan
taraf
signifikansi
5%,
dapat disimpulkan bahwa
berbelanja online lebih memuaskan bagi mahasiswa karena harganya lebih murah.
3. An economist who is interested in public economics had a thought that political constellation in Indonesia will affect financial market, especially banking, by rising interest rate. He said that market will respond quickly to big political events due to the expectation. To test his theory, a curious economics student collects quarterly deposit rate datas from ten private banks and eight public banks before and after the election day. With 1% significance level, please determine whether the economist’s thought were right or wrong. Bank
Deposit Rate Before (%)
Deposit Rate After (%)
1
5,50
5,60
2
5,75
5,60
3
5,75
6,00
4
6,00
6,00
5
3,00
5,55
6
5,88
5,75
7
6,50
6,75
8
7,30
7,45
9
5,88
6,00
10
6,25
6,50
11
5,50
5,58
12
5,75
5,88
13
6,00
6,00
14
5,75
6,50
15
5,50
5,50
16
5,50
6,00
17
6,25
6,50
18
6,88
7,30
Jawab:
Ho: p(+) = p(-), pemilu tidak meningkatkan tingkat bunga deposito 3 bulanan H1: p(+) > p(-), pemilu meningkatkan tingkat bunga deposito 3 bulanan α : 0,01 Deposit
Deposit
Rate
Rate
Before (%)
After (%)
1
5,50
5,60
2
5,75
3
Bank
D1
Rank
Rank (+)
0,10
2
2
5,60
-0,15
6,5
5,75
6,00
0.25
9,5
9,5
4
6,00
6,00
0
-
-
5
3,00
5,55
2,55
15
15
6
5,88
5,75
-0,13
4,5
7
6,50
6,75
0,25
9,5
9,5
8
7,30
7,45
0,15
6,5
6,5
9
5,88
6,00
0,12
3
3
10
6,25
6,50
0,25
9,5
9,5
11
5,50
5,58
0,08
1
1
12
5,75
5,88
0,13
4,5
4,5
13
6,00
6,00
0
-
-
14
5,75
6,50
0,75
14
14
15
5,50
5,50
0
-
-
16
5,50
6,00
0,50
13
13
17
6,25
6,50
0,25
9,5
2,5
18
6,88
7,30
0,42
12
12
(after-before)
Total
Hipotesis H0 = Pemilu tidak menyebabkan tingkat suku bunga naik H1 = Pemilu menyebabkan tingkat suku bunga naik
Rank (-)
6,5
-
4,5
102
-
-
11
Jumlah R- = 11
Kriteria :
T + / T – terkecil ≤ T tabel H0 ditolak
T + / T – terkecil > T tabel H0 tidak dapat ditolak
T hitung dan T tabel :
T hitung = jumlah ranking terkecil = 11
T tabel = dicari dengan menggunakan tabel wilcoxon dengan n (jumlah sampel tanpa tanda nol ) = 15, α = 1 % maka didapatkan T tabel = 20
Kesimpulan : Karena T hitung ≤ T tabel, 11 < 20, maka H0 ditolak. Jadi dengan taraf signifikansi 1%, dapat disimpulkan bahwa pemilu dapat meningkatkan suku bunga deposito dan pernyataan sang ekonom tersebut benar.
4. Diambil sampel 50 orang, mereka diminta untuk menentukan pemilihan Kepala Desa yang akan dipilih. Data di ambil sebelum dan sesudah debat dari 2 calon Kepala Desa. Calon A diwakili angka 1 dan Calon B diwakili angka 2. Dengan tingkat kepercayaan 95%, apakah terdapat perbedaan atau perubahan pilihan terhadap calon Kepala Desa setelah debat dilakukan? Data sebagai berikut :
(Sumber: http://susenobimo.blogspot.com) Jawab: CARA KOMPUTER Langkah-langkah SPSS: 1) Klik Analyze > Nonparametric Test > 2 Related Samples 2) Masukkan kedua variabel ke dalam kolom Test Pairs List 3) Pilih McNemar 4) Klik OK
Hipotesis: H0 = Tidak terdapat perubahan yang signifikan pemilihan kepala desa sebelum dan sesudah debat. H1 = Terdapat perubahan yang signifikan pemilihan kepala desa sebelum dan sesudah debat. Kriteria uji:
Exact Sig. (2-tailed) ≥ α : Ho tidak dapat ditolak Exact Sig. (2-tailed) < α : Ho ditolak
Output SPSS
Kesimpulan Tabel pertama menunjukan hasil crosstabulasi data sebelum dan sesudah debat dilakukan. Dari tabel Test Statistic diketahui Exact Sig. (2-tailed) > α atau (0,000< 0,05) maka tolak hipotesis nol (H0) yang artinya ada perubahan yang signifikan pemilihan kepala desa sebelum dan sesudah debat dilakukan dengan taraf nyata 5%.
CARA MANUAL After
Before
Calon 1
Calon 2
TOTAL
Calon 1
3 (a)
6 (b)
9
Calon 2
38 (c)
3 (d)
41
TOTAL
41
9
50
𝜒2 =
(𝑏 − 𝑐)2 (6 − 38)2 1024 = = = 23,272727 (𝑏 + 𝑐) (6 + 38) 44
𝑑𝑓 = (𝑟 − 1)(𝑐 − 1) = (2 − 1)(2 − 1) = 1 𝛼 = 5% Look chi-square table 𝜒𝛼2 = 3,84146
Kriteria
𝜒 2 ≤ 𝜒𝛼2 Ho tidak dapt ditolak
𝜒 2 > 𝜒𝛼2 Ho ditolak
Ternyata, 23,272727 > 3,84146 atau 𝜒 2 > 𝜒𝛼2 , maka Ho ditolak. Jadi, dengan tingkat kepercayaan 95%, ada perubahan yang signifikan pemilihan kepala desa sebelum dan sesudah debat dilakukan.
5. A researcher wanted to investigate the impact of an intervention on smoking. In this hypothetical study, 50 participants were recruited to take part, consisting of 25 smokers and 25 non-smokers. All participants watched an emotive video showing the impact that deaths from smokingrelated cancers had on families. Two weeks after this video intervention, the same participants were asked whether they remained smokers or nonsmokers.Therefore, participants were categorized as being either smokers or non-smokers before the intervention and then re-assessed as either smokers or non-smokers after the intervention.
With 5% significance level, please determine whether the proportion of non-smokers statistically significantly different after the intervention as compared to before or not.
(Sumber: Laerd Statistics, McNemar's test using SPSS) Jawab: After
Before
Non-Smoker
Smoker
TOTAL
Non-Smoker
20 (a)
5 (b)
25
Smoker
16 (c)
9 (d)
25
TOTAL
36
14
50
𝜒2 =
(𝑏 − 𝑐)2 (5 − 16)2 121 = = = 5,761904762 (𝑏 + 𝑐) (5 + 16) 21
𝑑𝑓 = (𝑟 − 1)(𝑐 − 1) = (2 − 1)(2 − 1) = 1 𝛼 = 5% Look chi-square table 𝜒𝛼2 = 3,84146
Kriteria
𝜒 2 ≤ 𝜒𝛼2 Ho tidak dapat ditolak
𝜒 2 > 𝜒𝛼2 Ho ditolak
Ternyata, 5,761904762 > 3,84146 atau 𝜒 2 > 𝜒𝛼2 , maka Ho ditolak. Jadi, dengan tingkat kepercayaan 95%, ada perubahan
antara jumlah
populasi perokok dan bukan perokok sebelum dan setelah adanya intervensi video.
NON-PARAMETRIK II
Data pada penelitian kuantitatif dianalisis dengan cara tertentu yaitu menggunakan statistik. Statistik tersebut dibagi menjadi dua kelompok, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif adalah jenis statistik yang
menganalisis
data
populasi
dengan
cara
mendeskripsikan
atau
menggambarkan data yang telah terkumpul, dan tanpa membuat kesimpulan yang berlaku umum. Sedangkan statistik inferensial adalah jenis statistik yang menganalisis data sampel, dan membuat generalisasi (diberlakukan secara umum) pada populasi. Statistik inferensial kemudian dibedakan menjadi statistik parametrik dan statistik non-parametrik. Statistik parametrik mensyaratkan banyak asumsi, yaitu asumsi tentang kenormalan data, homogenitas data, dan datanya berupa interval atau rasio. Sedangkan statistik non-parametrik tidak memerlukan asumsiasumsi di atas terpenuhi. Statistik non-parametrik dipakai apabila peneliti tidak mengetahui karakteristik kelompok item yang menjadi sumber sampelnya. Metode ini dapat diterapkan terhadap data yang diukur dengan skala ordinal dan dalam kasus tertentu, dengan skala nominal. Pengujian non-parametrik bermanfaat untuk digunakan apabila sampelnya kecil dan lebih mudah dihitung daripada metode parametrik. Metode ini digunakan untuk situasi berikut: 1. Apabila ukuran sampel demikian kecil sehingga distribusi statistik pengambilan sampel
tidak mendekati normal, dan
apabila tidak ada asumsi yang dapat dibuat tentang bentuk distribusi populasi yang menjadi sumber sampel. 2.
Apabila digunakan data peringkat atau ordinal. (Data ordinal hanya memberikan informasi tentang apakah suatu item lebih
tinggi, lebih rendah, atau sama dengan item lainnya; data ini sama sekali tidak menyatakan ukuran perbedaan). 3. Apabila digunakan data nominal. (Data nominal adalah data dimana sebutan seperti laki-laki atau perempuan diberikan kepada item dan tidak ada implikasi dalam sebutan tersebut).
A. SPEARMAN Koefisien korelasi peringkat sperman, rs, adalah ukuran erat-tidaknya kaitan antara dua variabel ordinal; artinya rs merupakan ukuran atas kadar/derajat hubungan antara data yang telah disusun menurut peringkat (ranked
data) (Supranto, Johanes; 2001). Koefisien korelasi
(r) dihitung
dengan menggunakan nilai aktual dari X dan Y, sedangkan koefisien Spearman yang akan kita bicarakan berikut ini menggunakan nilai peringkat untuk X dan Y, dan bukan nilai aktual. Hipotesis a. Two-tailed tes
H0: tidak ada korelasi antara variabel X dengan variabel Y (independent)
H1 : ada korelasi antara variabel X dengan variabel Y (dependent)
b. Lower-tailed test untuk korelasi negatif
H0: tidak ada korelasi antara variabel X dengan variabel Y (independent)
H1: ada kecenderungan untuk nilai yang lebih kecil dari X untuk dipasangkan dengan nilai lebih besar dari Y, dan sebaliknya.
c. Upper-tailed test untuk korelasi positif
H0 : tidak ada korelasi antara variabel X dengan variabel Y (independent)
H1 : ada kecenderungan untuk nilai lebih besar dari X dan Y untuk dipasangkan bersama-sama
Prosedur penghitungan koefisien korelasi peringkat Spearman: 1. Menyusun peringkat data 2. Menghitung perbedaan antara pasangan peringkat 3. Menghitung rs Tidak ada angka yang sama 2 6 ∑𝑛 𝑖−1 𝑑𝑖
𝑟𝑠 = 1 − (
𝑛(𝑛2 −1)
)
Dimana: rs = koefisien korelasi Spearman d = selisih antara rank X dan rank Y = R(X) – R(Y) n = jumlah pasangan Ada angka yang sama 𝒏+𝟏 𝟐 ) 𝟐
∑𝒏 𝒊=𝟏 𝑹(𝑿𝒊)𝑹(𝒀𝒊)−𝒏(
𝒓𝒔 =
𝟐 (∑𝒏 𝒊=𝟏 𝑹(𝑿𝒊) −𝒏(
𝟏 𝟏 𝒏+𝟏 𝟐 𝟐 𝒏 𝒏+𝟏 𝟐 𝟐 ) ) (∑𝒊=𝟏 𝑹(𝒀𝒊)𝟐 −𝒏( ) ) 𝟐 𝟐
(Sumber: Conover, W.J. 1999. Practical Nonparametric Statistics. United States of America: John Wiley) Kendall berpendapat bahwa nilai rs terletak antara: -1 ≤ rs ≤ 1 -1 : mempunyai korelasi sempurna tetapi berlawanan atau negatif 0 : tidak ada atau tidak mempunyai korelasi 1 : mempunyai korelasi sempurna dan searah atau positif 4. Menghitung Wp dengan menggunakan tabel Quantiles of Spearman’s 5. Bandingkan nilai rs dan Wp dengan kriteria: a. Two-tailed test |rs| ≤ W1- α/2 H0 tidak dapat ditolak |rs|> W1- α/2 H0 ditolak b. Lower-tailed test untuk korelasi negatif rs ≥ -W1-α H0 tidak dapat ditolak
rs < -W1-α H0 ditolak c. Upper-tailed test untuk korelasi positif rs ≤ W1-α H0 tidak dapat ditolak rs > W1-α H0 ditolak 6. Menarik kesimpulan Menggunakan SPSS Langkah-langkah
menyelesaikan
korelasi
peringkat
Spearman
dengan
menggunakan SPSS: 1. Buka software SPSS 2. Pilih menu FileNewData 3. Klik Variable View pada data editor, kemudian buat variabel yang telah ditentukan 4. Klik Data View kemudian isilah sesuai variabel yang telah dibuat 5. Mengolah data: a) Pilih menu Analyze, pilih submenu Correlate kemudian klik Bivariate b) Pilih variabel yang akan dikorelasikan ke dalam Test Variables c) Klik Spearman dan Two-tailed / One-tailed test pada kolom Test of Significance d) Klik Flag Significant Correlation e) Klik OK
6. Menarik kesimpulan: Kriteria: Sig α ≥ α Ho tidak dapat ditolak Sig α < α H0 ditolak
Contoh Soal Seorang manajer personalia ingin mengetahui apakah ada hubungan antara prestasi kerja seseorang dengan tingkat kecerdasan (diukur dengan IQ). Untuk itu, diambil 9 orang pekerja dan seorang supervisor diminta memberi penilaian pada tiap pekerja tersebut tentang prestasi kerjanya. Gunakan taraf nyata 5%! Pekerja
Prestasi
IQ
1
84
110
2
85
100
3
87
108
4
92
103
5
91
102
6
96
97
7
83
124
8
89
130
9
88
116
(Sumber: Modul Statistika II 2011) Jawab:
Hipotesis
H0: tidak ada hubungan antara prestasi pekerja dan IQ-nya
H1: ada hubungan antara prestasi pekerja dan IQ-nya 6 ∑𝑛 𝑑 2
𝑖 𝑟𝑠 = 1 − ( 𝑛(𝑛𝑖−1 2 −1) )
6 𝑥 162
𝑟𝑠 = 1 − (9(92 −1)) 972
𝑟𝑠 = 1 − (720) 𝑟𝑠 = −0,35 𝑛=9 Wp = W1-α/2 = W1-0,05/2 = W0,975 = 0,6833
Kriteria: |rs| ≤ W1- α/2 H0 tidak dapat ditolak |rs| > W1- α/2 H0 ditolak
Ternyata : |0,35| < 0,6833 H0 tidak dapat ditolak
Menggunakan SPSS
Kriteria: Sig α ≥ α H0 tidak dapat ditolak Sig α < α H0 ditolak
Ternyata: 0,356 > 0,05 H0 tidak dapat ditolak
Kesimpulan: Pada tingkat signifikansi 5% tidak ada hubungan antara prestasi pekerja dan IQ-nya.
B. MANN-WHITNEY Asumsi :
Sampelnya adalah sampel acak dan kedua sampel saling bebas / independen.
Memiliki dua variabel, yaitu variabel independen (categorical) dan dependen (continuous or ordinal).
Yang diuji pada uji Mann Whitney ini adalah adanya perbedaan pengaruh pada dua buah sampel bebas yang diambil dari satu atau dua buah populasi.
Mann-Whitney dapat digunakan ketika jumlah data pada kedua sampel tidak seimbang.
Hipotesis yang akan diuji adalah :
H0 : Tidak ada perbedaan peringkat untuk kedua cara
H1 : Peringkat yang lebih tinggi akibat efek dari salah satu cara.
Misalkan X1, X2,…,Xn sampel acak untuk populasi pertama dan Y1,Y2,…,Ym sampel acak untuk populasi kedua. Misalkan R(Xi) adalah peringkat untuk Xi dan R(Yi) adalah peringkat untuk Yi. Sehingga hipotesis yang akan diuji adalah:
H0: E(X) = E(Y)
H1: E(X) ≠ E(Y)
CONOVER Prosedur pengujian:
1. Menyatakan hipotesis dan α Hipotesis: Uji Dua Pihak
Uji Pihak Kanan
Uji Pihak Kiri
H0: P(X) = P(Y)
H0: P(X) = P(Y)
H0: P(X) = P(Y)
Ha: P(X) ≠ P(Y)
Ha: P(X) > P(Y)
Ha: P(X) < P(Y)
2. Menyusun peringkat data tanpa memperhatikan kategori sample (gabungan) 3. Menjumlahkan peringkat di setiap kategori sample yang telah digabungkan dan hitung T-statistik.
Jika tidak ada peringkat yang sama atau hanya sedikit yang sama peringkatnya maka statistic ujinya: 𝑛
𝑆 = ∑ 𝑅(𝑋𝑖) 𝑖=1
𝑛1 (𝑛1 + 1) 2 Jika Banyak peringkat yang seri maka statistic ujinya: 𝑇=𝑆−
𝑆−𝑛
𝑇1 =
𝑁+1 2
𝑛𝑚(𝑁 − 1) 𝑛𝑚 ∑𝑁=𝑛+𝑚 𝑅12 − 𝑖=1 𝑁(𝑁 − 1) 4(𝑁 − 1)
√
4. Lihat table, tentukan nilai table ( Wα ) 5. Lakukan pengujian kriteria:
Ho Tidak Dapat Ditolak Ho Ditolak
Uji Dua Pihak
Uji Pihak Kiri
Uji Pihak Kanan
Wα/2 ≤ T ≤W1-α /2
T ≥Wα
T ≤ W1-α
T < Wα
T > W1-α
T < Wα /2 T > W1-α/2
Keterangan: W1-α/2 = n(N+1) - Wα /2 W1-α = n(N+1) - Wα 6. Untuk n > 20, pakai rumus : 𝑊𝛼 =
𝑛𝑚 2
+ 𝑋𝑝
√𝑛𝑚(𝑛+𝑚+1) 12
CARA KOMPUTER 1. Masuk ke SPSS 2. Masuk ke Variable View, measure Ordinal 3. Masukkan data ke dalam Data View (gabungkan sample 1 & sample 2 dalam 1 kolom) 4. Kolom 1 = [dependent variable], kolom 2 = [independent variable] (isikan 0 untuk grup [dependent variable] & 1 untuk [independent variable]) 5. Masuk ke Analyze, klik Nonparametric Test 6. Klik 2 Independent sample, masukkan [dependent variable] di Test Variable List dan [independent variable] di Grouping Variable 7. Klik Define Group, masukkan grup 1 = 0, grup 2 = 1, continue 8. Checklist Mann-Whitney, OK Kriteria computer:
Exact Sig (1-tailed) ≥ α, H0 tidak dapat ditolak Exact Sig (1-tailed) < α, H0 ditolak
Asymp Sig (2-tailed) ≥ α, H0 tidak dapat ditolak Asymp Sig (2-tailed) < α, H0 ditolak
Contoh Soal Berikut ini adalah data mengenai pendapatan dari pegawai di PT Telephone Indonesia yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri.
Universitas Dalam
Universitas Luar
Negeri
Negeri
85
79
78
68
83
85
80
82
74
80
65
75
88
81
79
64
69
65
71
Dengan menggunakan taraf nyata 5% ,tentukanlah apakah terdapat perbedaan pendapatan yang signifikan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri ! (Sumber: Soal Modul Statistka II 2013) Jawab:
Hipotesis
Ho : Tidak terdapat perbedaan pendapatan antara pegawai yang
merupakan
lulusan Universitas Dalam Negeri dan Luar
Negeri
Ha : Terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri
S = ∑ R(1) = 105 𝑇 = 105 −
10(10+1) 2
T = 60 Wα/2 = 21 W1-α/2= 69
Kriteria T < Wα/2 Ho ditolak T > W1-α/2 Ho ditolak
Ternyata, 60 < 21 maka Ho tidak dapat ditolak
Kesimpulan: Dengan taraf nyata 5%, dapat disimpulkan bahwa tidak terdapat perbedaan pendapatan antara pegawai yang merupakan lulusan Universitas Dalam Negeri dan Luar Negeri.
SOAL NON-PARAMETRIK II 1. STA Corporation, sebuah perusahaan konsultan statistik yang sudah sukses di Bandung, ingin membuka cabang peusahaannya di daerah Jatinangor. Untuk itu, Divisi Marketing ingin mengetahui pengaruh besarnya biaya iklan yang digunakan terhadap jumlah konsumen guna menunjang strategi ekspansi bisnis perusahaan tersebut. Untuk mencapai tujuan penelitian tersebut dikumpulkanlah data biaya iklan dan jumlah konsumen dari masing-masing cabang di daerah Bandung di periode yang sama. Setelah diolah dengan software SPSS, berikut adalah hasil yang diperoleh.
Dengan tingkat signifikansi 1%, jawablah pertanyaan berikut. a. Berapa banyak jumlah cabang STA Corporation di Bandung? b. Apakah biaya iklan berpengaruh signifikan terhadap jumlah konsumen? Mengapa? c. Apakah jawaban poin b. berubah dengan tingkat signifikansi 5%? (Sumber: fiktif) Jawab: a. N = 10 b. Kriteria Uji :
Sig.α ≥ α Ho tidak dapat ditolak Sig.α < α Ho ditolak ditolak Ternyata. Sig. α < α ( 0.009 < 0,01 ), maka Ho ditolak. Jadi dapat disumpulkan terdapat hubungan yang signifikan antara biaya iklan dengan jumlah konsumen STA Corporation. c. Tidak berubah, karena dengan α = 5%, tetap berlaku Sig. α < α (0.009 < 0,05).
2. A psychologist from University of South Caroline believed that doing sport could stimulate brain to think faster and do difficult calculation on math. To prove this statement, a researcher collects some data from a public school in Bandung. The following data concerning the relationship between the score of sport and mathematics subjects of the 10 students. Sports
82
75
85
70
77
60
63
66
80
89
Mathematics
79
80
89
65
67
62
61
68
81
84
Examine, if there is a real positive correlation between the score of sport and mathematics subjects? (significance level 5 %). (Sumber: Modul Statistika II 2013, diolah kembali). Jawab: Nilai Olahraga
Nilai Matematika
X
Urutan
Y
Urutan
1
82
8
79
2
75
5
3
85
4
D (X-Y)
D2
6
2
4
80
7
-2
4
9
89
10
-1
1
70
4
65
3
1
1
5
77
6
67
4
2
4
6
60
1
62
2
-1
1
7
63
2
61
1
1
1
Mahasiswa
8
66
3
68
5
-2
4
9
80
7
81
8
-1
1
10
89
10
84
9
1
1
JUMLAH
22
Hipotesis
H0 : rs = 0
Ha : rs > 0 6(22)
𝑟𝑠 = 1 − 10(102 −1) = 0,867
ρs tabel(dimana n = 10 dan α = 5 %) = 0,5315
Kriteria pengujian ; Ho tidak dapat ditolak apabila rs ≤ ρs tabel
Karena rs = 0,867 > dari ρs tabel = 0,5315, maka Ho ditolak. Jadi dengan taraf nyata 5%, ada hubungan positif yang nyata antara nilai olahraga dengan nilai matematika.
3. Barang Giffen dalam ilmu ekonomi didefinisikan sebagai barang yang akan turun permintaannya seiring dengan bertambahnya pendapatan seseorang. Salah satu komoditi yang dianggap masuk pada kelompok barang giffen adalah singkong. Namun, terdapat dugaan bahwa komoditi ini tidak lagi bersifat giffen ketika dijual daerah pedesaan karena orang di pedesaan masih menganggap singkong sebagai salah satu bahan makanan pokok. Berikut ini adalah data pendapatan masyarakat desa dan konsumsi singkong selama satu bulan yang dikumpulkan dari 11 rumah tangga.
Rumah Tangga
Pendapatan (Rp.)
Konsumsi Singkong (kg)
A
500.000
5
B
1.000.000
9
C
700.000
7,5
D
325.000
4
E
675.000
8
F
710.000
10
G
400.000
3
H
830.000
4,5
I
200.000
4,3
J
250.000
6
K
475.000
5,5
Dengan tingkat signifikansi 1%, buktikanlah apakah singkong masih merupakan barang Giffen di daerah pedesaan! (ceteris paribus). (Sumber: fiktif) Jawab: Rumah
Pendapatan
Konsumsi Singkong
Tangga
X
Urutan
Y
Urutan
1
500.000
6
5
2
1.000.000
11
3
700.000
4
D (X-Y)
D2
5
1
1
9
10
1
1
8
7,5
8
0
0
325.000
3
4
2
1
1
5
675.000
7
8
9
-2
4
6
710.000
9
10
11
-2
4
7
400.000
4
3
1
3
9
8
830.000
10
4,5
4
6
36
9
200.000
1
4,3
3
-2
4
10
250.000
2
6
7
-5
25
11
475.000
5
5,5
6
-1
1
JUMLAH
Hipotesis
86
H0 : rs ≥ 0
Ha : rs < 0 6(86)
𝑟𝑠 = 1 − 11(112 −1) = 0,6090909
ρs tabel(dimana n = 11 dan α = 1 %) = 0,7000
Kriteria pengujian ; Ho ditolak apabila rs < -W1-α
Karena rs = 0,60909 > dari -W1-α = -0,7000, maka Ho tidak dapat ditolak. Jadi dengan taraf nyata 5%, tidak ada hubungan negatif antara pendapatan RT dengan konsumsi singkong, sehingga singkong tidak bersifat Giffen jika dijual di area pedesaan, ceteris paribus.
4. Graphic below gives the number of years of formal education (X) and the age of entry into the labour force (Y) for 12 males from the Regina Labour Force Survey. Both variables are measured in years, a ratio level of measurement and the highest level of measurement. All of the male are aged 30 or over, so that most of these males are likely to have completed their formal education.
Years of Education (X) & Ages of Entry into Labour Force (Y) for 12 Regina Males 25 20 15
17
16 10
20
18 15
15
22
22 19
18 17
18
12
12
16
15 12
8
10
18
15 10
8
10
5 0 1
2
3
4
5
6 X
7 Y
8
9
10
11
12
By testing with Spearman rank correlation, can we say that those respondents who obtained more years of schooling generally entered the labour force at the older ages? (𝛼 = 1%). (Sumber: University of Regina’s Book Chapter XI: “Association Between Variables”) Jawab:
Respondent X 1 10 2 12 3 15 4 8 5 20 6 17 7 12 8 15 9 12 10 10 11 8 12 10 Total Hipotesis
Y 16 17 18 15 18 22 19 22 18 15 18 16
Rank X 4 7 9,5 1,5 12 11 7 9,5 7 4 1,5 4
Rank Y 3,5 5 7,5 1,5 7,5 11,5 10 11,5 7,5 1,5 7,5 3,5
Rank X*Rank Y 14 35 71,25 2,25 90 126,5 70 109,25 52,5 6 11,25 14 602
Rank X ^2 16 49 90,25 2,25 144 121 49 90,25 49 16 2,25 16 645
Ho: Tidak ada hubungan positif antara lamanya bersekolah dengan umur memasuki angkatan kerja
Ha: Terdapat hubungan positif antara lamanya bersekolah dengan umur memasuki angkatan kerja
Pengujian Karena banyak angka yang sama, maka gunakan rumus rs yang kedua.
rs =
13 2
602−12( )2 √(645−12𝑥42,25)√643,5−12𝑥42,25) 95
rs = 11,74734012 𝑥 11,68332145
Rank Y^2 12,25 25 56,25 2,25 56,25 132,25 100 132,25 56,25 2,25 56,25 12,25 643,5
rs = 95 / 137,2479508 rs = 0,692177912 ρs tabel(dimana n = 12 dan α = 1 %) = 0,6713
Kriteria pengujian ; Ho tidak dapat ditolak apabila rs ≤ ρs tabel
Karena rs = 0,6922 > dari ρs tabel = 0,6713, maka Ho tidak dapat ditolak. Jadi dengan taraf nyata 1%, tidak terdapat bukti yang cukup bahwa lamanya bersekolah berpengaruh positif dengan umur memasuki angkatan kerja.
5. Education is the important thing to all countries around the world. Based on that, large proportion of their GNP are spent on education, including teachers’ payment, school building, books purchasing, ect. In July 2014 there was a science testing that required all sophomores in science study to answer 100 questions related to their disciplines. Table below shows the proportion of each county spent on education and the average correct answers in science testing their candidates made. With significance level of 5%, can you tell that the countries that have lower education quality should rise their proportion of GNP on education? Country
% of GNP spent on Education
Canada Spain Scotland Korea Italy US Switzerland France Russia Jordan Hungary Israel
7.4 3.2 5.2 4.5 4.0 7.5 4.8 6.1 7.0 7.1 5.7 10.2
Average Correct answers on Science testing 69 68 68 78 70 67 74 69 71 57 73 70
Jawab:
Canada Spain Scotland Korea Italy US
Average Correct % of GNP spent answers on Science on Education testing 7.4 69 3.2 68 5.2 68 4.5 78 4.0 70 7.5 67
Switzerland
4.8
74
4
11
-7
49
France Russia Jordan Hungary Israel
6.1 7.0 7.1 5.7 10.2
69 71 57 73 70
7 8 9 6 12
5,5 9 1 10 7,5
1,5 -1 8 -4 4,5
2,25 1 64 16 20,25
Country
Rank X
Rank Y
D
D^2
10 1 5 3 2 11
5,5 3,5 3,5 12 7,5 2
4,5 -2,5 1,5 -9 -5,5 9
20,25 6,25 2,25 81 30,25 81
TOTAL
373,5
Hipotesis
H0 : rs = 0
Ha : rs > 0 6(373,5)
𝑟𝑠 = 1 − 12(122 −1) = 1- (2241/1716) = -0,305944056
ρs tabel(dimana n = 12 dan α = 5%) = 0,4965
Kriteria pengujian ; Ho ditolak apabila rs > W1-α
Karena rs = -0,305944056 < dari W1-α = 0,4965, maka Ho tidak dapat ditolak. Jadi dengan taraf nyata 5%, tidak terdapat bukti yang cukup akan adanya hubungan positif antara besarnya proporsi GNP suatu negara terhadap kualitas pendidikan / tingkat kecerdasan masyarakatnya.
6. The effectiveness of advertising for two rival products (Brand X and Brand Y) was compared.
Market research at a local shopping centre was
carried out, with the participants being shown adverts for two rival brands
of coffee, which they then rated on the overall likelihood of them buying the product (out of 10, with 10 being "definitely going to buy the product"). Some of the participants gave ratings for one of the products, the others gave ratings for another product. Brand X
Brand Y
Participant
Rating
Participant
Rating
1
3
1
9
2
4
2
7
3
2
3
5
4
6
4
10
5
2
5
6
6
5
6
8
7
10
Can we say that there is a significant difference between the ratings given to each brand in terms of the likelihood of buying the product? Use the best testing method with 95% confidence level. (Sumber: www.sussex.ac.uk) Jawab: Brand X
Brand Y
Participant
Rating
Rank
Participant
Rating
Rank
1
3
3
1
9
11
2
4
4
2
7
9
3
2
1,5
3
5
5,5
4
6
7,5
4
10
12,5
5
2
1,5
5
6
7,5
6
5
5,5
6
8
10
7
10
12,5
-
-
68
TOTAL
-
23
Hipotesis
Ho : Tidak terdapat perbedaan signifikan antara rating produk X dan Y
Ha : Terdapat perbedaan signifikan antara rating produk X dan Y
S = ∑ R(1) = 68 𝑇=𝑆−
𝑛1 (𝑛1 +1) 2
= 68-28 = 40
Wα/2 = 35 W1-α/2 = n(N+1) - Wα/2 = 7.14-35 = 63
Kriteria uji T < Wα/2 Ho ditolak T > W1-α/2 Ho ditolak
Ternyata, 40 ≥ 35 atau T ≥ Wα/2 dan 40 < 63 atau T < W1-α/2 maka H0 tidak dapat ditolak.
Kesimpulan: Jadi, dengan tingkat signifikansi 5%, tidak terdapat bukti yang cukup bahwa negara yang memiliki proporsi GNP yang lebih tinggi untuk biaya pendidikan akan mempunyai masyarakat yang lebih cerdas. Cara II: 2 ∑𝑁 𝑖=1 𝑅1 = 817
𝑇1 =
𝑇1 = 𝑇1 =
𝑆−𝑛 𝑛𝑚
𝑁+1 2 𝑛𝑚(𝑁−1)
𝑅12 − √𝑁(𝑁−1) ∑𝑁=𝑛+𝑚 𝑖=1 4(𝑁−1) 14 2 7.6 6.7(13−1) .817− √13(13−1) 4(13−1)
68−7.
14 2 7.6 6.7(13−1) √13(13−1).817− 4(13−1)
68−7.
𝑇1 = 𝑇1 =
19 √219,9615385−10,5 19 14,47278613
𝑇1 = 1,312808731 7. Tabel dibawah ini merupakan tabel yang berisikan data mengenai pendapatan dari Manajer Sumber Daya Manusia di kota Medan dan Makassar. Hitunglah apakah pendapatan di Medan lebih besar daripada di Makassar ? (dalam ribuan Rupiah). Gunakan 𝛼 = 5%. Medan
450
600
575
700
540
540
630
580
715
450
650
0
0
0
0
0
0
0
0
0
0
0
Makass
430
520
490
570
600
620
540
470
640
ar
0
0
0
0
0
0
0
0
0
Jawab:
Hipotesis
Ho : Pendapatan Manajer Sumber Daya Manusia di Medan tidak lebih besar dari Manajer Sumber Daya Manusia di Makassar
Ha : Pendapatan Manajer Sumber Daya Manusia di Medan lebih besar dari Manajer Sumber Daya Manusia di Makassar
S = ∑ R(1) = 130.5 T = 130.5 - [11(11+1)/2] T = 64.5 Wα = 94 Kriteria T > Wα Ho ditolak Ternyata, 64.5 < 28 maka Ho tidak dapat ditolak Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa pendapatan Manajer Sumber Daya Manusia di Medan tidak lebih besar dari Manajer Sumber Daya Manusia di Makassar.
8. A psychologist to make the hypothesis that students from high schools in urban possessed a National Examination score greater than at the high school
students in the rural. The following results obtained from the
following tests. UN
43
56
31
30
41
38
53
32
45
47
68
39
42
33
54
40
24
30
33
41
Urban UN Rural With a 5% significance level, determine whether there is a difference between National Examination scores in urban and rural? (Sumber: fiktif) Jawab:
Hipotesis
H0: there is not a difference between National Examination scores in urban and rural
H1: there is a difference between National Examination scores in urban and rural
CARA MANUAL UN di Kota
R (X)
UN di Desa
R (Y)
43
14
47
16
56
19
68
20
31
4
39
9
30
2
42
13
41
11,5
33
6,5
38
8
54
18
53
17
40
10
32
5
24
1
45
15
30
3
33
6,5
41
11,5
S = ∑ R(X) = 113.5 𝑇=𝑆−
𝑛1 (𝑛1 +1) 2
T = 113,5 –
11(11+1) 2
T = 47.5 Lihat tabel: n = 9, m = 11, α = 0,05 Wα /2 = 24 W1-α/2 = (n x m) - Wα /2 = (99)-24= 75
Kriteria : 2 tailed-test, T < Wα /2 atau T > W1-α/2 H0 ditolak
Ternyata: 24< 47.5<75, Ho tidak dapat ditolak
Conclusion: So, with the significant level 5%, there is not a difference between National Examination scores in urban and rural.
CARA KOMPUTER Penyelesaian Komputer • Masuk ke SPSS • Masuk ke variable view, measure Ordinal • Masukkan data ke dalam data view (gabungkan sample 1 & sample 2 dalam 1 kolom) • Kolom 1 = nilai, kolom 2 = grup ( isikan 0 untuk nilai UAN di kota & 1 untuk nilai UAN di desa) • Masuk ke Analyze , klik Nonparametric Test • Klik 2 Independent sample, masukkan nilai di Test Variable List dan Skor di grouping Variable • Klik Define Group, masukkan grup 1 = 0, grup 2 = 1, continue • Checklist Mann whitney, Ok
APPENDIX
Tabel Distribusi Normal Z
Tabel Chi-Square
Tabel Product Moment R