RENCANA
MATAKULIAH
STATISTIK
EKONOMI
INFERENSI Materi Kuliah No 1. 2. 3. 4. 5. 6. 7. 8. 9.
Materi
Pertemua n 1 1 1 2 2 2 1 1 1 12
Distribusi Normal Distribusi Binomial Distribusi Chi Square Distribusi Sampling Teori Penaksiran Uji Hipotesis Uji Chi Square Analisis Regresi & Korelasi Statistik Non Parametrik JUMLAH
Penilaian : 1. 2. 3. 4. 5.
UTS UAS TUGAS QUIZ / Latihan Absensi
30% 40% 20% 10%
Buku sumber : 1. Sudjana, Statistika Jilid II
2. Anto Dajan, Metode Statistika 08172314131 M. RIZAL : 085222399218 ROHANA 085224952995
PELUANG Ruang sampel •
Himpunan
semua
hasil
yang
mungkin
dari
suatu
percobaan statistik disebut ruang sampel, biasanya dinyatakan dengan lambang S. Contoh:
Percobaan
melantunkan
satu
keping
uang
logam
menghasilkan S={Muka, Belakang} Percobaan melantunkan satu buah diadu menghasilkan S={1,2,3,4,5,6} •
Kejadian adalah himpunan bagian dari ruang sampel
•
Suatu kejadian yang mengandung satu unsur ruang sampel disebut kejadian sederhana, suatu kejadian yang dapat dinyatakan sebagai gabungan beberapa kejadian sederhana disebut kejadian majemuk.
•
Ruang nol atau ruang hampa adalah himpunan bagian ruang sampel yang tidak mengandung unsur.
Menghitung titik sampel •
Bila suatu operasi dapat dilakukan dengan n1 cara dan bila untuk tiap cara ini operasi kedua dapat dikerjakan dengan
n2
cara
maka
kedua
operasi
itu
dapat
dikerjakan bersama-sama dengan n1 x n2 cara. Contoh : Pelantunan satu keping koin mata uang memberikan dua hasil kemungkinan yaitu S={M, B}. Apabila dua keping
mata
uang
dilantunkan
sekaligus
akan
memberikan hasil 4 hasil kemungkinan yaitu S={MM, MB,
BM,
BB}.
Berapa
kemungkinan
hasil
dari
pelantunan satu keping koing dengan satu dadu bersisi 6? •
Suatu permutasi adalah susunan yang dapat dibentuk dari kumpulan benda-benda yang diambil sebagian atau seluruhnya. berlainan
Banyaknya
adalah
n!.
permutasi Banyak
n
permutasi
berlainan bila diambil r sekaligus adalah : n Pr =
n! (n − r )!
benda n
yang benda
•
Jumlah kombinasi dari n benda yang berlainan bila diambil sebanyak r adalah :
n n! = r r! (n − r )!
Peluang suatu kejadian •
Peluang suatu kejadian A adalah jumlah bobot semua titik sampel yang termasuk A, Jadi : 0 ≤ P ( A) ≤ 1, P ( S ) = 1
•
Bila suatu percobaan dapat menghasilkan N macam hasil
yang
berkemungkinan
sama
dan
bila
tepat
sebanyak n dari hasil berkaitan dengan kejadian A, maka peluang kejadian A adalah :
P ( A) = •
n N
Contoh bila satu kartu ditarik dari satu kotak kartu bridge (berisi 52), hitunglah peluang bahwa kartu itu heart (heart ada 13). Jawab : Jumlah hasil yang mungkin adalah 52, dan 13 di antaranya adalah heart. Jadi peluang kejadian A menarik satu kartu heart adalah P(A)=13/52=1/4. Berapakah peluang kejadian menarik kartu As ? Berapakah peluang kejadian menarik kartu bukan As ?
•
Dua kejadian saling ekslusif jika terjadinya kejadian yang satu menyebabkan tidak terjadinya terjadinya kejadian yang lain.
•
Jika A dan B adalah dua kejadian yang saling ekslusif maka berlaku : P(A atau B) = P(A) + P(B). Rumus ini mengatakan jika A dan B dua kejadian yang saling ekslusif maka peluang terjadinya A dan B adalah jumlah peluang A dan peluang B.
•
Dua kejadian dikatakan bebas atau independen jika terjadinya atau tidak terjadinya peristiwa yang satu tidak mempengaruhi atau dipengaruhi oleh kejadian lainnya. Jika A dan B dua peristiwa bebas, maka berlaku : P(A dan B)= P(A) x P(B). Rumus ini mengatakan bahwa
jika A dan B bebas maka peluang terjadinya kejadian A dan B adalah hasil kali peluang A dan B. •
Ekspektasi atau nilai harapan adalah hasil kali antara peluang dan kejadiannya. Sebagai contoh : Apabila kita melakukan undian dengan melantunkan sebuah uang logam, maka apabila muncul muka kita membayar Rp.1.000 kepada lawan sedangkan apabila muncul belakang
kita
tidak
membayar
apa-apa.
Maka
Ekspektasi dari kejadian tersebut adalah : E = P(Muka) x - Rp. 1.000 +P(Belakang) x Rp.0,= 0.5(Rp.1.000) + 0.5(Rp.0) = - Rp. 500 QUIZ : Dalam satu buah kantung terdapat 3 bola berwarna hijau, 5 bola berwarna putih 2 bola berwarna biru. Misalkan dari kantung tersebut dilakukan pengambilan bola tiga kali tanpa pengembalian, tentukan peluang terambil bola berwarna hijau pada pengambilan pertama, terambil bola berwarna putih pada pengambilan kedua dan terambil bola berwarna biru
pada
pengambilan
yang
ketiga.
Peubah Acak (Random Variable) •
Peubah acak adalah suatu fungsi bernilai real yang harganya ditentukan oleh tiap anggota dalam ruang sampel. Contoh : Pada pelantunan uang logam kita tahu bahwa peluang muncul muka dan belakang masingmasing adalah ½ . Misalnya hasil dari percobaan 1000 kali percobaan pelantunan uang logam diperoleh data sebagai berikut : Nampak
Frekuensi
Frekuensi
Muka
Sebenarnya diharapkan 0 480 500 1 520 500 Secara teoritis, digunakan notasi x sebagai lambang dari
kejadian
dan
f (x) sebagai
lambang
untuk
menyatakan peluang bagi harga x yang bersangkutan. Maka diperoleh :
atau f ( x) = •
x
f (x)
0 1
½ ½
1 , x = 0,1 2
Pada percobaan pelantunan dadu, maka masing-masing sisi memiliki peluang yang sama yaitu 1/6. Maka percobaan pelantunan dadu tersebut memiliki peubah acak :
f ( x) = •
1 , x = 1,2,3,4,5, dan 6 6
Latihan
:
coba
tentukan
peubah
acak
(random
variable) dari hasil percobaan pelantunan 2 uang logam sekaligus, pelantunan 3 uang logam sekaligus, serta hasil
percobaan
pelantunan
satu
uang
bersamaan dengan pelantunan satu buah dadu !
logam
n
•
Sifat peubah acak :
∑ f ( x) = 1 1
•
Jika
suatu
ruang
sampel
mengandung
titik
yang
berhingga banyaknya atau suatu deretan anggota yang banyaknya sama dengan banyaknya bilangan bulat, maka ruang sampel tersebut disebut ruang sampel diskret, dan peubah acak yang didefinisikan pada ruang sampel tersebut adalah peubah acak diskret, contoh peubah acak distribusi binomial. •
Jika suatu ruang sampel mengandung titik sampel yang tak
berhingga
banyaknya
dan
sama
banyaknya
dengan banyak titik pada sepotong garis maka ruang sampel itu disebut ruang sampel kontinu dan peubah acak yang didefinisikan di atasnya disebut peubah acak kontinu, contoh : peubah acak distribusi normal. Distribusi Normal N~( µ , σ 2 ) Satu diantara distribusi kontinyu adalah distribusi normal atau distribusi Gauss, sebagai penghargaan kepada seorang matematikawan Carl Gauss yang telah berperan banyak menyelidiki hal ini pada akhir abad ke 18 di samping peneliti pertama Piere de Laplace dan Abraham de Moivre. Distribusi normal disebut sebagai distribusi paling penting dalam statistika karena pada pekerjaan selanjutnya ternyata banyak teori yang didasarkan pada distribusi normal. Persamaan distribusi normal :
1 f ( x) = e σ 2π
1 X −µ − 2 σ
2
Keterangan :
π = nilai konstan yang besarnya = 3,1416
e = tetapan bilangan pokok logaritma natural = 2,7183 µ = parameter, rata-rata distribusi normal
σ
= parameter, simpangan baku (standar deviasi) distribusi normal
X
= peubah acak kontinu, harganya − ∞ < X < +∞
Distribusi normal memiliki memiliki dua parameter yakni rata-rata
µ
dan simpangan baku (standar deviasi)
σ
.
Sehingga lambang umum untuk distribusi normal adalah N( µ , σ ) . Kedua parameter ini akan mempengaruhi bentuk grafik distribusi normal. Grafik distribusi normal menyerupai genta/bel sehingga disebut dengan Bell Curve.
Gambar Bell Curve distribusi normal N~( µ , σ 2 ) Pengaruh besar kecilnya simpangan baku alpa (
σ
):
Grafik berwarna merah (paling runcing) memiliki simpangan baku ( ) alpa paling besar sedangkan grafik berwarna
σ
biru memiliki simpangan baku alpa (
Pengaruh besar kecilnya rata-rata (
σ
) paling kecil.
µ ):
µ1
µ2
Untuk menentukan peluang sebuah kejadian X yang berdistribusi normal secara teoritis, karena melibatkan integral yang kompleks jadi proses penghitungannya sangat sulit dilakukan. Tapi karena hasil perhitungan integral adalah sama dengan dengan menentukan luas dibawah kurva, berarti menentukan peluang sebuah kejadian X sama saja dengan dengan menghitung luas daerah dibawah kurva distribusi normal tersebut. Untuk menyederhanakan distribusi normal, digunakan sebuah konsep yang disebut ditribusi normal baku (normal standard) yaitu distribusi normal yang memiliki rata-rata 0 dan simpangan baku =1. Hal ini dapat dilakukan menggunakan transformasi yang mengubah peubah acak X yang berdistribusi normal ke dalam peubah acak Z yang berdistribusi normal baku dengan menggunakan rumus :
Z=
X −µ
σ
Apabila hal ini dilakukan maka persamaan distribusi normal baku adalah : 1
− z2 1 f ( z) = e 2 σ 2π
Secara grafis transformasi dari
N(
µ ,σ
) menjadi N(0,1)
adalah sebagai berikut : Normal Umum
Normal Baku Z=
σ
X −µ σ
σ =1 µ
µ =0
Tabel luas dibawah kurva normal Z dan penggunaannya : Lihat buku Sudjana Jilid II halaman 46 sampai 56. Contoh : Bila X merupakan peubah acak yang memiliki distribusi normal dengan rata-rata µ = 24 dan standar deviasi σ =12, berapakah peluang (17,4<X<58,8) ? Jawab : Pengubahan peubah acak normal 17,4 dan 58,8 masingmasing ke dalam peubah acak normal baku diperoleh :
17,4 − 24 = −0,55 12 58,8 − 24 Z2 = = 2,90 12
Z1 =
Dengan demikian P(17,4<X<58,8) = P(-0,55455) = P(Z>0,5) dengan menggunakan tabel distribusi normal diperoleh : P(Z>0,5) = P(1-0,6915) = 0,3085
Contoh : Angka ujian statistik sebagian besar mahasiswa memiliki rata-rata µ = 34 dan simpangan baku/standar deviasi σ = 4. Jika distribusi angka-angka ujian tersebut mendekati distribusi normal, dibawah angka ujian statistik berapakah akan diperoleh 10 persen terendah dari seluruh distribusi angka-angka tersebut? Jawab : Dalam soal diatas diketahui bahwa bahwa rata-rata µ = 34 dan standar deviasi σ = 4. Maka dengan menggunakan tabel distribusi normal luas dibawah kurva normal yang sesuai dengan 10% adalah -1,28, sehingga : X − 34 4 X = 28,88
− 1,28 =
Jadi diperoleh keterangan bahwa 10% dari seluruh mahasiswa memperoleh nilai ujian statistik 28,8 atau kurang. Contoh : Sebuah sampel mesin cuci memiliki diameter rata-rata sebesar 0,502m dan standar deviasi sebesar 0,005m. Mesin cuci yang demikian dianggap tidak memenuhi syarat jika memiliki spesifikasi diameter di luar 0,496m dan 0,508m. Coba tentukan persentase mesin cuci yang tidak memenuhi syarat jika diketahui bahwa diameter mesin cuci tersebut memiliki distribusi normal? Jawab : Dalam soal diatas diketahui bahwa bahwa rata-rata µ = 0,502m dan standar deviasi σ = 0,005m.
Z1 =
0,496 − 0,502 = −1,2 0,005
Z2 =
0,508 − 0,502 = 1,2 0,005
P(Z<-1,2)= 0,1151 P(Z>1,2)=P(1-0,8849)= 0,1151 Jadi persentase mesin cuci yang tidak memenuhi syarat adalah 11,51%+11,51%=23,02%.
DISTRIBUSI BINOMIAL Suatu percobaan sering terdiri atas beberapa usaha, tiap usaha dengan dua kemungkinan dapat diberi nama sukses dan gagal. Hal ini terjadi misalnya pada pengujian barang hasil produksi dengan tiap pengujian atau usaha dapat menunjukkan apakah suatu barang cacat atau tidak cacat. Kita dapat menentukan atau memilih salah satu hasil sebagai sukses. Percobaan seperti ini disebut percobaan binomial. Suatu percobaan binomial adalah : 1. Percobaan
terdiri
atas
n
usaha
yang
berulang
(tertentu). 2. Tiap usaha memberikan hanya 2 jenis hasil yang dapat
ditentukan dengan sukses atau gagal. 3. Peluang sukses dinyatakan dengan p, tidak berubah
dari usaha yang satu ke yang berikutnya. 4. Tiap
usaha
bebas
dengan
usaha
lainnya
(tidak
dipengaruhi oleh usaha lain). Distribusi binomial : Bila suatu usaha binomial dapat menghasilkan sukses dengan peluang
p
dan gagal dengan
peluang q = 1 − p , maka distribusi peluang peubah acak binomial X, yaitu banyaknya sukses dalam n usaha bebas adalah :
n b( x ; n, p ) = p x q n − x , x = 0,1,2, ... , n x n n! dengan = x x!(n − x)! Contoh : Hitunglah peluang distribusi binomial untuk p=¾ , x=2, n=4
Jawab : 2
P(X=2) =
3 4 3 1 b( 2 ; 4, ) = 4 2 4 4
2
4! 3 2 27 = . 4 = 2!2! 4 128
=
0,21
Jadi peluang kita mendapatkan 2 item sukses dari 4 item yang masing-masing memiliki peluang sukses ¾, adalah 0.21
Contoh : Misalnya kita melantunkan 10 dadu sebanyak satu kali, berapa peluangnya akan muncul tepat 8 kali munculnya sisi mata dadu 6? Jawab : Diketahui p=1/6, n=10, x=8
1 10 1 P(X=8) = b 8;10, = 6 8 6
1 = 45 6
8
8
5 6
2
2
5 = 0,000015 6
Contoh : Sebuah mesin produksi menghasilkan suatu produk dengan peluang menghasilkan produk cacat adalah 15%. Diambil secara acak dari produk mesin tersebut sebanyak 30 buah untuk diselidiki. Berapa peluang dari produk yang diambil itu akan terdapat : a. Semuanya bagus (tidak cacat) b. Satu rusak c. Dua bagus
Jawab : a. Diketahui
q=0,15 maka p=0,85, n=30 dan x=30.
Sehingga :
30 ( 0,85) 30 ( 0,15) 0 = 0,0076 30
P(X=30)= b( 30;30;0,85) =
Jadi peluang semua produk yang diambil sebanyak 30 bagus semua (tidak ada yang cacat) adalah 0,0076 b. Diketahui q=0,15, p=0,85, n=30 dan x=29. Sehingga :
30
P(X=29)= b( 30;29;0,85) = ( 0,85) 29
29
( 0,15) 1 = 0,0404
Jadi peluang dari produk yang diambil sebanyak 30 ternyata hanya 1 yang rusak adalah 0,0404. c. Diketahui p=0,85, n=30 dan x=2 . Sehingga :
30
P(X=2)= b( 30;2;0,85) = ( 0,85) ( 0,15) 2 2
28
=0
Jadi peluang dari produk yang diambil sebanyak 30 ternyata hanya 2 yang rusak adalah 0. Contoh : Setelah diadakan penelitian terhadap suatu mesin fotocopy, maka diketahui bahwa pada setiap 1450 lembar hasil fotocopy akan terjadi kerusakan sebanyak 145 lembar. Apabila dilakukan fotocopy sebanyak 5 lembar, berapakah peluang untuk menemukan 0, 1, 2, ... , 5 lembar kerusakan ?
Jawab : Misalkan X adalah kejadian menemukan lembar kertas tidak rusak •
n=5, x=5 q=1/10
5 5 0 b( 5;5;0,9) = ( 0,9) ( 0,1) = 0,59049 5 •
n=5, x=4 q=1/10
5 4 1 b( 4;5;0,9) = ( 0,9) ( 0,1) = 0,32805 4 •
n=5, x=3, q=1/10
5 3 2 b( 3;5;0,9 ) = ( 0,9) ( 0,1) = 0,0729 3 •
n=5, x=2, q=1/10
5 2 3 b( 2;5;0,9) = ( 0,9) ( 0,1) = 0,0081 2 •
n=5, x=1, q=1/10
5 1 4 b(1;5;0,9 ) = ( 0,9) ( 0,1) = 0,00045 1 •
n=5, x=0, q=1/10
5 0 5 b( 0;5;0,9 ) = ( 0,9 ) ( 0,1) = 0,00001 0 Contoh : Seorang penderita penyakit darah yang jarang terjadi memiliki peluang 0,4 untuk sembuh. Bila diketahui ada 15 orang yang telah mengidap penyakit tersebut, berapakah peluang : a. Paling sedikit 10 akan sembuh b. Antara 3 sampai 8 yang sembuh c. Tepat 5 akan sembuh
Jawab : a. Misalnya X menunjukkan banyaknya yang sembuh,
maka peluang paling sedikit 10 akan sembuh adalah : P(X=10)+P(X=11)+
P(X=12)+
P(X=13)+
P(X=14)+
P(X=15) = P ( X ≥ 10)
P ( X ≥ 10) = 1 − P ( X ≤ 10) 9
= 1 − ∑ b( x;15;0,4) x =0
= 1 – 0,9662 = 0,0338 Jadi peluang paling sedikit 10 dari 15 orang penderita penyakit tersebut akan sembuh adalah 0,00338 b. P(3 ≤ X ≤ 8) =
8
8
2
x =3
x =0
x =0
∑ b( x;15;0,4) = ∑ b( x;15;0,4) − ∑ b( x;15;0,4) = 0,9050 – 0,0271 = 0,8779
Jadi peluang antara 3 sampai 8 dari 15 penderita penyakit tersebut akan sembuh adalah 0,8779 c. P ( X = 5) = b( x;15;0,4) =
5
4
x =0
x =0
∑ b( x;15;0,4) − ∑ b( x;15;0,4)
=0,4032 – 0,2173 = 0,1859 Jadi peluang tepat 5 orang dari 15 penderita penyakit tersebut akan sembuh adalah 0,1859 PR: Untuk mengelabui petugas pabean, seorang pelancong menaruh enam tablet narkotik dalam sebuah botol yang berisi sembilan vitamin yang sama bentuk dan warnanya. Bila petugas pabean memeriksa tiga tablet secara acak untuk dianalisis, berapakah peluang pelancong tersebut akan ditahan karena membawa narkotik?
TUGAS : KERJAKAN SOAL-SOAL BAB II NOMOR 24, 26, 27, 30, 31, DAN 32 SAMPLING Populasi : Adalah kumpulan keseluruhan obyek yang diteliti. Sampel : Adalah sebagian dari populasi menggunakan cara-cara tertentu.
yang
diambil
dengan
Berdasarkan banyak obyek yang ada di dalam populasi, populasi dapat dibedakan menjadi : 1. Populasi tak hingga
Yaitu populasi yang memiliki tak terhingga/tak terbatas banyak obyek. Sebagai contoh : a. Volume air hujan b. Volume udara/gas c. Kepuasan konsumen d. Prestasi atau kinerja karyawan 2. Populasi terhingga /terbatas
Yaitu populasi yang memiliki banyaknya obyek. Sebagai contoh :
terhingga/terbatas
a. Banyaknya perusahaan di suatu daerah b. Banyaknya karyawan di suatu perusahaan c. Banyak pesanan sebuah perusahaan selama 10
tahun terakhir d. Banyaknya produksi dalam satu bulan e. dll
Statistika bertujuan untuk mengambil kesimpulan dari populasi. Untuk itu diperlukan data-data yang lengkap mengenai populasi tersebut. Cara mengambil data dari populasi antara lain : 1. Sensus ; yaitu pengambilan data populasi dari keseluruhan obyek yang ada pada populasi tersebut. 2. Sampling ; yaitu pengambilan sebagian data populasi dari obyek yang ada pada populasi tersebut.
Pengambilan data secara sampling lebih banyak dilakukan dibandingkan dengan pengambilan data secara sensus, karena berbagai alasan seperti berikut ini : 1. Faktor biaya dan faktor ekonomis Data yang diambil secara sampling jumlahnya kurang dari data yang diambil secara sensus sehingga lebih hemat 2. Faktor ketelitian dalam penelitian Karena pengambilan data secara sensus melibatkan obyek yang lebih banyak, sehingga memungkinkan timbul lebih banyak kesalahan dalam pencatatan, pendokumentasian dan pengolahan. 3. Faktor penghematan waktu Pengambilan data secara sampel yang lebih sedikit, jelas akan mempercepat proses statistik. 4. Percobaan yang sifatnya merusak Dalam beberapa contoh kasus penelitian, pengambilan data dilakukan dengan cara merusak obyek yang diteliti. Sehingga lebih banyak obyek yang diteliti akan mengakibatkan lebih banyak obyek yang dirusak. 5. Populasi tak terhingga Pada populasi tak terhingga tidak mungkin dilakukan pengambilan data secara sensus. Beberapa teknik sampling Dalam pengambilan sampel terdapat dua cara yang dapat dilakukan, yaitu : a. Pengambilan data dengan cara pengembalian (with
replacement) b. Pengambilan data dengan cara tanpa pengembalian
(without replacement) Terdapat beberapa untuk melakukan pengambilan data : a. Sampling seadanya b. Sampling dengan pertimbangan c. Sampling peluang atau sampling acak
• Sampling acak dari populasi tak hingga • Sampling aca dari populasi terhingga
Kesalahan pada pengambilan data Pengambilan data secara statistik harus bebas dari kesalahan dan keragu-raguan karena data-data tersebut akan menjadi bahan pengambilan kesimpulan yang harus bisa dipertanggungjawabkan. Beberapa kesalahan dalam pengambilan data statistik antara lain : 1. Kesalahan sampling : • Kesalahan mengambil sampel/responden • Jumlah sampel kurang 2. Kesalahan non-sampling: • Ketidakjelasan populasi • Pertanyaan yang tidak tepat, membingungkan, atau jawaban yang tidak lengkap. DISTRIBUSI SAMPLING Distribusi yang telah dipelajari yaitu distribusi Binomial dan distribusi Normal adalah distribusi teoritis yang dikembangkan dari penurunan rumus matematika. Sedangkan distribusi yang langsung diperoleh dari data aktual pada populasi yang akan diteliti adalah distribusi sampling. Jika informasi yang dikumpulkan dari data aktual itu adalah berupa rata-rata hitung untuk semua sampel yang mungkin dapat diambil dari sebuah populasi, maka diperoleh distribusi sampling rata-rata hitung. Jika informasi yang dikumpulkan dari data aktual itu adalah berupa semua simpangan baku (standar deviasi) untuk semua sampel yang mungkin dapat diambil dari sebuah populasi akan diperoleh distribusi sampling simpangan baku. Parameter
Statistik
Populasi
Sampel
Rata-rata (mean)
µ
Simpangan baku (standar deviasi)
σ
x
s
Cara pengambilan sampel Untuk melakukan pengambilan data sampel dari populasi yang berukuran N, dapat digunakan cara permutasi atau kombinasi data sehingga diperoleh kelompok-kelompok data sampel yang masing-masing berukuran n. Sebagai contoh suatu populasi memiliki lima anggota yaitu A,B,C,D dan E, maka kemungkinan pengambilan sampel adalah : Sampel terdiri dari 2 obyek : 1. A,B 2. A,C 3. A,D 4. A,E 5. B,C 6. B,D 7. B,E 8. C,D 9. C,E 10.
D,E
Sampel terdiri dari 3 obyek : 1. A,B,C 2. A,B,D 3. A,B,E 4. A,C,D 5. A,C,E 6. A,D,E 7. B,C,D 8. B,C,E 9. B,D,E 10. C,D,E
Distribusi sampling rata-rata Jika terdapat sebuah populasi yang terhingga berukuran N, memiliki parameter rata-rata
µ dan simpangan baku σ ,
dilakukan pengambilan sampel secara acak yang masingmasing berukuran sehingga memiliki kumpulan rata-rata hitung
x.
n
Dalam hal ini kita telah membentuk distribusi
sampling rata-rata
x. PopulaPsi (rata-rata µ)
Sampel 1 X1, X2, ……… X n
Rata-rata sampel X1
Sampel 2 X1, X2, ……… X n
Rata-rata sampel X2
Sampel 3 X1, X2, ……… X n
Rata-rata sampel X3
Sekelompok rata-rata sampel X1, X2, ……… X k
Jadi distribusi sampling rata-rata hitung
x adalah kumpulan
dari bilangan-bilangan yang masing-masing merupakan ratarata hitung. Hubungan antara rata-rata hitung sampel dan rata-rata hitung populasi adalah :
µx = µ Artinya : rata-rata untuk distribusi sampling rata-rata sama dengan rata-rata populasinya. Hubungan antara simpangan baku sampel ddan simpangan baku populasi :
σ N−n , untuk sampel kecil atau n N −1
σX = terbatas :
σ
σX =
n
, untuk sampel besar atau tidak
terbatas Kesimpulan :
µ dan
Jika dari sebuah populasi yang memiliki rata-rata
σ
simpangan baku masing berukuran akan
σX =
, diambil sampel acak yang masingn maka distribusi sampling rata-rata
mempunyai
σX N−n n N −1
µ dan
rata-rata
(jika
sampel
kecil)
simpangan atau
σX =
baku
σX (jika n
sampel besar). Kita dapat menentukan berapa ukuran sampel paling sedikit apabila kita mengharapkan perbedaan nilai ratra-rata sampel yang satu dan yang lainnya ditentukan. Jika dikehendaki selisih rata-rata setiap dua sampel tidak lebih dari d , maka berlaku hubungan :
σ ≤d n Sebagai contoh : kita menginginkan perbedaan nilai ratarata setiap dua sampel sebesar d =0,5 maka dengan =6 diperoleh :
σ
6 n
≤ 0,5 atau
n ≥ 144
Ternyata paling sedikit harus diambil 144 data untuk setiap sampel agar perbedaan nilai rata-rata setiap dua sampel sebesar d =0,5. Contoh : Jika sebuah sampel acak sebesar n=10 dipilih dari populasi normal sebesar N=40 dengan rata-rata µ = 5,5 dan standar deviasi σ =2,9155 berapakah rata-rata dan standar deviasi distribusi sampelnya?
µ X = 5,5 dan
σX =
2,9155 40 − 10 = 0,80861421 40 − 1 10
Contoh : Diketahui bahwa distribusi kecepatan maksimal dari 1.000 mobil Mazda memiliki rata-rata 148,2km/jam dengan standar deviasi sebesar 5,4km/jam. Jika sebuah sampel yang terdiri dari 100 unit mobil Mazda dipilih secara acak dari populasi diatas berapakah peluang kecepatan rata-rata dari 100 mobil tersebut lebih besar dari 149km/jam? Jawab : Dalam hal ini sampel dianggap terbatas dengan N=1000, dan n=100, rata-rata µ =148,2 dan standar deviasi σ =5,4. Maka kita peroleh : µ X = 148,2 dan σ X =
Z=
5,4 1000 − 100 = 0,5125 1000 − 1 100
149 − 148,2 = 1,56097561 0,5125
Jadi P(X>149)=P(Z>1,56)=0,0594 atau 5,94%=6% Contoh : Pelat baja yang diproduksi oleh sebuah pabrik memiliki daya regang rata-rata 500kg dan standar deviasi sebesar 20 kg. Jika sampel acak yang terdiri dari 100 pelat sedemikian dipilih dari populasi yang terdiri dari 100.000 pelat, berapakah rata-rata sampelnya akan kurang dari 496 kg?
Jawab : Dalam hal ini N dianggap tidak terbatas dan n=100, ratarata µ =500 dan standar deviasi σ =20. Maka kita peroleh : µ X = 500
20 =2 100
dan
σX =
Z=
496 − 500 = −2 2
P(X<496)=P(Z<-2)=0,0228=2,28% Suatu mesin minuman diatur sedemikian rupa sehingga banyaknya minuman yang dikeluarkan secara hampiran berdistribusi normal dengan rata-rata 207ml dan simpangan baku 15ml. Secara berkala, mesin diperiksa dengan mengambil sampel sembilan buah dan dihitung rata-rata isinya. Bila ratarata sampel jatuh pada selang 177 s.d 237 ml maka mesin dianggap bekerja dengan baik. Jika tidak mesin harus di atur lagi. Tindakan apa yang seharusnya diambil bila rata-rata sampel 219ml ? Dalil Limit Pusat Apabila kita melakukan pemilihan sampel yang berdistribusi normal, bagaimana penghitungannya?
tidak
Secara matematis distribusi rata-rata sampel akan mendekati distribusi normal jika besarnya sampel n bertambah tanpa batas, hal ini didasarkan oleh suatu dalil matematis yang sangat terkenal dan sangat berguna dalam analisis statistik : Dalil limit pusat : Jika sampel acak dipilih dari populasi dengan rata-rata µ X dan standar deviasi σ X dan jika besarnya sampel n berukuran besar maka rata-rata sampelnya akan memiliki distribusi pemilihan sampel mendekati distribusi normal dengan rata-rata µ X = µ X dan standar deviasi σ X =
σX . n
Jika populasinya terbatas maka rata-rata sampelnya akan memiliki distribusi pemilihan sampel dengan rata-rata µ X = µ X dan standar deviasi σ X =
σX n
N −n , jika populasinya N −1
normal maka distribusi pemilihan sampelnya akan normal.
Distribusi Sampling Perbandingan (Proporsi) Misalkan kita memiliki sebuah populasi berukuran N dengan perbandingan atau proporsi populasi untuk peristiwa tertentu sama dengan p dan simpangan baku p(1 − p ) . Dari populasi tersebut kita ambil sampel berukuran n . Dari setiap sampel yang diperoleh hitunglah perbandingan sampelnya untuk peristiwa yang menjadi perhatian kita, perbandingan dari sampel-sampel yang diperoleh pada umumnya akan berbeda-beda harganya. Kumpulan atau distribusi semua perbandingan sampel-sampel ini dinamakan Distribusi sampling perbandingan atau Distribusi sampling perbandingan proporsi. Rata-rata dan simpangan baku untuk distribusi sampling perbandingan masing-masing diberi simbol µ p dan σ p . Bila dinyatakan dalam parameter populasi p adalah : µp = p
σp =
n p(1 − p ) > 5% ) , (jika sampel besar yaitu N n
σp =
n p (1 − p ) N − n , (jika sampel kecil yaitu ≤ 5% ) N n N −1
Untuk menentukan peluang nilai perbandingan peristiwa yang dikehendaki dari sebuah sampel berukuran n terletak antara batas-batas tertentu, dapat berlaku dalil limit pusat asalkan ukuran sampel n cukup besar. Jika ukuran sampel acak n cukup besar maka distribusi p = x/n sampling perbandingan ternyata mendekati distribusi normal. Distribusi normal yang didekati oleh distribusi sampling p = x / n ini mempunyai rata-rata p dan p(1 − p ) atau n n n > 5% atau ≤ 5% . bergantung pada N N
simpangan
baku
σp =
σp =
p (1 − p ) N − n n N −1
Selanjutnya untuk menentukan bagian-bagian luas dari lengkungan normal standar digunakan transformasi : z=
x/n− p n > 5% ) p (1 − p ) (jika sampel besar yaitu N n
atau
z=
x/n− p n ≤ 5% ) p (1 − p ) N − n (jika sampel kecil yaitu N n N −1
Dari kekeliruan baku perbandingan yaitu σ p kita dapat menentukan nilai minimum ukuran sampel n bila perbandingan tiap sampel yang diharapkan terjadi diketahui. Nilai n tersebut dihitung dari : p(1 − p) ≤d n
Contoh : Dari suatu proses produksi semacam barang, ternyata 90% dari produksi tanpa cacat dan 10% lagi dalam keadaan cacat. Setiap hari kerja, selama proses berlangsung diambil sampel acak terdiri dari 100 barang. Tentukan : a. Rata-rata persentase barang yang rusak dan simpangan bakunya b. Peluang barang rusak dari sebuah berukuran 100 paling kecil 15%.
sampel
c. Berapa ukuran sampel paling sedikit agar jika kita mengambil sampel cukup banyak dengan ukuran tersebut, persentase kerusakannya diharapkan akan berbeda tidak lebih dari 2%. Jawab : Misalkan kita definsikan p=proporsi barang yang rusak. Dari soal diatas dapat diketahui p = 0,1 , n = 100 , populasi dianggap tak hingga. a. µ p = p = 0,1 b. σ p =
p (1 − p) 0,1(1 − 0,1) = = 0,03 n 100
P(X>15%) =
z=
x/n− p 15 / 100 − 0,1 = = 1,67 0,03 p(1 − p ) n
P(X>15%) =P(Z>1,67)=0,0475 jadi peluang akan memperoleh barang rusak paling sdkt 15% dari sampel berukuran 100 adalah 0,0475 Untuk menentukan n terkecil dengan p = 0,1 , d = 0,02 p (1 − p ) 0,1(1 − 0,1) ≤d ⇒ ≤ 0,02 ⇒ d ≥ 225 n n
Dalil Limit Pusat Apabila kita melakukan pemilihan sampel yang berdistribusi normal, bagaimana penghitungannya?
tidak
Secara matematis distribusi rata-rata sampel akan mendekati distribusi normal jika besarnya sampel n bertambah tanpa batas, hal ini didasarkan oleh suatu dalil matematis yang sangat terkenal dan sangat berguna dalam analisis statistik : Dalil limit pusat : Jika sampel acak dipilih dari populasi dengan rata-rata µ X dan varians σ 2 dan jika besarnya sampel n bertambah besar maka rata-rata sampelnya akan memiliki distribusi pemilihan sampel mendekati distribusi normal dengan rata-rata µ X = µ X dan standar deviasi σ X =
σX . Jika n
populasinya terbatas maka rata-rata sampelnya akan memiliki distribusi pemilihan sampel dengan rata-rata µ X = µ X dan standar deviasi σ X =
σX n
N −n , jika populasinya N −1
normal maka distribusi pemilihan sampelnya akan normal. Distribusi Sampling Selisih Rata-Rata Dalam penelitian kita sering ingin ketahui apakah antara rata-rata dua sample mempunyai perbedaan yang berarti ataukah kita bisa mengambil kesimpulan bahwa kedua sample itu berasal dari populasi dengan rata-rata sama. Misalkan terdapat dua populasi yang berukuran cukup besar memiliki rata-rata bakunya
σ1
dan
σ2.
µ1 dan µ 2
sedangkan simpangan
Dari kedua populasi tersebut diambil
sampel yang masing-masing berukuran
n1
dan
n2
. Dari
setiap sampel yang diambil tentukanlah rata-ratanya, sehingga diperoleh x11 , x12 , , x1n , x21 , x22 , , x2 n Misalkan diperoleh 1
2
rata-rata untuk sampel dari populasi pertama rata untuk sampel dari populasi kedua adalah
x1 dan rata-
x2 . Kumpulan
dari x1 dan x2 dinamakan dengan distribusi sampling selisih rata-rata. Bila distribusi ini dicari rata-ratanya diberi simbol µ sr dan simpangan baku σ sr , maka : µ sr = µ1 − µ 2 σ sr =
σ1 σ 2 + n1 n2 2
2
Jika ukuran sample
n1
dan
n2
cukup besar maka
distribusi sampling selisih rata-rata akan mendekati distribusi normal dengan rata-rata µ sr dan simapngan baku
σ sr . Untuk membuatnya menjadi normal maka diperlukan transformasi : z=
( x1 − x2 ) − ( µ1 − µ 2 ) σ1 σ 2 + n1 n2 2
2
Contoh : Misalkan sebuah pabrik memproduksi dua jenis lampu pijar A dan B masing-masing diperkirakan daya pakainya mencapai rata-rata 1.400 jam dan 1.200 jam, sedangkan simpangan bakunya 200 jam dan 100 jam. Jika dari tiap jenis diambil sampel acak masing-masing terdiri atas 125 lampu dan kemudian diuji, berapakah peluang lampu jenis A akan mempunyai rata-rata daya pakai paling sedikit 250 jam lebihnya dari rata-rata daya pakai lampu jenis B? Jawab : Misalkan x A dan xB adalah masing-masing rata-rata daya pakai dari lampu-lampu yang berada dalam sampel-sampel yang diambil dari populasi A dan B. Maka yang dinyatakan adalah peluang ( x A - xB ) paling sedikit 250 jam. Jika digunakan indeks A dan B yang sesuai maka diperoleh : σ1 σ 2 200 2 100 2 σ sr = + = + = 20 jam n1 n2 125 125 2
2
Sehingga z =
250 − (1.400 − 1.200) 250 − 200 = = 2,5 20 20
P(Z>2,5)= 0,621% Besi baja yang diproduksi PT. A memiliki daya regang ratarata 4.500kg dan simpangan baku 200kg. Sedangkan besi baja yang diproduksi PT. B memiliki daya regang rata-rata 4.000kg dan simpangan baku 300kg. Andaikan sampel acak sebesar 50 dipilih dari besi baja hasil produksi PT.A dan sampel acak sebesar 100 dipilih dari besi baja hasil produksi PT. B. Berapa peluang daya regang rata-rata besi baja perusahaan PT.A akan lebih besar 600kg dari pada daya regang rata-rata besi baja PT.B ? Jawab : µ sr = µ1 − µ 2 = 4.500 − 4.000 = 500 σ1 σ 2 σ sr = + = n1 n2 2
2
40.000 90.000 + = 41,23kg 50 100
Z=
600 − 500 = 2,425.. 41,23
P(Z>2,425)=0,75% Distribusi Sampling Selisih Perbandingan Jika terdapat dua populasi, populasi pertama memiliki perbandingan p1 dan simpangan baku p1 (1 − p1 ) dan populasi kedua memiliki perbandingan p2 dan simpangan baku p2 (1 − p2 ) . Kemudian diam bil semua sampel acak yang masing-masing berukuran n1 dan n2 . Kemudian dibentuk semua selisih perbandingan sampel-sampelnya : x1 x 2 − n1 n2
maka akan perbandingan :
diperoleh
distribusi
sampling
selisih
µ sp = p1 − p2
σ sp =
p1 (1 − p1 ) p1 (1 − p 2 ) + n1 n2
Jika perbandingan dari kedua populasi tidak diketahui tetapi dianggap sama, jadi p1 = p2 = p maka diambil perbandingan gabungan : p=
x1 + x2 sehingga diperoleh simpangan bakunya : n1 + n2
σ sp =
1 1 p (1 − p) + n1 n2
Jika sampel berukuran besar maka distribusi selisih perbandingan inipun akan mendekati distribusi normal. Angka standar yang digunakan untuk membuatnya menjadi normal standar adalah : x1 x2 − − ( p1 − p2 ) n n2 z= 1 p1 (1 − p1 ) p1 (1 − p 2 ) + n1 n2
Jika p1 = p2 = p : z=
x1 x2 − n1 n2 1 1 p (1 − p ) + n1 n2
Contoh : Ada semacam barang yang dihasilkan oleh dua pengusaha A dan B. Barang yang dihasilkan oleh A biasa terjadi kerusakan 5% sedangkan barang yang dihasilkan B terjadi kerusakan 4%. Dari barang-barang yang dihasilkan kedua pengusaha ini diambil sampel masing-masing 100 barang. Berapakah peluang selisih perbandingan kerusakan barang yang dihasilkan oleh A terhadap kerusakan barang yang dihasilkan oleh B akan berbeda dalam interval 0,5% ? (halaman 103, buku Sudjana) 0,5% − ( 5% − 4% )
z=
5%(1 − 5%) 4%(1 − 4%) + 100 100
=
− 0,05% = −0,1706 = 0,43227 0,029309
PENDUGAAN SECARA STATISTIK DAN PENDUGAAN PARAMETER •
Pada umumnya kita tidak melakukan observasi atau pengamatan yang menyeluruh meliputi seluruh unsur populasi, kita tidak akan tahu dengan tepat nilai-nilai parameter rata-rata populasi µ X dan simpangan baku
σ X dari distribusi sampel yang kita pilih.
•
Persoalan yang penting adalah menentukan sampel yang harus kita gunakan untuk menduga kuantitas populasi yang tidak diketahui tersebut. Kuantitas sampel yang kita pergunakan untuk pengujian bagi tujuan sedemikian itu dianggap sebagai penduga (estimator). Jadi fungsi nilai sampel yang digunakan untuk menduga parameter tertentu dinamakan penduga parameter yang bersangkutan. Sedangkan nilai-nilai yang dinyatakan dengan angka dan yang kita peroleh dengan jalan mengevaluasi penduga di atas dinamakan dugaan secara statistik (statistical estimate). Misalnya rata-rata sampel X merupakan penduga bagi rata-rata populasi µ X , jika rata-rata sampel adalah 10 maka kita katakan bahwa 10 merupakan dugaan kita secara statistik tentang parameter
µX .
• Dalam pemilihan secara alternatif terhadap berbagai kemungkinan penduga yang dapat dianggap sebagai penduga parameter yang paling baik, kita perlu meneliti ciri-ciri dari berbagai distribusi pemilihan sampel khususnya rata-rata dan variansi. Ciri-ciri penduga yang baik : 1.
Tidak bias (unbiased)
2.
Efisien
3.
Konsisten
Pendugaan parameter distribusi normal Misalkan X 1 , X 2 , X 3 , , X n menyatakan unsur-unsur dari suatu sampel acak sebesar n yang dipilih dari suatu populasi normal dengan rata-rata dan variansi yang tidak diketahui. •
Penduga rata-rata populasi yang paling baik adalah rata-rata sampel yang dirumuskan sebagai : X =
1 n ∑ Xi . n i=1
Rata-rata sampel ini bersifat tidak bias, efisien, dan konsisten. •
Pendugaan dengan s2 =
variansi
variansi
σ X2 dapat
populasi sampel
yang
dilakukan
dirumuskan
:
n
1 ( X i − X )2 . ∑ n − 1 n =1
Pendugaan interval •
Jika kita menginginkan suatu pengukuran yang obyektif tentang derajat kepercayaan kita terhadap kepastian dugaan, maka sebaiknya kita menggunakan pendugaan interval (interval estimation).
• Dengan menggunakan pendugaan interval kita dapat menyatakan berapa besar kepercayaan kita bahwa interval di atas betul-betul mencakup parameter yang kita duga. • Pendugaan interval dapat dirumuskan : st − Z α / 2σ st < parameter < st + Z α / 2σ st st
= statistik sampel atau penduga
Zα / 2
= standar deviasi statistik sampel
σ st
= koefisien yang sesuai dengan interval keyakinan yang digunakan
Pendugaan interval sampel besar : Jika kita menggunakan interval keyakinan 95% dengan
σX
sudah diketahui maka interval keyakinannya dapat diberikan sebagai :
X − Z 0, 025σ X < µ X < X + Z 0,025σ X
X − 1,96
σX σ < µ X < X + 1,96 X n n
Untuk menggambarkan luas dugaan itu secara peluang, interval keyakinan
µX
dapat dinyatakan sbb :
P ( X − Z 0, 025σ X < µ X < X + Z 0, 025σ X ) = 1 − α σ σ P X − 1,96 X < µ X < X + 1,96 X = 0,95 n n
σ disebut dengan ukuran kekeliruan dari n penaksiran parameter rata-rata populasi µ X yang ditaksir berdasarkan X .
• Statistik z α / 2
• Untuk menentukan banyaknya minimum sampel yang
harus diambil agar memenuhi persamaan diatas dapat 2
z .α digunakan rumus : n ≥ α / 2 dengan k = batas kekeliruan k yang diinginkan. Contoh : Sebuah biro pariwisata di Jakarta mengadakan suatu penelitian tentang kepariwisataan di Indonesia dan ingin memperkirakan pengeluaran rata-rata para wisatawan asing per kunjungannya di Indonesia. Guna keperluan di atas dipilih sampel acak sebanyak 100 wisatawan asing untuk diwawancarai. Hasil wawancara dapat diketahui bahwa ratarata pengeluaran per kunjungannya adalah $800 per wisatawan. Jika standar deviasi pengeluaran semua wisatawan dianggap konstan sebesar $120, maka buatlah interval keyakinan sebesar 95% guna menduga rata-rata pengeluaran para wisatawan per kunjungannya di Indonesia Jawab : n = 100, X =$800, σ X =$120, α =0,05, 1 − α =0,95, Z 0,025 = 1,96 Sehingga σ X =
120 100
= $12
P( 800 − 1,96(12) < µ X < 800 + 1,96(12) ) = 0,95
( 776,48 < µ X
< 823,53) = 0,95
Jadi rata-rata pengeluaran para wisatawan per orang per kunjungan dalam selang kepercayaan 95% berkisar antara $776,48 hingga $823,52.
Contoh : Sebuah rumah makan ingin menduga rata-rata pengeluaran para konsumennya untuk makan siang yang dijual oleh rumah makan itu. Sebuah sampel acak dipilih dari populasi yang dianggap tidak terhingga. Dari ketiga puluh enam konsumen, diketahui bahwa rata-rata pengeluarannya adalah Rp.12.000,-. Andaikan standar deviasi dianggap konstan sebesar Rp.2.400,- buatlah interval keyakinan sebesar 95% untuk menduga rata-rata pengeluaran seluruh konsumen. Jawab : n = 36, X =$Rp.12.000, σ X =$2.400, α =0,05, 1 − α =0,95, Z 0, 025 = 1,96
Sehingga σ X =
2400 36
= 400
dan P(12000 − 1,96(400) < µ X < 12000 + 1,96(400) ) = 0,95
(11216< µ X < 12784) = 0,95 Jadi dapat diduga dengan keyakinan 95% bahwa pengeluaran konsumen di rumah makan tersebut sekitar Rp.11.216 dan Rp.12.784. Pendugaan parameter populasi kecil/terbatas. Pada bahasan sebelumnya telah diketahui bahwa untuk sampel yang terbatas rata-rata standar deviasi dari sampel adalah σ X =
σX n
N −n . N −1
N=banyaknya populasi n=banyaknya sampel Dengan keyakinan sebesar 95% dan σ X diketahui maka interval keyakinan
µ X untuk sampel terbatas adalah :
σ P X − 1,96 X n
N−n σ < µ X < X + 1,96 X N −1 n
N −n = 0,95 N − 1
Contoh : Sampel acak sebesar n=64 dan X = 0,1165 dipilih dari populasi yang terbatas sebesar N=300 dan diketahui σ X = 0,012 , maka pendugaan secara parameter µ X dengan interval keyakinan 95,45% adalah sebagai berikut :
σX =
0,012 300 − 64 0,012 236 = = 0,00134 8 300 − 1 8 299
P( 0,1165 − 2(0,00134) < µ X < 0,1165 + 2(0,00134) ) = 0,9545
P( 0,11382 < µ X < 0,11918) = 0,9545
Pendugaan
parameter
µX ,
dengan
σ X tidak
diketahui Apabila taksiran dilakukan berdasarkan pada sampel yang dengan µ X dan σ X tidak diketahui, penggunaan distribusi normal akan mengakibatkan kekeliruan yang cukup besar. Oleh karena itu digunakan pendekatan distribusi t (atau distribusi student). Secara umum pendugaan parameter jika
σX
µX
tidak diketahui adalah dengan sampel tidak
terbatas adalah sebagai berikut :
s s P X − t (α / 2,d . f ) < µ X < X + t(α / 2,d . f ) = 1−α n n d.f. = derajat kebebasan = n-1 pendugaan parameter
µ X jika σ X tidak diketahui dengan
sampel terbatas adalah sebagai berikut :
s P X − t (α / 2,d . f ) n
N −n s < µ X < X + t (α / 2 , d . f ) N −1 n
N − n = 1−α N −1
Contoh : Di suatu pabrik telah diukur 16 buah kayu untuk dasar penaksiran panjang rata-rata tekstil. Dari 16 kayu yang diukur tadi ternyata rata-rata panjangnya 54,5m dan simpangan bakunya 0,8m. Apabila sampel dianggap kecil, tentukan interval kepercayaan panjang rata-rata yang sebenarnya untuk setiap kayu yang dihasilkan dengan α = 5% . Jawab : Diketahui n =16, x =54,5m dan s = 0,8 m Dengan α = 5% dan derajat kebebasan n -1=16-1=15 maka dari tabel distribusi t diperoleh t=2,1315.
0,8 0,8 P 54,5 − 2,1315 < µ X < 54,5 + 2,1315 = 95% 16 16
P (54,1 < µ X < 54,9) = 95% Penaksiran Perbandingan (Proporsi) • Terdapat dua cara untuk menaksir perbandingan
p , yaitu p diambil
taksiran titik dan taksiran interval. Sebagai penaksir perbandingan dari sampel. Jika untuk sebuah sampel yang berukuran n terdapat peristiwa A sebanyak x buah (0 ≤ x ≤ n) dan dalam populasinya terdapat perbandingan peristiwa itu sama dengan p ( p belum diketahui), maka titik taksiran p untuk peristiwan A adalah
p = x/n.
• Kita ketahui bahwa jika terdapat sebuah populasi berukuran N
dengan perbandingan populasi untuk peristiwa tertentu sama dengan
p
memiliki simpangan baku
tersebut kita ambil sampel berukuran • Jika ukuran sampel acak
n.
p(1 − p ) . Dari populasi n
n
cukup besar maka distribusi sampling perbandingan p = x / n ternyata mendekati distribusi normal. Penaksir interval dari sampling perbandingan dirumuskan sebagai berikut :
P p − Z α 2
p (1 − p ) < p < p + Zα n 2
p (1 − p ) = 1−α n
x P − Z α n 2
x x (1 − ) n n < p< x+Z α n n 2
x x (1 − ) n n = 1−α n
• Rata-rata dan simpangan baku untuk distribusi sampling perbandingan: µp = p
σp =
n p(1 − p ) > 5% ) , (jika sampel besar yaitu N n
σp =
n p (1 − p ) N − n ≤ 5% ) , (jika sampel kecil yaitu N n N −1
• Selanjutnya untuk menentukan bagian-bagian luas lengkungan normal standar digunakan transformasi :
dari
Contoh : Dinas kesehatan kota ingin sekali meneliti persentase penduduk kota dewasa yang merokok paling tidak satu bungkus sehari. Sebuah sampel acak sebesar n=300 dipilih dari populasi yang terdiri dari penduduk kota yang telah dewasa dan ternyata 36 orang merokok paling sedikit satu bungkus sehari. Buatlah
interval keyakinan sebesar 95% guna menduga proporsi penduduk kota dewasa yang merokok paling sedikit satu bungkus perharinya. Jawab : p=X/n=36/300=12
0,12(1 − 0,12) 0,12(1 − 0,12) = 1 − 5% P 0,12 − Z 5% < p < 0,12 + Z 5% 300 300 2 2 0,12(1 − 0,12) 0,12(1 − 0,12) = 95% P 0,12 − 1,96 < p < 0,12 + 1,96 300 300
P( 0,12 − 0,037 < p < 0,12 + 0,037 ) = 95% Jadi jika kita gunakan interval keyakinan 95% maka dugaan bahwa proporsi penduduk dewasa yang merokok paling sedikit satu bungkus perharinya akan terletak antara 8,3% hingga 15,7% • Kita dapat menentukan nilai minimum ukuran sampel
n
bila perbandingan tiap sampel yang diharapkan terjadi diketahui. Nilai
n
tersebut dihitung dari :
p (1 − p) ≤d . n
PENGUJIAN HIPOTESIS • Salah satu kegunaan dari ilmu statistik adalah sebagai
alat untuk pengambilan kesimpulan atau keputusan mengenai suatu populasi. Pengambilan kesimpulan atau keputusan tersebut menggunakan sifat-sifat atau karakteristik sampel yang diambil dari populasi.
• Pengambilan keputusan dari suatu populasi tersebut hendaknya dilakukan cukup alasan dan dapat dipertanggungjawabkan secara ilmiah. • Dalam usaha untuk memperoleh kesimpulan, biasanya
didahului oleh adanya dugaan, atau pengandaian atau asumsi mengenai populasi yang bersangkutan. Pengandaian ini mungkin betul mungkin juga tidak betul, disebut dengan hipotesis statistik atau disingkat hipotesis. Hipotesis inilah yang akan diteliti kebenarannya dengan menggunakan karakteristik sampel yang diambil dari populasi. Sehingga sampailah kita pada kesimpulan menerima hipotesis (artinya hipotesisnya benar) atau tidak menerima hipotesis (artinya hipotesisnya salah).
• Apabila kita memiliki sebuah hipotesis mengenai sebuah populasi, maka kita akan selalu memiliki sebuah hipotesis alternatif yang berlawanan dengan hipotesis tadi. Hipotesis yang berlawanan tersebut disebut dengan hipotesis tandingan. • Pada pengambilan kesimpulan dari suatu populasi, yaitu
dengan cara menerima hipotesis atau menolak hipotesis tentu saja dapat terjadi pengambilan kesimpulan yang “benar” atau pengambilan keputusan yang “salah”. Berikut ini adalah berbagai kemungkinan yang dapat terjadi : 1. Jika hipotesis benar, dan kita menerima hipotesis
tersebut. Maka pengambilan keputusan tersebut adalah langkah benar. 2. Jika hipotesis yang dibuat adalah salah, dan kita
menolak hipotesis tersebut. Maka pengambila keputusan tersebut adalah langkah yang benar. 3. Jika hipotesis yang dibuat adalah benar, tetapi
berdasarkan penelitian yang dilakukan kita menolaknya. Maka pengambilan keputusan tersebut adalah langkah yang keliru. Kekeliruan tersebut disebut dengan kekeliruan jenis I atau kekeliruan α . Jadi kekeliruan α adalah kekeliruan yang terjadi waktu mengambil kesimpulan yang seharusnya diterima tetapi kita menolaknya.
4. Jika hipotesis yang dibuat adalah salah, tetapi berdasarkan penelitian yang dilakukan kita menerimanya. Maka pengambilan keputusan tersebut adalah langkah yang keliru. Kekeliruan tersebut disebut dengan kekeliruan jenis II atau kekeliruan beta. Jadi kekeliruan beta adalah kekeliruan yang terjadi pada waktu kita menolak sesuatu yang seharusnya diterima.
Kesimpulan
Keadaan sebenarnya Hipotesis benar
Hipotesis salah
Hipotesis diterima
Kesimpulan benar
Kekeliruan jenis II
Hipotesis ditolak
Kekeliruan jenis I
Kesimpulan benar
• Jadi untuk melakukan pengujian hipotesis harus dilakukan
dengan perencanaan sedemikian rupa sehingga kekeliruan-kekeliruan α dan β dapat ditekan hingga sekecil mungkin untuk menghindari kesalahan pengambilan keputusan.
• Besar kecilnya risiko membuat kekeliruan ( α
atau β ) biasanya dinyatakan dalam bentuk peluang. Peluang melakukan kekeliruan jenis I (yaitu peluang peluang menolak hipotesis benar) dinamakan taraf signifikan atau taraf nyata atau taraf arti, peluang ini sering dinyatakan dengan α . Arti dari nilai α adalah kita merasa yakin sebesar (1- α )% bahwa kita telah membuat kesimpulan yang benar. Nilai α dapat ditentukan sebelum penelitian dilakukan.
• Salah satu tahap yang penting dalam prosedur pengujian
hipotesis adalah menentukan kriteria menerima atau menolak hipotesis (yaitu menentukan nilai statistik sampel yang dianggap sebagai alasan dasar guna menerima atau menolak hipotesis). Nilai statistik demikian itu disebut dengan daerah kritis (critical region). Daerah penerimaan H0 Daerah penolakan H0
s Titik kritis
Daerah kritis Salah satu tahap yang penting dalam prosedur pengujian hipotesis adalah menentukan kriteria menerima atau menolak H0 (menentukan nilai statistik sampel yang dianggap sebagai alasan dasar guna menerima atau menolak H0 di atas). Nilai statistik demikian itu disebut dengan daerah kritis (critical region). • Langkah-langkah
yang harus dipersiapkan melakukan pengujian hipotesis adalah :
dalam
1. Merumuskan hipotesis dan hipotesis alternatif Hipotesis statistik adalah suatu pernyataan atau dugaan mengenai satu atau dua populasi.
a. Hipotesis yang mengandung pengertian sama :
H o : µ = µ0 H1 : µ ≠ µ0 b. Hipotesis yang mengandung pengertian maksimum :
H o : µ ≤ µ0 H1 : µ > µ0 c. Hipotesis yang mengandung pengertian minimum :
H o : µ ≥ µ0 H1 : µ < µ0 2. Menentukan alat uji hipotesis
z=
x−µ σ/ n
t=
x−µ s/ n
Uji z digunakan apabila simpangan baku populasi (sigma) ketahui Uji t digunakan apabila simpangan baku sample (s) diketahui
3. Menentukan kriteria penerimaan atau penolakan hipotesis, termasuk didalamnya menentukan taraf signifikan α. Taraf signifikansi dari pengujian hipotesis statistik adalah peluang dari kekeliruan jenis I, yaitu peluang menolak hipotesis nol yang benar.
α /2
α
α /2
α 4. Melakukan penarikan kesimpulan Menguji rata-rata Contoh 1 : Dari pengalaman yang cukup meyakinkan ternyata pada umumnya masa pakai semacam lampu pijar sekitar 800 jam. Akhir-akhir ini timbul dugaan bahwa masa pakai lampu itu telah mengalami perubahan (belum diketahui apakah menjadi lebih baik atau menjadi lebih buruk). Untuk menentukan apakah memang kualitas telah berubah atau masih sama seperti yang lalu, pengusaha menguji sebanyak 50 buah lampu. Kelima puluh buah lampu tersebut dinyalakan terus menerus hingga mati kemudian untuk setiap lampu dicatat berapa lama bisa menyala, dan akhirnya ditentukan rata-ratanya. Andaikan diperoleh untuk kelima puluh buah lampu yang dicoba tadi rata-rata masa pakainya 792 jam dan simpangan baku untuk populasi lampu itu 60 jam. Apabila pengujian dugaan ini risiko α = 5% , ambilah kesimpulan bahwa kualitas lampu tersebut masih tetap atau sudah berubah.
Contoh 2 : Sebuah iklan mengatakan bahwa singlet merek A yang dihasilkan oleh suatu pabrik cukup awet untuk dipakai selama tempo 180 hari. Untuk menguji kebenaran pernyataan iklan tersebut, diambil sampel sebanyak 36 sampel untuk digunakan (sebagaimana keadaan lazim) hingga rusak. Andaikan dari 36 sampel tersebut diperoleh rata-rata rusak pada hari ke 174, jika simpangan baku ditaksir 10 hari dan untuk pengujian hipotesis ini digunakan α = 5% . Tentukanlah apakah penelitian yang dilakukan berhasil memperlihatkan bahwa singlet ini cukup awet sesuai dengan pernyataan iklan ? Uji menyangkut rata-rata dan variansi H0 µ = µ0
µ = µ0
Uji Statistik
Daerah kritis
Z=
X − µ0 ,σ diketahui σ/ n
µ < µ0 µ > µ0 µ ≠ µ0
Z < − zα
T=
X − µ0 ,v = n −1 s/ n
µ < µ0 µ > µ0 µ ≠ µ0
T < −tα
σ tidak diketahui µ1 − µ 2 = d 0
H1
( X1 − X 2 ) − d0
Z=
(σ 12 / n1 ) + (σ 22 / n 2 )
Z > zα Z < − zα / 2 dan Z > zα / 2
T > tα T < −tα / 2 dan T > tα / 2
µ1 − µ 2 < d 0 Z < − z α µ1 − µ 2 > d 0 Z > z α µ1 − µ 2 ≠ d 0 Z < − zα / 2 dan Z > zα / 2
;
σ 1 , σ 2 diketahui µ1 − µ 2 = d 0
T=
( X1 − X 2 ) − d0 S p / (1 / n1 ) + (1 / n2 )
µ 1 − µ 2 < d 0 T < −t α µ1 − µ 2 > d 0 T > t α µ1 − µ 2 ≠ d 0 T < −tα / 2 dan T > tα / 2
;
v = n1 + n2 − 2, σ 1 = σ 2 2
Sp =
(n1 − 1) s1 + (n 2 − 1) s 2 n1 + n 2 − 2
2
σ 1 , σ 2 tidak diketahui µ D = d0
T=
D − d0 ;v = n −1 s/ n
σ tidak diketahui
µD < d0 µD > d0 µD ≠ d0
T < −tα T > tα T < −tα / 2 dan T > tα / 2
p < p0
Z < − zα
Z=
x − p0 n p 0 (1 − p 0 ) / n
p > p0 p ≠ p0
Z > zα Z < − zα / 2 dan Z > zα / 2
d < d0
Z < − zα
Z=
x1 x 2 − − d 0 n1 n2 p1 (1 − p1 ) p 2 (1 − p 2 ) + n1 n2
d > d0
Z > zα Z < − zα / 2 dan Z > zα / 2
p = p0
p1 − p 2 = d 0
σ 2 = σ 02
χ2 =
(n − 1) S 2 ,v = n −1 σ 02
d ≠ d0
σ 2 <σ0
2
χ 2 < χ12−α
σ 2 > σ 02
χ 2 > χ −2α
σ 2 ≠ σ 02
χ 2 < χ12−α / 2 dan χ 2 > χ 2 α / 2
Prosedur umum untuk melakukan pengujian hipotesis adalah sebagai berikut : 1. Nyatakan hipotesis nol serta hipotesis tandingannya. 2. Pilih taraf keberartian (level of significance)
α
tertentu
yang diinginkan serta tentukan besar sampel n. 3. Pilih uji statistik yang sesuai sebagai dasar bagi prosedur pengujian. 4. Tentukan daerah kritis. Hal tersebut bergantung kepada
hipotesis tandingannya (H1). 5. Kumpulkan data sampel dan hitung statistik sampel
serta ubah ke dalam variabel Z atau T. 6. Jika statistik yang dihitung dengan cara demikian itu
terletak dalam daerah penolakan, kita harus menolak hipotesis nol (H0). Contoh : Sebuah pabrik memproduksi pelat baja dengan panjang rata-rata 80cm dengan standar deviasi 7 cm. Setelah sekian tahun mesin yang memproduksi baja tersebut diragukan keakuratan ukurannya dalam memproduksi pelat baja tersebut. Untuk itu diambil sampel acak sebanyak 100 unit pelat baja, setelah diukur panjang rata-ratanya 83cm dan standar deviasinya tidak berubah. Apakah masih diragukan bahwa rata-rata panjang pelat baja yang dihasilkan pabrik tersebut tidak sama dengan 80cm? Ujilah dengan taraf keberartian 5%. Jawab :
H 0 : µ = 80
1.
H 1 : µ ≠ 80
2.
α = 5%
3.
Z=
X − µ0 , σ diketahui σ/ n
4. Daerah kritis :
α /2
α /2 -1,96
1,96
83 − 80 = 4,2857 7 / 100
5.
Z=
6.
Karena Z>1,96 berarti Z jatuh pada daerah penolakan H0 . Maka H0 harus ditolak dengan resiko kesalahan menolak H0 yang benar 5%.
Contoh : Rata-rata waktu yang diperlukan calon mahasiswa pada saat pendaftaran di sebuah perguruan tinggi adalah 50 menit dengan standar deviasi 10 menit. Suatu cara pendaftaran baru dengan menggunakan komputer canggih sedang diujicobakan. Bila sampel acak dengan 12 mahasiswa membutuhkan waktu mendaftarkan diri 42 menit dengan simpangan baku 11,9 menit menggunakan cara baru ini, ujilah hipotesis bahwa rataan populasi sekarang lebih kecil dari 50 dengan taraf keberartian (1) 5% (2) 1%. Anggaplah populasi waktu mendaftar berdistribusi normal.
Jawab :
H 0 : µ ≥ 50menit
1. 2.
H1 : µ < 50menit
α = 5% ;
3. T =
X − µ0 , v = n −1 s/ n
4. Daerah kritis : (1) T<-2,2010; (2) T<-3,1058
α 5.
T=
42 − 50 = −2,33 11,9 / 12
6. Kesimpulan : Tolak H0 pada taraf keberartian 5%. Artinya pada taraf keberartian 5% cara pendaftaran dengan menggunakan komputer canggih tersebut dianggap mampu menurunkan waktu yang dipakai saat pendaftaran ; tetapi terima H0 pada taraf keberartian 1%, yang berarti cara pendaftaran baru dengan menggunakan komputer canggih tidak mampu menurunkan waktu saat pendaftaran. Contoh : a. Sebuah iklan mengatakan bahwa singlet merek A yang
dihasilkan oleh suatu pabrik cukup awet untuk dipakai selama tempo 180 hari. Untuk menguji kebenaran pernyataan iklan tersebut, diambil sampel sebanyak 36 sampel untuk digunakan (sebagaimana keadaan lazim) hingga rusak. Andaikan dari 36 sampel tersebut diperoleh rata-rata rusak pada hari ke 174, jika simpangan baku ditaksir 10 hari dan untuk pengujian hipotesis ini digunakan α = 5% . Tentukanlah apakah penelitian yang dilakukan berhasil memperlihatkan bahwa singlet ini cukup awet sesuai dengan pernyataan iklan ?
b. Diduga bahwa pemuda-pemuda yang gemar melakukan
atletik pada umumnya lebih tinggi badanya. Kemudian diambil sampel masing-masing 50 pemuda dari kelompok gemar atletik dan tidak gemar atletik untuk diukur tingginya diperoleh rata-rata 163,5cm untuk kelompok gemar atletik dan 162cm untuk kelompok yang tidak gemar atletik. Benarkah pemuda yang gemar atletik lebih tinggi badannya dibandingkan dengan yang tidak gemar atletik? Ambil simpangan baku 7cm untuk masing-masing populasi. c. Berdasarkan hasil survey sekitar 30% saja dari orangorang yang datang ke sebuah toko kemudian berbelanja disitu, selebihnya hanya melihat-lihat saja. Akhir-akhir ini si empunya toko memperkirakan bahwa saat ini telah mengalami perubahan. Lalu diadakan survey terhadap 400 orang yang datang ke toko tersebut, terdapat 132 orang yang datang dan berbelanja. Buatlah kesimpulan dari hasil penelitian yang dilakukan oleh si pemilik toko tersebut dengan taraf nyata 5% ! d. Dari lampu pijar yang dihasilkan pengusaha A dicoba sebanyak 100 buah sedangkan dari pengusaha B dicoba 80 buah. Dari penelitian diperoleh bahwa ratarata masa pakai lampu A 807 jam sedangkan masa pakai B adalah 822 jam dengan simpangan baku sama yaitu 80 jam. Ujilah dengan dengan taraf nyata 5% untuk membuktikan bahwa kekuatan lampu itu sama atau berbeda ? e. Seorang produsen menyatakan bahwa 95% dari barang
yang dihasilkan tergolong pada kualitas yang memuaskan. Pemeriksaan terhadap 200 barang yang dihasilkan ternyata 18 di antaranya tidak disenangi oleh konsumen karena cacat. Selidikilah pernyataan produsen tadi dengan taraf nyata 1%. f. Kita ketahui bahwa dalam satu rim kertas terdiri dari
500 lembar. Akhir-akhir ini setiap pembeli mengeluh karena jarang sekali diperoleh rim kertas yang penuh. Dari penelitian diperoleh bahwa dari 160 rim kertas yang diambil secara bebas dipasaran rata-rata berisi 492 lembar, simpangan baku 4 lembar. Dengan taraf nyata 1%, apakah penelitian ini memperkuat keluhan konsumen ? g. Penelitian yang dilakukan di suatu kota ternyata dari 100 kaum ibu ada 68 orang yang lebih menyenangi
tepung A apabila dibandingkan dengan 32 ibu ibu yang menyenangi tepung B. Penelitian di kota lain menghasilkan 216 orang dari 300 kaum ibu ternyata menyenangi tepung A sedangkan sisanya menyenangi tepung B. Gunakan taraf nyata 5% untuk menguji perbedaan yang nyata ataukah tidak mengenai kaum ibu yang menyenangi tepung A di kedua kota itu ? UJI CHI-KUADRAT Pada bahasan sebelumnya kita telah pelajari pengujian hipotesis yang menyangkut uji rata-rata, uji proporsi, uji selisih rata-rata dan uji selisih proporsi. Untuk melakukan pengujian hipotesis yang menyangkut pengujian simpangan baku (sigma) terlebih dahulu harus dipelajari sebuah distribusi yang disebut dengan distriubsi Chi-Kuadrat χ 2 . Sekedar untuk mengetahui hasil disingkat dengan penelaahan matematis, maka distribusi Chi-Kuadrat 2 χ disingkat dengan memiliki persamaan :
y = y0 e
1 − χ2 2
(χ )
1 2 − 2 ( v −2 )
Dimana : χ 2 = merupakan variabel kontinu yang harganya dibatasi oleh 0 ≤ χ 2 ≤ α v = derajat kebebasan yang nilainya = (n-1) y 0 = bilangan tetap yang membuat luas di bawah grafik dan
di atas sumbu datar sama dengan satu unit persegi. Menaksir Simpangan Baku Pada bahasan sebelumnya telah dipelajari cara menaksir rata-rata, menaksir proporsi, menaksir selisih rata-rata dan menaksir selisih proporsi, berupa taksiran titik serta taksiran interval. Untuk taksiran interval dari simpangan baku sigma digunakan rumus sbb :
s n −1 s n −1 ≤σ ≤ χ1 χ 1 2
α
1− α 2
Contoh : Seorang ahli ekonomi meneliti sampel yang terdiri atas 20 pasar tradisional di suatu daerah untuk menentukan berapa besar variasi yang mungkin mengenai harga daging sapi. Diperoleh 20 jenis harga daging sapi dengan rata-rata Rp.
95,- dengan simpangan baku Rp. 3,- . tentukan batas-batas variasi harga dengan koefisien kepercayaan 95%.
Jawab : Yang ditanyakan tidak lain adalah batas-batas sigma untuk s=3, n=20, alpa=5%. Kita misalkan populasi berdistribusi normal. Jika harga-harga ini disubstitusikan ke rumus diatas, untuk χ 2 0,975 = 8,90655 dan χ 2 0,025 = 32,8523 (masing-masing dengan d.k.=20-1=19), maka diperoleh :
3 20 − 1 32,8523
≤σ ≤
3 20 − 1 8,90565
atau
2,28 ≤ σ ≤ 4,38
Menguji Simpangan Baku Langkah-langkah untuk pengujian hipotesis menyangkut sigma : 1. Tentukan hipotesis H0 serta H1 2. Tentukan
α
3. Tentukan
alat
uji
hipotesis
chi
kuadrat
:
(n − 1) S 2 χ = ,v = n −1 σ 02 2
4. Tentukan daerah kritis :
5. Tentukan nilai statistik dari uji chi kuadrat sampel 6. Buat kesimpulan Contoh : Suatu pengusaha pembuat baterei HP menyatakan umur baterainya berdistribusi hampir normal dengan standar deviasi 0,9 tahun. Bila sampel acak sebesar 10 baterai mempunyai standar deviasi 1,2 tahun, apakah σ > 0,9 ? Jawab : 1. 2.
H 0 :σ 2 ≤ 0,81 H1 :σ 2 > 0,81
α = 5%
(n − 1) S 2 ,v = n −1 3. χ = σ 02 2
4. Daerah kritis : χ 2 >16,919;
α (10 − 1)(1,2) 2 5. χ = = 16,0 0,81 2
6. Kesimpulan : Terima H0 pada taraf keberartian 5% dan disimpulkan bahwa tidak ada alasan bahwa standar deviasi lebih dari 0,9 tahun. Contoh : Diketahui bahwa simpangan baku untuk volume air minum dalam kemasan botol merek tertentu adalah 0,25cc. Akhirakhir ini diduga bahwa mesin telah berjalan tidak sebagaimana mestinya. Oleh karena variasi isi botol diduga telah membesar. Untuk menentukan apakah perlu atau tidak set up ulang terhadap mesin, diteliti sebanyak 20 botol dengan simpangan baku s=0,32cc. Tentukan, apakah mesin itu ternyata perlu di set up ulang dengan taraf nyata 5%? Jawab : 1. 2.
H 0 :σ = 0,25 H1 :σ > 0,25
α = 5%
2 3. χ =
(n − 1) S 2 ,v = n −1 σ 02
4. Daerah kritis : χ 2 >30,144;
α (20 − 1)(0,32) 2 = 31,1296 5. χ = (0,25) 2 2
6. Kesimpulan : Tolak H0 pada taraf keberartian 5% dan disimpulkan bahwa simpangan baku volume air minum dalam kemasan botol tersebut melebihi 0,25cc sehingga mesin harus di set up ulang. Uji Chi-Kuadrat untuk data Multinomial Pada bahasan sebelumnya telah kita pelajari data binomial, yaitu jenis data yang dapat di bedakan menjadi dua kategori. Sedangkan apabila data yang dapat dibedakan lebih dari dua kategori disebut dnegan data mutinomial. Agar perumusan lebih mudah, k buah kategori diberi nomor urut 1,2,...,k. Frekuensi yang terjadi berdasarkan hasil percobaan atau pengamatan disebut fi sedangkan frekuensi yang diperoleh berdasarkan teori yang berlaku dinamakan Fi . 1
2
...
K
Pengamatan (fi)
f1
f2
...
fk
Teoritis (Fi)
F1
F2
...
Fk
Untuk menguji kesesuaian antara fi dan Fi digunakan statistik : k
( f i − Fi ) 2
i =1
Fi
χ =∑ 2
, dengan d.k. = (k-1)
Langkah-langkah Uji Chi Kuadrat untuk data pengujian hipotesis menyangkut data multinomial : 1. Tentukan hipotesis H0
:
µ1 = µ 2 = ... = µ k sedangakan
untuk H1 : paling sedikit satu tanda sama dengan tidak berlaku 2. Tentukan 3. Tentukan
α
alat
uji k
2 mutlinomial : χ = ∑ i =1
(
hipotesis chi kuadrat 2 f i − Fi ) , dengan d.k. = (k-1) Fi
4. Tentukan daerah kritis : 5. Tentukan nilai statistik dari uji chi kuadrat sampel 6. Buat kesimpulan
Contoh : Banyaknya orang yang berbelanja ke sebuah toko setiap hari selama satu minggu adalah sbb : Hari
Senin
Berbelan 127 ja
Selasa
Rabu
Kamis
Jumat
Sabtu
112
121
109
132
149
Supaya diuji dengan alpa =5% apakah banyaknya orang yang berbelanja itu bergantung kepada hari ataukah tidak? Penyelesaian : µ1 = µ 2 = ... = µ k yiatu hipotesis H0 : banyaknya orang yang berbelanja tidak bergantung kepada nama hari. sedangakan untuk H1 : paling sedikit satu tanda sama dengan tidak berlaku atau banyak orang yang berbelanja bergantung kepada nama-nama hari
1. Tentukan
2. Tentukan 3. Tentukan
α
=5% alat
uji
mutlinomial : χ = 2
k
∑
hipotesis
( f i − Fi )
i =1
chi
kuadrat
2
, dengan d.k. = (k-
Fi
1) 4. Tentukan daerah kritis :
dengan d.k=(6-1)=5
diperoleh batas daerah kritis χ 2 = 11,0705
α 5. Tentukan nilai statistik dari uji chi kuadrat sampel Hari
Senin
Selasa Rabu
Kamis
Jumat
Sabtu
fi
127
112
121
109
132
149
Fi
125
125
125
125
125
125
Fi =
127 + 112 + 121 + 109 + 132 + 149 = 125 6
(127 − 125) 2 (112 − 125) 2 (121 − 125) 2 (109 − 125) 2 (132 − 125) 2 (149 − 125) 2 + + + + + 125 125 125 125 125 125 2 χ = 8,56
χ2 =
6. Kesimpulan : terima H0 , berarti bahwa hari-hari dalam minggu tidak mempengaruhi banyak orang yang datang berbelanja ke toko tersebut. Hari
I
II
III
IV
V
VI
fi
5
15
10
20
0
10
Fi
10
10
10
10
10
10
Tabel Kontingensi bxk Seperti yang sudah dibahas pada bagian sebelumnya bahwa data yang bersifat kualitatif atau kategori ini biasanya dapat disajikan dalam bentuk tabel kontingensi. Tabel kontingensi ini merupakan bentuk khusus dari tabel baris-kolom. Kekhususannya adalah bahwa tabel kontingensi diberi ukuran menurut banyaknya kategori dalam baris dan banyaknya kategori dalam kolom. Apabila kategori dalam baris ada b buah dan kategori dalam kolom ada k buah, maka tabel seperti ini disebut tabel kontingensi bxk. Yang paling sederhana adalah tabel kontingensi 2x2 artinya untuk masing-masing baris dan kolom mempunyai dua kategori. Data kualitatif yang dikumpulkan dicatat menurut kategori yang digunakan disertai banyaknya atau frekuensi yang diperoleh. Frekuensi untuk setiap kategori dinyatakan dalam bentuk bilangan. Tabel yang disajikan dalam tabel 9.5 terdiri atas b baris (dari b kategori untuk faktor I) dan k kolom (dari k kategori untuk faktor II) sehingga semuanya akan terdapat (bxk) buah sel. Sel yang dibentuk baris ke-i dan kolom ke-j sel (i,j) mempunyai frekuensi pengamatan sebesar Oij . Jumlah frekuensi baris ke-i adalah Oi0=Oi1+ Oi2+ Oi3+...+ Oik. Demikian juga jumlah frekuensi kolom ke-j diberi notasi Ooj sehingga O0j=O1j+ O2j+ O3j+...+ Obk Tabel kontingensi bxk Faktor II (kolom) Jumlah Kat 1 Kat 2 ... Kat k Kat 1 O11 O12 ... O1k O1o Kat 2 O21 O22 ... O2k O2o Faktor I (baris) ... Kat b Ob1 Ob2 ... Obk Obo Oo1 Oo2 ... Ook Ooo Frekuensi seluruh pengamatan atau ukuran sampelnya adalah N= O00=O01+ O02+ O03+...+ O0k= O10+ O20+ O30+...+ Ob0
Uji Kebebasan Antara Dua faktor Pertanyaan yang sering muncul dalam analisis seperti ini adalah “apakah faktor (atau variabel) I yang terdiri dari beberapa katagori bergantung pada faktor II yangjuga terdiri dari beberapa katagori ?”. Dengan kata lain, kita akan menentukan apakah antara faktor I dan faktor II itu saling bebas atau tidak. Untuk menguji kebebasan antara dua faktor ini, dimana bentuk hipotesisnya adalah Ho : faktor I dan faktor II saling bebas (independent) Hi : Faktor I dan faktor II tidak saling beabas (dependent) Dapat dilakukan dengan menggunakan statistik uji chi-kuadrat, dengan rumus hitung sebagai berikut :
Dengan penjumlahan dilakukan terhadap semua (bxk) sel. Untuk dapat menghitung statistim uji diatas, maka terlebih dahulu kita perlu menghitung frekuensi harapan bagi setiap sel dalam tabel 4 dibawah asumsi bahwa Ho benar. Rumus untuk mendapatkan frekuensi ini adalah
Adapun kreteria uji dalam pengujian hipotesis diatas adalah bila > dengan derajat bebas v = (b – 1)(k – 1), maka tolak hipotesis Ho bahwa kwdua faktor tersebut saling bebas pada taraf nyata α, bila dalam hal lainnya Ho diterima.
Contoh 4 Perhatikan tabel klasifikasi silang mengenai sikap atau pandangan responden pada masalah aborsi dan lamanya pendidikan responden (dalam tahun) dimana hal ini sikap tentang aborsi sebagai baris dan lamanya pendidikan sebagai kolom. Data diperoleh dari General Social Surveys pada tahun 1972-1974 (Haberman, 1978). Tabel 5.6 Sikap tentang aborsi dan pendidikan : sel frekuensi :
<8 Pendidikan 9-12 >13 Total
Positif 101
Sikap Ragu Negatif 120 320
599
341
756
475
161
308
1175
622
1384
Total 541 1696 944 3181
1. Apakah terdapat hubungan atau asosiasi antara faktor lamanya pendidikan dengan sikap responden terhadap masalah aborsi. 2. Jika terdapat hubungan, bagaimana kekuatan hubungan itu terjadi? Hipotesis yang di uji disini adalah : Ho : faktor lamanya pendidikan dengan faktor sikap responden adalah saling bebas H1 : faktor lamanya pendidikan dengan faktor sikap responden adalah tidak saling bebas. Hitung nilai harapan untuk masing-masing sel dalam kasus ini faktor I terdiri dari 3 kategori dan faktor II terdiri dari 3 kategori, sehingga nantinya akan terdapat 9 buah nilai harapan yang harus dihitung. Untuk sel (1,1) : Untuk sel (1,2) : Demikian seterusnya dengan cara yang sama diperoleh nilai harapan untuk sel (3,3) adalah : Hasil perhitungan nilai harapan untuk masing-masing sel selengkapnya dapat dilihat pada tabel berikut ini Sikap Positif Ragu 101 120 <8 (199.83) (105.78) 599 341 Pendidikan 9-12 (626.47) (331.63) 475 161 >13 (140.96) (184.59) Total 1175 622
Negatif 320 (235.38) 756 (737.90) 308 (410.72) 1384
Total 541 1696 944 3181
Selanjutnya dengan mengambil taraf signifikansi sebesar 5% dan derajat bebas v=(3-1)(3-1)=4, maka dari tabel distribusi chi-kuadrat diperoleh nilai . Oleh karena itu nilai . Maka dapat diputuskan bahwa kita akan menolak hipotesis nol tentang faktor lamanya pendidikan dengan faktor sikap responden adalah saling bebas, dan menerima hipotesis alternatifnya. Artinya bahwa terdapat hubungan antara faktor lamanya pendidikan dengan faktor sikap responden dalam menghadapi masalah aborsi.
Ukuran Asosiasi Antara Dua Faktor Dalam hal pengujian hipotesis Ho diatas ditolak, yang berarti kedua faktor itu tidak saling bebas, peneliti sering ingin mengetahui derajat hubungan atau asosiasi ini, kita dapat membandingkan dengan hasil penelitian lain yang sejenis dan tentunyan dapat membayangkan bagaimana kedua faktor kuatnya saling terikat. Ada sejumlah ukuran asosiasi yang telah ditemukan, yang pada umumnya dihitung dengan menggunakan statistik uji x2 yang diperoleh melalui persamaan sebelumnya. Beberapa diantara ukuran-ukuran asosiasi itu adalah : a. Koefisien Kontingensi Pearson Koefisien kontingensi ini diusulkan poleh pearson dan mempunyai harga antara nol dan satu. Rumus hitung koefisien ini diberikan oleh:
Dimana p = 0 menyatakan adanya kebebasan yang sempurna antara kedua faktor atau variabel, sedangkan untuk p = 1 menyatakan adanya asosiasi sempurna. Akan tetapi, pada umumnya nilai p tidak akan mencapai batas atas satu. b. koefisien Kontingensi Kendall – Stuart Kendall – stuart memberikan rumus lain sebagai perbaikan terhadap koefisien kontingensi pearson. Mereka memasukan banyaknya baris dan kolom dalam daftar kontingensi kedalam rumus sehingga diperoleh :
Dalam hal terjadi kebebasan yang sempurna antara kedua faktor, rumus diatas akan memberikan terjadi kebebasan yang sempurna antara kedua faktor, rumus di atas akan memberikan T=0. Batas atas tercapai sama dengan satu apabila antara kedua faktor terjadi hubungan yang tidak saling bebas sempurna untuk b=k, artinya daftar kontingensi yang mempunyai banyaknya baris sama dengan banyaknya kolom. Jika daftar kontingensi (bxk) dibuat dengan bxk, maka batas atas ini tidak akan tercapai. a. Koefisien Kontingensi Cramer Cramer memperbaiki koefisien kontingensi Kendall-Stuart sehingga harganya akan mencapai batas atas +1 dimana rumusnya diberikan oleh :
Dengan adalah harga terkecil di antara banyaknya baris dan kolom dalam tabel kontingensi. Apabila b=k , berarti daftar kontingensi ini berbentuk bujur sangkar sehingga nilai C akan sama dengan T, sedangkan dalam hal bxk maka akan berlaku C akan lebih besar daripada T. Pada contoh sebelumnya, untuk mengukur kekuatan hubungan antara kedua faktor itu dapat dihitung dengan menggunakan koefisien kontingensi Pearson, yaitu :
Jadi, walaupun terdapat asosiasi antara faktor lamanya pendidikan dengan faktor sikap responden dalam menghadapi masalah aborsi tetapi derajat asosiasinya sangat rendah, yaitu hanya sebesar 5%.
REGRESI LINIER Seringkali penelitian dilakukan melibatkan data lebih dari satu populasi, misalnya populasi X dan populasi Y. Penelitian tersebut dilakukan untuk mengetahui hubungan antara X dan Y. Didalam bahasan Regresi Linier, kedua populasi ini disebut dengan variabel X dan variabel Y. Sebagai contoh X adalah himpunan data banyak pengunjung yang datang ke suatu suatu toko, sedangkan Y adalah himpunan data pemasukan bagi toko tersebut. Hubungan linier antara variabel Y dan X, dengan variabel Y sebagai variabel tak bebas dan variabel X sebagai variabel bebas secara matematis dirumuskan sebagai berikut :
Yˆ = a + bX Rumusan hubungan ini disebut dengan nama regresi Y atas X, dengan Yˆ berarti taksiran nilai Y untuk harga X yang diketahui. Variabel X disebut variabel bebas sedangkan variabel Y disebut variabel tak bebas karena harganya ditentukan oleh X. Tugas yang dihadapi oleh peneliti adalah menentukan harga a dan b berdasarkan data atau sampel X dan Y yang diketahui. Dengan menggunakan metode kuadrat terkecil harga a dan b adalah sebagai berikut : b=
n∑ X iYi −
( ∑ X )( ∑ Y ) i
i
n∑ X − ( ∑ X i ) 2 i
2
( ∑ Y )( ∑ X ) − ( ∑ X )( ∑ X Y ) a= n∑ X − ( ∑ X ) 2 i
i
i
i i
2
2 i
i
Rumus yang lebih mudah diingat : b=
∑ ( X − X )(Y − Y ) ∑( X − X ) i
i
2
i
a = Y − bX
b disebut kemiringan b menunjukkan besar
Parameter parameter
garis
regresi,
pengaruh
harga
variabel
X
terhadap variabel Y. Sedangkan parameter a , adalah bilangan konstan yang harganya tidak menunjukkan peran terhadap pengaruh X terhadap Y. B
A
Harga koefisien b positif menunjukkan adanya pengaruh positif X terhadap Y (secara grafis ditunjukkan oleh gambar A). Sedangkan harga koefisien b negatif menunjukkan adanya pengaruh negatif X terhadap Y (pengaruh terbalik X terhadap Y, secara grafis ditunjukkan oleh gambar B). Contoh : X2
Y2
XY
32
1156
1024
1088
38
36
1444
1296
1368
3
34
31
1156
961
1054
4
40
38
1600
1444
1520
5
31
29
961
841
899
6
43
42
1849
1764
1806
7
40
33
1600
1089
1320
8
30
29
900
841
870
9
33
29
1089
841
957
10
39
36
1521
1296
1404
No.
X
Y
1
34
2
Yˆ
31,64 5 34,95 7 31,64 5 36,61 2 29,16 2 39,09 6 36,61 2 28,33 4 30,81 8 35,78 5
Y- Yˆ
(Y- Yˆ )2
0,355
0,126
4,84
2,15
1,043 0,645
1,088
3,24
6,42
0,417
6,08
1,388 0,162
1,926
2,904 3,612
8,434
0,666 1,818
0,443 3,304
4,84 14,4 4 27,0 4 46,2 4 14,4 4 38,4 4 10,2 4
0,215
0,046
7,84
0,026
13,049
20,55 19,95 72,82 0,22 19,95 19,95 6,42
11
33
31
1089
961
1023
12
32
31
1024
961
992
13
36
33
1296
1089
1188
14
40
37
1600
1369
1480
15
42
36
1764
1296
1512
16
40
38
1600
1444
1520
17
41
37
1681
1369
1517
18
32
30
1024
900
960
19
34
30
1156
900
1020
20
30
28
900
784
840
21
35
35
1225
1225
1225
22
36
29
1225
841
1015
23
37
34
1296
1156
1224
24
39
35
1369
1225
1295
25
40
36
1521
1296
1404
26
33
32
1600
1024
1280
27
34
32
1089
1024
1056
28
36
34
1156
1156
1156
29
37
37
1296
1369
1332
30
37 108 6 36, 2
34 100 4 33, 5
1369 3955 6
1156 3394 2
1258 3658 3
b= a=
0,8 3 3,5
Jmlh Rata2
30,81 8 29,99 0 33,30 1 36,61 2 38,26 8 36,61 2 37,44 0 29,99 0 31,64 5 28,33 4 32,47 3 33,30 1 34,12 9 35,78 5 36,61 2 30,81 8 31,64 5 33,30 1 34,12 9 34,12 9 1004
0,182
0,033
1,010 0,301
1,020
0,388 2,268
0,150
1,388 0,440
1,926
0,010 1,645 0,334
0,000
2,527 4,301 0,129 0,785 0,612
0,091
5,144
0,194
2,708
10,2 4 17,6 4 0,04 14,4 4 33,6 4 14,4 4 23,0 4 17,6 4
6,08 6,08 0,22 12,48 6,42 20,55 12,48 12,02 12,02
0,112
4,84 38,4 4
6,384
1,44
2,35
18,499
0,04
19,95
0,017
0,64
0,28
0,616
2,35
29,88
1,182
1,398
7,84 14,4 4 10,2 4
0,355
0,126
4,84
2,15
0,699
0,488
0,04
0,28
2,871 0,129
8,243
0,64
12,48
0,017
0
76,39
0,64 386, 8
0,28 341,4 7
0,375
6,42 2,15
Pada contoh tersebut diperoleh :
Yˆ = 0,83 X + 3,5 Pendekatan ANOVA (Analisis Variansi) Untuk melakukan pengujian hipotesis terhadap β =0 dapat dilakukan dengan pendekatan ANOVA. Jumlah Variasi
Sumber Variasi
Derajat Kebebas an
Rataan Kuadrat
f hitung
Regresi
JKR
1
Galat
JKG
n-2
Total
JKT
n-1
Nilai
2 F hitung = JKR / s
Fα (1, n − 2) .
JKR s2 =
JKR / s 2
JKG n−2
cdibandingkan dengan nilai Tabel
Apabila nilai F hitung kurang dari F tabel maka hipotesis β =0 diterima, artinya model regresi tidak dapat diterima karena variabel X tidak terbukti berpengaruh terhadap variabel Y.
Contoh Tabel ANOVA output SPSS : ANOVA(b)
Sum of
Model 1
Squares Regression Residual Total
Mean
Df
F
Square
265,067
1
265,067
76,399 341,467
28 29
2,729
97,14 6
n = 30 Tabel ini memperlihatkan tabel analisis variansi dari model regresi dengan n=30, dapat dilihat bahwa nilai Fhitung = 97,146. Apabila diambil alpa 5%, ternyata F hitung lebih dari F tabel (F5%(1, 28) = 4,20), sehingga hipotesis β =0 ditolak. Artinya model regresi ini dapat diterima atau variabel X terbukti berpengaruh terhadap variabel Y. Rumus yang lebih mudah diingat : b=
∑ ( X − X )(Y − Y ) ∑( X − X ) i
i
2
i
a = Y − bX
Kegunaan dari regresi linier 1. Dapat menentukan model variabel X dan Variabel Y.
hubungan
linier
antara
2. Dapat menentukan tingkat keeratan hubungan variabel X dan variabel Y. 3. Model regresi linier dapat digunakan untuk teknik peramalan. Harga a dan b yang diperoleh dari data sampel X dan Y hanyalah taksiran untuk parameter sebenarnya yaitu α dan β dari model matematika : Yi = α + β X i + Ei . Harga α dan β yang sebenarnya tidak bisa kita ketahui. Namun kita dapat menentukan nilai taksiran interval dari α dan β .
Untuk menentukan interval taksiran β diperlukan asumsi yang harus diambil mengenai X dan Y, yaitu : 1. Untuk harga X yang diketahui, variabel tak bebas Y
bersifat bebas dan berdistribusi normal dengan ratarata α + βX dan simpangan bakunya σ Y . X . 2. Simpangan baku
σ Y . X dimisalkan sama untuk setiap X
yang diberikan. Dengan menggunakan asumsi diatas secara matematis dapat dibuktikan bahwa : µb = β σ Y .X
σb =
∑X
− n( X )
2 i
2
Pada umumnya harga σ Y . X tidak diketahui, oleh karena itu pada praktiknya digunakan titik taksirannya, yaitu :
∑ (Y
i
sY . X =
− Y ) − b 2 (∑ X i − X ) 2
2
n−2
Interval kepercayaan untuk β :
b − z 1 .σ b < β < b + z 1 .σ b 2
α
2
α
b − z 1 .sb < β < b + z 1 .sb 2
α
2
α
Jika sampel yang digunakan kepercayaan untuk β :
b − t 1 .sb < β < b + t 1 .sb 2
α
2
α
berukuran
kecil,
Interval
Menguji Koefisien β Untuk menguji hipotesis mengenai koefisien β , seperti biasa kita memiliki perumusan hipotesis H0 dan hipotesis tandingan H1, yaitu : H0 : β = β 0 H1 :
β ≠ β0
H1 :
β >β 0
H1 :
β <β 0
Sebagai alat uji hipotesis, digunakan rumusan statistik sebagai berikut : t=
(b − β0 ) sx sY . X
. n − 1 , d.k. = (n – 2)
ANALISIS KORELASI
Pada bahasan sebelumnya kita telah pelajari hubungan antara dua variabel yaitu X dan Y dengan menggunakan metode regresi linier. Hubungan diperoleh dinyatakan dalam bentuk persamaan garis yang disebut dengan garis regresi. Sedangkan untuk mengukur tingkat keeratan hubungan (asosiasi) antara dua variabel digunakan metode korelasi. Ukuran derajat kekuatan korelasi antara dua variabel dinamakan koefisien korelasi (diberi lambang r). 1. Koefisien korelasi harus besar apabila derajat asosiasi tinggi dan harus kecil apabila derajat asosiasi rendah. 2. Koefisien korelasi harus bebas dari satuan varibel
Rumus koefisien korelasi
∑ (Y − Yˆ ) 1− ∑ (Y − Y )
2
r=±
r=
∑ ( X − X )(Y − Y ) (n − 1) s x ⋅ s y
r=
r=
∑ ( X − X )(Y − Y ) ∑ ( X − X ) ∑ (Y − Y ) 2
2
n∑ ( X i Yi ) − ∑ X i ∑ Yi
{n∑ X } − {∑ X } {∑ Y } − {∑ Y } 2
2
i
i
2
i
2
i
• Dapat dibuktikan bahwa besar koefisien korelasi berada pada interval -1 dan 1 atau -1 ≤ r ≤ +1 • Tanda
r positif menyatakan bahwa antara variabelvariabel itu terdapat korelasi positif atau korelasi langsung yang berarti nilai variabel X yang kecil berpasangan dengan nilai variabel Y yang kecil dan nilai X yang besar berpasangan dengan nilai variabel Y yang besar.
• Koefisien korelasi r adalah ukuran untuk menentukan
kuatnya korelasi linier dan bukan menentukan ada atau tidak adanya korelasi antara variabel X dan variabel Y.
• Koefisien determinasi adalah nilai koefisien korelasi yang dikuadratkan ( r2 ) sehingga nilainya selalu positif ( 0 ≤ r2 ≤ +1). Dalam praktik penelitian, koefisien determinasi
lebih banyak digunakan karena lebih mudah ditafsirkan. Biasanya disajikan dalam bentuk persen ( r2 x 100% ) yang hasilnya diartikan sebagai variasi variabel yang satu disebabkan oleh perubahan variabel yang lainnya. Contoh : apabila koefisien korelasi antara X dan Y adalah sebesar r=0,94 maka 88,36% variasi Y ditentukan oleh X. Menghitung r untuk data berkelompok Rumus penghitungan koefisien korelasi diatas dapat digunakan apabila datanya masih belum disusun dalam daftar distribusi frekuensi. Penelitian terhadap dua variabel, maka akan kita peroleh dua tabel distribusi frekuensi. Kedua tabel distribusi frekuensi ini harus disajikan ke dalam satu tabel distribusi frekuensi yang berklasifikasi dua.
Apabila data dari dua variabel telah disusun ke dalam satu tabel distribusi frekuensi maka digunakan rumus : r=
n(∑ fuv) − (∑ f x u ) ⋅ ( f y v )
{n∑ f u
}{
− (∑ f x u ) 2 n∑ f y v 2 − (∑ f y v ) 2
2
x
}
u=koding untuk variabel X v=koding untuk variabel Y fx=frekuensi kelas interval dari variabel X fy=frekuensi kelas interval dari variabel Y f=frekuensi dalam tiap sel n=banyak data u Y 0,49 5 1,49 5 2,49 5 3,49 5 4,49 5 5,49 5 6,49 5 7,49 5 fx fxu fxu2 fuv
44,5
Upah bulanan 54,5 64,5 74,5
v
34, 5 -3
-3
1
-2
2
3
1
-1
1
2
10
2
5
6
5
1
1
2
4
3
2
1
3
-2
0 1
-1
84,5
fy
fyv
fyv2
fuv
1
-3
9
9
6
-12
24
26
15
-15
15
17
1
19
0
0
0
2
1
12
12
12
8
10
6
2
19
38
76
56
2
5
2
2
11
33
99
45
14 19 19 38
19 24 48 48
1 12 21 63 45
1 7 13 225 181
2 N=85 13 225 181
8 61
32 267
20 181
0
1
4 -12 36 24
4 -20 40 16
10 -19 19 10
19 0 0 0
94, 5 3
2
Menghitung korelasi Rank (korelasi spearman) Apabila data yang dimiliki disusun berdasarkan rank, maka rumus untuk menghitung korelasi rank : r' = 1 −
6∑ d i2
n(n 2 − 1)
d i = selisih tiap pasang rank
n=banyaknya pasangan data X A B C D E F G H Jumlah
Y 63 80 78 67 83 90 75 72
478 643 620 514 597 635 579 593
RANK X 8 3 4 7 2 1 5 6
RANK Y 8 1 3 7 4 2 5 5
di2
di 0 2 1 0 -2 -1 0 1
0 4 1 0 4 1 0 1 11
Korelasi rank :
r' = 1 −
6(11) = 0,869 8(8 2 − 1)
Pengujian korelasi 1. Pengujian populasi memiliki r=0, alat uji statistik yang digunakan : t =
r n−2 1− r2
, d .k . = n − 2
Pengujian populasi memiliki r = r0 ≠ 0 , terlebih dahulu
2.
1+ r . Maka 1− r
digunakan transformasi Fihser : Z = ln 1 2
akan diperoleh distribusi normal baku dengan rata1
1+ r
1
0 , σz = rata dan simpangan baku : µ z = ⋅ ln . 2 1 − r0 n−3 Selanjutnya standardisasi untuk distribusi normal bisa
Z − µz
diperoleh dengan menggunakan z = σ z Tugas 1. Judul penelitian
Contoh : Pengaruh pupuk dan pestisida terhadap hasil panen 2. Latar belakang penelitian Berisi : -
Alas an pengambilan judul penelitian
-
Alas an pengambilan variable
-
Menjelaskan variable Y, X1, X2
-
Sebutkan referensi (buku, jurnal, atau penelitian yang sudah ada)
3. Tujuan penelitian Sebutkan tujuan penelitian 4. Data dan teknik pengumpulan -
Sebutkan jenis data yang diambil (primer atau sekunder)
-
Sebutkan satuan dari data (kg, ton, orang, rupiah, dollar)
-
Sebutkan cara mengumpulkan data (sumber, nama pengarang, tahun, penerbit, alamat website, tempat waktu dan nama orang yang diwawancara)
5. Pengolahan data -
Tampilkan bilangan atau tabel hasil pengolahan data dari SPSS atau MS excel
6. Analisis hasil pengolahan data Berikan komentar mengenai hasil pengolahan data, terutama tentang : -
Nilai R2
-
Tabel Anova
-
Tabel Coefficient
-
Persamaan regresi linier
-
Dan lain-lain
7. Kesimpulan