1
PENDAHULUAN
1.1. PENGERTIAN STATISTIK DAN STATISTIKA Statistik adalah kumpulan data, bilangan maupun non bilangan yang disusun dalam table dan atau diagram yang melukiskan suatu persoalan. Contoh tabel dan diagram statistik dapat dilihat pada tabel 1.1 dan gambar 1.1 berikut. Tabel 1. 1 Nilai statistika mahasiswa Fisika Tahun 1999 Nilai
Jumlah Mahasiswa
A
5
B
9
C
25
D
3
E
1
(a)
(b)
Gambar 1. 1. (a) diagram lingkaran (b) diagram balok Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data, pengolahan atau penganalisaannya dan penarikan kesimpulan berdasarkan kumpulan data dan penganalisaan yang dilakukan. Statistika dikelompokkan dalam dua kelompok yaitu statistika deskriptif dan statistika inferensia. Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Sedangkan
2
Statistika Dasar
pengertian statistika inferensia adalah metode yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan tentang seluruh gugus data induknya. 1.2. DATA STATISTIK Data statistik adalah keterangan atau ilustrasi mengenai sesuatu hal yang bisa berbentuk kategori (misalnya rusak, baik, cerah, berhasil) atau bilangan. Selanjutnya data yang berupa kategori disebut sebagai data kualitatif dan data bilangan disebut data kuantitatif. Berdasarkan cara perolehannya data kuantitatif dibedakan menjadi data diskrit dan data kontinu. Data-data yang diperoleh dari hasil menghitung atau membilang termasuk dalam data diskrit, sedangkan data-data yang diperoleh dari hasil mengukur termasuk dalam data kontinu. Menurut sumbernya kita mengenal data intern dan data ekstern. Data intern adalah data yang diperoleh dari perusahaan atau instansi yang bersangkutan. Sedangkan data ekstern diperoleh dari luar instansi atau perusahaan tersebut. Data ekstern dibedakan menjadi data primer dan data sekunder. Data primer adalah data yang dikeluarkan oleh badan sejenis. Sedangkan data lainnya termasuk data sekunder. Semua data-data yang baru dikumpulkan dan belum pernah diolah disebut sebagai data mentah. 1.3. POPULASI DAN SAMPEL Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita baik yang berhingga maupun tak berhingga jumlahnya. Seringkali tidak praktis mengambil data dari keseluruhan populasi untuk menarik suatu kesimpulan. Untuk itu dilakukan pengambilan sampel yaitu sebagian atau himpinan bagian dari populasi. Sampel yang diambil harus dapat merepresentasikan populasi yang ada. Prosedur pengambilan sampel yang menghasilkan kesimpulan yang konsisten terlalu tinggi atau terlalu rendah mengenai suatu ciri populasi dikatakan berbias. Untuk menghindari kemungkinan bias ini perlu dilakukan pengamblian contoh acak atau contoh acak sederhana. Contoh acak sederhana didefinisikan sebagai contoh yang dipilih sedemikian rupa sehingga setiap himpunan bagian yang berukuran n dari populasi mempunyai peluang terpilih yang sama.
Pendahuluan
3
1.4. PEMBULATAN ANGKA Dalam perhitungan dan analisis data statistik seringkali diperlukan pembulatan angkaangka. Berikut ini adalah beberapa aturan tentang pembulatan angka-angka. 1. Jika angka yang harus dihilangkan adalah 4 atau kurang, maka angka terkanan yang mendahuluinya tetap. Contoh: Rp. 59.376,- dibulatkan menjadi Rp. 59 ribu. 2. Jika angka yang haarus dihilangkan adalah lebih dari 5 atau angka 5 diikuti angka bukan nol maka angka yang mendahuluinya ditambah dengan 1. Contoh: 176,51 kg dibulatkan menjadi 177 kg. 3. Jika angka yang harus dihilangkan hanya angka 5 atau angka 5 diikuti nol, maka angka yang mendahuluinya tetap jika genap dan ditambah 1 jika ganjil. Aturan ini dikenal dengan aturan genap terdekat. Contoh: 8,500 dibulatkan menjadi 8 19,5 dibulatkan menjadi 20
1.5. NOTASI PENJUMLAHAN Dalam statistika kita sangat sering menjumlahkan bilangan yang banyak. Misalnya, kita mungkin akan menghitung harga rata-rata pasta gigi merk tertentu yang dijual di sepuluh toko yang berbeda, atau mungkin pula kita ingin mengetahui berapa kali sisi gambar muncul bila tiga keping mata uang dilempar beberapa kali. Dengan menggunakan huruf yunani Σ (sigma kapital) kita dapat menuliskan notasi n
penjumlahan dengan
x
i
yang kita baca penjumlahan xi dengan i dari 1 sampai n. Bilangan
i =1
1 dan n selanjutnya kita sebut sebagai batas bawah dan batas atas penjumlahan. Untuk subskrip dapat digunakan huruf sembarang, walaupun biasanya I, j, dan k lebih sering digunakan para statistikawan. Jadi jelas bahwa: n
xi = i =1
n
x
j
j =1
Bila kita menumlahkan untuk semua xi yang ada, kedua batas penjumlahan sering dihilangkan, sehingga kita cukup menuliskan
x . i
4
Statistika Dasar
Contoh 1.1 Jika x1 = 3, x2 = 5, dan x3 = 7 tentukanlah: 3
a) Σ xi
b)
2 xi
3
2
c)
i =1
(x − i ) i
i=2
Jawab: a) Σ xi = x1 + x2 + x3 = 3 + 5 + 7 = 15 3
2x
b)
= 2 x1 + 2 x2 + 2 x3 = 18 + 50 + 98 = 166
2
2
i
2
2
i =1 3
(x − i ) = (x
c)
i
2
i=2
− 2) + ( x3 − 3) = 3 + 4 = 7
Contoh 1.2
Jika diketahui x1 = 2, x2 = -3, x3 = 1, y1 = 4, y2 = 2, dan y3 = 5 tentukanlah: 3 b) xi i =2
3
a)
xi yi i =1
2 2 yj j =1
Jawab: 3
a)
x y i
= x1 y1 + x2i y2i + x3i y3i = (2)(4) + (−3)(2) + (1)(5) = 7
i
i =1
b)
3 xi i=2
2 2 y j = x2 + x3 j =1
(
) (y
1
2
)
+ y2 = (−2)(20) = −40 2
Ada tiga dalil yang memberikan aturan dasar tentang notasi penjumlahan yaitu: Dalil 1.1 :
Penjumlahan dua atau lebih variabel sama dengan jumlah masing-masing penjumlahannya. Jadi n
n
n
n
i =1
i =1
i =1
i =1
( xi + yi + zi ) = xi + yi + zi
Pendahuluan
5
Bukti: Demgan menguraikan ruas kiri dan kemudian mengelompokkan kembali
kita memperoleh n
(x + y i
i
+ zi ) = ( x1 + y1 + z1 ) + ( x2 + y2 + z2 ) + ... + ( xn + yn + zn )
i =1
= ( x1 + x2 + ... + xn ) + ( y1 + y2 + ... + yn ) + ( z1 + z2 + ... + zn ) n
=
n
x + y + z i
i =1
Dalil 1.2 :
n
i
i =1
i
i =1
Jika c adalah suatu konstanta, maka n
n
i =1
i =1
cxi = c xi Bukti: Demgan menguraikan ruas kiri dan kemudian memfaktorkannya kita
memperoleh n
cx
i
= cx1 + cx2 + ... + cxn
i =1
= c ( x1 + x2 + ... + xn ) n
= c xi i =1
Dalil 1.3 :
Jika c adalah suatu konstanta, maka n
c = nc i =1
Bukti: Jika dalam dalil 1.2 semua xi sama dengan 1, maka: n
c = c + c + c + ... + c = nc i =1
n suku
6
Statistika Dasar
Contoh 1.3
Jika diketahui x1 = 2, x2 = 4, y1 = 3, y2 = -1, maka tentukanlah nilai 2
(3x − y i
i
i =1
+ 4)
Jawab: 2
(3xi − yi + 4)
=
i =1
2
2
2
i =1
i =1
i =1
3xi − yi + 4 2
2
i =1
i =1
= 3 xi − yi + (2)(4) = (3) (2 + 4) – (3 - 1) + 8 = 24
Contoh 1.4 3
Sederhanakanlah bentuk berikut
(x − i )
2
i =1
Jawab: 3
(x − i )
2
(x 3
=
2
− 2 xi + i 2
i =1
i =1
(x ) - (2 xi ) + (i ) 3
=
)
3
3
2
i =1
= 3x2 - 2x
2
i =1 3
i + i =1
i =1
3
i
2
i =1
= 3x2 - 2x (1 + 2 + 3) + (1 + 4 + 9) = 3x2 - 12x + 14
Statistika Dasar
7
PENYAJIAN DATA
2
Secara garis besar ada dua macam cara penyajian data dalam statistika yaitu: 1.
Grafik atau diagram yang terbagi menjadi: a. Diagram batang atau balok b. Diagram garis atau grafik c. Diagram lingkaran d. Diagram lambang e. Diagram peta f. Diagram pencar
2.
Tabel atau daftar yang dapat berbentuk: a.
Daftar baris kolom
b.
Daftar kontingensi
c.
Daftar distribusi frekuensi
2.1. DIAGRAM BATANG Penyajian data dalam gambar akan lebih menjelaskan lagi persoalan secara visual. Data yang variabelnya berbentuk kategori atau atribut sangat tepat disajikan dalam bentuk diagram batang. Data tahunan pun dapat pula disajikan dalam diagram ini asalkan tahunnya tidak terlalu banyak. Untuk menggambar diagram batang diperlukan sumbu datar dan sumbu tegak yang berpotongan tegak lurus. Sumbu datar dan juga sumbu tegak dibagi menjadi beberapa skala bagian yang sama. Skala dumbu datar dan sumbu tegak tidak perlu sama. Sebagai contoh lihat tabel 2.1 mengenai banyaknya murid menurut tingkat sekolah dan jenis kelamin.
8
Penyajian Data
Tabel 2. 1 Banyak murid di daerah A menurut tingkat sekolah dan jenis kelamin Tahun 1970 Tingkat Sekolah
Banyak Murid Laki-Laki Perempuan
JUMLAH
SD
875
687
1.562
SMP
512
507
1.019
ST
347
85
432
SMA
476
342
818
SMEA
316
427
743
2.526
2.048
4.574
Jumlah
Catatan : Data karangan.
Kalau hanya. diperhatikan jumlah murid, tanpa perincian jenis kelamin, tabel 2.1dapat dibuat dalam sebuah diagram batang tunggal, seperti dapat terlihat dalam Gambar 2.1. Letak batang yang satu dengan yang lainnya harus terpisah dan lebarnya. digambarkan serasi dengan keadaan tempat diagram. Di atas batang boleh juga, nilai data dituliskan.
(a)(b) Gambar 2. 1. (a) diagram batang vertikal
(b) diagram batang horizontal
Jika jenis kelamin juga diperhatikan dan digambarkan diagramnva, maka didapat diagram batang dua komponen. Bentuk yang tegak adalah seperti gambar 2.2. berikut ini.
Statistika Dasar
9
Gambar 2. 2. Diagram batang dua komponen Untuk kategori data yang berlawanan, seperti data di atas, dapat pula dibuat diagram batang dua arah seperti terlihat pada gambar 2.3. berikut.
Gambar 2. 3. Diagram batang dua arah Jika terdapat klasifikasi atribut dengan nilai data yang sangat besar dibandingkan dengan klasifikasi lainnya, batang untuk yang bernilai besar ini lebih baik dipatahkan. Contohnya dapat dilihat dalam gambar 2.4.
10
Penyajian Data
Gambar 2. 4. Diagram batang yang dipatahkan Dari beberapa contoh cara membuat diagram batang di atas kita dapat membuat sendiri variasinya sesuai dengan kebutuhan.
2.2. DIAGRAM GARIS Untuk menggambarkan keadaan yang serba terus atau berkesinambungan, misalnya produksi minyak tiap tahun, jumlah penduduk tiap tahun, keadaan temperatur badan tiap jam dan lainlain, dibuat diagram garis. Seperti, diagram batang, di sini pun diperlukan system sumbu datar dan sumbu tegak yang saling tegak lurus. Sumbu datar menyatakan waktu sedangkan sumbu tegaknya melukiskan banyaknya data tiap waktu. Contoh berikut ini menyatakan penggunaan barang di sebuah perusahaan selama tahun 1971 sampai tahun 1980. Tabel 2. 2. Penggunaan barang perusahaan roti tahun 1971-1980 TAHUN 1971 1972 1973 1974 1975
JUMLAH BARANG YANG DIGUNAKAN 376 524 412 310 268
TAHUN 1976 1977 1978 1979 1980
JUMLAH BARANG YANG DIGUNAKAN 476 316 556 585 434
Dengan memperhatikan gerak garis, kita dapat mempelajari bagaimana fluktuasi atau naik-
Statistika Dasar
12
turun penggunaan barang dari tahun ke tahun. 700
Banyak barang
600 500 400 300 200 100 0 1970
1972
1974
1976
1978
1980 Tahun
Gambar 2. 5. Diagram garis penggunaan barang perusahaan Jika nilai datanya mengumpul di sekitar harga yang jauh dari sumbu horisontalnya, maka lebih baik dilakukan loncatan atau pemutusan sumbu tegak seperti tampak pada gambar 2.6 berikut. 700
Banyak barang
600 500 400 300 200 1970
1972
1974
1976
1978
1980 Tahun
Gambar 2. 6. Diagram garis dengan pemotongan sumbu tegak Jika kita ingin mendapat gambaran persoalan dalam pengertian absolut, maka kita gunakan skala hitung atau skala dalam kertas millimeter biasa. Apabila yang dikehendaki gambaran persoalan dalam bentuk relatif biasanya digunakan kertas grafik lain yang disebut kertas semi-logaritma. Dinamakan demikian karena salah satu sumbunya, biasanya sumbu tegak, mempunyai skala berbentuk logaritma, sedangkan sumbu lainnya berskala hitung.
2.3. DIAGRAM LINGKARAN
Penyajian Data
13
Untuk membuat diagram lingkaran, gambarkan sebuah lingkaran, lalu dibagi-bagi menjadi beberapa. sektor. Tiap sektor melukiskan kategori data yang terlebih dahulu diubah kedalam derajat. Dianjurkan titik pembagian mulai dari titik tertinggi lingkaran. Diagram lingkaran ini sering digunakan untuk melukiskan data atribut. Tabel 2. 3 Keperluan biaya tiap bulan di suatu daerah Keperluan Biaya Untuk % Pos A
28
Pos B
18
Pos C
14
Pos D
22
Pos E
10
Pos F
8
Jumlah
100
Contohnya kita ambil data dalarn tabel 2.3. tentang keperluan biaya tiap bulan. Terlebih dahulu tiap nilai data diubah kedalarn deraiat. Pos A, misalnya menjadi
28 18 x 360o = 100,8o dan pos B = x 360o = 64,8o . Pos-pos yang lainnya dihitung dengan 100 100 cara yang sama dan didapat untuk pos C= 50,4o, pos D = 79,20, pos E = 360 dan pos F = 28,80. Dengan teliti, sudut-sudut tersebut digarnbarkan dalarn sebuah lingkaran. Hasilnya seperti terlihat dalarn garnbar 2.7 (a).
(a)
(b)
Gambar 2. 7. (a) Diagram lingkaran (b) Diagram Pastel
14
Statistika Dasar
Variasi bentuk diagram lingkaran dapat pula dibuat misalnya seperti tampak pada gambar 2.7 (b) yang disebut diagram pastel. Penjelasan baik untuk diagram lingkaran maupun diagram pastel dapat ditulis di luar lingkaran, tetapi jika ruangannya cukup lebih baik ditulis dalam sektor secara mendatar juga. 2.4. DIAGRAM LAMBANG
Sering dipakai untuk mendapatkan gambaran kasar sesuatu hal dan sebagai alat visual bagi orang awam. Sangat menarik dihhat, lebih-lebih jika simbol yang digunakan cukup baik dan menarik. Setiap satuan jurnlah tertentu dibuat sebuah simbol sesuai dengan macarn datanya. Misalnya untuk data mengenai jiwa, penduduk dan pegawai dibuat gambar orang, satu gambar untuk tiap 5000 jiwa; untuk data bangunan, gedung sekolah dan' lain-lain dibuat garnbar gedung, satu gedung menyatakan 25 buah, dan masih banyak contoh lain lagi. kesulitan yang dihadapi ialah ketika menggambarkan bagian simbol untuk satuan yang tidak penuh. Sebagai contoh yaitu untuk melukiskan jumlah pegawai di berbagai jawatan, dibuat diagram simbol yang dapat dilihat pada gambar 2.8.
Gambar 2. 8. Jumlah pegawai di berbagai jawatan Contoh lain adalah diagram simbol yang menggambarkan penggunaan listrik dalam KWH untuk industri-industri di beberapa daerah di Indonesia selama tahun 1958 seperti terlihat pada gambar 2.9.
Penyajian Data
15
Gambar 2. 9. Jumlah pemakaian listrik untuk industri dalam KWH 2.5. DIAGRAM PETA
Diagram ini dinamakan juga kartogram. Dalarn pembuatannya digunakan peta geografis tempat data terjadi. Dengan demikian diagram ini melukiskan keadaan dihubungkan dengan tempat kejadiannya. Salah satu contoh yang sudah terkenal ialah jika kita membuka buku peta bumi. Di situ antara lain terdapat peta daerah atau pulau dengan mencanturnkan pula gambar-gambar pohon, kelapa, jagung, kuda, sapi dan lain-lain. Contoh lain adalah tentang rata-rata pertumbuhan penduduk di Jawa Barat selama 1961 - 1971 menurut Kantor Statistik Propinsi Jawa Barat. Diagram petanya dapat dilihat pada gambar 2.10. di bawah ini.
Gambar 2.10. Diagram peta pertumbuhan penduduk di Jawa Barat
Gambar 2.11. berikut melukiskan penempatan transmigran dari Jawa Barat ke Kalimantan selama periode 1951 - 1972/1973. Dalam diagram tersebut ditunjukkan banyaknya jiwa yang ditransmigrasikan, dan datanya dapat dibaca di atas gambar kepala orang.
16
Statistika Dasar
Gambar 2.11. Jumlah transmigran penduduk JABAR periode 1951-1972/1973 2.6. DIAGRAM PENCAR
Untuk kumplan data yang terdiri atas dua variable dengan nilai kuantitatif, diagramnya dapat dibuat dalam sistem sumbu koordinat dan gambarnya merupakan kumpulan titik-titik yang terpencar. Karenanya diagram ini disebut diagram pencar seperti pada gambar 2.12.
Gambar 2.12. Diagram pencar
3
DISTRIBUSI FREKUENSI DAN GRAFIKNYA
3.1. DAFTAR DISTRIBUSI FREKUENSI DAN GRAFIKNYA Dalam distribusi frekuensi data dikelompokkan dalam beberapa kelas interval misalnya a–b, c-d dan seterusnya yang disebut dengan kelas interval. Tabel 3.1 berikut ini adalah contoh distribusi frekuensi. Tabel 3. 1. Nilai Ujian Statistika untuk 80 Mahasiswa Nilai Ujian
Banyak Mahasiswa (f)
31 - 40
2
41 - 50
3
51 - 60
5
61 - 70
14
71 – 80
24
81 – 90
20
91 - 100
12
Jumlah
80
Urutan kelas interval disusun mulai data terkecil sampai data terbesar. Setiap kelas berturut-turut diberi nama kelas inteval pertama, kelas interval kedua dan seterusnya. Ada beberapa istilah yang digunakan dalam distribusi frekuensi yaitu: 1.
Limit kelas atau ujung kelas yaitu nilai-nilai terkecil dan terbesar dalam setiap kelas interval. Nilai terbesar disebut sebagai limit atas kelas dan nilai terkecil disebut sebagai limit bawah kelas.
2.
Batas kelas yaitu limit kelas ± setengah nilai skala terkecil. Nilai yang besar disebut batas atas kelas dan nilai yang kecil disebut sebagai batas bawah kelas.
Statistika Dasar
3.
17
Titik tengah kelas atau tanda kelas yaitu nilai yang terletak pada tengah setiap kelas interval. Aturan umum yang digunakan untuk menentukan titik tengah kelas atau tanda kelas adalah: Tanda kelas = ± ½ (limit bawah + limit atas)
Macam-macam distribusi frekuensi 1. Distribusi frekuensi 2. Distribusi frekuensi. Relative (%) 3. Distribusi frekuensi kumulatif kurang dari 4. Distribusi frekuensi kumulatif lebih dari 3.2. CARA MEMBUAT DISTRIBUSI FREKUENSI Berikut ini diberikan beberapa langkah cara membuat distribusi frekuensi: 1. Tentukan Rentang (R) R = Nilai terbesar – nilai terkecil. = 98 - 34 = 64 2. Tentukan banyaknya kelas interval yang diperlukan. Biasanya paling sedikit diambil 5 dan paling banyak 15 kelas interval. Cara lain yang cukup bagus untuk n buah data adalah dengan menggunakan acuan aturan Starges, yaitu: Banyak kelas
= 1 + (3,3) log n = 1 + (3,3) log 80 = 7,28 ≈ 7 kelas
3. Tentukan panjang kelas interval (P) yang ditentukan dengan aturan:
P=
64 Re n tan g = = 9,14 = 10 Banyakkelas 7
4. Tentukan limit kelas 5. Daftar semua limit kelas 6. Menentukan frekuensi masing-masing kelas. Untuk memperkecil kemungkinan kesalahan dalam menghitung besarnya frekuensi, dapat digunakan bantuan kolom tabulasi seperti terlihat pada gambar 3.1.
18
Distribusi Frekuensi dan Grafiknya
Gambar 3. 1. Kolom tabulasi dalam distribusi frekuensi Contoh 3.1.
Nilai Ujian Statistik 80 orang mahasiswa adalah sebagai berikut: 79 49 48 34 81 98 87 80 80 84 90 70 91 93 82 78 70 71 92 38 56 81 74 73 68 72 85 51 65 93 83 86 80 35 83 73 74 43 86 88 92 93 76 71 90 72 67 75 80 91 61 72 97 81 88 81 70 74 98 95 80 59 73 71 83 60 83 82 60 67 89 63 76 63 88 70 66 88 79 75 Dengan menggunakan aturan pembuatan distribusi frekuensi tersebut di atas dapat dibuat sebuah distribusi frekuensi dengan 7 kelas seperti terlihat dalam tabel 3.1. Jika ujung kelas bawah pertama diambil sama dengan data terkecil yaitu 35 maka daftarnya menjadi seperti terlihat dalam tabel 3.2.
Statistika Dasar
19
Tabel 3. 2. Nilai Ujian Statistika untuk 80 Mahasiswa Nilai Ujian
Frekuensi (f)
34 – 43
3
44 – 53
3
54 – 63
8
64 – 73
23
74 – 83
20
84 – 93
19
94 – 103
4
Jumlah
80
Meskipun tabel 3.1 dan tabel 3.2 sama-sama dapat digunakan namun tabel 3. 3. kurang baik digunakan karena nilai limit atas kelas interval terakhir lebih dari 100 sedangkan nilai mahasiswa maksimum adalah 100. Jadi yang paling baik digunakan tabel 3.1. 3.3. DISTRIBUSI FREKUENSI RELATIF DAN KUMULATIF
Dalam tabel 3.1 di atas, frekuensi dinyatakan dengan banyak data yang terdapat dalam tiap kelas atau dalam bentuk absolut. Jika frekuensi dinyatakan dalam persen, maka diperoleh daftar distribusi frekuensi relatif. Untuk tabel 3.1 dapat kita peroleh daftar distribusi frekuensi relatif seperti dalam tabel 3.3. Tabel 3.3. Distribusi frekuensi relatif untuk nilai ujian statistika NILAI
f(%)
31 - 40
2 50
41 - 50
3:75
51 - 60
6,25
61 - 70
17,50
71 - 80
30,00
81 - 90
25,00
91 - 100
15,00
Jumlah
100,00
20
Distribusi Frekuensi dan Grafiknya
Frekuensi relatif, disingkat f(%), untuk kelas pertama didapat dari
2 x 100% = 2,50%. 80
Untuk kelas-kelas yang lain dihitung dengan jalan yang sama. Kedua bentuk frekuensi, absolut dan relatif dapat disajikan dalam sebuah daftar seperti terlihat dalam tabel 3.4. berikut. Tabel 3. 4. Nilai ujian statistika 80 mahasiswa Nilai Uiian
fabs
f (%)
31 - 40
2
2,50
41 - 50
3
3,75
51 - 60
5
6,25
61 - 70
14
17,50
71 - 80
24
30,00
81 - 90
20
25,00
91 - 100
12
15,00
JumIah
80
100,00
Ada lagi sebuah daftar yang biasa dinamakan daftar distribusi frekuensi kumulatif. Daftar distribusi frekuensi kumulatif dapat dibentuk dari daftar distribusi frekuensi biasa, dengan jalan menjumlahkan frekuensi demi frekuensi. Ada dua macam distribusi frekuensi kumulatif yaitu kurang dari dan atau lebih dari seperti terlihat pada tabel 3.5 dan tabel 3.6. Untuk kedua macam distribusi tersebut terdapat pula nilai-nilai frekuensi absolut dan relatif. Tabel 3. 5. Nilai ujian statistika 80 mahasiswa (kumulatif kurang dari) NILAI UJIAN
fkum
f (%)
Kurang dari 31
0
0
41
2
2,50
51
5
6,25
61
10
12,50
71
24
30,00
81
48
60,00
91
68
85,00
101
80
100,00
Statistika Dasar
21
Tabel 3. 6. Nilai ujian statistika 80 mahasiswa (kumulatif atau lebih) NILAI UJIAN
fkum
f (%)
31 atau lebih
80
100,00
41
78
97,50
51
75
93,75
61
70
87,50
71
56
70,00
81
32
40,00
91
12
15,00
101
0
0
3.4. HISTOGRAM DAN POLIGON FREKUENSI
Meskipun diagram balok menyampaikan dengan segera informasi yang dikandung sekumpulan data dalam bentuk yang ringkas, biasanya kita lebih tertarik pada sajian gambar yang disebut Histogram. Berbeda dengan diagram balok, dalam histogram lebar baloknya menggunakan batas kelas dan bukan limit kelas. Histogram dari data dalam tabel 3.1 diberikan dalam gambar 3.2. berikut ini.
Gambar 3.2. Histogram frekuensi Untuk masalah tertentu biasanya sumbu tegaknya menyatakan frekuensi relatif atau persentase sehingga histogramnya juga disebut histogram frekuensi relatif atau histogram persentase.
Cara kedua yang bermanfaat bagi penyajian data numeric dalam bentuk grafik adalah apa yang disebut poligon frekuensi. Poligon frekuensi dibentuk dengan memplotkan
22
Distribusi Frekuensi dan Grafiknya
frekuensi kelas terhadap titik tengah kelas dan kemudian menghubungkan titik-titik yang berurutan dengan sebuah garis lurus.
Gambar 3.3. Poligon Frekuensi
Poligon merupakan bangun bersisi banyak yang tertutup. Untuk menutup poligon frekuensi diperlukan sebuah selang kelas tambahan yang ditambahkan pada kedua ujung distribusi frekuensi, masing-masing berfrekuensi nol. Untuk contoh seperti terlihat pada gambar 3.3. titik tengah kedua kelas tambahan itu adalah 25,5 dan 105,5. Kedua titik tersebut memungkinkan kita untuk menghubungkan kedua ujung pada sumbu datar, sehingga menghasilkan sebuah poligon. Jika poligon yang kita gambarkan diperoleh dari daftar frekuensi kumulatif baik daftar kumulaatif lebih dari atau kumlatif kurang dari, maka poligon tersebut dinamakan poligon frekuensi kumulatif atau Ogif Frekuensi seperti terlihata pada gambar 3.4. berikut.
(a)
(b)
Gambar 3. 4. (a) Ogif frekuensi kurang dari (b) Ogif frekuensi lebih dari
Statistika Dasar
23
3.5. MODEL POPULASI
Poligon frekuensi yang merupakan garis patah-patah dapat didekati oleh sebuah lengkungan kurva halus yang bentuknya secocok mungkin dengan bentuk poligon tersebut. Lengkungan tersebut dinamakan kurva frekuensi. Kurva ini dapat menjelaskan sifat atau karakteristik dari suatu populasi. Sebagai contoh, poligon frekuensi pada gambar 3.3. dapat didekati dengan garis tebal pada kurva frekuensi seperti terlihat pada gambar 3.5. berikut.
Gambar 3.5. Kurva frekuensi Kurva frekuensi yang diperoleh dari sample yang representatif merupakan model frekuensi yang ikut menjelaskan ciri-ciri populasi. Bentuk model populasi yang sering dikenal yaitu model normal, simetrik, positif (miring ke kiri), negatif (miring ke kanan), bentuk J dan U. a. Model normal, bentuknya selalu simetrik dan mempunyai sebuah puncak (Unimodal). b. Model simetrik juga unimodal. Bedanya kalau model normal selalu simetrik, tetapi model simetrik belum tentu normal. c. Model miring (ke kanan/ke kiri). Model positif menggambarkan bahwa terdapat tsedikit gejala yang bernilai makin besar. Sedang model negatif terjadi sebaliknya.
Gambar 3.6. (A) model normal (B) Model simetrik
24
Distribusi Frekuensi dan Grafiknya
Gambar 3.7. Model populasi miring ke kiri (A) dan miring ke kanan (B) Model positif menggambarkan bahwa terdapat sedikit gejala yang bernilai makin besar. Sedangkan model negatif terjadi sebaliknya. Soal ujian yang terlalu mudah sehingga banyak peserta yang mendapat nilai baik menggambarkan model kurva negatif.
(C) Gambar 3.8. Model populasi bentuk J (A), bentuk J terbalik (B) dan bentuk U (C) Untuk kedua gambar (a) dan (b) di atas memperlihatkan fenomena yang modelnya berbentuk J. Ini banyak terdapat dalam dunia ekonomi, industri dan fisika. Sedangkan gambar 3.8. (c) adalah model berbentuk U dimana mula-mula terdapat banyak gejala bernilai kecil, kemudian menurun untuk gejala bernilai besar dan akhirnya naik lagi untuk nilai gejala yang makin besar.
UKURAN PEMUSATAN
4
Ukuran pemusatan dibagi dalam dua kelompok yaitu ukuran gejala pusat dan ukuran letak. 1. Ukuran gejala pusat, meliputi •
Rata-rata hitung (mean)
•
Rata-rata ukur
•
Rata-rata harmonik
•
Rata-rata gabungan
•
Modus
2. Ukuran letak, meliputi •
Median
•
Kuartil
•
Desil
•
Persentil
Ukuran-ukuran tersebut di atas dapat dihitung dari kumpulan data populasi atau sampel. Jika ukuran-ukuran yang diambil dihitung dari data populasi disebut parameter , sedangkan jika dihitung dari data sampel disebut statistik.
4.1. RATA-RATA HITUNG (MEAN) Rata-rata atau lengkapnya rata-rata hitung, untuk data kuantitatif yang terdapat dalam sebuah sampel dihitung dengan membagi jumlah nilai seluruh data dengan banyaknya data. Simbol rata-rata untuk sampel adalah x sedangkan rata-rata untuk populasi dipakai simbol μ. Secara matematis rata-rata x dinyatakan dengan n
x + x + x3 + ... + xn x= 1 2 n
x
i
atau
x=
i =1
n
(4.1)
26
Ukuran Pemusatan
atau lebih sederhama lagi ditulis x=
x
i
(4.2)
n
Jika masing-masing mempunyai frekuensi maka rata-ratanya disebut sebagai rata-rata terboboti yang dinyatakan dengan persamaan (4.3). x=
f x f i
i
(4.3)
i
Contoh 4.1.
Dalam ujian mata kuliah Statistika Dasar, ada lima mahasiswa mendapat nilai 70, enam mendapat nilai 69, tiga mendapat 45, dan masing-masing seorang mendapat nilai 80 dan 56, maka rata-rata data tersebut dapat dihitung dengan bantuan tabel 4.1 berikut: Tabel 4.1. Nilai ujian Statistika Dasar Nilai (xi)
Frekuensi (fi)
fi xi
70
5
350
69
6
414
45
3
135
80
1
80
56
1
56
Jumlah
16
1035
Dari tabel didapat Σ fi=16 dan Σ fixi=1035 Sehingga x=
f x f i
i
i
=
1035 = 64.6 16
Jadi nilai rata-rata ujian ke enam belas mahasiswa tersebut adalah 64.6
Statistika Dasar
27
Contoh 4.2.
Data pada tabel 4.2 berikut merupakan daftar barang yang disimpan di gudang, dan diantaranya terdapat yang rusak. Tabel 4.2. Daftar barang dalam gudang Barang
Disimpan (fi)
% Rusak (xi)
fi xi
A
100
96
96
B
200
46
92
C
160
50
80
D
80
75
60
Jumlah
540
-
328
Jika ditanyakan berapa persen rata-rata barang dalam gudang yang rusak, berdasarkan persamaan 4.3 diperoleh: x=
f x f i
i
=
i
328 x100 % = 60,07 % 540
Bukan seperti ini x=
(96% + 46% + 50% + 75% ) = 66,75 % 4
Kita dapat juga menetukan rata-rata Gabungan yaitu rata-rata dari beberapa sub sampel lalu dijadikan satu. Jika kita mempunyai data n1, n2, n3, … dengan nilai rata-rata masing-masing x1 , x 2 , x 3 , ... maka rata-rata gabungan data di atas dinyatakan dengan xgab =
n x n i
i
(4.4)
i
Untuk data-data yang tersusun dalam distribusi frekuensi rata-ratanya dihitung dengan x=
f x f k
k
k
dengan xk : nilai tengah kelas fk : frekuensi kelas
(4.5)
28
Ukuran Pemusatan
Cara lain untuk menghitung rata-rata dari data dalam daftar distribusi frekuensi adalah dengan cara sandi atau cara singkat. Untuk ini diambil salah satu tanda kelas, namakan xo. Untuk harga xo ini diberi nilai sandi c = 0. Tanda kelas yang lebih kecil dari xo berturut-turut diberi harga-harga sandi c = -1, c = -2, c = -3, dan seterusnya. Sedangkan tanda kelas yang lebih besar dari xo berturut-turut diberi harga-harga sandi c = +1, c = +2, c = +3, dan seterusnya. Dengan cara ini jika p = panjang kelas interval besarnya sama, maka harga ratarata dpat dihitung dengan persamaan 4.6 berikut ini. f i ci x = xo + p f i
(4.6)
dengan xo : tengah kelas acuan
fi : frekuensi ke-i ci : harga sandi
p : lebar kelas
4.2. RATA-RATA UKUR (RATA-RATA GEOMETRIK)
Rata-rata ukur digunakan jika perbandingan dua data berturutan tetap atau hampir tetap. Untuk data bernilai x1, x2, x3, … , xn, maka rata-rata ukur didefinisikan sebagai: U = n x 1 . x 2 . x 3 ... x n
(4.7)
Untuk bilangan-bilangan yang bernilai besar digunakan logaritma, dan persamaan 4.7 menjadi log U =
log x
i
n
(4.8)
Untuk fenomena yang bersifat tumbuh seperti pertumbuhan penduduk, bakteri dan lain-lain digunakan rumus yang mirip rata-rata ukur yaitu:
x Pt = Po 1+ 100 dengan
t
Po = keadaan awal atau permulaan Pt = keadaan akhir x = rata-rata pertumbuhan setiap satuan waktu t = satuan wakru yang digunakan
(4.9)
Statistika Dasar
29
Untuk data-data yang telah disusun dalam daftar distribusi frekuensi rata-rata ukurnya dinyatakan dengan persamaan: log U =
(f log x ) f i
i
(4.10)
i
dengan
xi = tanda kelas fi = frekuensi yang sesuai dengan xi
4.3. RATA-RATA HARMONIK
Rata-rata harmonik biasanya digunakan untuk merata-ratakan kecepatan beberapa jarak tempuh atau mencari harga rata-rata suatu komoditi tertentu. Untuk data-data yang bernilai x1, x2, x3, … , xn, dalam sampel berukuran n maka rata-rata harmonik dinyatakan oleh H=
n 1 x i
(4.11)
atau lengkapnya H=
n 1 1 1 + + ... + x1 x2 xn
Untuk data-data yang disusun dalam distribusi frekuensi rata-rata harmonik dihitung dengan menggunakan persamaan: H=
f
i
f xi i
(4.12)
Secara umum hubungan rata-rata hitung (x ) , rata-rata ukur (U) dan rata-rata harmonik (H) dinyatakan dengan:
H≤U≤x
(4.13)
30
Ukuran Pemusatan
4.4. MODUS
Modus (Mo) adalah nilai atau fenomena yang paling sering muncul atau paling bayak terjadi. Untuk data kualitatif tanpa disadari, ukuran ini sering dipakai untuk menyatakan ratarata. Jika kita dengar kalimat, kebanyakan kematian di Indonesia disebabkan oleh penyakit malaria, atau kalimat, pada umumnya kecelakaan lalulintas disebabkan oleh kecerobohan pengemudi, maka keduan hal tersebut di atas tidak lain merupakan modus penyebab kematian dan kecelakaan lalulintas. Untuk data kuantitatif yang telah disusun dalam daftar distribusi frekuensi, maka modus dari data-data tersebut ditentukan dengan menggunakan persamaan: b1 M o = b + p b1 + b 2
dengan
(4.14)
b : batas bawah kelas modal (kelas dengan frekuensi tertinggi) p : panjang/lebar kelas modal b1: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya b2: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya
4.5. MEDIAN
Median (Me) merupakan nilai data yang terletak tepat di tengah setelah seluruh data diurutkan dari yang terkecil sampai yang terbesar. Jadi dengan demikian 50% dari jumlah data terletah atau bernilai di bawah nilai median dan 50% data terletak diatas nilai median. Jika banyaknya data ganjil, maka median (Me) merupakan data yang paling tengah, dan jika banyak datanya genap maka nilai median (Me) sama dengan rata-rata hitung dua data tengah.
Untuk data-data yang disusun dalam daftar distribusi frekuensi, nilai Me dihitung dengan menggunakan persamaan 4.15 berikut: 1 n−F Me =b + p 2 f
(4.15)
Statistika Dasar
dengan
31
b = batas bawah kelas median, yaitu kelas dimana median akan terletak p = panjang/lebar kelas median n = ukuran sampel atau banyaknya data F = jumlah semua frekuensi kelas dibawah kelas median f
= frekuensi kelas median
Ada hubungan empirik antara mean, modus, dan median yang dinyatakan dalam persamaan 4.16 berikut: Mean – Mo = 3 (Mean – Me)
(4.16)
Dalam grafik kedudukan ketiga nilai tersebut dapat dilihat dalam gambar 4.1. Untuk kurva yang simetrik (model populasi normal), nilai mean, median dan modus berimpit atau sama besar.
a. Kurva positif
b. Kurva negatif
Gambar 4.1. Grafik hubungan Mean, Modus, dan Median
4.6. KUARTIL
Jika sekumpulan data dibagi menjadi empat bagian yang sama setelah disusun menurut urutan nilainya maka bilangan pembaginya disebut kuartil. Ada tiga buah kuartil yaitu kuartil pertama (K1), kuartil kedua (K2),dan kuartil ketiga (K3). Untuk menetukan nilai kuartil caranya adalah: 1. susun data menurut urutan nilainya 2. tentukan letak kuartil 3. tentukan nilai kuartil Letak kuartil ke I yang dilambangkan Ki ditentukan dengan: Letak k i = data ke
i (n + 1) ; i = 1, 2, 3 4
(4.17)
32
Ukuran Pemusatan
Untuk data yang disusun dalam distribusi frekuensi kuartil Ki dihitung dengan: in −F ; i = 1, 2, 3 Ki = b + p 4 f
dengan
(4.18)
b = batas bawah kelas Ki, yaitu kelas dimana Ki akan terletak p = panjang/lebar kelas Ki n = ukuran sampel atau banyaknya data F = jumlah semua frekuensi kelas dibawah kelas Ki f
= frekuensi kelas Ki
4.7. DESIL
Jika sekumpulan data dibagi menjadi sepuluh bagian yang sama setelah disusun menurut urutan nilainya maka bilangan pembaginya disebut desil. Ada sembilan buah desil yaitu desil pertama (D1), desil kedua (D2),dan seterusnya sampai desil kesembilan (D9). Untuk menetukan nilai desil caranya adalah: 1. susun data menurut urutan nilainya 2. tentukan letak desil 3. tentukan nilai desil Letak desil ke i yang dilambangkan Di ditentukan dengan: Letak Di = data ke
i (n +1) ; i = 1, 2, 3,…,9 10
(4.19)
Untuk data yang disusun dalam distribusi frekuensi, desil Di dihitung dengan: in −F ; i = 1, 2, 3,…,9 Di = b + p 10 f dengan
b = batas bawah kelas Di, yaitu kelas dimana Di akan terletak p = panjang/lebar kelas Di n = ukuran sampel atau banyaknya data F = jumlah semua frekuensi kelas dibawah kelas Di f
= frekuensi kelas Di
(4.20)
Statistika Dasar
33
4.8. PERSENTIL
Jika sekumpulan data dibagi 100 sama besar akan menghasilkan persentil ke 1,2,3,…,99. Dengan cara yang sama seperti menentukan desil, letak persentil ditentukan oleh: Letak Pi = data ke
i (n + 1) ; i = 1, 2, 3,…,99 100
(4.21)
Untuk data dalam distribusi frekuensi in − F 100 ; i = 1, 2, 3,…,9 Pi = b + p f
dengan
b = batas bawah kelas Pi p = panjang kelas Pi n = ukuran sampel atau banyaknya data F = jumlah seluruh frekuensi sebelum kelas Pis f
= frekuensi kelas Pi
(4.22)
5
UKURAN SIMPANGAN
Ukuran simpangan atau juga dikenal dengan ukuran variasi digunakan sebagai gambaran bagaimana berpencarnya suatu data kuantitatif. Ukuran-ukuran tersebut yaitu rentang, rentang antar kuartil, deviasi atau simpangan kuartil, rata-rata deviasi, deviasi standar, varians, dan koefisien variasi. 5.1. RENTANG, RENTANG ANTAR KUARTIL, DAN SIMPANGAN KUARTIL Rentang atau disebut juga wilayah adalah ukuran variasi yang paling mudah ditentukan dan dinyatakan dengan: Rentang = data terbesar – data terkecil
(5.1)
Contoh 5.1. Nilai IQ lima anggota keluarga adalah 108, 112, 127, 118 dan 113. Tentukan rentangnya! Jawab: Rentang kelima IQ tersebut adalah 127 – 108 = 19
Rentang Antar Kuartil (RAK) merupakan selisih antara kuartil ketiga dengan kuartil pertama atau secara matematis dituliskan: RAK = K3 – K1
(5.2)
Deviasi atau simpangan Kuartil (SK) harganya setengah dari rentang antar kuartil. SK= 1/2 RAK = 1/2 (K3 – K1)
(5.3)
5.2. RATA-RATA SIMPANGAN Misalkan data hasil pengamatan adalah x1, x2, x3,…, xn dengan rata-rata x kita dapat menentukan simpangan setiap data dari rata-ratanya tersebut. Secara matematis simpangan dinyatakan dengan xi − x (baca: harga mutlak selisih xi dengan x ). Selanjutnya kita dapat pula menghitung rata-rata simpangan data-data tersebut dengan menggunakan persamaan 5.4.
Statistika Dasar
35
Rata-rata Simpangan (RS) RS =
χi − χ
(5.4)
n
5.3. VARIANS DAN SIMPANGAN BAKU Dalam prakteknya rata-rata simpangan yang tersebut dalam sub bab 5.2 jarang sekali digunakan. Penggunaan nilai-nilai mutlak membuatnya sulit dimanipulasi secara matematik. Sebagai gantinya kita gunakan ragam atau varians yaitu kuadrat semua simpangan tersebut. Ada dua macam varians yaitu varians populasi dan varians contoh (sampel). Varians populasi didefinisikan sebagai: N
σ2 =
(x
i
− μ )2
i =1
(5.5)
N
dimana: σ2 = varians populasi μ = rata-rata populasi N = jumlah atau banyaknya data dalam populasi Jika kita menggunakan persamaan 5.5 untuk menghitung varians dari sebuah sampel acak, hasilnya secara rata-rata cenderung lebih rendah dari σ2 sehingga hasil terebut tidak bisa menggambarkan populasi secara benar (bersifat bias). Untuk mengatasi bias ini, penyebut n diganti dengan n-1 sehingga varians sampel dihitung dengan : n
s2 =
(χ i =1
i
−χ)
2
(5.6)
n −1
Bila x berupa bilangan desimal yang telah dibulatkan, kita akan banyak menumpuk kesalahan bila menggunakan rumus varians sampel di atas. Untuk itu marilah kita turunkan sebuah rumus hitung yang banyak digunakan yaitu: n
s
2
=
n
i =1
n xi − xi i =1 n (n − 1 )
2
2
(5.7)
36
Ukuran Simpangan
Bukti: Menurut definisi n
s
2
=
(χ i i =1
−χ)
(x n
2
=
n −1
2 i
− 2xxi + x 2
i =1
)
n −1
Dengan menerapkan dalil-dalil dalam notasi penjumlahan sub bab 1.5 kita mendapatkan n
s2 =
n
x i − 2 x x i + nx 2 2
i =1
i =1
n −1
x
i
Selanjutnya ganti x dengan
dan kalikan baik pembilang maupun penyebut dengan n
n
sehingga didapatkan n
s
2
=
n
i =1
n xi − xi i =1 n (n − 1 )
2
2
Simpangan baku atau deviasi standart adalah akar dari varians sehingga: •
Simpangan baku untuk populasi disimbolkan σ sama dengan
•
Simpangan baku untuk sampel disimbolkan s sama dengan
σ2 s2
Jika data dari sampel telah disusun dalam daftar distribusi frekuensi, maka untuk menentukan varians dipakai rumusan: 2
s =
f (χ i
i
−χ)
2
(5.8)
n −1
Atau yang lebih baik digunakan n f i χ i − ( f i χ i ) 2
2
s =
n (n − 1 )
2
(5.9)
Kita dapat melihat bahwa rumus 5.8 menggunakan nilai rata-rata x sehingga kemungkinan terdapat akumulasi kesalahan karena pembulatan besar, sedangkan rumus 5.9 hanya menggunakan nilai tengah atau tanda kelas interval untuk menghindari adanya akumulasi kesalahan akibat pembulatan.
Statistika Dasar
37
Seperti halnya dalam penghitungan rata-rata, dalam menghitung varians kita dapat juga menggunakan cara sandi atau cara singkat dimana xi diganti dengan ci sehingga perhitugan akan menjadi lebih sederhana. Rumusnya adalah: n f i ci − ( f i ci )2 s = p n(n − 1) 2
dengan p
2
(5.10)
= panjang kelas interval
ci = nilai sandi n
= fi
Sebenarnya rumus 5.10 dapat diperoleh dari rumus 5.9 dengan menggunakan transformasi
ci =
xi − x0 berdasarkan sifat: p
1).
Jika tiap nilai data xi ditambah atau dikurangi dengan bilangan yang sama, maka simpangan baku (s) tidak berubah.
2).
Jika tiap nilai data xi dikalikan dengan bilangan yang sama (d), maka simpangan bakunya menjadi d kali simpangan baku semula.
Selanjutnya seperti halnya rata-rata, kita dapat menghitung juga simpangan baku gabungan dengan menggunakan persamaan 5.11 di bawah ini. s2 =
(n − 1)s n −k i
2 i
i
dengan ni = jumlah data sampel ke i si = Simpangan baku sampel ke i k = jumlah / banyaknya sampel .
(5.11)
38
Ukuran Simpangan
Contoh 5.2. Nilai-nilai yang diberikan oleh enam juri dalam suatu pertandingan senam adalah sebagai berikut: 7, 5, 9, 7, 8, dan 6. Hitung simpangan baku bagi populasi ini !
Jawab: Pertama-tama kita hitung
μ=
7+5+9+7+8+6 =7 6
dan kemudian 6
σ2
(x = =
i
− 7
i=1
)2
6
(0)2 + (− 2)2 + (2)2 + (0)2 + (1)2 + (− 1)2 6
=
5 3
5.4. DALIL CHEBYSHEV
Dalam bagian terdahulu kita telah bahas tentang ukuran pemusatan yaitu rata-rata dan simpangan di sekitar rata-rata tersebut. Dua nilai yang paling sering digunakan para statistikawan adalah rata-rata dan simpangan baku. Ahli matematika Rusia P.L. Chebyshev (1821-1894) menemukan bahwa proporsi pengukuran yang jatuh di antara dua nilai yang setangkup terhadap rata-ratanya berhubungan dengan simpangan bakunya. Penemuannya dinyatakan dalam sebuah dalil yang dikenal dengan dalil Chebyshev yaitu “sekurang-kurangnya 1 − 1
k2
bagian data terletak dalam k
simpangan baku dari rata-ratanya” Misalnya untuk k=2, dalil itu mengatakan bahwa sekurang-kurangnya 1 − 1
22
=3
4
atau 75% bagian data pasti terletak dalam batas-batas 2 simpangan baku pada kedua sisi nilai rata-ratanya. Jadi 3 selang μ ± 2σ .
4
atau lebih bagian pengamatan suatu populasi pasti terletak dalam
Statistika Dasar
39
5.5. BILANGAN BAKU ATAU NILAI Z
Ketika mengevaluasi prestasi seorang mahasiswa dalam matakuliah kimia dan ekonomi pada semester tertentu, kita mungkin ingin membandingkan nilai yang diperoleh untuk kedua mata kuliah tersebut. Seandainya dalam kimia ia memperoleh nilai 82 sedang dalam ekonomi 89 belum tentu ia lebih pandai dalam mata kuliah ekonomi. Tidakkah mungkin mata kuliah yang satu lebih sulit dari mata kuliah lainnya. Mungkin mahsiswa tersebut lebih berprestasi dalam kimia daripada ekonomi dibandingkan dengan mahasiswa lain di kelasnya. Salah satu cara untuk menentukan tingkatan kedua hal tersebut di atas adalah dengan menentukan nilai Z. Suatu pengamatan x dari suatu populasi yang mempunyai rata-rata μ dan simpangan baku σ, mempunyai nilai z yang didefinisikan sebagai : Zi =
x
i
−μ
σ
; i = 1,2,3,…. N
(5.12)
Dalam penggunaannya nilai Z sering diubah menjadi distribusi baru dengan rata-rata μ0 dan simpangan baku σ0 yang ditentukan. Nilai yang diperoleh dengan cara ini disebut nilai Z atau bilangan baku standar dengan rumusan:
xi − μ σ
Zi = μo + σ o
(5.13)
dengan μo = rata-rata bilangan baku
σo = simpangan baku yang ditentukan Untuk lebih memperjelas gambaran kita mengenai penggunaan nilai Z marilah kita perhatikan contoh berikut ini.
Contoh 5.3.
Ketrampilan mengetik yang berbeda diperlukan bagi seorang sekretaris tergantung apakah ia bekerja di suatu kantor yang bergerak dalam bidang hukum, akutansi atau pada suatu lembaga peneitian dalam suatu universitas. Untuk mengevaluasi calon bagi ketiga posisi tersebut, suatu lembaga tenaga kerja mengadakan tiga macam tes yang berbeda dan hasilnya tampak pada tabel berikut:
40
Ukuran Simpangan
Tabel 5.1. Data untuk contoh ketikan yang telah dibakukan Posisi
Skor Pelamar
Hukum
Rata-rata
Simpangan baku
141 detik
180 detik
30 detik
Akutansi
7 menit
10 menit
2 menit
Penelitian
33 menit
26 menit
5 menit
Untuk posisi apakah pelamar ini paling cocok ditempatkan ? Jawab: Pertama-tama kita hitung nilai Z untuk masing-msing tes tersebut Hukum
Z =
141 − 180 30
= - 1,3
Akutansi
Z =
7 − 10 2
= - 1,5
Penelitian
Z =
33 − 26 5
= 1,4
Karena kecepatan merupakan pertimbangan utama, kita mencari nilai Z yang berada paling jauh di sebelah kiri dari rata-ratanya (paling singkat waktunya), dan bagi calon ini yaitu –1,5. Dengan demikian prestasi pelamar ini relatif lebih tinggi di antara pengetik-pengetik di perusahaan akutansi daripada dua bidang lainnya, dan sebaiknya ia ditempatkan di perusahaan akutansi. Ukuran-ukuran simpangan diatas merupakan ukuran absolut. Jika dari simpangan absolut diambil simpangan bakunya, maka kita dapatkan koefisien Variasi (KV) yang dinyatakan dengan persamaan 5.14 berikut. KV =
Simpangan baku x100% rata - rata
(5.14)
Sekarang tinjau variasi 5 cm untuk ukuran jarak 100 m dan variasi 5 cm untuk ukuran jarak 20 m. Keduanya jelas memberikan pengaruh yang berbeda. Untuk mengukur pengaruh demikian dan untuk membandingkan variasi antar nilai-nilai besar dan nilai-nilai kecil, digunakan dispersi relatif yang dirumuskan dengan: Dispersi relatif =
Simpangan baku rata - rata
(5.15)
Statistika Dasar
41
5.6. KEMIRINGAN DAN KURTOSIS
Kita sudah mengenalmodel populasi yang bentuknya bisa positif, negatif atau simetrik yang juga disebut kurva model normal. Model positif terjadi bila kurvanya mempunyai ekor yang memanjang ke sebelah kanan. Sebaliknya jika ekornya memanjang ke sebelah kiri disebut kurva model negatif. Kedua model kurva ini mempunyai sifat tak simetri. Untuk mengetahui derajat taksimetri sebuah model kurva, digunakan ukuran kemiringan atau
koefisien kemiringan pearson yang dinyatakan dengan: Kemiringan =
Rata - rata − Modus Simpangan baku
(5.16)
Kemiringan =
3 (Rata - rata − Median ) Simpangan baku
(5.17)
atau
Persamaan 5.16
dan 5.17 berturut-turut dinamakan koefisien kemiringan pearson tipe
pertama dan tipe kedua. Selain kemiringan, bertitik tolak dari kurva model normal kita kenal istilah kurtosis yang merupakan tinggi rendahnya atau runcing datarnya bentuk kurva model populasi normal. Kurva distribusi normal yang tidak terlalu runcing atau tidak terlalu datar dinamakan
mesokurtik. Kurva yang runcing dinamakan leptokurtik sedangkan yang datar disebut platikurtik.
Gambar 5.1. Kurva bentuk-bentuk kurtosis
42
Ukuran Simpangan
Salah satu ukuran kurtosis adalah koefisien kurtosis
yang diberi simbol a4 dan
dinyatakan dengan persamaan berikut:
(
a 4 = m 4 / m2
2
)
dengan m2 dan m4 didapat dari rumus m r =
(5.18)
(x
i
− x)r
n
. r = 1,2,3,…
Kriteria yang didapat dari rumus tersebut adalah: a) a4 = 3
kurvanya mempunyai distribusi normal
b) a4 > 3
kurvanya mempunyai distribusi leptokurtik
c) a4 < 3
kurvanya mempunyai distribusi platikurtik
PROBABILITAS ATAU PELUANG
6 6. 1.
RUANG CONTOH Dalam statistika kita menggunakan istilah percobaan untuk sembarang proses yang
dapat menghasilkan data, misalnya percobaan pelemparan sekeping mata uang logam. Dalam percobaan tersebut akan dihasilkan dua data yaitu angka dan gambar. Dalam sebuah percobaan didefinisikan istilah ruang contoh yaitu himpunan semua kemungkinan hasil dari percobaan yang mengandung paling banyak informasi mengenai hasil-hasil percobaan, disimbolkan S Dalam beberapa percobaan, sangat membantu bila kita merinci semua anggota ruang contoh secara sistematik melalui sebuah diagram pohon. Pada percobaan pelemparan dadu misalnya, didapat ruang contoh sebagai berikut:.
1
4
1
1
1
2
2
2
3
2
3
3
3
4
4
4
5
5
5
6
6
6
1
1
1
2
2
2
3
5
3
6
3
4
4
4
5
5
5
6
6
6
Dari diagram pohon di atas dapat kita lihat bahwa untuk pelemparan dua buah dadu diperoleh ruang contoh S = 36. Selain dalam bentuk deretan dua atau lebih angka-angka, ruang contoh dapat juga disajikan dalam bentuk kata-kata seperti
44
Statistika Dasar S = [X | X adalah kota dengan penduduk > 1 juta jiwa ].
Dibaca: S adalah himpunan semua X dan X adalah kota berpenduduk lebih dari satu juta jiwa. Begitu pula, bila S adalah himpunan semua titik (x,y) pada lingkaran berjari-jari 2 dan berpusat di titik asal, maka kita dapat menuliskan:
{
}
S = ( x, y ) x 2 + y 2 = 4
6. 2.
(6.1)
KEJADIAN
Kejadian adalah himpunan bagian dari ruang contoh. Kejadian dikelompokkan menjadi 3 bagian yaitu: a. Kejadian sederhana yaitu kejadian yang hanya terdiri dari satu titik contoh. b. Kejadian majemuk yaitu kejadian yang terdiri dari 2 atau lebih titik contoh atau kejadian yang merupakan gabungan dari beberapa kejadian sederhana. c. Ruang nol atau ruang kosong atau himpunan kosong yaitu himpunan atau ruang contoh yang tidak memiliki titik contoh dan diberi lambang ( φ ). Hubungan antara kejadian dengan ruang contohnya dapat digambarkan dengan diagram Venn. Dalam diagram Venn seperti terlihat pada gambar 6.1, ruang contohnya digambarkan
sebagai empat persegi panjang, sedangkan kejadiannya digambarkan sebagai lingkaranlingkaran dalam persegipanjang tersebut.
Gambar 6.1. Kejadian dan ruang contoh
6. 3.
PENGOLAHAN KEJADIAN
Pengolahan kejadian akan menghasilkan sebuah kejadian baru dan kejadian baru terebut tetap merupakan himpunan bagian dari ruang contoh semula. Pengolahan kejadian itu dapat berbentuk irisan kejadian, kejadian saling bebas, gabungan kejadian, dan komplemen kejadian.
Probabilitas atau Peluang
45
Irisan (interaksi) dua kejadian A dan B dilambangkan dengan A B, adalah
kejadian yang mengandung semua unsur persekutuan kejadian A dan B. Pada gambar 6.2, irisan kejadian A dan B adalah daerah yang diarsir hitam
A B = daerah arsir hitam Gambar 6.2. Irisan kejadian A dan B Dua kejadian C dan D dikatakan saling bebas (terpisah) bila C D = φ , artinya kejadian C dan kejadian D tidak memiliki unsur persekutuan. Gambar 6.3 memperlihatkan bahwa kejadian C dan D adalah kejadian yang saling pisah.
CD=φ Gambar 6.3. Dua kejadian yang saling pisah Paduan (union) dua kejadian A dan B dilambangkan dengan A B adalah kejadian yang mencakup semua unsur atau anggota A dan B atau keduanya seperti diperlihatkan pada gambar 6.4. berikut.
A B = daerah arsiran hitam
Gambar 6.4. Union (paduan) dua kejadian Komplemen suatu kejadian A relatif terhadap S adalah himpunan semua anggota S yang
bukan anggota A. Kita lambangkan komplemen A dengan A’. Dalam diagram venn pada gambar 6.5 terlihat hubungan antara kejadian A, komplemennya (A’), dan semesta atau ruang contohnya.
46
Statistika Dasar
S
S = Himpunan bilangan asli A’
A
A = Himpunan bilangan ganjil A’= Himpunan bilangan genap (daerah yang diarsir hitam
Gambar 6.5. Kejadian dan komplemen kejadian Persamaan-persamaan berikut ini adalah akibat deari definisi-definisi di atas, dan kebenarannya dapat dengan mudah diperiksa melalui diagram venn. 1. A φ = φ
4. S’ = φ
2. A φ = A
5. φ’ = S
3. A A’ = φ
6. (A’) ‘= A
7. A A’ = S
6.4. MENCACAH TITIK CONTOH Prinsip dasar mencacah sering disebut dengan kaidah penggandaan dan dinyatakan dengan dalil berikut. Kaidah penggandaan :
“Bila suatu operasi dapat dilakukan dalam n1 cara dan untuk setiap cara tersebut dapat dilakukan operasi kedua dengan n2 cara maka kedua operasi tersebut dapat dilakukan dalam n1 n2 cara”. Contoh 6.1.
Berapa macam menu makan siang yang terdiri atas sup, sandwich, daging, dan minuman yang dapat dipilih dari 4 macam sup, 3 jenis sandwich, 5 macam daging, dan 4 minuman ? Jawab : Banyaknya menu makan siang adalah (4)(3)(5)(4) = 240 macam.
Probabilitas atau Peluang
47
Sering kita mempunyai ruang contoh yang unsurnya mengandung semua kemungkinan susunan sekelompok benda. Susunan yang berbeda itu disebut permutasi. Jadi permutasi adalah suatu susunan yang berbeda dan dibentuk oleh keseluruhan atau sebagian
dari data. Banyaknya permutasi n benda yang berbeda adalah n ! atau n (n-1) (n-2)…(3)(2)(1). Sebagai contoh, nilai 5! adalah 120 atau ditulis 5! = (5) (4) (3) (2) (1) = 120. Bila kita mengambil r benda dari n benda yang berbeda maka kita akan dapatkan susunan sebanyak n (n-1) (n-2)…(n-r+1). Secara umum kita katakana banyaknya permutasi akibat pengambilan r benda dari n dari benda yang berbeda adalah:
n
Pr =
n! (n - r)!
(6.2)
Permutasi yang berasal dari penyusunan benda dalam bentuk lingkaran disebut permutasi melingkar. Dua permutasi melingkar dianggap berbeda jika benda yang berpadanan dalam kedua susunan itu diawali atau diikuti dengan benda yang berbeda. Banyaknya permutasi n benda yang disusun dalam suatu lingkaran dinyatakan dengan P = (n-1) !
(6.3)
Berikut ini diberikan cara pencacahan titik contoh jika benda-benda yang akan kita susun tidak semuanya berbeda, artinya ada beberapa jenis yang sama. Banyaknya permutasi yang berbeda dari n benda dimana n1 diantaranya berjenis pertama, n2 berjenis kedua, … , nk berjenis ke-k adalah P=
n! n1!n 2!...
(6.4)
Contoh 6.2.
Berapa macam susunan berbeda yang mungkin untuk posisi ketua dan wakil HMJ dari calon pria sebanyak 5 orang dan calon wanita sebanyak 3 orang ?
Jawab : Banyaknya susunan yang berbeda adalah
8! = 56 macam. 5! 3!
48
Statistika Dasar
Barangkali kita ingin mengetahui banyaknya cara menyekat atau membagi n benda ke dalam r kumpulan yang disebut sel. Banyaknya cara menyekat n benda ke dalam r sel dengan n1 unsur dalam sel pertama, n2 unsur dalam sel kedua dan seterusnya dinyatakan oleh persamaan 6.5 berikut. n n! = n1 , n2 , ... , nr n1 ! n2 !... nr !
(6.5)
Sedangkan dalam hal ini n1 + n2 + … + nr = n Apabila kita ingin mengambil r benda dari n benda tanpa memperhatikan urutannya maka yang kita lakukan tidak lain adalah membagi n benda ke dalam 2 sel dengan sel pertama terdiri dari r benda dan sel yang lain adalah sisanya atau n-r benda. Pengambilan yang demikian ini kita namakan kombinasi. Banyaknya kombinasi r benda dari n benda yang berbeda tanpa memperhatikan urutannya adalah. n n! = r r!(n − r )!
(6.6)
Contoh 6.3.
Dari 3 orang anggota PAN dan 4 orang anggota PKB, hitunglah banyaknya komisi yang terdiri dari 3 orang dengan 1 orang dai PAN dan 2 orang dari PKB yang dapat dibentuk.
Jawab : 3 3! Banyaknya cara memilih 1 orang dari 3 anggota PAN adalah = =3 1 1! (3 − 1)! 4 4! Banyaknya cara memilih 2 orang dari 4 anggota PKB adalah = =6 2 2! (4 − 2)!
Dengan menggunakan kaidah penggandaan kita dapat menemukan banyaknya komisi yang dapat dibentuk yaitu (6)(3) = 18.
Probabilitas atau Peluang
49
6.5. DEFINISI PELUANG Peluang suatu kejadian A adalah jumlah peluang semua titik contoh dalam kejadian A.
Dengan demikian
0 ≤ P(A) ≤ 1,
P(φ) = 0,
P(S) = 1.
Contoh 6.4.
Sekeping uang logam dilemparkan dua kali. Berapa peluang sekurang-kurangnya sisi gambar muncul sekali ?
Jawab : Ruang contoh bagi percobaan ini adalah S = {GG, GA, AG, AA}. Bila uang itu setimbang, setiap kejadian mempunyai peluang yang sama untuk terjadi. Karena terdapat 4 titik contoh dalam semesta (ruang contoh) maka setiap titik contoh berpeluang ¼. Bila B adalah kejadian bahwa sekurang-kurangnya sisi gambar muncul sekali, maka P(B) = 3 x ¼ = ¾. Dua peristiwa atau lebih disebut saling eksklusif jika terjadinya peristiwa yang satu mencegah terjadinya peristiwa yang lain. Sekeping mata uang dengan sisi angka dan gambar dilemparkan sekali, maka masing-masing peristiwa munculnya sisi angka atau sisi gambar adalah dua kejadian yang saling ekslusif, karena kejadian munculnya sisi angka mencegah terjadinya muncul sisi gambar dan sebaliknya. Misalkan sebuah peristiwa A dapat terjadi sebanyak n kali diantara N peristiwa yang saling eksklusif dan masing-masing tejadi dengan kesempatan yang sama, maka peluang kejadian A adalah
n atau ditulis N P( E ) =
n N
(6.7)
Contoh 6.5.
Hitunglah peluang memperoleh kartu hati bila sebuah kartu diambil secara acak dari seperangkat kartu bridge. Jawab : Banyaknya kemungkinan semua hasil percobaan adalah 52, dan 13 di antaranya adalah hati. Maka peluang memperoleh kartu hati adalah P(A) =
13 1 = . 52 4
50
Statistika Dasar
Perhatikan frekuensi relatif tentang terjadinya sebuah peristiwa. Misalnya sebuah mata uang logam dilempar berkali-kali dan setiap kali pelemparan dicatat hasilnya. Peluang sesungguhnya munculnya sisi gambar adalah rasio banyaknya sisi gambar yang muncul dengan banyaknya percobaan atau pelemparan. Dari hal tersebut di atas didefinisikan istilah peluang sebuah peristiwa sebagai limit dari frekuensi relatif bila jumlah pengamatan
diperbesar sampai tak hingga.
6.6. KAIDAH PENJUMLAHAN Seperti telah dituliskan dalam sub bab 6.5, nilai peluang sebuah kejadian adalah antara 0 dan 1 atau ditulis 0 ≤ P(A) ≤ 1 . P(A) = 0 artinya kejadian atau peristiwa A pasti tidak
terjadi dan P(A) = 1 artinya peristiwa A pasti terjadi. Dalam perhitungan peluang ada beberapa kaidah yang dapat membantu untuk menyederhanakan perhitungan. Kaidah yang pertama disebut kaidah penjumlahan yaitu: 1. Bila A dan B adalah dua kejadian sembarang maka peluang A dan atau B disefinisikan: P( A ∪ B ) = P( A) + P( B) − P( A ∩ B )
(6.8)
2. Bila A dan B adalah dua kejadian yang saling terpisah atau saling ekslusif maka P ( A ∪ B ) = P ( A) + P ( B )
(6.9)
atau secara umum dinyatakan Bila A1, A2,…, An adalah kejadian yang saling terpisah atau saling ekslusif maka P( A1 ∪ A2 ∪ ... ∪ An ) = P( A1 ) + P( A2 ) + ... + P( An )
(6.10)
3. Bila A dan A’ adalah dua kejadian yang satu merupakan komplemen lainnya, maka P(A) + P(A’) = 1
(6.11)
Contoh 6.6.
Peluang seorang mahasiswa lulus matematika adalah 2
3
dan peluang ia lulus statistik
dasar adalah 4 . Bila peluang lulus sekurang-kurangnya satu mata kuliah adalah 4 , berapa 9 5 peluang ia lulus kedua mata kuliah tersebut ?
Probabilitas atau Peluang
51
Jawab :
Misalkan
M = lulus matematika D = lulus statistik dasar M D = lulus matematika atau statistik dasar (minimal satu) M D = lulus kedua mata kuliah
Jadi berdasarkan persamaan 6.8 kita peroleh P(M D ) = P(M) + P(D) – P(M D) = 2 + 4 − 4 = 14 3 9 5 45
6.7. PELUANG BERSYARAT Peluang terjadinya kejadian B bila diketahui bahwa suatu kejadian lain A telah terjadi disebut peluang bersyarat dan dilambangkan dengan P(B⏐A) yang dibaca sebagai peluang terjadinya B bila A telah terjadi atau singkatnya peluang B bila A diketahui. Peluang bersyarat didefinisikan sebagai P(B⏐A) =
P(A ∩ B) atau P(A B) = P(A) . P(B⏐A) P(A )
(6.12)
Dan sebaliknya peluang A bila B diketahui dinyatakan dengan P(A⏐B) =
P(A ∩ B) P(B)
(6.13)
Dua kejadian A dan B dikatakan bebas apabila: P(B⏐A) = P(B) atau P(A⏐B) = P(A)
(6.14)
Perhatikan dua kejadian pada percobaan pengambilan dua kartu beturut-turut dengan pengembalian atau pemulihan, A = terambilnya kartu ace B = terambilnya kartu sekop Karena setelah percobaan pertama kartu dikembalikan, maka ruang contoh untuk percobaan pertama dan kedua tetap sama yaitu 52 kartu sehingga: P(B⏐A) = 13/52 = ¼ dan P(B) = 13/52 = ¼ Karena P(B⏐A) = P(B) maka kejadian A dan B dikatakan bebas.
52
Statistika Dasar
Contoh 6.7.
Perhatikan eksperimen pelemparan dadu dimana dadu dibuat sedemikian hingga peluang muncul bilangan genap dua kali lebih besar dari bilangan ganjil. Jika dadu dilemparkan sekali maka ruang contohnya adalah S = {1, 2, 3, 4, 5, 6}. Misalkan
B = kejadian munculnya bilangan kuadrat murni A = bilangan yang muncul lebih dari 3
Tentukan peluang kejadian B setelah A terjadi ! Jawab : P(1) = 1 P(4) = 2
P(2) = 2
9
P(5) = 1
9
Peluang kejadian A adalah P(A) = 5
9
P(3) = 1
9
P(6) = 2
9
dan P(A B) = 2
9 9
9
Maka berdasarkan persamaan 6.12 kita peroleh P(B⏐A) =
2 2 P(A ∩ B) = 9 = 5 P(A ) 5 9
Bandingkan dengan P(B) sebelum dibatasi atau didahului kejadian A.
P(B) = P(1) + P(4) =
3 1 = 9 3
6.8. KAIDAH PENGGANDAAN
Kaidah penggandaan menyatakan bahwa bila dalam suatu percobaan kejadian A dan B keduanya dapat terjadi sekaligus maka P(A B) = P(A) . P(B⏐A)
(6.15)
atau secara umum jika dalam suatu percobaan kejadian-kejadian A1, A2, …, Ak dapat terjadi, maka dapat dinyatakan P(A1 A2 A3 …. Ak) = P(A1) P(A2⏐A1) P(A3⏐A2 A1) … P(Ak⏐A1.Ak-1)
(6.16)
Bila dua kejadian saling bebas maka P(A B) = P(A) . P(B)
(6.17)
atau secara umum jika dalam suatu percobaan kejadian-kejadian A1, A2, …, Ak saling bebas maka kita dapat menyatakan P(A1 A2 …. Ak) = P(A1) P(A2) … P(Ak)
(6.18)
Probabilitas atau Peluang
53
Contoh 6.8.
Sebuah uang logam dibuat tak seimbang sehingga peluang muncul sisi gambar dua kali lebih besar dari sisi angka. Bila uang itu dilemparkan 3 kali, berapa peluang mendapatkan dua sisi angka dan satu sisi gambar ? Jawab :
Misalkan
B = kejadian mendapat dua sisi angka dan satu sisi gambar. = {AAG, AGA, GAA}
2 1 1 2 P(AAG) = P(A A G) = P(A) P(A) P(G) = = 3 3 3 27 P(AGA) = P(GAA) =
2 27
sehingga P(B) =
2 2 2 6 2 + + = = . 27 27 27 27 9
Latihan :
6.1. Populasi sarjana dalam suatu kota dikategorikan menurut jenis kelamin dan status pekerjaan, seperti tampak dalam tabel berikut: Jenis kelamin
Bekerja
Menganggur
Laki-laki
460
40
Perempuan
140
260
Berapa peluang seorang laki-laki yang telah bekerja untuk menjadi duta dalam pertemuan nasional ? 6.2. Peluang seorang dokter mendiagnosis penyakit secara benar adalah 0,7. Bila diketahui dokter tersebut salah mendiagnosis, pasien akan menuntut ke pengadilan adalah 0,9. Berapa peluang dokter salah mendiagnosis dan pasien menuntut ke pengadilan ?
6.9. KAIDAH BAYES
Mari kita lihat kembali soal latihan no 6.1 di atas. Jika ada tambahan informasi bahwa 36 orang yang bekerja menjadi anggota Rotary Club dan 12 orang yang menganggur menjadi anggota Rotary Club seperti terlihat pada gambar . Berapa peluang kejadian A = yang terpilih menjadi duta adalah anggota Rotary Club.
54
Statistika Dasar
E’
E
A = anggota rotary club
A
E = sudah bekerja E’= menganggur
Gambar 6.6. Diagram Venn yang menunjukkan kejadian-kejadian A, E, E’ Dengan melihat gambar 6.6. kita dapat menuliskan A sebagai paduan dua kejadian yang saling terpisah. Secara matematis hal ini dinyatakan dengan A
= (E A) (E’ A)
P(A)
= P[(E A) (E’ A)] = P(E A) + P(E’ A) = P(E) P(A⏐E) + P(E’) P(A⏐E’ )
Selanjutnya kita dapat temukan P(E)
=
600 2 = 900 3
P(E’) = 1 −
P(A⏐E) =
2 1 = 3 3
P(A⏐E’) =
36 3 = 600 50 12 1 = 300 25
Jadi 4 2 3 1 1 P(A) = + = 3 50 3 25 75
Dalam diagram pohon persalan tersebut di atas dapat digambarkan sebagai berikut : E P(E) = 2
P(A⏐E) = 3
50
A
P(E) P(A⏐E)
3
P(E’) = 1
3
E
P(A⏐E’) = 1
A 25
P(E’) P(A⏐E’)
Probabilitas atau Peluang
55
Generalisasi dari kasus diatas dinyatakan dalam kaidah eliminasi atau dalil peluang total berikut :
“ Bila kejadian-kejadian B1, B2, … ≠ 0 untuk I = 1, 2, … k, maka untuk sembarang kejadian A yang merupakan himpunan bagian S berlaku : P(A)
= P(B1) P(A⏐B1) + P(B2) P(A⏐B2) + … + P(Bk) P(A⏐Bk).
(6.19)
= P[(B1 A) (B2 A) …. (Bk A)
Gambar 6.7. Penyekatan ruang contoh S
Contoh 6.9.
Tiga mahasiswa telah dicalonkan menjadi ketua HMJ. Peluang Adam, Brown dan Cony terpilih masing-masing 0,3, 0,5 0,2. Seandainya Adam terpilih peluang kas himpunan bertambah adalah 0,8. Jika Brown atau Cony terpilih, peluang tambahnya kas adalah 0,1 dan 0,4. Berapa peluang kas HMJ bertambah ? Jawab :
A = kas HMJ bertambah B1 = Adam terpilih B2 = Brown terpilih B3 = Cony terpilih Dengan menerapkan kaidah eliminasi P(A) = P(B1) P(A⏐B1) + P(B2) P(A⏐B2) + P(B3) P(A⏐B3). = (0,3) (0,8) + (0,5) (0,1) + (0,2) (0,4) = 0,37 Selain mencari peluang P(A) bagaimana kita menghitung peluang bersyarat P (B3 A) dalam contoh 6.9. Dengan kata lain seandainya kita diberitahu uang kas telah bertambah,
56
Statistika Dasar
berapa peluang bahwa yang terpilih sebagai ketua HMJ adalah cony ? Pertanyaan tersebut dapat terjawab dengan menerapkan sebuah kaidah yang disebut Kaidah Bayes yaitu: “ Jika kejadian-kejadian B1, B2, B3, … Bk merupakan sekatan dari ruang contoh S dengan P(Bi) ≠ 0 untuk i = 1, 2, 3,… ,k maka untuk sembarang kejadian A yang bersifat P(A) ≠ 0
P(Br A ) =
P( Br ) P( A Br ) P(B1 ) P(A B1 ) + P(B2 ) P(A B2 ) + .... + P(Bk ) P(A Bk )
(6.20)
dengan r =1, 2, …, k
Contoh 6.10.
Dari contoh kaidah eliminasi, jika ternyata sebelum pemilikan kas HMJ sudah bertambah, berapa peluang Cony terpilih menjadi ketua HMJ ? Jawab :
Dengan menggunakan kaidah Bayes P(B3 A ) =
P(B3 ) P(A B3 ) P(B1 ) P(A B1 ) + P(B2 ) P(A B2 ) + P(B3 ) P(A B3 )
=
=
(0,2)(0,4)
(0,3) (0,8) + (0,5) (0,1) + (0,2)(0,4)
=
0,08 0,37
8 37
6.10. EKSPEKTASI
Misalkan sebuah eksperimen menghasilkan k perisatiwa, dan peluang masing-masing peristiwa P1, P2, … Pk dan untuk tiap peristiwa terdapat satuan (bobot d1, d2 … dk) maka ekspektasi eksperimen itu
ξ = P1d1 + P2d2 + … + Pkdk = Pidi
7
DISTRIBUSI PELUANG
Seringkali dalam sutau percobaan statistik kita tidak tertarik pada keterangan rinci setiap titik contoh, namun hanya tertarik pada suatu keterangan numerik hasil percobaan. Misalnya dalam sebuah percobaan pelemparan dua buah mata uang logam yang masingmasing memiliki sisi angka (A) dan gambar (G) didapat titik contoh sebagai berikut: S = {AA, AG, GA, GG}
Bila kita hanya tertarik pada berapa banyaknya sisi gambar (G) yang muncul, maka angka 0, 1, dan 2 dapat diberikan pada setiap titik contoh. Bilangan-bilangan 0, 1, dan 2 merupakan besaran acak yang nilainya ditentukan dari hasil percobaan. Nilai-nilai itu dapat dipandang sebagai variabel acak X tertentu yang dalam hal ini menyatakan berapa banyak sisi gambar yang muncul. Dari keterangan di atas dapat didefinisikan istilah variabel acak sebagai suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Bila suatu ruang contoh mengandung titik contoh yang tak terhingga banyaknya seperti banyaknya bilangan cacah, maka ruang itu disebut ruang contoh diskret. Sedangkan bila dalam ruang contoh itu mempunyai titik contoh yang banyaknya sama dengan banyaknya titik dalam sebuah ruas garis, maka ruang itu disebut ruang contoh kontinu. Variabel acak yang didefinisikan di atas ruang contoh diskret dan kontinu masingmasing disebut variabel aak diskret dan variabel acak kontinu. Jadi variabel acak diskret digunakan untuk data cacahan sedangkan variabel acak kontinu digunakan untuk data ukur.
Contoh 7.1 : Pada percobaan pelemparan dua keping mata uang, dihasilkan titik contoh {AA, AG , GA, GG} . Misal banyaknya muncul gambar dinyatakan x, maka x kemungkinannya adalah sebagai berikut:
disebut variabel acak yang
58
Statistika Dasar
Tabel 7.1. Variabel acak dan peluangnya x
Jumlah Titik Contoh
P(x)
0
1
1/4
1
2
2/4
2
1
1/4
Jumlah
4
1
7.1. DISTRIBUSI PELUANG DISKRET Pada variabel acak diskret, setiap nilainya dikaitkan dengan suatu peluang tertentu. Jumlah seluruh peluangnya adalah 1 seperti telihat pada tabel 7.1. Himpunan semua pasangan berurutan (x, f (x )) disebut fungsi peluang atau distribusi peluang bagi variabel acak diskret. Jadi ditribusi peluang diskret adalah sebuah tabel atau rumus yang mencantumkan semua kemungkinan nilai dan nilai peluangnya.
Contoh 7.2. Tentukan rumus distribusi peluang banyaknya sisi gambar bila sebuah mata uang logam dilempar 3 kali. Jawab : Banyaknya titik contoh = 23 = 8 sehingga penyebut bagi peluangnya adalah 8 dan semua titik contoh ini mempunyai peluang yang sama. 3 Banyaknya muncul sisi gambar adalah x 3 x Jadi fungsi peluangnya adalah f(x) = , untuk x = 0, 1, 2, 3 8
Distribusi Peluang
59
7.2. DISTRIBUSI PELUANG KONTINU Peluang untuk mengambil tepat salah satu nilai dari variabel acak kontinu adalah nol. Oleh karena itu distribusi peluang untuk variabel acak kontinu tidak dapat disajikan dalam bentuk tabel tetapi dinyatakan dalam sebuah fungsi yang disebut fungsi kepekatan peluang atau fungsi densitas. Fungsi tersebut dinyatakan sedemikian hingga luas daerah dibawah kurva, diatas sumbu x ≈ 1, atau secara matematis dituliskan dengan: ∞
f (x )dx = 1
(7.1)
−∞
Sebuah fungsi f disebut fungsi densitas bagi variabel acak kontinu x bila luas di bawah kurva dan di atas sumbu x sama denghan 1, dan bila luas daerah di bawah kurva antara x=a dan x=b menyatakan peluang x terletak antara a dan b.
Gambar 7.1. Beberapa bentuk fungsi densitas Untuk menentukan peluang antara x=a dan x=b dirumuskan b
P(a < x < b) = f (x )dx
(7.2)
a
7.3. EKSPEKTASI
Misalkan kita mempunyai sebuah eksperimen yang menghasilkan k buah peristiwa. Peluang terjadinya tiap peristiwa masing-masing p1, p2, …, pk dan untuk setiap peristiwa dengan peluang tersebut mempunyai bobot d1, d2, …, dk yang nilainya bobot tersebut bisa nol, positif, atau negatif. Nilai ekspektasi eksperimen itu didefinisikan sebagai berikut:
60
Statistika Dasar
ξ = p1d1 + p2 d 2 + ... + pk d k =
k
pd i
i
(7.3)
i =1
Sedangkan nilai ekspektasi untuk variabel acak kontinu dinyatakan dengan ξ (x ) =
∞
x f (x ) dx
(7.4)
−∞
Contoh 7.3.
Sebuah variabel acak kontinu x yang mengambil nilai antara x = 2 dan x = 4 mempunyai fungsi densitas
f (x ) =
x +1 8
a. Tunjukkan bahwa P(2 < x < 4) =1 b. Hitunglah P(x < 3,5) c. Hitunglah P(2,4 < x < 3,5)
Jawab :
Gambar 7.2. Luas daerah untuk contoh 7.3.a a. P(2 < x < 4)
= luas daerah diarsir (trapesium) = jumlah sisi sejajar x ½ alas = [f(2) + f(4)] x ½ (4 - 2) = ( 3/8 + 5/8) x ½ (2) =1
Distribusi Peluang
Gambar 7.3. Luas daerah untuk contoh 7.3.b b. P(x < 3,5)
= P(2 < x < 3,5) = [ f(2) + f(3,5) ] x ½ (3,5 – 2) = (3/8 + 4,5/8) x ½ (1,5) = 0,7
Gambar 7.4. Luas daerah untuk contoh 7.3.c c. P(2,4 < x < 3,5)= [f(2,4) + f(3,5)] x ½ (3,5 – 2,4) = [3,4/8 + 4,5/8] x ½ (3,5 – 2,4) = 0,54
61
62
Statistika Dasar
7.4. DISTRIBUSI BINOM
Seringkali suatu percobaan hanya mempunyai dua kemungkinan hasil, misalnya berhasil atau gagal, gambar atau angka dan sebagainya. Percobaan seperti itu disebut percobaan binom yaitu percobaan yang hanya menghasilkan dua nilai.
Ciri-ciri percobaan binom : 1. Percobaannya terdiri atas n ulangan. 2. Dalam setiap ulangan hasilnya dapat digolongkan sebagai berhasil atau gagal. 3. Peluang berhasil yang dilambangkan dengan P untuk setiap ulangan adalah sama. 4. Ulangan itu bersifat bebas satu sama lain. Sebagai contoh marilah kita tinjau sebuah percobaan pelemparan mata uang logam. Dalam percobaan pelemparan mata uang peluang berhasil munculnya gambar adalah: P(x) = π = ½
(7.5)
dan peluang gagal (muncul angka) adalah: P( x ) = 1 - π = ½
(7.6)
maka peluang untuk suatu urutan tertentu adalah πx (1 - π )n – x
(7.7)
dengan x = jumlah keberhasilan n = banyak ulangan Dalam suatu percobaan banyaknya titik contoh yang mempunyai x keberhasilan dan n – x n kegagalan adalah . Jadi peluang terjadinya sebuah peristiwa, misalnya A adalah x n P(x) = πx (1 - π )n – x x
(7.8)
n b(x, n, π) = πx (1 - π )n – x x
(7.9)
atau dituliskan dengan
Parameter rata-rata dan bilangan baku untuk distribusi binom dinyatakan dengan μ=nπ
(7.10)
σ = n π (1 − π )
(7.11)
Distribusi Peluang
63
Contoh 7.4.
Tentukan peluang mendapatkan tepat tiga bilangan 2 apabila sebuah dadu setimbang dilemparkan 5 kali.
Jawab : Peluang keberhasilan setiap ulangan π = 1/6 Peluang kegagalan setiap ulangan 1 - π = 5/6 x = banyaknya muncul bilangan 2 = 3 n = 5 (banyaknya ulangan)
b (3 , 5, 1/6)
5 n−x = π x (1 − π ) 3 3
5 1 5 = 3 6 6
2
= 0,032
Contoh 7.5.
Peluang seorang sembuh dari suatu penyakit adalah 0,4. Bila 15 orang diketahui menderita penyakit ini berapa peluang bahwa a. Minimal 10 orang dapat sembuh b. Ada 3 sampai 8 orang yang sembuh c. Tepat 5 orang yang sembuh
Jawab : a. P (x ≥ 10) = 1 – P(x < 10) 9
=1-
b (x , n , π ) x =0 9
=1-
b (x, 15, 0,4) x =0
= 1 – 0,9662 = 0,0338
64
Statistika Dasar
8
b (x, 15, 0,4)
b. P (3 ≤ x ≤ 8) =
x =3
=
8
b (x, 15, 0,4) -
x=0
3
b (x, 15, 0,4)
x=0
= 0,9050 - 0,0271 = 0,8779 c. P (x = 5)
= b (5, 15, 0,4) =
5
b (x, 15, 0,4) -
x=0
4
b (x, 15, 0,4)
x=0
= 0,4032 - 0,2173 = 0,1859
7.5. DISTRIBUSI MULTINOM
Percobaan multinom adalah percobaan yang menghasilkan lebih dari 2 kemungkinan hasil dalam setiap ulangan. Misalkan sebuah percobaan menghasilkan peristiwa E1, E2, E3, … dengan peluang π1, π2, π3 … maka peluang akan terdapat x1, x2, x3 … dari peristiwa E1, E2, … dinyatakan P(x1 , x 2 , ... x k ) =
n! . π1x 1 . π2x 2 ... πkx k x1! x 2! x 3! ... x k !
(7.12)
dengan x1 + x2 + … + xk = n π1 + π2 + … + πk = 1 0 < πi < 1 ;
i = 1, 2, 3, …, k.
Contoh 7.6.
Sebuah kotak berisi 3 mesin A, 4 mesin B, 5 mesin C. Sebuah mesin diambil dari kotak, dicatat jenisnya lalu dikembalikan lagi. Tentukan peluang di antara 6 barang yang dicatat diperoleh 1 mesin A, 2 mesin B, dan 3 mesin C.
Jawab : P(A) = π1 = 3/12
x1 = 1
P(B) = π2 = 4/12
x2 = 2
P(C) = π3 = 5/12
x3 = 3
n=6
Distribusi Peluang
65
Dengan menggunakan persamaan 7.12 kita dapat memperoleh P (x 1 , x 2 , x 3 ) = =
n! x2 π1x 1 π21 π3x 3 x1! x 2! x 3!
( )( )( )
1 3 2 6! 5 3 4 12 12 12 1! 2! 3!
= 0,12
7.6. DISTRIBUSI HIPERGEOMETRIK
Distribusi ini digunakan untuk percobaan tanpa pengembalian. Percobaan ini mengambil n sampel dari N populasi. Ciri percobaan Hipergeometrik : 1. Suatu contoh acak berukuran n diambil dari N populasi. 2. k dari N benda diklasifikasikan sebagai berhasil dan N–k benda diklasifikasikan gagal. Banyaknya keberhasilan x
dalam suatu percobaan hipergeometrik disebut variabel acak
hipergeometrik. Nilai peluang dalam distribusi hipergeometrik dinyatakan dengan k N - k x n - x P(x) = h (x, N, n, k) = ; x = 0,1,2, ..., k N n
(7.13)
Rata-rata dan ragam/varians bagi distribusi hipergeometrik dinyatakan nk N N-n k k . n . 1 - σ2 = N -1 N N
μ =
(7.14)
Contoh 7.7.
Sekelompok manusia terdiri atas 50 orang dan 3 diantaranya lahir pada tanggal 1 Januari. Secara acak diambil 5 orang. Berapa peluang diantara 5 orang tersebut a. tidak terdapat yang lahir pada 1 Januari b. ada seorang yang lahir pada 1 Januari
66
Statistika Dasar
Jawab : N = 50, n = 5, k = 3 k N - k x n - x a. P(0) = h(0, 50, 5, 3) = N n
3 47 0 5 = = 0,724 50 5
k N - k x n - x b. P(1) = h(1, 50, 5, 3) = N n
3 47 1 4 = = 0,253 50 5
7.7. DISTRIBUSI POISSON
Percobaan Poisson adalah percobaan yang menghasilkan nilai-nilai bagi suatu variabel acak x yang terjadi selama selang waktu tertentu atau di suatu daerah tertentu. Ciri-ciri percobaan Poisson : 1. Banyaknya hasil percobaan yang terjadi dalam selang waktu tertentu atau suatu daerah tertentu tidak bergantung pada percobaan selang waktu atau daerah yang lain. 2. Peluang terjadinya suatu hasil percobaan selama selang waktu yang singkat atau daerah yang kecil sebanding dengan panjang selang waktu tersebut dan besarnya daerah tersebut. 3. Peluang bahwa lebih dari satu hasil percobaan terjadi dalam selang waktu singkat atau daerah yang kecil dapat diabaikan. Bilangan x yang menyatakan banyaknya hasil percobaan dalam suatu percobaan Poisson disebut variabel acak Poisson dan distribusi peluangnya disebut distribusi Poisson. Distribusi peluang bagi variabel acak poisson x dinyatakan dengan : P (x , μ ) =
e-μ μ x x!
(7.15)
di mana x = 1, 2, 3, … e = 2,718128 Sedangkan ragam atau varians dalam distribusi poisson adalah σ2 = μ Contoh 7.8.
(7.16)
Distribusi Peluang
67
Rata-rata jumlah hari tutup sekolah pada musim dingin adalah 4. Berapa peluang bahwa sekolah-sekolah akan tutup selama 6 hari pada suatu musim dingin ?
Jawab : P(6,4) =
e − 4 46 = 0,1042 6!
7.8. DISTRIBUSI NORMAL (GAUSS)
Distribusi yang paling penting dalam statistika dan paling banyak digunakan adalah distribusi normal. Grafik distibusi normal disebut kurva normal yaitu kurva yang berbentuk genta seperti terlihat pada gambar 7.5. Distribusi ini untuk variabel acak kontinu dinyatakan dengan fungsi densitas berikut. x -μ σ
-1 1 2 f (x ) = e σ 2π
dimana
2
(7.17)
-∞ < x < ∞ π = 3,14159 e = 2,718
Gambar 7.5. Kurva normal Bila nilai-nilai μ dan σ diketahui, maka kurva normal tersebut telah tertentu dengan pasti. Berikut ini diberikan beberapa bentuk kurva normal. Untuk dua kurva normal dengan simpangan baku sama tetapi nilai tengah atau rata-ratanya berbeda ditunjukkan pada gambar 7.6. Sedangkan kurva normal dengan nilai tengah sama tetapi simpangan baku berbeda ditunjukkkan dalam gambar 7.7.
68
Statistika Dasar
Gambar 7.6. Kurva normal dengan μ1 ≠ μ2 tetapi σ1 = σ2
Gambar 7.7. Kurva normal dengan μ1 = μ2 tetapi σ1 < σ2 Untuk nilai tengah dan simpangan baku yang berbeda, kurva normalnya ditunjukkan dalam gambar 7.8.
Gambar 7.8. Kurva normal dengan μ1 ≠ μ2 tetapi σ1 < σ2 Dari pengamatan kita terhadap gambar 7.5 sampai gambar 7.8 diperoleh sifat-sifat penting distribusi normal berikut ini: 1. Grafiknya selalu diatas sumbu x. 2. Luas daerah yang terletak di bawah kurva tetapi di atas sumbu x sama dengan 1 3. Bentuknya simetrik terhadap x = μ. 4. Mempunyai satu modus (unimodal) tercapai pada x = μ yang membuat fungsimencapai nilai maksimum sebesar
0,3989 . σ
5. Grafiknya berasimtotkan sumbu x di mulai dari x = μ + 3σ ke kanan dan x = μ - 3σ ke kiri
Distribusi Peluang
69
Jika nilai σ makin besar maka bentuk kurva makin rendah (Platikurtik) dan jika σ makin kecil maka bentuk kurva makin tinggi (leptokurtik). Dalam distribusi normal juga berlaku rumus sebelumnya yaitu: ∞
f (x ) dx
=1
-∞
(σ ∞
-∞
2π
)
−1
e
(7.18)
- 1 Z2 2
dx = 1
(7.19)
Peluang harga x antara a dan b P (a < x < b) =
(σ b
a
2π
)
−1
e
- 1 Z2 2
dx
(7.20)
Untuk penggunaan praktis telah disusun daftar distribusi normal standart atau normal baku dengan nilai μ (rata-rata) = 0 dan σ = 1
70
Statistika Dasar
Fungsi densitas normal baku berbentuk
f (z ) =
1 - 12 Z 2 e 2π
(7.21)
-∞ < x < ∞
dimana
Z=
x -μ σ
Ada sebuah kaidah empirik yang telah ditentukan secara teoritik dengan menggunakan luas daerah di bawah kurva normal yaitu jika sebuah fenomena berdistribusi normal, maka : 1. Kira-kira 68,23 % dari kasus ada dalam daerah satu simpangan baku sekitar rata-rata yaitu antara μ + σ. 2. ada 95,45 % dari kasus terletak dalam daerah dua simpangan baku sekitar rata-rata yaitu antara μ - 2σ dan μ + 2σ. 3. hampir 99,73 dari kasus ada dalam daerah tiga simpangan baku sekitar rata-rata yaitu antara μ - 3σ dan μ + 3σ. Contoh 7.9.
Sebuah perusahaan alat listrik memproduksi lampu yang umurnya menyebar normal dengan nilai tengah atau rata-rata 800 jam dan simpangan baku 40 jam. Hitung peluang sebuah lampu hasil produksinya berumur antara 778 dan 834 jam. Jawab : 778 − 800 = −0,55 40 834 − 800 Z2 = = 0,85 40 Z1 =
maka P [778 < x < 834]
= P (-0,55 < Z < 0,85) = P (Z < 0,85) – P (Z < -0,55) = 0,8023 – 0,2912 = 0,5111
Distribusi Peluang
71
Latihan :
1. Suatu ujian terdiri dari 15 pertanyaan berganda, masing-masing dengan 4 kemungkinan jawaban dan hanya satu yang benar. Berapa peluang seseorang yang menjawab secara menebak saja memperoleh 5 sampai 10 jawaban yang benar ? 2. Hitung peluang mendapatkan dua bilangan 1, satu bilangan 2, satu bilangan3, dua bilangan 4, tiga bilangan 5, satu bilangan 6, bila sebuah dadu setimbang dilemparkan 10 kali. 3. Dari 12 peluru kendali diambil secara acak 5 peluru dan ditembakkan. Bila diantara 12 peluru tersebut ada 3 yang rusak sehingga macet saat ditembakkan, berapa peluang a. kelima peluru berhasil ditembakkan ? b. sebanyak-banyaknya 2 yang macet 4. Rata-rata disuatu simpangan terjadi 3 kecelakaan lalu lintas per bulan. Berapa peluang bahwa pada suatu bulan tertentu di simpangan ini terjadi a. tepat 5 kecelakaan b. kurang dari 3 kecelakaan c. sekurang-kurangnya 2 kecelakaan 5. Diameter bagian dalam ring piston menyebar normal dengan nilai tengah 10cm dan simpangan baku 0,03 cm. a.
Berapa peluang ring yang diameter dalamnya lebih dari 10,075 cm.
b.
Berapa peluang sebuah ring mempunyai diameter dalam antara 9,97 dan 10,03 cm.
c.
Di bawah nilai berapa terdapat 15% ring yang diproduksi.
7.9. PENDEKATAN DISTRIBUSI NORMAL TERHADAP DISTRIBUSI BINOM
Antara distribusi binom dan distribusi normal terdapat hubungan tertentu. Jika untuk fenomena yang berdistribusi binom berlaku: 1. N cukup besar 2. π = P(A) = Peluang peristiwa A terjadi, tidak terlalu dekat dengan nol. maka distribusi binom dapat didekati dengan distribusi normal. Distribusi normal tersebut mempunyai rata-rata μ = Nπ dan simpangan baku σ = Nπ(1 -π) . Agar distribusi normal baku dapat dipakai maka digunakan transformasi : Z=
X - Nπ Nπ(1 - π)
(7.22)
72
Statistika Dasar
7.10. DISTRIBUSI STUDENT (t)
Distribusi variabel acak kontinu lainnya adalah distribusi student atau distribusi t yang fungsi densitasnya dinyatakan dengan:
f (t ) =
K t2 1 + n −1
1
(7.23)
2n
Persamaan 7.23 berlaku untuk harga-harga t yang memenuhi - ∞ < t < ∞ dan K merupakan bilangan tetap yang besarnya bergantung pada n sedemikian hingga luas daerah di bawah kurva sama dengan satu unit. Pada distribusi t ini terdapat bilangan (n-1) yang disebut derajat kebebasan dan disingkat dk. Bentuk grafiknya seperti grafik distribusi normal baku, dan simetrik terhadap t=0 seperti terlihat pada gambar 7.9. Untuk melakukan perhitungan-perhitungan, telah di susun tabel distribusi t.
Gambar 7.9. Kurva distribusi student (t) 7.11. DISTRIBUSI CHI KUADRAT
Distribusi chi kuadrat merupakan distribusi dengan variabel acak kontinu. Simbol yang dipakai untuk chi kuadrat adalah χ2. Persamaan atau fungsi densitas untuk distribusi chi kuadrat adalah: f (u ) = K u dengan u = χ2 (nilainya u > 0) v = derajat kebebasan K = konstanta e = 2,7183
1 1 v -1 − u 2 2
e
(7.24)
Distribusi Peluang
73
Grafik distribusi chi kuadrat umumnya merupakan kurva positif (miring ke kanan) seperti terlihat pada gambar 7.10. Kemiringan ini semakin berkurang jika derajat kebebasan v semakin besar. Untuk perhitungan, telah disusun tabel distribusi chi kuadrat.
Gambar 7.10. Kurva distribusi chi kuadrat (χ2)
7.12. DISTRIBUSI F
Distribusi F juga mempunyai variabel acak yang kontinu dengan fungsi densitas sebagai berikut : f (F ) = K
F
1
2
(v1 − 2 )
v1 F 1 + v 2
1
2
( v1 + v2 )
(7.25)
dengan variabel acak F memenuhi F > 0, K=konstanta yang harganya bergantung pada v1 dan v2 sedemikian hingga luas di bawah kurva sama dengan 1, v1=dk pembilang, v2=dk penyebut. Grafik distribusi F tidak simetrik dan umumnya sedikit positif seperti terlihat pada gambar 7.11. Seperti juga distribusi yang lain, tabel distribusi F juga telah disusun untuk keperluan perhitungan.
Gambar 7.11. Kurva distribusi F
74
Statistika Dasar
Contoh 7.10.
Untuk pasangan derajat kebebasan v1 = 24 dan v2 = 8, ditulis juga (v1, v2) = (24, 8), maka untuk p = 0,05 didapat F = 3,12 sedangkan untuk p=0,01 didapat F = 5,28 (lihat daftar distribusi F). Ini didapat dengan jalan mencari nilai 24 pada baris atas dan angka 8 pada kolom kiri. Jika dari 24 turun dan dari 8 ke kanan, maka didapat bilangan-bilangan tersebut. Yang atas untuk p = 0,05 dan yang bawah untuk p = 0,01.
8
SAMPLING ATAU PENARIKAN CONTOH
Sampel adalah sebagian populasi yang diambil dengan menggunakan cara-cara tertentu. Untuk mendapatkan kesimpulan yang dapat dipertanggungjawabkan haruslah ditempuh cara-cara yang benar dalam setiap langkah termasuk cara-cara pengambilan sampel atau biasa disebut sampling. 8.1. ALASAN MELAKUKAN SAMPLING Untuk melakukan analisis statistik diperlukan data, karenanya data perlu dikumpulkan. Sensus terjadi apabila setiap anggota yang ada dalam populasi dikenai penelitian. Jika tidak maka samplinglah yang ditempuh. Ada beberapa alasan mengapa sampling dilakukan. a. Ukuran populasi Telah kita kenal bahwa ada dua macam ukuran populasi yaitu terhingga dan takhingga. Dalam popuasi tak hingga sensus jelas tidak mungkin dilakukan karena obyeknya sangat banyak atau takhingga. Untuk populasi yang terhingga belum tentu sensus dapat dilakukan karena ukurannya masih dianggap cukup besar, misalnya satu milliard. Anggapan demikian sering membuat teori sampling dan analisisnya menjadi lebih sederhana. b. Masalah biaya Bagaimanapun juga semakin banyak obyek yang diteliti, maka semakin banyak juga biaya yang diperlukan. Jika dananya terbatas maka pilihan untuk melakukan sampling adalah tepat. Perlu diingat bahwa biaya diperlukan bukan hanya untuk pengumpulan data tetapi juga untuk analisis, diskusi, perhitungan-perhitungan, gaji ahli dan ongkos konsultasi. c. Masalah waktu Sensus memerlukan waktu yang lebih banyak dibanding dengan sampling. Dengan demikian sampling dapat memberikan data lebih cepat. Apabila diinginkan kesimpulan yang cepat maka sampling akan terasa sekali manfaatnya. Jadi jelas dengan sampling, selain menghemat biaya juga dapat menghemat waktu.
Sampling atau Penarikan Contoh
75
d. Percobaan yang sifatnya merusak Jika penelitian yang dilakukan terhadap obyek sifatnya merusak, maka sensus tidak mungkin dilakukan dan satu-satunya cara adalah sampling. Tidak mungkin sensus dilakukan untuk mengetahui rasa jeruk dalam keranjang, kekuatan daya ledak granat yang dihasilkan, kemanjuran obat baru yang dihasilkan, kekuatan ban mobil yang diproduksi dan masih banyak lagi contoh yang lain. Jika semua jeruk dirasakan, semua granat dicoba, tidak ada sisanya yang dapat dijual. e. Masalah ketelitian Salah satu hal agar kesimpulan yang dihasilkan dapat dipertanggungjawabkan adalah adalah ketelitian. Pengalaman mengatakan bahwa semakin banyak data yang diteliti, makin berkurang ketelitian yang dihasilkan. Petugas, peneliti, pencacah akan merasa bosan mengerjakan hal yang sama dalam jumlah yang besar. Kebosanan itu dapat menyebabkan kesalahan sehingga data yang diperoleh kurang dapat dipercaya. f. Faktor ekonomis Faktor ekonomis diartikan dengan apakah kegunaan dari hasil penelitian tersebut sepadan dengan biaya yang dikeluarkan untuk melakukan penelitian itu. Jika biaya sensus tidak seimbang dengan manfaat hasil penelitian, maka sampling lebih ekonomis untuk dilakukan. 8.2. RANCANGAN SAMPLING Dalam perancangan sampling ada beberapa hal yang perlu diperhatikan antara lain: a. Rumuskan persoalan yang ingin diketahui b. Tentukan dengan jelas batas populasi mengenai persoalan yang ingin diketahui tersebut. Pengambilan sampel dari populasi yang salah akan mengakibatkan pengambilan keputusan yang salah pula. c. Definisikan dengan jelas dan tepat segala unit dan istilah yang diperlukan. d. Tentukan unit sampling yang diperlukan. Unit sampling adalah satuan terkecil yang menjaadi anggota populasi. Untuk meneliti macam beras yang digunakan misalnya, apakah unit sampling yang digunakan keluarga atau setiap anggota keluarga ? e. Tentukan dan rumuskan cara-cara pengukuran dan penilaian yang akan digunakan. Untuk mengukur derajat kecerdasan penduduk berdasarkan pendidikan terakhir, ukuran apa yang dipakai dan berapa nilainya untuk setiap kategori ?. Samakah nilainya untuk seorang
76
Statistika Dasar
lulusan SMA yang mengikuti kursus satu tahun dengan seseorang yang hanya mengakhiri akademi di tahun pertama ? f. Kumpulkan jika ada, segala keterangan tentang hal yang ingin diteliti yang pernah dilakukan di masa lampau. g. Tentukan ukuran sampel, yaitu berapa unit sampling yang harus diambil dari populasi. Jangan sampai sampel berukuran terlalu kecil sehingga kesimpulan yang dihasilkan tidak memuaskan dan jangan pula terlalu besar yang menyebabkan biaya yang dikeluarkan terlalu banyak. h. Tentukan cara sampling mana yang dipakai agar sampel yang diperoleh representatif. i. Tentukan cara pengumpulan data mana yang akan dilakukan. Apakah wawancara langsung, dengan daftar isian, meneliti langsung, atau mengumpulkan data dari sumbersumber yang sudah ada. j. Trentukan metode analisis mana yang akan digunakan. k. Sediakan biaya dan minta bantuan ahli baik berbentuk pembantu tetap atau hanya sebagai konsultan. 8.3. BEBERAPA CARA SAMPLING Misalkan kita mempunyai berhingga berukuran N, dan dari populasi itu akan diambil sampel berukuran n. Ada berapa sampel yang dapat kita ambil ?. Ada dua perlakuan yang kita kenal yaitu: a. Pengambilan sampel dengan pengembalian, artinya anggota populasi yang telah diambil untuk dijadikan sampel dicampur kembali dengan anggota populasi asalnya. Secara umum jika dari populasi berukuran N diambil sampel berukuran n dengan pengembalian maka ada Nn sampel yang mungkin diambil. Secara teoritik, populasi berhingga yang dikenai sampling dengan pengembalian dapat dianggap sebagai populasi tak hingga, karena pengambilan sampel berapapun tidak akan menghabiskan anggota populasi. Cara sampling seperti ini hampir tak pernah digunakan kecuali untuk simulasi ketika mencari hasil-hasil yang mungkin didapat dari sampling terhadap populasi tak hingga. b. Pengambilan sampel tanpa pengembalian, artinya sampel yang telah diambil tidak disimpan kembali ke dalam populasi. Jadi setiap anggota populasi hanya dapat diambil satu kali.
Sampling atau Penarikan Contoh
77
Secara umum dinyatakan, banyaknya sampel berukuran n yang dapat diambil dengan cara tanpa pengembalian dari sebuah populasi berukuran N adalah: N N! = n n ! (N - n ) !
(8.1)
Dari persamaan 8.1 jika n = N maka hanya ada sebuah sampel yaitu populasi itu sendiri. Dalam hal ini tentunya sampling tidak lain adalah sensus itu sendiri. Secara garis besar dikenal tiga cara sampling yang mungkin dapat digunakan untuk keadaan tertentu agar diperoleh sampel yang representatif. Tiga cara itu adalah: a. Sampling seadanya. Pengambilan sebagian dari populasi berdasarkan seadanya data atau kemudahannya mendapatkan data tanpa perhitungan apapun mengenai derajat kerepresentatifannya, digolongkan ke dalam sampling seadanya. Sampel yang didapat dengan cara demikian sangat lemah atau samar-samar. Sampel yang demikian ini memang syah asalkan kesimpulan yang dibuat berdasarkan sampel ini disertai kesadaran bahwa terdapat hubungan yang samar-samar antara populasi dan sampel. Ini mengakibatkan kesimpulan yang dibuat bersifat kasar dan sementara. Cara ini masih juga digunakan terutama dalam bidang-bidang sosial. Sebagai contoh misalnya, mengumpulkan pendapat atau opini masyarakat dari orangorang yang lewat untuk keperluan pooling tentang partai mana yang akan menang dalam pemilu mendatang. Mudah dilihat bahwa orang-orang yang lewat tidak merupakan bagian yang representatif dari keseluruhan masyarakat yang berhak memilih. b. Sampling pertimbangan atau purposif. Sampling purposif atau dikenal dengan sampling pertimbangan, terjadi apabila pengambilan sampel dilakukan berdasarkan pertimbangan perorangan atau pertimbangan peneliti. Hanya mereka yang dianggap ahli yang patut memberikan pertimbangan. Sampling purposif akan baik hasilnya di tangan seorang ahli yang mengenal populasi dan dapat segera mengetahui maslah yang khas. Sampling cara ini cocok untuk studi kasus dimana banyak aspek dari kasus tunggal yang representatif diamati dan dianalisis. Berikut ini diberikan contoh untuk sampling pertimbangan. Penelitian hanya mendapat 30% dari kuisoner yang dikirimkan. Berdasarkan pertimbangan tertentu, diputuskan untuk menggunakan data 30% tersebut sebagai sampel yang representatif. Dianggap, atas
78
Statistika Dasar
dasar pertimbangan, bahwa mereka yang tidak mengembalikan kuisoner dan yang mengembalikan mempunyai karakteristik yang sama dengan yang sedang diteliti. Kedua cara sampling di atas yaitu sampling seadanya dan sampling purposif sering disebut sampling nonpeluang karena pada waktu sampel diambil dari populasi, peluang tidak diikutsertakan. Ketelitian dan kerepresentatifan sampel nonpeluang tidak dapat ditaksir dan akibatnya tidak mungkin menggeneralasikan hasil sampel terhadap populasi dengan derajat keyakinan tertentu. Meskipun demikian sampling nonpeluang masih digunakan mengingat keperluan praktis dan sering dikehendaki kesimpulan yang sementara dan kasar. c. Sampling peluang. Jika peluang digunakan ketika pengambilan sampel dilakukan, maka yang kita lakukan disebut sampling peluang. Sampel yang didapat dinamakan sampel peluang, yaitu sebuah sampel yang anggota-anggatanya diambil dari populasi berdasarkan peluang yang diketahui. Jika tiap anggota populasi mempunyai peluang yang sama untuk diambil sebagai sampel maka sampel yang didapat dinamakan sampel acak. Sampel acak inilah yang biasanya lebih diutamakan untuk penelitian dibandingkan dengan macam sampel yang lain. Hal ini karena sampel acak membuat peneliti mempunyai cara obyektif untuk menilai presisi atau ketelitian hasilnya. Karenanya sampel acak memungkinkan untuk menduga dan menghitung besarnya variasi sampling atau kekeliruan sampling, yaitu perbedaan antara statistik sampel dan parameter populasi. Contohnya hasil proses, misalnya tablet yang dihasilkan oleh sebuah mesin dianggap sebagai anggota hasil sampling acak dari sebuah populasi yanag terdiri atas semua hasil yang mungkin diproduksi jika proses itu berlangsung terus-menerus dalam kondisi yang sama. Jika terjadi perubahan yang mempengaruhi proses, maka hasil proses baru merupakan sebuah sampel acak dari populasi baru yang terjadi karena pengaruh perubahan tersebut. Jika kita menghendaki sampel acak tetapi ternyata beberapa anggota populasi mempunyai kesempatan atau peluang yang lebih untuk diambil menjadi anggota sampel daripada anggota sampel lainnya, maka yang diperoleh adalah sampel bias. Cara yang sudah dikenal umum untuk mengambil sebuah sampel acak dari populasi berhingga adalah sebagai berikut. Misalkan populasinya beranggotakan 426 dan akan diambil sampel acak yang terdiri atas 20 anggota. Pada kertas kecil yang berukuran dan berindentitas sama, dituliskan nomor masing-masing anggota populasi. Dengan demikian terdapat 426 helai
Sampling atau Penarikan Contoh
79
kertas yang selanjutnya digabung dan ditempatkan dalam sebuah wadah tertentu. Setelah diaduk dengan baik sesorang dengan mata tertutup diminta untuk mengambil sehelai kertas. Sisanya diaduk lagi, lalu diambil satu lagi dan begitu seterusnya hingga 20 kali. Nomornomor yang ditarik itulah yang menjadi anggota sampel. 8.4. BEBERAPA MACAM SAMPLING UNTUK MENDAPATKAN SAMPEL YANG REPRESENTATIF Cara pengambilan sampel acak yang diuraikan di atas (sub bab 8.3) baik sekali untuk populasi yang homogen, yaitu populasi yang anggota-anggotanya berada di bawah penyebab yang sama. Untuk populasi yang heterogen (tidak homogen) digunakan cara lain, diantaranya adalah sampling berstrata atau sampling petala, sampling proporsional, sampling klaster dan sampling area. Bila populasinya heterogen, biasanya akan lebih baik dibuat menjadi beberapa strata atau petala atau lapisan. Pembuatan srata ini ditentukan berdasarkan karakteristik tertentu sedemikian hingga strata itu menjadi homogen. Dari setiap strata lalu diambil secara acak anggota-anggota yang diperlukan atau dengan kata lain dilakukan pengacakan di dalam setiap strata. Gabungan anggota-anggota yang didapat akan membentuk sebuah sampel strata. Sampling strata biasanya diperbaiki lagi dengan menggunakan cara proporsional. Dengan cara ini dimaksudkan bahwa banyak anggota dari setiap strata diambil sebanding dengan ukuran setiap strata. Cara ini disebut sampling acak proporsional dan sampelnya disebut sampel acak proporsional. Contoh 8.1. Diperlukan sampel berukuran 169 pelajar laki-laki SLTA. Misalkan ada 3 SLTA dengan jumlah pelajar sebagai berikut, SMU sebanyak 2.758 pelajar, SPG sebanyak 3.826 pelajar, dan STM sebanyak 1.473 pelajar. Tentukan jumlah sampel dengan cara sampling acak proporsional untuk setiap strata !
80
Statistika Dasar
Jawab : Kita punya 3 strata dengan perbandingan SMU : SPG : STM = 2.758 : 3.826 : 1.473. Jumlahnya adalah 8.057 pelajar. Maka jumlah sampel yang diambil dari strata SMA adalah
2.758 3.826 x 169 pelajar = 58 pelajar, dari SPG diambil x 169 pelajar = 80 pelajar, dari 8.057 8.057 STM diambil
1.473 x 169 pelajar = 31 pelajar. 8.057
Jadi perlu diambil secara acak 58 pelajar SMU, 80 pelajar SPG, dan 31 pelajar STM. Sampling Klaster. Dalam sampling ini populasi dibagi-bagi menjadi beberapa
kelompok atau klaster. Secara acak klaster-klaster yang diperlukan diambil dengan proses pengacakan. Setiap anggota yang berada dalam klaster-klaster yang diambil secara acak tadi merupakan sampel yang diperlukan. Contoh 8.2.
Untuk meneliti pendapatan keluarga di suatu daerah, sampling klaster dapat dilakukan. Misalnya daaerah itu terdiri dari kabupaten, kecamatan, desa dan rukun tetangga. Untuk mendapatkan sampel klaster mula-mula secara acak diambil sampel yang terdiri dari kabupaten. Dari tiap kabupaten dalam sampel yang disebut kabupaten sampel, secara acak diambil kecamatan. Banyaknya kecamatan yang diambil dari tiap kabupaten sampel mungkin sama atau mungkin berbeda. Sekarang didapat kecamatan sampel. Selanjutnya dari setiap kecamatan sampel, diambil secara acak desa untuk mendapatkan desa sampel. Akhirnya dari tiap desa sampel secara acak pula diambil rukun tetangga sampel. Keluarga-keluarga yang ada dalam rukun tetangga sampel inilah, setelah semuanya digabungkan, yang menjadi anggota sampel klaster. Jika klaster-klaster terdiri atas area tanah maka diperoleh sampling area. Samplingnya sama seperti yang diuraikan di atas. Selain sampling yang diuraikan di atas, masih ada lagi beberapa sampling yang lain yaitu sampling sistematik, sampling ganda, sampling multipel, dan sampling sekuensial. a. Sampling sistematik. Dalam sampling ini anggota sampel diambil dari populasi pada jarak interval waktu, ruang atau urutan yang uniform. Jika populasi berukuran N dan sampel beranggotakan n maka besarnya jarak interval adalah (N/n).
Sampling atau Penarikan Contoh
81
b. Sampling ganda. Jika untuk menyimpulkan populasi dilakukan sampling, maka pada umumnya hanya sebuah sampel berukuran tertentu dengan cara tertentu pula yang biasa digunakan. Sampling yang demikian disebut sampling tunggal. Seringkali sampel tunggal kurang efisien karena bisa terjadi terlalu banyak anggota yang diambil dan karenanya terjadi pemborosan waktu dan biaya. Untuk mengatasi hal ini dapat digunakan sampling ganda. Dalam sampling ganda, penelitian dilakukan dengan menggunakan sebuah sampel yang ukurannya relatif kecil. Berdasarkan sampel ini kesimpulan mengenai populasi dibuat. Jika hasilnya telah memenuhi kriteria yang telah ditentukan maka sampling berhenti dan kesimpulan dibuat. Jika tidak sampel yang kedua diambil dan digabungkan dengan yang pertama. Kemudian kesimpulan dibuat berdasarkan sampel gabungan tersebut. Sampling ganda banyak digunakan dalam statistika industri untuk pengontrolan kualitas. c. Sampling Multipel. Sampling ini adalah perluasan dari sampling ganda. Dalam sampling multipel pengambilan sampel dilakukan lebih dari dua kali dan setiap kali pengambilan digabungkan menjadi sebuah sampel. Pada tiap gabungan, analisis dilakukan dan kesimpulan dibuat. Sampling berhenti apabila hasilnya sudah memenuhi kriteria yang telah direncanakan. d. Sampling sekuensial. Sampling ini sebenarnya juga sampling multipel. Perbedaannya adalah dalam sampling sekuensial tiap anggota sampel diambil satu persatu dan pada tiap kali selesai mengambil anggota, analisis dilakukan, lalu berdasarkan hal ini kesimpulan dibuat untuk menentukan apakah sampling dihentikan atau diteruskan. 8.5. KESALAHAN SAMPLING DAN NON SAMPLING
Dalam penelitian ada dua macam kesalahan pokok yang bisa terjadi yaitu kesalahan sampling dan kesalahan nonsampling. Kesalahan sampling disebabkan oleh kenyataan adanya pemeriksaan yang tidak
lengkap tentang populasi dan penelitian hanya dilakukan berdasarkan sampel. Jadi penelitian terhadap sampel yang diambil dari sebuah populasi dan penelitian terhadap populasi sendiri dilakukan dengan cara yang sama tetapi memberikan hasil yang berbeda. Perbedaan antara hasil sampel dan hasil yang akan dicapai bila prosedur yang sama juga digunakan untuk penelitian terhadap populasi dinamakan kesalahan sampling. Para ahli statistika telah berusaha untuk mengukur dan memperhitungkan kesalahan ini supaya dapat dikontrol. Cara
82
Statistika Dasar
untuk melakukannya ialah dengan jalan mengambil sampel berdasarkan sampling acak dan memperbesar ukuran sampel. Kesalahan nonsampling. Kesalahan ini bisa terjadi dalam setiap penelitian, apakah itu
berdasarkan sampel atau berdasarkan populasi (sensus). Beberapa penyebab terjadinya kesalahan nonsampling adalah: a. Populasi tidak didefinisikan sebagaimana mestinya. b. Populasi menyimpang dari populasi yang seharusnya dipelajari. c. Kuisoner tidak dirumuskan sebagaimana mestinya. d. Istilah-istilah telah didefinisikan secara tidak tepat atau telah digunakan secara tidak konsisten. e. Para responden tidak memberikan jawaban yang akurat, menolak untuk menjawab atau tidak ada di tempat ketika petugas datang untuk melakukan wawancara. Selain itu kesalahan nonsampling dapat terjadi pada waktu mencatat data, melakukan tabulasi dan melakukan perhitungan-perhitungan. Kesalahan ini dapat menimbulkan kesulitankesulitan dalam penelitian dan oleh karenanya perlu untuk dihindarkan.
9
DISTRIBUSI SAMPLING
9.1. PENDAHULUAN Untuk mempelajari populasi kita mernerlukan sampel yang diambil dari populasi yang bersangkutan. Meskipun kita dapat mengambil lebih dari sebuah sampel berukuran n dari sebuah populasi berukuran N, pada prakteknya hanya sebuah sample yang biasa diambil dan digunakan untuk hal terseout. Sampel yang diambil ialah sampel acak dan dari sampel tersebut nilai-nilai statistiknya dihitung untuk digunakan seperlunya. Bagaimana statistik dari sampel digunakan sehubungan dengan penganalisisan populasi akan diuraikan kemudian. Untuk ini diperlukan sebuah teori yang dikenal dengan nama distribusi sampling Distribusi sampling biasanya diberi nama bergantung pada nama statistik yang digunakan, misalnya distribusi sampling rata-rata, distribusi sampling proporsi, distribusi sampling simpangan baku dan lain lagi. Nama nama teisebut biasa disingkat menjadi distribusi rata-rata, distribusi proporsi, distribusi simpangan baku dan lain-lain. Dalam bagian-bagian berikut satu per satu tentang distribusi sampling.
9.2. DISTRIBUSI RATA-RATA Misalkan diambil n sampel dari N populasi dengan cara tanpa pemgembalian maka akan N didapat buah sampel. Setiap sampel mempunyai nilai rata-rata X . Anggap rata-rata ini n sebagai data baru sehingga didapat kumpulan data yang terdiri atas rata-rata dari sampelsampel tersebut. Dari kumpulan data di atas kita dapat menghitung rata-rata dari rata-rata
( )
( )
yang disimbolkan μ x dan simpangan bakun dari rata-rata yang disimbolkan σ x .
84
Statistika Dasar
Contoh 9.1.
Diberikan sebuah populasi dengan N = 10 yang datanya: 98, 99, 97, 98, 99, 98,97, 97, 98, 99. Jika dihitung, populasi ini mempunyai μ= 98 dan σ= 0,78. Diambil sampel berukuran n = 2. 10 Semuanya ada = 45 buah sampel. Untuk setiap sampel kita hitung rata-ratanya. Data 2
dalam tiap sanipel dan rata-rata tiap sampel diberikan dalam daftar berikut ini. Tabel 9.1. Semua sampel berukuran n=2 dari populasi N=10 Sampel
Rata-rata
Sampel
Rata-rata
Sampel
Rata-rata
(98 , 99)
98,5
(99 , 98)
98,5
(99 , 98)
98,5
(98 , 97)
97,5
(99 , 99)
99,0
(99 , 97)
98,0
(98 , 98)
98,0
(97 , 98)
97,5
(99 , 97)
98,0
(98 , 99)
98,5
(97 , 99)
98,0
(99 , 98)
98,5
(98 , 98)
98,0
(97 , 98)
97,5
(99 , 99)
99,0
(98 , 97)
97,5
(97 , 97)
97,0
(98 , 97)
97,5
(98 , 97)
97,5
(97 , 97)
97,0
(98 , 97)
97,5
(98 , 98)
98,0
(97 , 98)
97,5
(98 , 98)
98,0
(98 , 99)
98,5
(97 , 99)
98,0
(98 , 99)
98,5
(99 , 97)
98,0
(98 , 99)
98,5
(97 , 97)
97,0
(99 , 98)
98,5
(97 , 98)
97,5
(97 , 98)
97,5
(99 , 99)
99,0
(98 , 97)
97,5
(97 , 99)
98,0
(99 , 98)
98,5
(98 , 97)
97,5
(97 , 98)
97,5
(99 , 97)
98,0
(98 , 98)
98,0
(97 , 99)
98,0
(99 , 97)
98,0
(98 , 99)
98,5
(98 , 99)
98,5
Jumlah semua nilai rata-rata = 4410 Jumlah ke-45 buah rata-rata adalah 4.410. Maka rata-ratanya untuk ke-45 nilai rata-rata ini adalah
4410 = 98 . Jadi μx = 98. 45
Distribusi Sampling
85
Simpangan baku ke-45 rata-rata di atas juga dapat dihitung. Besarnya adalah σ x =0,52 Tetapi rata-rata populasi μ = 98 dan simpangan baku σ = 0,78. Selanjutnya kita hitung:
σ n
0,78 10 − 2 N −n = 0,52 = N −1 2 10 − 1
( N ) > 5% berlaku
Ternyata berlaku bahwa untuk n
μx = μ
σx =
σ n
(9.1)
N-n N -i
( N ) ≤ 5% berlaku
Sedangkan untuk n
μx = μ
σx =
(9.2)
σ n
Selanjutnya σ x disebut kesalahan standar rata-rata atau kesalahan baku rata-rata. Ini
merupakan ukuran variasi rata-rata sampel sekitar rata-rata populasi μ. Kesalahan baku ratarata σ x mengukur besarnya perbedaan rata-rata yang diharapkan dari sampel ke sampel. Dari sampel-sampel tersebut dalam tabel 9.1 dapat dibuat sebuah distribusi peluang rata-rata. Hasilnya seperti tampak dalam tabel 9.2. Tabel 9.1. Frekuensi dan peluang rata-rata dari tabel 9.1 Rata-rata
Frekuensi
Peluang
97
3
1/15
97,5
12
4/15
98
15
1/3
98,5
12
4/15
99
3
1/15
Jurnlah
45
1
Jika sebuah populasi mempunyai rata-rata μ dan simpangan baku σ yang besarnya terhingga, maka untuk ukuran sampel acak n yang cukup besar, distribusi rata-rata sampel mendekati distribusi normal dengan rata-rata μ x = μ dan simpangan baku σ x =
σ n
.
86
Statistika Dasar Apabila populasi yang disampel sudah berdistribusi normal meskipun ukuran sampel
n< 30 maka rata-rata sampel juga berdistribusi normal. Distribusi normal yang didapat dari distribusi rata-rata perlu distandarkan agar daftar distribusi normal baku dapat digunakan. Untuk itu digunakan transformasi Z =
X - μx
(9.3)
σx
dengan μx = μ
σx =
σ n
Apabila dari populasi diketahui variansnya dan perbedaannya antara rata-rata dari sampel satu ke sampel lain diharapkan tidak lebih dari nilai tertentu (d) maka berlaku σx ≤ d
(9.4)
dari persamaan (9.4) di atas ukuran sampel yang paling kecil dapat ditentukan. Contoh 9.2.
Tinggi badan mahasiswa rata-rata mencapai 165 cm dan simpangan baku 8,4 cm. Telah diambil sebuah sampel acak terdiri dari 45 mahasiswa. Tentukan berapa peluang tinggi ratarata ke-45 mahasiswa tersebut ? a. antara 160 cm dan 168 cm b. paling sedikit 166 cm Jawab:
Ukuran sampael 45 tergolong sampel yang besar sehingga dianggap berdistribusi normal dengan rata-rata μ x = 165 cm dan simpangan baku σ x =
σ n
=
8,4 = 1,252 cm. 45
a. Dari persamaan (9.3) dengan x = 160 dan x = 168 diperoleh: Z1 =
160 − 165 168 − 165 = −3,99 dan Z 2 = = 2,40 . 1,252 1,252
Dengan
menggunakan
tabel
distribusi
normal
diperoleh
luas
kurva
= 0,5 + 0,4918 = 0,9918 , sehingga peluang rata-rata tinggi mahasiswa antara 160 cm dan 168 cm adalah 0,9918
Distribusi Sampling
87
b. Rata-rata tinggi paling sedikit 166 cm memberikan nilai Z paling sedikit
=
166 − 165 = 0,80 dan dari daftar distribusi normal baku luas kurva = 0,5-0,2881=0,2119 1,252
Jadi peluang yang dicari adalah 0,2119
Contoh 9.3.
Untuk contoh 9.2 di atas, misalkan harga-harga x dari sampel yang satu dengan yang lain diharapkan tidak lebih dari 1 cm. Jika populasi cukup besar maka tentukan jumlah sampel minimal yang harus diambil! Jawab:
Dari persamaan (9.4) menghasilkan
8,4 ≤ 1 atau n ≥70,58. Jadi paling sedikit dioperlukan 71 n
mahasiswa yang harus diambil sebagai sampel.
9.3. DISTRIBUSI PROPORSI
Jika populasi berukuran N
yang didalamnya ada peristiwa A sebanyak Y maka
( N)
didapat parameter proporsi peristiwa A sebesar μ = Y
Jika dari proporsi tersebut diambil sampel acak berukuran n dan x diantaranya termasuk peristiwa A maka diperoleh statistik proporsi peristiwa A =
x n
Dari kumpulan harga-harga statistik proporsi dapat dihitung rata-rata μ x dan n simpangan bakunya σ x . n
( N ) > 5% berlaku
Untuk ukuran populaasi kecil n μ
x
n
= π
σ xn =
π (1 - π ) n
N-n N −1
(9.5)
88
Statistika Dasar
( N) ≤ 5% berlaku
Dan jika ukuran populasi besar dibandingkan dengan ukuran sampel n μ
x
n
= π
σ xn =
π (1 - π) n
(9.6)
Selanjutnya σ x dinamakan kesalahan baku proporsi atau galat baku proporsi. n Untuk ukuran sampel n yang cukup besar
(n
≥ 30 ) , distribusi proporsi (x/n)
( N ) > 5%
mendekati distribusi normal dengan parameter seperti pada persamaan (9.5) jika n dan seperti persamaan (9.6) jika
(n N) ≤ 5% . Untuk perhitungan dengan menggunakan
daftar distribusi normal, nilai z dapat ditentukan melalui transformasi Z =
x
- π σx n
n
(9.7)
Jika perbedaan antara proporsi sampel yang satu dengan yang lain diharapkan tidak lebih dari sebuah harga (d) yang ditentukan, maka berlaku: σx n ≤ d
(9.8)
Contoh 9.4.
Ada petunjuk kuat bahwa 10% anggota masyarakat tergolong ke dalam golongan A. Sebuah sampel acak terdiri dari 100 orang telah diambil. a. Tentukan peluangnya bahwa dari 100 orang itu akan ada paling sedikit 15 orang dari golongan A. b. Barapa orang harus diselidiki agar persentase golongan A dari sampel yang satu dengan yang lain diharapkan hanya memiliki perbedaan paling besar 2 %. Jawab :
Populasi yang dihadapi cukup besar dengan π = 0.1 a. Untuk ukuran sampel 100 yang diantaranya paling sedikit 15 tergolong kategori A, maka paling sedikit x/n = 0,15 dan kesalahan bakunya adalah:
σx/n =
π (1 − π ) n
=
0,10 (0,90 ) = 0,03 100
Distribusi Sampling
Bilangan Z paling sedikit adalah
89
0,15 − 0,10 = 1,67 dan dari daftar distribusi normal baku 0,03
luasnya adalah =0,5 – 0,4525 = 0,0475. Jadi peluang dalam sampel itu paling sedikit ada 15 kategori A adalah ,0475 b. Dari persamaan (9.8) dengan π = 0,1 dan 1-π = 0,90 sedangkan d = 0.02 maka
σ
x
n
=
π (1 - π ) n
≤ d
0,1 (0,9 ) ≤ 0,02 n n ≥ 225
Jadi paling sedikit sampel harus berukuran 225.
9.4. DISTRIBUSI SIMPANGAN BAKU
Seperti halnya distribusi rata-rata, diambil sampel-sampel acak berukuran n dan dari setiap sampel yang diambil dapat ditentukan simpangan bakunya (s). Dari kumpulan ini dapat dihitung rata-ratanya (μs ) dan simpangan bakunya (σs ) . Untuk n besar, biasanya n ≥ 100 , distribusi simpangan baku sangat mendekati distribusi normal dengan :
μs = σ σs = σ
(9.9) 2n
dengan σ adalah simpangan baku populasi. Untuk membuat distribusi normal baku, nilai Z diperoleh dari transformasi Z =
S- σ σs
(9.10)
9.5. DISTRIBUSI SELISIH DAN JUMLAH RATA-RATA
Misalkan ada dua populasi masing-masing N1 dan N2 dengan rata-rata (μ1 ) dan (μ 2 )
( )
( )
serta simpangan baku σ1 dan σ 2 . Dari setiap populasi diambil sampel berukuran N1 dan N2, dan hitung rata-ratanya didapatkan kumpulan rata-rata sampel. X 1 , X 2 , X 3 , ........ Xn dan Y 1 , Y 2 , Y 3 , .............. Y r
90
Statistika Dasar
Dari masing-masing rata-rata sampel dapat dihitung selisih rata-rata sampel. i = 1, 2, 3, ........., k
X i - Y j dengan
j = 1, 2, 3, .........., r
Kumpulan selisih rata-rata sampel demikian akan membentuk distribusi selisih rata-rata. Dari kumpulan tersebut kita dapat menghitung rata-ratanya (μ x − y ) dan menghitung simpangan bakunya (σ x − y ) . Ternyata untuk N1 dan N2 yang cukup besar dan sampel-sampel acak diambil independen satu dengan yang lain berlaku :
μx σx
= μ1 - μ 2
-y
σ 12
=
-y
+
n1
(9.11)
σ 22 n2
Kita dapat juga mengambil selisih rata-rata y j − xi dan dalam hal ini berlaku:
μy - x σy
= μ 2 - μ1
σ 12
=
-x
+
n1
(9.12)
σ 22 n2
Untuk ukuran sampel yang cukup besar, selisih rata-rata x - y akan mendekati distribusi normal dengan rata-rata dan simpangan baku seperti pada persamaan (9.11). Untuk perhitungan menggunakan daftar distribusi normal baku digunakan transformasi : Z =
(x
- y
)σ
(μ 1
- μ
2
)
(9.13)
x - y
Apabila dari dua kumpulan rata-rata sampel xi dengan I=1, 2, 3,…,k dan y j dengan j=1, 2, 3,…,r dibentuk jumlahnya, maka akan diperoleh jumlah rata-rata (μ x + y ) . Untuk sampel-sampel acak yang independen berlaku:
μx σx
+ y
= μ1 + μ 2
+ y
=
σ 12 n1
+
σ 22 n2
(9.14)
Distribusi Sampling
91
Untuk sampel-sampel yang berukuran cukup besar, distribusi jumlah rata-rata tersebut akan mendekati distribusi normal dengan parameter rata-rata dan simpangan baku seperti dalam persamaan (9.14) di atas. Untuk membuat menjadi normal baku digunakan transformasi:
Z =
(x + y) - (μ
1
σx + y
+ μ2 )
(9.15)
Contoh 9.5.
Rata-rata tinggi mahasiswa laki-laki 163 cm dan sipangan baku 5,2 cm sedang mahasiswa wanita rata-rata 152 cm dan simpangan baku 4,9 cm. Dari dua kelompok mahasiswa tersebut masing-masing diambil sampel 140 orang. Berapa peluang rata-rata tinggi mahasiswa lakilaki minimal 10 cm lebihnya dari mahasiswa wanita? Jawab:
Misalkan x dan y masing-masing menyatakan rata-rata tinggi dari sampel untuk mahasiswa laki-laki dan wanita. Yang ditanyakan adalah peluang x − y paling sedikit 10 cm. Dari yang diketahui, didapat μ1 = μx = 163 cm, μ2 = μy = 152 cm, σ1 = σx =5,2 cm, σ2 = σy = 4,9 dan n1 = n2 = 140. Karena jumlah sampel cukup besar, menurut teori di muka, x − y berdistribusi normal dengan rata-rata
σ x−y =
(5,2)2 + (4,9)2 140
140
μ x − y = (163-152) cm = 11 cm dan simpangan baku
cm = 0,6038 cm .
Berdasarkan persamaan (9.13) maka Z =
10 − 11 = −1,66 . Luas daerah normal baku yang 0,6038
diperlukan adalah 0,5 + 0,4515 = 0,9515. Jadi peluang yang dicari adalah 0,9515.
9.6. DISTRIBUSI SELISIH PROPORSI
Misalkan ada dua populasi masing-masing berdistribusi binom dan keduanya berukuran besar. Dalam kedua populasi itu ada peristiwa A dengan proporsi π1 untuk populasi pertama dan π2 untuk populasi kedua. Dari kedua populasi itu secara independen diambil sampel-sampel acak berukuran n1 dari populasi pertama dan n2 dari populasi kedua. Untuk peristiwa A di peroleh kumpulan proporsi
y xi , I=1, 2, …,k dan j , j=1, 2,…,r dengan xi n1 n2
adalah adanya peristiwa A dalam sampel yang diambil dari populasi pertama, dan yj = adanya
92
Statistika Dasar
peristiwa A dalam sampel yang diambil dari populasi kedua, k dan r masing-masing adalah banyaknya sampel yang diambil dari populasi pertama dan kedua. x y Selisih proporsi i − j dapat dibentuk sehingga terdapat kumpulan selisih n1 n2
proporsi. Dari kumpulan tersebut dapat dihitung rata-ratanya (μsp) dan simpangan bakunya x y (σsp), dengan sp = i − j = selisih antara proporsi sampel pertama dan proporsi sampel n1 n2
kedua. Dalam hal ini berlaku:
μ sp = π 1 − π 2 σ sp =
π 1 (1 − π 1 ) π 2 (1 − π 2 ) +
n1
(9.16)
n2
Untuk ukuran-ukuran sampel yang besar distribusi selisih proporsi mendekati distribusi normal dengan parameter seperti dalam persamaan (9.16). Agar distribusi normal ini menjadi distribusi normal baku diperlukan transformasi: Z=
(x / n1 − y / n2 ) − (π 1 − π 2 ) σ sp
(9.17)
Contoh 9.6.
Ada petunjuk kuat bahwa calon A akan mendapat suara 60% dalam pemilihan suara. Dua buah sampel acak secara independen telah diambil masing-masing terdiri atas 300 orang. Tentukan peluangnya akan terjadi perbedaan persentase tidak lebih dari 10% yang memilih A. Jawab : Kedua sampel diambil dari sebuah populasi sehingga π1 = π2 = 0,6. Jika x = banyaknya orang yang memilih A dalam sampel pertama, dan y = banyaknya orang yang memilih A dalam sampel kedua, maka yang dicari adalah peluang
(x / n1 − y / n2 ) < 10% atau ( y / n2 − x / n1 ) < 10% Setelah digabung akan menjadi – 10% < (x / n1 − y / n2 ) < 10%. Menurut teori, μsp = π1 - π2 =(0,6-0,6) = 0 dan σ sp = Nilai Z yang diperlukan adalah Z1 =
0,6 x 0,4 0,6 x 0,4 + = 0,04 300 300
− 0,1 − 0 0,1 − 0 = −2,50 dan Z 2 = = 2,50 0,04 0,04
Luas daerah normal baku yang diperlukan = 2 (0,4938) = 0,9876
Distribusi Sampling
93
9.7. DISTRIBUSI SAMPLING LAINNYA
Misalkan kita mempunyai sebuah populasi yang berdistribusi normal atau hampir normal dengan rata-rata μ dan simpangan baku σ. Dari populasi tersebut diambil dsampel acak berukuran n lalu dihitung rata-rata x dan simpangan baku s. Sehubungan dengan hal tersebut terdapat dua hal yaitu: a. Statistik t, yang ditentukan oleh t=
x−μ s/ n
(9.18)
ternyata berdistribusi student dengan derajat kebebasan v = n-1. b. Statistik χ2 yang ditentukan oleh
( n − 1)s 2 χ = 2 2
σ
(x =
i
− x)
2
σ2
(9.19)
dengan xi , I=1, 2,…,n merupakan data dalam sampel, akan berdistribusi χ2 dengan derajat kebebasan v = n-1. Misalkan sekarang kita mempunyai dua populasi yang masing-masing berdistribusi normal dengan simpangan baku σ1 dan σ2. Dari setiap populasi ini secara independen diambil sebuah sampel acak berukuran n1 dari populasi pertama dan n2 dari populasi kedua. Dari sampel pertama simpangan baku s1 dihitung dan demikian juga simpangan baku s2 dari sampel kedua. Kemudian dibentuk statistik F yang ditentukan oleh: F=
s12 / σ 12 s22 / σ 22
(9.20)
Ternyata bahwa statistik F ini berdistribusi F dengan dk pembilang v1 = n1-1 dan dk penyebut v2 = n2 – 1. Semua distribusi sampling di sini akan banyak digunakan terutama dalam statistika induktif.
10
PENDUGAAN PARAMETER
Dengan statistika kita berusaha untuk menyimpulkan sifat-sifat populasi yang dipelajari berdasarkan data yang diambil baik secara sampling atau melalui sensus. Cara pengambilan kesimpulan yang akan dipelajari dalan bab ini adalah cara-cara menduga harga parameter. Jadi harga parameter yang sebenarnya tidak diketahui, akan diduga berdasarkan sampel yang diambil dari populasi yang bersangkutan. Parameter populasi yang akan diduga dan diuraikan dalam bab ini adalah rata-rata, simpangan baku dan proporsi. 10.1. PENDUGA Secara umum, parameter populasi akan diberi simbol θ. Jadi θ dapat merupakan ratarata μ, simpangan baku σ, proporsi π dan lain-lain. Jika nilai θ tidak diketahui, akan kita duga dengan nilai θˆ (theta topi), dan selanjutnya θˆ disebut dengan penduga. Tentu saja yang kita ingikan adalah nilai dugaan sama dengan nilai sebenarnya atau θˆ = θ. Tetapi hal tersebut dapat dikatakan hal yang ideal sifatnya. Kenyataan yang tidak kita kehendaki namun dapat terjadi adalah nilai dugaan θˆ terlalu tinggi dari θ atau nilai dugaan θˆ terlalu rendah dari θ. Beberapa kriteria untuk mendapatkan nilai penduga yang baik adalah tak bias, mempunyai varians minimum, dan konsisten. Berikut ini beberapa penjelasan tentang hal tersebut: a. Penduga θˆ dikatakan tak bias jika rata-rata semua harga θˆ yang mungkin akan sam dengan θ atau ditulis μθˆ = θ . Dalam bahasa ekspektasi, hal diatas ditulis dengan
()
ξ θˆ = 0 . Nilai penduga yang tidak memenuhi persyaratan ini dikatakan sebagai penduga yang bias. b. Penduga bervarians minimum yaitu penduga dengan varians terkecil di antara semua penduga untuk parameter yang sama. Jika θˆ 1 dan θˆ 2 adalah dua penduga untuk θ di mana varians untuk θˆ 1 lebih kecil dibandingkan varians untuk θˆ 2 , maka θˆ 1 merupakan penduga dengan varians minimum.
Pendugaan Parameter
95
c. Misalkan θˆ adalah penduga untuk θ yang dihitung berdasarkan sebuah sampel acak berukuran n. Jika ukuran sampel n makin besar mendekati ukuran populasi, maka θˆ akan mendekati θ, dan θˆ disebut penduga konsisten. d. Penduga tak bias dan bervarians minimum dinamakan penduga terbaik. 10.2. CARA-CARA PENDUGAAN
Jika parameter θ harganya diduga oleh sebuah harga θˆ tertentu, maka θˆ dinamakan penduga, atau tepatnya titik dugaan. Untuk selanjutnya kita hanya menggunakan istilah penduga saja. Contoh 10.1.
Untuk menduga tinggi rata-rata mahasiswa Indonesia kita arnbil sebuah sampel acak. Data sampel dikumpulkan lalu dihitung rata-ratanya. Misalkan didapat x = 163 cm. Jika 163 cm ini dipakai untuk menduga rata-rata tinggi mahasiswa Indonesia, maka 163 adalah titik dugaan untuk rata-rata tinggi mahasiswa Indonesia. Secara umum dikatakan x adalah penduga atau titik dugaan untuk μ. Titik dugaan untuk
sebuah parameter μ misalnya, harganya akan berlainan bergantung pada harga x yang didapat dari sampel-sampel yang diambil. Karenanya orang sering merasa kurang yakin atau
kurang percaya atas hasil pendugaan macarn ini. Sebagai gantinya, dipakai interval dugaan atau selang dugaan, yaitu menduga harga parameter di. antara batas-batas dua harga. Untuk contob di atas misalnya, kita dapat menduga rata- rata tinggi rnahasiswa antara 155 cm dan 170 cm atau.antara 150 cm dan 175 cm dan sebagainva. Makin besar jarak interval maka kepercayaan tentang kebenaran pendugaan yang dilakukan semakin besar pula. Menduga rata-rata tinggi mahasiswa antara 50 cm dan 200 crn merasa pasti benar. daripada menduga antara 150 cm dan 175 cm. Dalam prakteknya harus dicari interval dugaan yang.sempit dengan derajat kepercayaan yang mernuaskan. Derajat kepercayaan menduga, disebut koefisien kepercayaan, yang merupakan pernyataan dalain bentuk peluang. Jika koefisien kepercavaan dinvatakan dengan γ (baca: gamma), maka 0 < γ < 1. Harga γ yang digunakan bergantung pada persoalan yang dihadapi dan berapa besar si peneliti ingin yakin dalam mernbuat pernyataannya. Nilai γ yang biasa digunakan ialah 0,95 atau 0,99.
96
Statistika Dasar Untuk menentukan interval dugaan parameter θ dengan koefisien kepercayaan γ, maka
sebuah sampel acak diambil, lalu dihitung nilai-nilai statistik yang diperlukan. Perumusan dalarn bentuk peluang untuk parameter θ antara, A dan B adalah: P (A θ B) = γ
(10.1)
dengan A dan B fungsi dari statistik, jadi merupakan variabel acak, tetapi tidak bergantung pada θ. Persamaan (10.1) diartikan: peluangnya adalah γ bahwa interval yang sifatnya acak yang terbentang dari A ke B akan berisikan θ. Apabila selanjutnya A dan B dihitung harganya berdasarkan data sampel, maka A dan B sekarang merupakan bilangan tetap- Dalam hal ini, pernyataan di atas tidak lagi benar tetapi harus dikatakan sebaagai berikut: Kita merasa yakin 100 γ % bahwa parameter θ akan ada di dalam interval (A,B). Jadi bukan dikatakan: peluangnya sama dengan γ bahwa θ terletak antara A dan B, melainkan seseorang hanya yakin 100 γ % bahwa θ itu terletak antara A dan B. Perbedaan ini perlu dipahami, karena θ memang terletak atau tidak terletak antara A dan B yang peluangnya masing-masing 1 atau 0. 10.3. MENDUGA RATA-RATA
Misalkan kita mempunyai sebuah populasi berukuran N dengan rata-rata μ dan simpangan baku σ. Dari populasi ini parameter rata-rata μ akan diduga. Untuk keperluan ini, diambil sebuah sampel acak berukuran n, lalu hitung statistik yang perlu, yaitu x dan s. Titik
dugaan untuk rata-rata μ ialah x. Dengan kata lain, nilai μ besarnya diduga oleh harga x yang didapat dari sampel. Untuk memperoleh dugaan yang lebih tinggi derajat kepercayaannya, digunakan interval dugaan atau selang dugaan disertai nilai koefisien kepercayaan yang dikehendaki. Dalam hal ini kita membedakan tiga hal yaitu: 1. Simpangan baku σ diketahui dan populasinya berditribusi normal.
Untuk kasus dalam hal ini persamaan (10.1) berubah menjadi
σ σ μ x + z1γ P x − z 1 γ =γ 2 2 n n
(10.2)
dengan γ = koefisien kepercayaan dan z 1 γ = bilangan z yang diperoleh dari tabel distribusi 2
normal baku untuk peluang ½ γ.
Pendugaan Parameter
97
Untuk memperoleh interval kepercayaan sebesar 100 γ % dari parameter μ dapat digunakan persamaan
σ
x − z1γ
n
2
μ x + z1γ 2
σ
(10.3)
n
2. Simpangan baku σ tidak diketahui dan populasinya berditribusi normal
Dalam kenyataannya parameter σ jarang sekali diketahui, bahkan tidak diketahui, kecuali mungkin dari pengalaman. Karena itu untuk hal ini persamaan 10.2 diganti dengan:
s s μ x + tp P x − t p =γ n n
(10.4)
dengan γ = koefisien kepercayaan dan tp = nilai t yang diperoleh dari daftar distribusi t student dengan p = ½ (1+γ) dan dk = (n-1). Untuk menentukan selang interval kepercayaannya persamaan 10.3 diganti dengan persamaan 10.5 berikut:
x − tp
s s μ x + tp n n
Bilangan-bilangan yang didapat dari
(10.5)
s x − tp n
dan
s x + tp n
masing-masing
dinamakan batas bawah dan batas atas selang kepercayaan. Jika ukuran sampel n relatif besar dibandingkan dengan ukuran populasi N, yaitu (n/N) > 5 % maka persamaan 10.3 menjadi
σ
x − z1γ
n
2
.
σ N −n N −n . μ x + z1γ 2 N −1 n N −1
(10.6)
dan persamaan 10.5 menjadi
x − tp
s N −n s N −n . . μ x + tp n N −1 n N −1
(10.7)
Khusus dalam hal interval kepercayaan 50 % yang memberikan nilai z0.5 = 0,6745 maka persamaan 10.3 menjadi
x − 0,6745
σ n
μ x + 0,6745
σ n
. Hal ini berarti
σ peluangnya adalah setengah bahwa dalam interval acak x ± 0,6745 akan mengandung n σ rata-rata μ. Bilangan 0,6745 disebut kekeliruan peluang untuk rata-rata. n
98
Statistika Dasar
3. Simpangan baku σ tidak diketahui dan populasinya tidak berditribusi normal
Untuk kasus ini memerlukan perhitungan yang rumit dengan penguasaan matematika yang tinggi dan dalam tulisan ini tidak dibahas. Contoh 10.2.
Sebuah sampel acak terdiri dari 100 mahasisova telah diambil dari sebuah Universitas lalu nilai-nilai IQ-nya dicatat. Didapat x = 112 dan s= 10. a) Kita dapat mengatakan bahwa IQ rata-rata untuk mahasiswa Universitas itu adalah 112. Dalarn hal ini titik dugaan telah digunakan. b) Jika dikehendaki interval dugaan IQ rata-rata dengan koefisien kepercayaan 0,95 maka dapat dipakai persamaan (10.5). Untuk p = 0,975 dan dk = 99 dengan interpolasi dari daftar distribusi t (student) dalarn lampiran 3 didapat tp = 1,987 dan persamaan (10.5) memberikan: 112 − (1,987 )
10 10 μ 112 + (1,987 ) 100 100
atau
110,0 μ 114,0 ladi diyakini 95% bahwa interval kepercayaan uniuk IQ rata-rata mahasiswa adalah
110,0 μ 114,0 . Dengan kata lain kita merasa 95% yakin (percaya) bahwa IQ rata-rata mahasiswa akan ada dalarn inarval dengan batas 110,0 dan 114,0. 10.4. MENDUGA PROPORSI (π)
Tinjau sebuah populasi berukuran N di mana terdapat proporsi π untuk peristiwa A yang ada dalam populasi itu. Sebuah sampel acak berukuran n diambil dari populasi itu. Misalnya terdapat x peristiwa A, sehingga proporsi sampel untuk peristiwa A = (x/n). Jadi titik dugaan untuk π adalah (x/n). Jika 100 γ % interval kepercayaan untuk pendugaan π dikehendaki, maka kedua persamaan berikut harus diselesaikan. n y π (1 − π )
=
1
n y π (1 − π )
=
1
b
y
y=x
x
y
y =0
n− y
n− y
2
(1 − γ )
(10.8)
2
(1 − γ )
(10.9)
Pendugaan Parameter
99
Nilai π yang didapat dari persamaan (10.8) merupakan batas bawah interval kepercayaan sedangkan nilai π yang didapat dari persamaan (10.9) merupakan batas atasnya. Persamaan-persamaan di atas sangat panjang dan tidak praktis untuk diselesaikan. Untuk itu sering digunakan pendekatan distribusi normal untuk ukuran sampel yang cukup besar. Persamaan 100 γ % yakin untuk interval kepercayaan π dalam hal ini berbentuk: p − z 12 γ
pq π p + z 12 γ n
pq n
(10.10)
dengan p=x/n dan q=1-p sedangkan z 12 γ adalah nilai z yang didapat dari daftar normal baku untuk peluang ½ γ. Contoh 10.3.
Misalkan kita ingin menduga ada berapa persen anggota masyarakat berumur 15 tahun ke atas yang termasuk ke dalam golongan A. Untuk ini sebuah sampel acak berukuran n=1.200 diambil yang menghasilkan 504 tergolong kategori A. 504 x100% = 42% . 1200
Persentase golongan A dalam sampel =
Jika diduga ada 42% anggota masyarakat berumur 15 tahun ke atas yang termasuk golongan A, maka dalam hal ini telah digunakan titik dugaan. Untuk menentukan 95% interval kepercayaan parameter π, persamaan (10.10) jelas dapat digunakan mengingat ukuran sampel n cukup besar. Dengan p = 0,42; q = 0,58 dan z0,475 = 1,96, maka : 0,42 − (1,96 )
0,42 x 0,58 0,42 x 0,58 π 0,42 + (1,96 ) 1200 1200
atau 0,39 π 0,45 Kita merasa yakin 95 % bahwa prosentase anggota masyarakat yang termasuk golongan A akan ada dalam interval 39 % dan 45 %. 10.5. MENDUGA SIMPANGAN BAKU (σ)
Untuk menduga varians σ2 dari sebuah populasi, sampel varians s2
berdasarkan
sampel acak berukuran n perlu dihitung, dan persamaan yang digunakan adalah persamaan (10.11) yaitu:
(x − x ) =
2
s
2
i
n −1
(10.11)
100
Statistika Dasar
Ternyata bahwa varians s2 adalah penduga takbias untuk varians σ2. Akan tetapi simpangan baku s bukan penduga takbias untuk simpangan baku σ. Jadi titik dugaan. s untuk σ adalah bias. Jika populasinya berdistribusi normal dengan varians σ2 maka 100 γ % interval kepercayaan untuk σ2 ditentukan dengan menggunakan distribusi chi-kuadrat. Rumusnya adalah:
(n − 1)s 2 σ 2 (n − 1)s 2 2 2 χ
1
2
(1+ γ )
χ
1
2
(10.12)
(1−γ )
dengan n = ukuran sampel sedangkan χ 122 (1+γ ) dan χ 122 (1−γ ) diperoleh dari daftar chi-kuadrat berturut-turut untuk p = ½ (1+γ) dan p = ½ (1-γ) dengan dk = (n - 1). Untuk mendapatkan interval dugaan simpangan baku σ, tinggallah melakukan penarikan akar ketidaksarnaan dalam persamaan (10.12). HasiI ini tidaklah eksak, akan tetapi cukup akurat untuk maksud-maksud tertentu. Contoh 10.3.
Sebuah sampel acak berukuran 30 telah diambil dari sebugh populasi yang berdistribusi normal dengen simpangan baku σ. Dihasilkan harga statistik s2= 7,8. Dengan koefisien kepercayaan 0,95 dan dk = 29, maka dari daftar chi-kuadrat didapat χ 02,975 = 45,7 dan χ 02,025 = 16,0. Dari persamaan (10.12) diperoleh: 29(7,8) 29(7,8) σ2 atau 4,95 σ 2 14,14 45,7 16,0 interval dugaan untuk sampangan baku σ adalah 2,23 σ 3,75 . Dengan demikian kita merasa yakin 95 % bahwa simpangan baku σ akan berada dalam interval yang dibatasi oleh 2,23 dan 3,75. 10.6. MENDUGA SELISIH RATA-RATA
Misalkan kita mempunyai dua buali populasi, kedua-duanya berdistribusi normal. Rata-rata dan simpangan bakunya masing-masing adalah μ1 dan σ1 untuk populasi pertama, μ2 dan σ2 untuk popuIasi kedua. Dari masing-masing populasi secara independen diambil sebuah sampel acak dengan ukuran n1 dan n2. Rata-rata dan simpangan baku dari sarnpel-sampel itu berturut-turut x1 , s1, dan x2 , s2. Akan diduga selisih rata-rata (μ1 - μ2).
Pendugaan Parameter Jelas bahwa titik dugaan untuk (μ1 - μ2) adalah
(x1 − x2 ) .
101
Bagairnana interval
dugaannya?. Dalam hal ini kita bedakan hal-hal berikut: A. Nilai σ1 = σ2
Jika kedua populasi berdistribusi normal dan mempunyai σ1 = σ2 = σ dan besarnya diketahui, maka 100 γ % interval kepercayaan untuk (μ1 - μ2) ditentukan dengan persamaan:
(x1 − x2 ) − z dengan z 12
γ
1
2
γ
σ
1 1 1 1 μ1 − μ 2 ( x1 − x2 ) + z 12 γ σ + + n1 n2 n1 n2
(10.13)
diperoleh dari daftar distribusi normal baku dengan peluang ½ γ.
Jika kedua populasi mempunyai σ1 = σ2 = σ tetapi besarnya tidak diketahui, pertama kita perlu menentukan varians gabungan dari sampel-sampel (s2) yang besarnya ditentukan dengan persamaan s
2
( n1 − 1)s12 + (n2 − 1)s22 =
(10.14)
n1 + n2 − 2
Interval kepercayaannya ditentukan dengan menggunakan distribusi student (t). Persamaan untuk menyatakan 100 γ % interval kepercayaan (μ1 - μ2) adalah
(x1 − x2 ) − t p .s
1 1 1 1 + μ1 − μ 2 ( x1 − x2 ) + t p .s + n1 n2 n1 n2
(10.15)
dengan s diperoleh dari persamaan (10.14) dan tp diperoleh dari daftar distribusi student (t) dengan p = ½ (1+γ) dan dk = (n1+ n2 - 2). B. Nilai σ1 ≠ σ2
Untuk populasi normal dengan σ1 ≠ σ2 teori di atas tidak berlaku dan teori yang ada hanya bersifat pendekatan. Dengan memisalkan s1 = σ1 dan s2 = σ2 untuk sampel-sampel acak yang berukuran cukup besar, kita dapat melakukan pendekatan kepada distribusi normal. Rumus untuk menentukan interval kepercayaannya adalah:
(x1 − x2 ) − z
1
2
γ
s12 s22 + μ1 − μ 2 ( x1 − x2 ) + z 12 n1 n2
γ
s12 s22 + n1 n2
dengan z½ γ diperoleh dari daftar distribusi normal baku dengan peluang ½ γ
(10.16)
102
Statistika Dasar
Contoh 10.3.
Ada dua cara pengukuran kelernbaban sesuatu zat. Dengan cara I, dilakukan 50 kali pengukuran yang menghasilkan x1 = 60,2 dan s12 =24,7. Cara II dilakukan sebanyak 60 kali dengan x2 =70,4 dan s22 =37,2. Tentukan interval kepercayaan 95 % perbedaan rata-rata pengukuran dari kedua cara itu ! Jawab: Jika dimisalkan hasil kedua cara pengukuran berdistribusi normal, maka dari persamaan (10.14) didapat varians gabungan sebesar:
s2 =
(50 − 1)(24,7 ) + (60 − 1)(37,2 ) = 31,53 50 + 60 − 2
Selanjutnya dihitung dulu: s
1 1 + = n1 n2
31,53 31,53 + = 1,08 50 60
Dengan p = 0,975 dan dk = 108, dari daftar distribusi student (t) didapat t=1,984. Dari persamaan (10.15) diperoleh:
(70,4 − 60,2) − (1,984)(1,08) μ1 − μ2 (70,4 − 60,2) + (1,984)(1,08) atau 8,06 μ1 − μ 2 12,34
Jadi kita percaya 95% bahwa selisih rata-rata pengukuran kedua cara itu akan ada dalam interval yang dibatasi oleh nilai 8,06 dan 12,34. C. Observasi berpasangan
Misalkan kita mempunyai dua populasi dimana populasi pertama mempunyai variabel acak X dan populasi kedua mempunyai variabel acak Y. Rata-ratanya masing-masing adalah μx dan μy. Sekarang diambil sampel acak yang berukuran sama dari masing-masing populasi, jadi n1 = n2 = n sehingga diperoleh data sampel (x1, x2, …,xn) dan (y1, y2, …,yn). Jika dimisalkan kedua data hasil observasi tersebut berpasangan seperti berikut: x1 berpasangan dengan y1, x2 berpasangan dengan y2, dan seterusnya sampai xn berpasangan dengan yn, maka untuk menduga selisih atau beda rata-rata μB =μx - μy, dapat dibentuk selisih atau beda tiap pasangan. Jadi dicari nilai B1 = x1 – y1, B2 = x2 – y2, dan seterusnya hingga Bn = xn –yn.
Pendugaan Parameter
103
Dari sampel berukuran n yang datanya terdiri dari B1, B2, …,Bn dapat dihitung ratarata B dan simpangan baku sB dengan menggunakan persamaan:
B B=
i
n
n Bi2 − ( Bi )
2
dan s = 2 B
n(n − 1)
Interval kepercayaan 100 γ % untuk μB ditentukan dengan menggunakan persamaan B − tp
sB s μB B + t p B n n
(10.17)
dengan tp diperoleh dari daftar distribusi student (t) untuk p = ½ (1+γ) dan dk = (n-1) 10.7. MENDUGA SELISIH PROPORSI
Kita mempunyai dua populasi binom dengan parameter untuk peristiwa yang sama masing-masing π1 dan π2. Dari populasi ini secara independen masing-masing diambil sebuah sampel acak berukuran n1 dari populasi pertama dan n2 dari populasi kedua. Proporsi untuk peristiwa yang diperhatikan dari sampel-sampel itu adalah p1 =
x1 x dan p2 = 2 dengan x1 n1 n2
dan x2 berturut-turut menyatakan banyaknya peristiwa yang diperhatikan yang didapat di dalam sampel pertama dan kedua. Untuk menentukan interval taksiran (π1 - π2) dapat digunakan pendekatan distribusi normal asalkan n1 dan n2 cukup besar. Rumus yang digunakan untuk interval kepercayaan 100 γ % selisih proporsi (π1 - π2) adalah:
( p1 − p2 ) − z
1
2
γ
p1q1 p2 q2 + π 1 − π 2 ( p1 − p2 ) + z 12 n1 n2
γ
p1q1 p2 q2 + n1 n2
(10.18)
dengan q1 = 1 – p1, q2 = 1 - p2 dan z½ γ diperoleh dari daftar distribusi normal baku dengan peluang p = ½ γ. Contoh 10.4.
Dua sampel acak yang satu terdiri dari 500 pemudi dan satu lagi 700 pernuda yang mengunjungi sebuah pameran telah diambil. Ternyata ada 325 pernudi dan 400 pemuda yang menyenangi parneran itu. Tentukan interval kepercayaan 95% untuk perbedaan persentase pernuda dan pemudi yang mengunjungi parneran dan menyenanginya.
104
Statistika Dasar
Jawab:
Prosentase pemudi yang menyenangi pameran adalah p1 = pemuda adalah p2 =
325 x 100 % = 65 % dan untuk 500
400 x 100 % = 57 %. Dari sini diperoleh q1=35 % dan q2= 43 %. 700
Dengan n1 = 500 dan n2 = 700 diperoleh: p1 q1 p2 q 2 + = n1 n2
0,65 . 0,35 0,57 . 0,43 + = 0,0284 500 700
Dari persamaan (10.18) dengan z = 1,96 diperoleh
(0,65 − 0,57 ) − (1,96)(0,0284) π 1 − π 2 (0,65 − 0,57 ) + (1,96)(0,0284) atau 0,024 π 1 − π 2 0,136
Jadi kita yakin 95 % bahwa perbedaan pemuda dan pemudi yang mengunjungi pameran dan menyenanginya berada dalam interval 2,4 % dan 13,6 %. 10.8. MENENTUKAN UKURAN SAMPEL
Berapa ukuran sampel yang diperlukan untuk melakukan suatu penelitian? Pertanyaan demikian sering diajukan oleh orang-orang yang akan melakukan penelitian. Jawabannya bergantung pada berbagai faktor, antara lain untuk apa sampel itu diperlukan. Ukuran sampel yang berhubungan dengan teori pendugaan dapat ditentukan antara lain berdasarkan pada: a. Apa yang akan diduga? b. Berapa besar perbedaan yang masih mau diterima antara yang diduga dan penduga? c. Berapa derajat kepercayaan atau koefisien kepercayaan yang diinginkan dalarn melakukan pendugaan? d. Berapa lebar interval kepercayaan yang masih mau diterima? Ketika. menduga parameter θ oleh θˆ , dua hal yang terjadi ialah menduga terlalu tinggi atau menduga tertalu rendah. Dalarn hal pertama θˆ > θ dan yang kedua θˆ < θ. Perbedaan antara θ dan θˆ ialah b = ⏐θ - θˆ ⏐. Makin kecil beda b makin baik dugaan kita karena makin dekat penduga yang kita pakai kepada parameter yang sedang diduga. Suatu ketika akan tiba pada ketentuan atau pertanyaan berapa besar beda b yang masih mau diterima dan dengan derajat kepercayaan berapa.
Pendugaan Parameter
105
Ketika menduga rata-rata μ oleh statistik x , maka beda b = ⏐μ - x ⏐. Untuk koefisien kepercayaan γ dan populasi berdistribusi normal dengan simpangan baku σ diketahui, maka ukuran sampel n ditentukan oleh: σ z 12 γ n b
2
(10.19)
Contoh 10.5.
Untuk menduga rata-rata waktu yang diperlukan oleh setiap mahasiswa dalam menyelesaikan sebuah soal tertentu, diperlukan sebuah sampel. Ketika menduga rata-rata tersebut, dikehendaki derajat kepercayaan 99% dengan beda yang lebih kecil dari 0,05 menit. Jika diketahui simpangan baku waktu yang diperlukan = 0,5 menit, berapa mahasiswa yang perlu diambil untuk sampel tersebut? Jawab:
Dengan σ = 0,5 menit, b = 0,05 menit dan z = 2,58 maka dari persamaan (10.19) didapat: (2,58)x(0,5) n = 665,64 0,05 2
Oleh karena ukuran sainpel harus merupakan bilangan diskrit, maka paling sedikit n = 666. Jadi paling sedlikit sampel itu harus terdiri atas 666 mahasiswa. Jika yang diduga itu proporsi π oleh statistik p = x/n, maka beda yang terjadi besarnya b = ⏐π - p⏐. Dengan memisalkan bahwa pendekatan distribusi normal kepada binom berlaku dan koefisien kepercayaan = γ maka ukuran sampel dapat ditentukan dari.rumus: z1 γ n π (1 − π ) 2 b
2
(10.20)
Jika varians π (1-π) diketahui, maka dalam persamaan (10.20) di atas tidak dapat digunakan. Dalarn hal ini varians π (1-π) diganti oleh harga maksimumnya yaitu 0,25.
106
Statistika Dasar
Contoh 10.6.
Misalkan Departemen P dan K perlu mengetahui ada berapa persen kira-kira anak-anak SD yang bercita-cita ingin menjadi guru. Ketika melakukan perkiraan ini, koefisien kepercayaan diambil sebesar 95% dengan kekeliruan menduga tidak lebih dari dua persen. Berapa anak SD yang perlu diteliti? Jawab:
Di sini varians π (1-π) harus diambil 0,25 karena soal tersebut sama sekah tidak menyebutkan tentang harga π. Dengan b = 0,02 dan z = 1,96 maka dari persamaan (10.20) didapat: 2
1,96 n (0,25) = 2,401 0,02
Jadi sampel itu paling sedikit harus terdiri dari 2.402 anak-anak SD. Contoh 10.7.
Jika untuk contoh 10.7 di atas, dari pengalaman diketahui ada 12 % anak bercita-cita ingin menjadi guru, teniukan berapa ukuran sampel sekarang? Jawab:
Kedalam rumus di atas kita substitusikan π = 0,12 dan 1 - π = 0,88, b = 0,02 dan z = 1, 96. Hasil yang diperoleh adalah: 2
1,96 n (0,12 ) = 1.014,18 0,02
Paling sedikit sampel yang diambil harus terdiri dari 1.015 anak SD. Dari kedua contoh terakhir ini, dapat dilihat bahwa dengan diketahuinya harga π, ukuran sampel telah sangat berkurang dari 2.402 nienjadi 1.015. Ini menyatakan bahwa informasi terdahulu sangat berfaedah, ikut membantu meringankan analisis dan juga meringankan biaya.