17 BAB 2
LANDASAN TEORI
2.1
Konsep Dasar Penaksiran Parameter
Statistik inferensi adalah Statistik yang dengan segala informasi dari sampel digunakan untuk menarik kesimpulan mengenai karakteristik populasi dari mana sampel itu diambil. Statistik inferensi digunakan untuk memprediksi keadaan dari suatu populasi berdasarkan sampel yang diambil dan berusaha untuk menyimpulkan karakteristik dari suatu populasi tersebut. Untuk ini kelakuan populasi dipelajari berdasarkan data yang diambil baik secara sampling ataupun sensus. Dalam kenyataannya mengingat berbagai faktor, untuk keperluan tersebut diambil sebuah sampel yang representatif lalu berdasarkan pada hasil analisis terhadap data sampel kesimpulan mengenai populasi dibuat. Kelakuan populasi yang akan ditinjau hanyalah mengenai parameter populasi dan sampel yang digunakan adalah sampel acak. Data sampel dikumpulkan dan dianalisis, nilai-nilai yang perlu yaitu statistik, dihitung dan dari nilai-nilai statistik tersebut dapat disimpulkan bagaimana parameter bertingkah laku, dan parameter yang akan ditaksir adalah rata-rata dan variansi (Surwako, 2007).
Metode penaksiran parameter didasarkan pada asumsi bahwa distribusi probabilitas normal dapat digunakan dengan ketentuan n ≥ 30, jika n<30 dengan syarat distribusi populasi adalah normal dan simpangan populasi diketahui (Andi Supangat, 2008). Secara umum penaksiran adalah dugaan atas sesuatu yang akan terjadi dalam kondisi tidak pasti (Surwako, 2007). Setiap pengusaha selalu membuat berbagai penaksiran untuk kegiatan-kegiatan pokok usahanya. Misalnya, pengusaha biro perjalanan wisata akan membuat perkiraan atas besarnya rata-rata biaya setiap perjalanan bagi dua orang, bagian pemasaran perusahaan semen membuat perkiraan berapa zak semen penjualan tahun depan, dll. Semakin tepat penaksiran atau perkiraan terhadap output yang dihasilkan, maka semakin efektif dan efisien alokasi sumber-sumber daya yang dimiliki oleh pengusaha untuk mendukung realisasi output yang dihasilkan.
18 Sifat atau ciri penaksir yang baik, adalah tidak bias, variasi minimum, konsisten, dan statistik cukup 1. Tidak bias Misalkan Θ * adalah estimator yang nilai θ *-nya adalah estimasi titik dari parameter populasi tak diketahui θ .Tentu diinginkan bahwa sebaran cuplikan Θ * akan memiliki mean yang sama dengan parameter yang diestimasi. Parameter yang seperti ini disebut bersifat takbias (Ronald & Raymond 1995). Dengan kata lain penaksir tak bias bagi parameter θ jika E( θ*) = θ , jika dikatakan penaksir bias bagi parameter θ , jika E( θ*) ≠ θ . Namun penaksir bias dapat diubah menjadi penaksir takbias jika ruas kanan dikalikan atau ditambahkan dengan konstanta tertentu.
2. Variansi Minimum
Apabila terdapat dua buah penaksir yang takbias, maka kedua penaksir tersebut akan dibandingkan dalam hal variansinya. Misalkan dua penaksir tak bias yaitu θ 1 * dan
θ 2 * untuk θ . Jika θ 1 * mempunyai variansi yang lebih kecil dibanding dengan θ 2 * , maka θ 1 * dikatakan penaksir takbias bervariansi minimum.
3. Konsisten Jika θ n * adalah penaksir untuk θ yang didasarkan pada sampel acak berukuran n, maka θ n * dikatakan konsisten bagi parameter θ , jika
lim p (θ n * −θ < ε ) = 1
(2.1)
x →∞
penentuan
penaksir
konsisten
ini
dapat
dilakukan
dengan
menggunakan
ketidaksamaan Chebyshev’s, lim p ( X − µ < kσ ) ≥ 1 − x →∞
1 k2
(2.2)
19 4. Statistik Cukup Statistik T = T ( x1 , x 2 ,..., x n ) dikatakan cukup bagi parameter, jika fungsi kepadatan peluang bersyarat: P( x1 , x 2 ,..., x n ) = x n | T(x 1 , x 2 ,..., x n ) = t tidak bergantung pada θ .
Estimasi nilai parameter memiliki dua cara, yaitu penaksir titik (point estimation) dan estimasi selang (interval estimation). 1. Penaksiran Titik (point estimation)
Penaksiran dari sebuah parameter populasi yang dinyatakan oleh sebuah bilangan tunggal disebut penaksir titik dari parameter tersebut (Murray & Larry, 1999). Penaksiran titik sebuah parameter: sebuah nilai yang diperoleh dari sampel dan digunakan sebagai penaksir dari parameter yang nilainya tidak diketahui. Misalkan x1 , x 2 , ..., x n merupakan sampel acak berukuran n dari x, maka statistik
θ * = h( x1 , x 2 ,..., x n ) yang berkaitan dengan θ dinamakan penaksir dari θ . Setelah sampel diambil, nilai-nilai yang dihitung dari sampel itu digunakan sebagai taksiran titik bagi θ .
Beberapa taksiran titik yang dihitung dari data sampel untuk parameter populasi yang bersesuaian. 1. Rerata populasi µ , taksiran titiknya adalah µ *= x 2. Variansi populasi σ 2 , taksiran titiknya adalah σ *= s 2 2
3. Simpangan baku populasi σ , taksiran titiknya adalah σ *= s
2. Penaksiran Selang (interval estimation).
Penaksiran dari parameter populasi yang dinyatakan oleh dua buah bilangan di antara posisi parameternya diperkirakan berada disebut sebagai penaksiran interval dari parameter tersebut (Murray & Larry, 1999). Misalkan µ dan σ masing-masing adalah mean dan deviasi standar dari distribusi sampling suatu statistik S. Maka jika distribusi sampling dari S
20 mendekati normal ( n ≥ 30), maka didapat statsitik sampel aktual S yang berada di dalam interval µ - σ sampai dengan µ + σ . Atas dasar ini masing-masing interval ini sebagai interval kepercayaan (confidence interval) untuk mengestimasi rata-rata. Bilangan-bilangan dari kedua ujung interval ini masing-masing dikenal sebagai batas kepercayaan (confidence limit). Jika statsitik S adalah mean sampel x , maka batas-batas kepercayaan 90%, 95% dan 99% untuk menaksir mean populasi µ masing-masing dirumuskan sebagai x ± 1,65 σ , x ± 1,96 σ dan
x
± 2,58 σ . Dalam bentuk yang lebih umum, batas kepercayaannya dirumuskan sebagai x ± z σ , z adalah yang bergantung kepada tingkat kepercayaan tertentu . Jika koefisien kepercayaan dinyatakan dengan α maka 0< α <1. Harga α yang digunakan tergantung pada persoalan yang dihadapi dan berapa besar si peneliti ingin yakin dalam membuat pernyataannya. Yang biasa digunakan adalah 0,90, 0,95 dan 0,99, yakni α = 0,90, α = 0,95 dan 0,99. Untuk menentukan taksiran parameter θ dengan koefisien kepercayaan α , maka sebuah sampel acak diambil, lalu dihitung statistiknya.
2.2
Distribusi Normal
Distribusi normal adalah distribusi probabilitas kontinu yang grafiknya disebut kurva normal seperti pada gambar 2.1. Sebuah distribusi normal dapat dideskripsikan secara penuh oleh rata-rata dan variansnya. Distribusi normal
menggambarkan dengan
cukup baik banyak gejala yang muncul di alam, industri, dan penelitian. Pengukuran fisik di bidang seperti percobaan meteorologi, penelitian curah hujan, dan pengukuran suku cadang yang diproduksi dapat diterangkan menggunakan distribusi normal. Disamping itu galat dalam pengukuran ilmiah dapat dihampiri dengan sangat baik oleh distribusi normal. Pada tahun 1733, Abraham DeMoivre menemukan persamaan matematika kurva normal. Ini merupakan dasar bagi teori statistika induktif. Distribusi normal sering pula disebut distribusi Gauss untuk menghormati Karl Friedrich Gauss (17771855), yang juga menemukan persamannya waktu meneliti galat dalam pengukuran yang berulang-ulang mengenai bahan yang sama.
21 Karakteristik dari variabel acak kontinu berbeda dengan variabel acak diskrit. Variabel acak kontinu mencakup semua bilangan, baik utuh maupun pecahan. Oleh karena itu tidak dapat dipisahkan nilai yang satu dengan yang lain. Itulah sebabnya fungsi variabel acak kontinu sering disebut fungsi kepadatan, karena tidak ada ruang kosong diantara dua nilai tersebut. Dengan kata lain realitasnya keberadaan satu buah angka dalam variabel acak kontinu jika ditinjau dari seluruh nilai adalah sangat kecil, bahkan mendekati nol. Karena itu tidak bisa dicari probabilitas satu buah nilai dalam variabel acak kontinu, tetapi yang dapat dilakukan adalah mencari probabilitas diantara dua buah nilai. Distribusi kontinu mempunyai fungsi matematis tertentu, jika fungsi tersebut digambar, maka akan berbentuk kurva kepadatan dengan sifat sebagai berikut : 1. Probabilitas nilai x dalam variabel tersebut terdapat dalam rentang antara 0 dan 1 2. Probabilitas total dari semua nilai x adalah sama dengan satu (sama dengan luas daerah di bawah kurva)
Fungsi kepadatan merupakan dasar untuk mencari nilai probabilitas diantara dua nilai variabel. Probabilitas di antara dua nilai adalah luas daerah di bawah kurva di antara dua nilai dibandingkan dengan luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dengan menggunakan integral tertentu (difinit integral).
Suatu variabel acak kontinu X yang distribusinya berbentuk lonceng disebut peubah acak normal. Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter µ dan σ 2, yaitu rataan dan variansnya. Fungsi padat variabel acak normal X dengan rataan µ dan variansi σ 2, adalah f ( x) =
1
σ 2π
e
1 x−µ − 2 σ
2
Yang menyatakan bahwa :
π
= suatu konstanta matematika yang nilainya mendekati 3,14159
e
= suatu konstanta matematika yang nilainya mendekati 2,71828
µ
= parameter, merupakan rata-rata untuk distribusi
σ2
= parameter, merupakan variansi untuk distribusi
(2.3)
22 dan nilai x mempunyai batas − ∞ < x < ∞ , maka dikatakan bahwa variabel acak X berdistribusi normal. Sifat-sifat penting distribusi normal: 1. grafiknya selalu ada di atas sumbu datar x . 2. bentuknya simetrik terhadap x = µ 3. mempunyai satu modus, jadi kurva unimodal, tercapai pada x = µ sebesar
0,3989
σ
4. grafiknya mendekati (berasimtutkan) sumbu datar x dimulai dari x = µ + 3σ ke kanan dan x = µ − 3σ ke kiri 5. luas daerah grafik selalu sama dengan satu unit persegi Untuk tiap pasang µ dan σ , sifat-sifat di atas seluruh dipenuhi, hanya bentuk kurvanya saja yang berlainan. Jika σ makin besar , kurvanya makin rendah (platikurtik) dan untuk σ makin kecil, kurvanya makin tinggi (leptokurtik).
σ µ
Gbr 2.1 Kurva normal
Untuk mengatasi kesulitan dalam menghitung integral fungsi padat normal maka dibuat tabel luas kurva normal sehingga memudahkan penggunaannya. Akan tetapi, tidak akan mungkin membuat tabel yang berlainan untuk setiap nilai µ dan σ . Untunglah,
seluruh
pengamatan
setiap
variabel
acak
normal
X
dapat
ditransformasikan menjadi himpunan pengamatan baru satu variabel acak normal Z dengan rataan nol dan variansi 1. Hal ini dapat dikerjakan dengan transformasi. Z=
X −µ
σ
(2.4)
23 Bilamana X mendapat suatu nilai x, nilai Z padanannya diberikan oleh. z=
(x − µ)
σ
. Jadi bila X bernilai antara x=x1 dan x=x2 maka variabel acak Z akan
bernilai antara z1 =
( x1 − µ )
σ
dan z 2 =
1 2πσ
P ( x1 < X < x2 ) =
=
( x2 − µ )
σ x2
∫e
. Karena itu dapat ditulis
1 x−µ − 2 σ
2
dx
x1
z2 2 2 z dz exp = − ∫ z∫ f ( x)dz 2πσ z2 1
1
z2
= p ( z1 < Z < z 2 )
(2.4)
Dengan Z terlihat merupakan suatu variabel acak normal dengan rataan nol dan variansi 1.
x1
x2
P(x1 < x < x 2 )
z1 z2 P(z1 < z < z 2 )
Gbr 2.2 Distribusi normal asli dan yang telah ditransformasikan
P(x1 < x < x 2= ) P(z1 < x < z 2 ) 2.3
Distribusi Sampel
Bidang statistika inferensi pada dasarnya berkenan dengan perampatan dan prediksi, hasil suatu percobaan statistika dapat dicatat dalam bentuk numerik ataupun aksara. Bila sepasang dadu dilantumlan dan jumlahnya merupakan hal yang ingin diselidiki maka hasilnya dicatat dalam bentuk numerik. Keseluruhan pengamatan yang ingin diteliti, berhingga atau tidak, membentuk apa yang disebut populasi atau universum. Kata populasi pengamatan yang diperoleh dari penelitian statistik yang menyangkut manusia. Sekarang statistikawan
24 menggunakan kata tersebut untuk menyatakan seluruh pengamatan tentang hal yang ingin diselidiki, terlepas apa itu menyangkut orang, binatang, ataupun benda lainnya. Banyaknya pengamatan dalam populasi dinamakan ukuran. Suatu populasi terdiri atas keseluruhan pengamatan yang menjadi perhatian (Ronald & Raymond, 1995).
Dalam bidang inferensial statistik statistikawan ingin menarik kesimpulan mengenai suatu populasi dalam hal tidak mungkin atau tidak praktis mengamati himpunan seluruh pengamatan yang membentuk populasi tersebut . Sebagai contoh dalam usaha menentukan rata-rata panjang umur bola lampu merk tersebut agar masih ada sisanya dijual . Biaya yang amat tinggi juga merupakan kendala dalam memeriksa seluruh populasi. Karena itu peneliti menggunakan sebagian pengamatan dari populasi dalam menarik inferensi tentang populasi tersebut. Sampel adalah suatu bagian himpunan dari populasi (Ronald & Raymond, 1995).
Dalam mengambil sampel acak berukuran n dari suatu populasi f ( x ) , didefinisikan variabel acak xi ,i = 1,2 ,..., n , sebagai pengukuran atau nilai sampel ke i yang diamati, variabel acak
x1 , x 2 ,...x n jadinya merupakan suatu sampel acak populasi
f ( x ) dengan nilai numerik
x1 , x 2 ,...x n , bila pengukuran dikerjakan dengan
mengulangi percobaan n kali secara bebas dalam keadaan yang pada dasarnya sama, maka dapat dianggap bahwa ke-n variabel acak berdistribusi f(x). Ini berarti bahwa
x1 , x2 ,...xn bebas dan masing-masing
x1 , x 2 ,...x n masing-masing berdistribusi peluang
f ( x1 ), f ( x 2 ),... f ( x n ) .
Misalkan
x1 , x 2 ,...x n merupakan n variabel acak bebas yang masing-masing
berdistribusi peluang f ( x ) . dari populasi
f(x)
x1 , x 2 ,...x n didefinisikan sebagai sampel acak ukuran n
dan distribusi peluang gabungannya ditulis sebagai:
f ( x1 , x 2 ,..., x n ) = f ( x1 ),( x 2 ),...,( x n ) (Ronald & Raymond 1995).
25 2.4
Maksimum Likelihood
Penaksiran kemungkinan maksimum merupakan salah satu pendekatan yang penting dalam sebuah statistika inferensi. Metode terbaik yang dapat digunakan dalam menentukan penaksir titik sebuah parameter. Misalkan X adalah peubah acak kontinu dengan fungsi kepadatan peluang berbentuk
f ( x, θ ) , dengan θ adalah suatu
parameter yang tidak diketahui. Misalkan
x1 , x 2 ,...x n merupakan sebuah sampel acak berukuran n, fungsi
likelihood dari sampel acak itu adalah: L( θ ) = f ( x1 ,θ ), f ( x 2 ,θ ),... f ( x n ,θ )
(2.5)
Fungsi likelihood adalah fungsi dari parameter yang tidak diketahui θ . Untuk memudahkan dalam menganalisis maka fungsi likelihood L( θ ) diberi ln. Penaksir maksimum likelihood dari θ adalah nilai θ yang memaksimumkan fungsi likelihood L( θ ) .
Dalam aplikasi L( θ ) menunjukkan fungsi densitas probabilitas bersama dari sampel random. Jika S ruang parameter yang merupakan interval terbuka dan L( θ ) merupakan fungsi yang dapat diturunkan serta diasumsikan maksimum pada S maka persamaan maksimum likelihoodnya adalah. ∂ L(θ ) = 0 ∂ (θ )
(2.6)
Jika penyelesaian dari persamaan tersebut ada, maka maksimum dari L( θ ) dapat terpenuhi. Apabila tak terpenuhi maka fungsi L( θ ) dapat dibuat logaritma naturalnya, dengan ketentuan jika ln L( θ ) maksimum maka L( θ ) juga maksimum, sehingga persamaan logaritma natural likelihoodnya adalah ∂ ln L(θ ) = 0 ∂ (θ )
(2.7)
26 2.5
Metode Bayes
Bila A dan B adalah dua kejadian sembarang pada S dan berlaku A ∩ B = 0 maka A dan B dikatakan dua kejadian yang saling lepas. Dua kejadian tersebut tidak mungkin terjadi secara bersamaan seperti pada gambar 2.3 dibawah ini:
Gbr 2.3 Kejadian yang saling lepas Dengan demikian probabilitas A ∪ B adalah : P ( A ∪ B ) = P ( A) + P (B ) Peristiwa A dapat ditulis sebagai gabungan dua buah kejadian yang saling lepas adalah: E ∩ A dan E c ∩ A maka A=( E ∩ A ) ∪ ( E c ∩ A ) dan dapat dibuat dalam bentuk gambar 2.4 di bawah ini:
Gbr 2.4 Gabungan dua kejadian yang saling lepas Dengan menggunakan probabilitas bersyarat maka :
[
P(A)= P ( E ∩ A) ∪ ( E c ∩ A)
]
= P ( E ∩ A) ∪ P ( E c ∩ A) = P( E ∩ A) + P( E c ∩ A) = P( E ) P( A E ) + P( E c ) P( A E c )
(2.8)
27 Peristiwa B1 , B2 ,..., Bk merupakan suatu sekatan (partisi) dari ruang sampel S dengan P( Bi ) ≠ 0 untuk i=1,2,…,k maka setiap peristiwa A anggota S berlaku: k
k
i =1
i =1
P( A) = ∑ P( Bi ∩ A) = ∑ P( Bi ) P( A | Bi )
(2.9)
Digunakan bila ingin diketahui probabilitas P( B1 |A),P( B2 |A)….,P( Bk |A) dengan rumus sebagai berikut : P( Br | A) =
P( A ∩ B) k
=
P( Br ) P( A | Br ) k
∑ P( B ∩ A) ∑ P( B ) P( A | B ) i =1
i
i =1
i
; r = 1,2,..k
(2.10)
i
Peluang Br disebut peluang a-priori, peluang (Br|B) disebut peluang a-posteriori. Metode Bayes adalah metode yang dapat digunakan untuk menaksir parameter distribusi normal. Bayes memperkenalkan suatu metode dimana kita perlu mengetahui bentuk distribusi awal (prior) dari populasi yang dikenal dengan metode Bayes. Sebelum menarik sampel dari suatu populasi terkadang kita peroleh informasi mengenai parameter yang akan diestimasi. Informasi ini kemudian digabungkan dengan informasi dari sampel untuk digunakan dalam mengestimasi parameter populasii dan parameter populasi berasal dari suatu distribusi, sehingga nilainya tidaklah tunggal dan merupakan variabel random. Bayes menggunakan interpretasi probabilitas secara subyektif di dalam analisa statistika
formal.
Pendekatan
Bayes
terhadap
metode
estimasi
statistik
menggabungkan informasi yang dikandung dalam sampel dengan informasi lain yang telah tersedia sebelumnya. Dari segi asumsi statistikawan klasik memandang bahwa parameter populasi mempunyai harga tertentu yang tidak diketahui sehingga pernyataan probabilitas tentang parameter populasi tidak mempunyai arti.
2.5.1 Distribusi Prior Distribusi awal (prior) adalah keterangan tambahan mengenai θ , misalnya bahwa θ diketahui berubah sesuai dengan distribusi peluang f ( θ ) dengan rataan awal µ 0 dan varians σ 0
2
yaitu dianggap bahwa θ merupakan nilai peubah acak θ dengan
28 distribusi peluang f ( θ ) dan ingin ditaksir nilai θ tertentu untuk populasi yang diambil sampelnya . Peluang yang dikaitkan dengan distribusi awal
ini disebut
peluang pribadi, karena mengukur derajat keyakinan seseorang mengenai letak parameter yang ingin ditaksir dan estimator mengunakan pengalaman dan pengetahuan sebagai dasar untuk memperoleh peluang pribadi yang berasal dari distribusi awal.
2.5.2 Distribusi Posterior Teknis bayes menggunakan distribusi awal f ( θ ) bersama dengan fungsi gabungan sampel f(x1, x2,
…,
xn: θ ) untuk menghitung distribusi posterior f( θ |x1, x2,
…,
xn).
Distribusi posterior (pasca) terdiri atas keterangan dari distribusi awal yang subjektif maupun distribusi sampel yang objektif dan menyatakan derajat keyakinan kita mengenai letak parameter θ setelah sampel diamati. f(x1, x2, …, xn| θ ) sama dengan f(x1, x2,
…,
xn: θ ) untuk distribusi peluang gabungan sampel bilamana ingin
menunjukkan bahwa parameter juga merupakan peubah acak. Distribusi gabungan sampel
x1 , x 2 ,...x n dan parameter θ adalah:
f(x1, x2, …, xn, θ )= f(x1, x2, …, xn; θ )f( θ ) . Sehingga distribusi marginalnya sebagai berikut : ∑ f ( x1 , x 2 ,...x n ;θ ) θ g(x1, x2, …, xn)= ∞ ∫ f ( x1 , x 2 ,...x n ;θ )dθ −∞
( bila diskrit ) (2.11) ( bila kontinu )
jadi distribusi posteriornya dapat ditulis sebagai berikut:
f (θ | x1 , x 2 ,...x n ) =
f(x1 , x 2 ,…, x n , θ) g(x1 , x 2 ,… , x n )
(2.12)
Distribusi posterior f( θ |x1, x2, …, xn) dinyatakan dengan θ *, disebut penaksiran bayes untuk θ (Ronald & Raymond, 1995).
29 2.5.3 Menentukan Selang Taksiran Bayes Selang atau interval bayes (1- α )100% untuk parameter θ dapat dibuat dengan menghitung selang yang titik tengahnya berada pada rataan distribusi pasca yang mengandung (1- α )100% peluang pasca. Sehingga selang a< θ
b
∫ θ
*
f( θ |x1, x2, …, xn: θ ) d θ = ∫
f( θ |x1, x2, …, xn: θ ) d θ
a
=
1−α 2
(2.13)
Rataan Posterior µ* adalah estimasi bayes dari rataan populasi µ , dan selang bayes (1-α)100% untuk µ dapat dibuat dengan menghitung selang µ* - Zα/2 σ * < µ < µ* + Zα/2 σ *
2.6
(2.14)
Batas Toleransi
Selang kepercayaan untuk parameter θ , yaitu selang yang berbentuk θˆ1 < θ < θˆ2 , bila
ˆ untuk sebuah sampel tertentu dan juga θˆ1 dan θˆ2 tergantung pada nilai statistik Θ ˆ . Ini berarti batas kepercayaan dihitung sedemikian rupa pada distribusi sampel dari Θ sehingga proporsi tertentu dari selang yang dihitung dari seluruh sampel yang dapat dibuat dengan ukuran yang sama mengandung parameter populasi θ . Untuk memperoleh taksiran yang lebih tinggi derajat kepercayaannya, digunakan interval atau selang taksiran disertai nilai koefisien kepercayaan yang dikehendaki. Jika simpangan baku diketahui dan populasinya berdistribusi normal , maka interval taksirannya adalah: σ σ p x − z α < µ < x + zα = (1 − α ) n n 2 2
(2.15)
Keterangan
α = adalah koefisien kepercayaan z α = bilangan z didapat dari table normal baku untuk peluang 2
α 2
30 Persamaan (2.1) di atas dapat dinyatakan dalam bentuk lain, adalah untuk memperoleh (1- α )100% interval kepercayaan parameter µ dapat menggunakan persamaan berikut:
x − zα
σ n
2
< µ < x + zα 2
σ
(2.16)
n
Bila z α menyatakan nilai z sehingga daerah di sebelah kanannya mempunyai 2
luas
α 2
maka didapat dua batas kepercayaan sebagai berikut:
θ * = x − zα
σ
2
dan θ * = x + z α
n
2
σ n
Gbr 2.5 Batas keprcayaan pada distribusi normal Jika x dipakai sebagai taksiran untuk μ, maka kita bisa yakin (confident) dengan tingkat keyakinan (confidence level) 100(1-α)% bahwa error (E= x-μ ) yg terjadi tidak akan lebih besar dari z α 2
σ
n
seperti pada gambar 2.6 di bawah ini:
Gambar 2.6 Interval kepercayaan rata-rata populasi
Sebagai contoh, bila semua sampel dengan ukuran n yang sama diambil dari suatu distribusi normal, 95% dari semua selang yang ditentukan oleh batas kepercayaan x ± 1,96
σ n
akan mengandung parameter µ . Karena itu dengan
31
kepercayaan 95% selang x ± 1,96
σ n
, yang dihitung dari suatu sampel tertentu, akan
mengandung parameter µ .
Suatu cara untuk menetapkan batas untuk nilai tunggal dalam populasi ialah dengan menentukan suatu selang kepercayaan untuk suatu proporsi tertentu dari pengukuran. Ini paling baik dijelaskan dengan membayangkan suatu keadaan yang menyangkut pengambilan sampel acak dari suatu keadaan yang menyangkut pengambilan sampel acak dari suatu distribusi normal dengan rataan µ dan variansi
σ 2 yang diketahui. Jelas suatu batas mencakup bagian tengah 95% dari populasi pengamatan adalah
µ ± 1,96 σ
(2.17)
Ini disebut selang toleransi, dan memang cakupan 95% dari pengamatan yang diukur adalah tepat. Akan tetapi, dalam praktek µ dan σ jarang diketahui, jadi pengguna terpaksa menggunakan x ± ks,
(2.18)
Dan sekarang, selang berbentuk peubah acak dan karena itu cakupan dari proporsi populasi yang dipenuhi selang tadi tidak lagi tepat. Akhibatnya selang kepercayaan 100(1 − γ )% berlaku untuk pernyataan tersebut karena x ± ks tidak dapat diharapkan selalu mencakup setiap proporsi tertentu. Batas toleransi untuk pengukuran yang berdistribusi normal dengan rataan µ dan simpangan baku σ yang keduanya tidak diketahui, batas toleransi diberikan oleh x ± ks , k ditentukan sedemikian rupa sehingga dapat ditegaskan dengan 100(1 − γ )% kepercayaan bahwa batas tersebut mengandung paling sedikit 1 − α proporsi pengukuran.