146
Pendekatan Terbaik..................(Toha Saifudin)
Pendekatan Terbaik diantara Distribusi Pareto, Pareto Tergeneralisir dan Mixture-Pareto dalam Pemodelan Reliabilitas (The Best Approach belong Pareto, Generalized Pareto and Mixture-Pareto in Reliability Modelling) Toha Saifudin Staf Pengajar Jurusan Matematika FMIPA Universitas Airlangga ABSTRACT The aim of this paper is look for the best approach belong Pareto, Generalized Pareto and mixture-Pareto distributions in data reliability modelling. What is the form of estimators of distributions and then find the best approach belong them is the problem discussed in here. The form of Pareto, Generalized Pareto and the components of mixture-Pareto that discussed in this paper is taked from Wolstenholme(1999) and Maximum Likelihood Estimation (MLE) is used to estimate each parameter of distributions. In estimation of parameters of Pareto and Generalized Pareto distributions was found that the form of estimators is in implicit function, then is used Newton Raphson method to finished. Whereas in estimation of mixture Pareto was needed Expectation and Maximization (EM) algorithm. Mean Square Error (MSE) was used as criteria in model selection. Smallest value of MSE belong them indicate that the distribution is the best approach belong them to reliability modelling. Keywords : pareto, generalized pareto, mixture-pareto, MLE, MSE. PENDAHULUAN Analisa data uji hidup merupakan analisa statistik yang membahas tentang daya tahan hidup suatu benda atau individu dalam keadaan operasional tertentu. Penerapan dari analisa ini biasanya banyak dilakukan di bidang kedokteran berkaitan dengan pemodelan ketahanan hidup penderita penyakit tertentu (Lee, 1992), dan di bidang produksi berkaitan dengan pemodelan tentang ketahanan hidup benda-benda produksi (Barlow and Proschan, 1996). Menurut Wolstenholme (1999) ketahanan hidup benda-benda produksi ini sering kali disebut keandalan atau reliabilitas (reliability). Salah satu distribusi yang ada dalam analisa data uji hidup adalah distribusi Pareto yang cukup sering digunakan khususnya untuk reliability (Wolstenholme, 1999). Salah satu penerapan distribusi Pareto adalah untuk menganalisis kekuatan benang nylon untuk karpet (Afify, 2003). Beberapa fenomena data uji hidup yang muncul dalam kehidupan nyata menunjukkan adanya variasi data yang sangat besar yang secara fisik biasanya berpola multimodal (Prihartanti, 2002). Fenomena demikian bila didekati dengan distribusi single univariat, berakibat adanya bias dalam analisisnya (Dalrymple et al., 2003). Gejala ini membawa pada pemikiran untuk menyelesaikannya dengan model alternatif lain, misalnya model tergeneralisirnya atau model Mixture sebagai gabungan beberapa sub-
populasi (komponen) yang masing-masing berpola distribusi single univariat yang dapat mengakomodasi variabilitas data (Bohning and Seidel, 2003). Namun disisi lain ada kalanya suatu data tahan hidup tidak perlu dimodelkan dengan mixture, karena justru lebih baik dengan distribusi single univariat. Pendekatan distribusi yang tepat atau sesuai akan memberikan analisis lanjut yang akurat, bila kurang tepat cenderung akan bias. Adanya tuntutan seperti ini membuat kita perlu melakukan pendekatan distribusi yang sebaik mungkin terhadap data dahan hidup. Karenanya akan menarik bila dilakukan penelitian tentang pemilihan model distribusi tahan hidup yang paling sesuai diantara Pareto, Pareto tergeneralisir dan Mixture Pareto guna memodelkan reliabilitas dengan tepat. Probability Density Function (PDF) PDF Distribusi Pareto Pada beberapa literatur distribusi Pareto didefinisikan dalam beberapa bentuk. Probability density function (pdf) dari distribusi Pareto 2 parameter mempunyai bentuk (Wolstenholme, 1999):
f ( x) =
αβ α ( β + x)α +1
,
x≥0
………..(1) dimana β > 0 adalah parameter skala dan α > 0 adalah parameter bentuk.
Jurnal ILMU DASAR Vol. 7 No. 2, 2006 : 146-154
dengan α >0 adalah parameter bentuk, β >0 adalah parameter skala dan γ >0 adalah parameter lokasi.
PDF Distribusi Pareto Tergenerealisir Pada beberapa literatur distribusi Pareto tergeneralisir juga didefinisikan dalam beberapa bentuk. Dalam Wolstenholme (1999) didefinisikan distribusi Pareto tergeneralisir dalam fungsi hazard sebagai berikut :
h( x ) = α +
β
γ +x
,x ≥ 0
147
PDF Distribusi Mixture-Pareto Berdasarkan distribusi mixture yang dikemukakan oleh McLachlan dan Basford (1988), maka pdf mixture-Pareto sebanyak g komponen dengan masing-masing dua parameter adalah sebagai berikut :
………..(2)
fmix (x;p, α , β ) = p1f1(x; α 1 , β 1 ) + p2f2(x; α 2 , β 2 )+…+ pgfg(x; α g , β g )
……..(3)
dimana fi (x; α i , β i ) adalah pdf bentuk (1) dengan 2 parameter α i , β i , i = 1,2, …, g. Estimasi Parameter Distribusi dengan Maksimum Likelihood Langkah-langkah estimasi parameter distribusi dengan metode Maksimum Likelihood berikut ini mengikuti Hogg dan Craig (1995).
Estimasi Parameter Distribusi Pareto Bila sampel yang diberikan adalah x1, x2, …, xn dan pdf-nya pada persamaan (1), maka diperoleh fungsi Likelihoodnya sebagai berikut:
L (θ) =
α β n
nα
n
∏(β + x )
−(α +1)
i
i =1
………..(4) untuk θ = (α, β) T . Kemudian setelah di-ln-kan, bentuknya menjadi ln L(θ) = n
n
i =1
i =1
n ln α + nα ln β − α ∑ ln ( β + xi ) − ∑ ln ( β + xi ) ………..(5) Selanjutnya penyelesaian αˆ dan βˆ dari sistem persamaan (6) dan (7) di atas adalah sebagai berikut : Untuk αˆ , dari persamaan (6) dapat ditulis n αˆ = n ………..(8) ln βˆ + x − n ln βˆ
Selanjutnya dengan mendiferensialkan persamaan (5) secara parsial terhadap masingmasing parameter α dan dan β menyamadengankan nol diperoleh n + n ln βˆ − αˆ nαˆ − αˆ βˆ
∑ ln(βˆ + x ) = 0 n
i
⎛ 1 ⎜ ⎜ ˆ i =1 ⎝ β + xi n
∑
0=
………..(6)
∑ (
i =1
⎛ βˆ ⎜ ⎜ ⎝
⎞ ⎟− ⎟ ⎠
⎛ 1 ⎜ ⎜ ˆ i =1 ⎝ β + xi n
∑
⎞ ⎟=0 ⎟ ⎠ ………..(7)
⎛ ⎜ 2 ⎜ n −⎜ n ⎞ ⎜ ln(βˆ + xi ) − n ln βˆ ⎟ ⎜ ⎟ ⎜ i =1 ⎠ ⎝
∑
i
)
i =1
Sedangkan untuk , dengan βˆ mensubstitusikan (8) ke (7) diperoleh :
⎞ ⎟ ⎟ ⎛ ⎞ i i =1 ⎜ 1 ⎟⎟ + n ⎜ βˆ + x ⎟ ⎟ i ⎠ ln(βˆ + xi ) − n ln βˆ i =1 ⎝ ⎟⎟ i =1 ⎠ n
n
⎛
1
⎞
∑ ⎜⎜⎝ βˆ + x ⎟⎟⎠
∑
Persamaan (9) tidak dapat diselesaikan secara analitis karena masih dalam bentuk fungsi implisit, karenanya digunakan metode Newton–Raphson untuk menyelesaikannya.
n
∑
……..(9)
Jurnal ILMU DASAR Vol. 7 No. 2, 2006 : 146-154
61
Apabila fungsi hazard Pareto Tergeneralisir seperti dinyatakan dalam (2), maka pdf-nya adalah sebagai berikut:
Estimasi Parameter Distribusi Pareto Tergeneralisir
⎡ x ⎤ f ( x) = h( x) exp ⎢ − ∫ h(u )du ⎥ ⎣ 0 ⎦ ⎛ ⎛ γ ⎞ β ⎞ ⎟⎟ [exp( −α x )] ⎜⎜ = ⎜⎜ α + ⎟⎟ γ +x⎠ ⎝ ⎝γ + x⎠
...……(10) diperoleh fungsi Likelihoodnya sebagai berikut :
Bila sampel yang diberikan adalah x1, x2, …, xn dan pdf-nya pada persamaan (10), maka ⎛ ⎛ L(θ) = ⎜ exp⎜ − ⎜ ⎜ ⎝ ⎝
n
∑
⎞⎞ n ⎟⎟ ⎠ ⎠ i =1
∏
αx i ⎟ ⎟
i =1
β
⎛⎛ ⎜ ⎜α + β ⎜⎜ γ + xi ⎝⎝
⎞⎛ γ ⎟⎜ ⎟⎜ γ + x i ⎠⎝
⎞ ⎟ ⎟ ⎠
β
⎞ ⎟ ⎟ ⎠
…..….. (11)
untuk θ = (α, β, γ) T . Kemudian setelah di-ln-kan, bentuknya menjadi ln L(θ)
n
=−
n
⎛
β
∑ α x + ∑ ln ⎜⎜⎝ α + γ + x i
i =1
i =1
i
⎞ ⎟⎟ + ⎠
n
⎛
γ
∑ ln ⎜⎜⎝ γ + x i =1
i
⎞ ⎟⎟ ⎠
β
………(12) Selanjutnya dengan mendiferensialkan persamaan (12) secara parsial terhadap masingγ dan masing parameter α , β dan menyamadengankan nol diperoleh : n
i =1
n
1
∑⎛
ˆ ⎜ αˆ + β ⎜ γˆ + xi ⎝
⎞ ⎟ ⎟ ⎠
−
∑x
i
=0
i =1
……....(13) n
n
1
∑ αˆ (γˆ + x ) + βˆ + n ln γˆ − ∑ ln(γˆ + x ) = 0 i
L(ψ ) =
n
g
j =1
i =1
∏ { ∑ pi f i ( x j ; α i , β i ) }
………(16) dengan ψ = ( p1 ,…,pg ,α1 ,…, αg ,β1 ,…, βg ) T, dan setelah di-ln-kan bentuknya menjadi g n ⎪⎫ ⎪⎧ ln ⎨ pi f i x j ; α i , β i ⎬ . ln L(ψ ) = ⎪⎭ j =1 ⎪ ⎩ i =1 ………(17)
∑ ∑
(
)
Fungsi ln-likelihood bentuk mixture tidak terbatas dan mencapai + ∞ untuk nilai tertentu dari ruang parameternya. Oleh karena itu n n xi 1 βˆ − βˆ + = 0 metode MLE tidak bisa langsung dipakai. Data ˆ γˆ (γˆ + xi ) ˆ ˆ ˆ sampel yang telah diberikan di atas dikenal i =1 (γ + xi ) α (γ + xi ) + β i =1 ………(15) sebagai data tidak lengkap (belum memberikan informasi tentang xj masuk subpopulasi ke-i mana, i=1,2,…,g). Sehingga Ketiga persamaan terakhir yang diperoleh yang diperkenalkan suatu variabel indikator zij, merupakan persamaan non linier dan berupa dimana fungsi implisit sehingga untuk zij = menyelesaikannya akan digunakan metode Newton-Raphson dalam bentuk vektor. 1 , jika y ∈ G ( G = subpopulas i ke − i ) ⎧⎪ j i i ⎨ ⎪⎩0, jika y j ∉ Gi (Gi = subpopulasi ke − i ) Estimasi Parameter Distribusi Mixture…………..(18) Pareto Dengan adanya variabel unobservable zij ini, Bila sampel yang diberikan adalah x1, x2, …, xn y , y maka diperkenalkan data lengkap dan pdf-nya pada persamaan (3), maka c c = (y1, y ) dimana y (x z ) ,… , y …, diperoleh fungsi Likelihoodnya sebagai n 1 = 1, 1 n = (xn, zn) memuat data terobservasi, xobs = (x1, …, xn) dan berikut: i =1
i =1
i
………(14)
∑
(
)
∑
Jurnal ILMU DASAR Vol. 7 No. 2, 2006 : 146-154
zj = (z1j ,…, zgj)′ dengan zij, i=1,…,g: j=1,…,n dan
(Ekspectation and Maximization) secara iteratif yaitu dengan menentukan ekspektasi dari (22) berdasarkan data sampel terobservasi xobs = { x2, …, xn }dan kemudian x1, memaksimumkannya. Ekspektasi terhadap (22) adalah Eψ (k) { ln Lc (ψ )| xobs}=
iid
z1, …, zn ~ Multg (1, p) , p = (p1, p2, … , pg) . (19) Selanjutnya dapat ditentukan bahwa pdf dari zj g
adalah h (zj; p, 1)=
∏p
i
zij
g
dan pdf dari xj
(
f i x j ,α i , β i
) }z
ij
j
i
i
(
)}
(k )
{Z ij | x j } ,
dan diperoleh
∏ ( p f (x ,α , β )) i i
} {
| x j ln pi f i x j ;α i , β i .
adalah menentukan nilai Eψ
Sehingga pdf untuk data lengkap y1 , y2 ,… , yn adalah g
ij
………(23) Pada tahap Ekspektasi ini yang dilakukan
, j = 1, 2, … , n.
i =1
f (yj) = f (xj, zj ) =
(k)
i =1 j =1
dengan syarat zj diketahui adalah g (xj | zj) =
∏{
n
∑∑ Eψ {Z
i =1
g
149
zij
Eψ
i =1
(k )
{Z ij | x j } = z ij
(k )
=
………(20)
pi ( k ) f i ( x j ; α i ( k ) , β i ( k ) ) g
∑p
i
(k )
f i ( x j ;α i (k ) , β i (k ) )
i =1
Jika sampel data lengkap yang diberikan adalah y1 , y2 ,… , yn dengan pdf pada (20) maka diperoleh fungsi Likelihoodnya sebagai berikut : ⎛ g n ⎞ Lc (ψ ) = ⎜ pi f i x j , α i , β i zij ⎟ ⎜ ⎟ ⎠ ⎝ i =1 j =1 ………(21) untuk ψ = ( p1 ,…,pg ,α1 ,…, αg ,β1 ,…, βg ) T, dan setelah di-ln-kan bentuknya menjadi (ψ ) = ln Lc
∏∏ (
g
n
∑∑ z i =1 j =1
ij
(
………(24) Kemudian pada tahap Maksimasi, ψ dilakukan estimasi yang memaksimumkan (23), sebut saja ψ (k+1) dan diperoleh : Estimator untuk αi , i = 1, 2, …, g :
))
n
∑z
∧
α i ( k +1) =
j =1
n
∑z j =1
log{ pi f i ( x j ;α i , β i )}
(k ) ij
(k ) ij
⎛ β i ( k +1) + x j ln ⎜ ⎜ β ( k +1) i ⎝
⎞ ⎟ ⎟ ⎠
,
………(25) ………(22)
Estimasi parameter Mixture-Pareto kemudian dilakukan dengan algoritma EM Estimator untuk βi , i = 1, 2, …, g : ⎛ ⎛ ∧ ( k +1 ) n ⎜ ⎜ β1 + yj (k) z1 j log ⎜ ∧ ⎜ ⎜ ⎜ β ( k +1 ) j =1 1 ⎝ ⎜ 0 = 1+ n ⎜ ⎜ z1j ( k ) ⎜ j =1 ⎜ ⎝
∑
⎞ ⎟ ⎟ ⎟ ⎠
∑
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
∑ j =1
⎞ ⎟ ⎟ ⎜∧ ⎜ β ( k +1 ) + y ⎟ j ⎠ ⎝ 1 ⎛
n
z1 j
( k )⎜
∧
β 1( k + 1 )
n
∑z j =1
(k ) 1j
,
.……..(26) ∧
Persamaan β 1( k + 1 ) tidak dapat diselesaikan secara analitis karena masih dalam bentuk
fungsi implisit. Oleh karena itu diperlukan metode Newton-Raphson untuk menyelesaikannya.
150
Pendekatan Terbaik..................(Toha Saifudin)
Estimator untuk pi , i = 1, 2, …, g : n
∧
p i1
( k +1)
∑z =
ij
merupakan fungsi distribusi empiris. Nilai MSE yang terkecil diantara ketiga distribusi menunjukkan bahwa hasil estimasi dari model atau distribusi tersebut adalah yang terbaik.
(k )
j =1
.
n
………(27)
Algoritma Pemrograman Algoritma Penentuan Estimator Parameter Distribusi Pada bagian ini akan diberikan algoritma penentuan estimator parameter untuk masingmasing distribusi yang dibahas dalam tulisan ini.
Pemilihan Model Distribusi yang Paling Sesuai Sebagai kriteria untuk menilai model atau distribusi pendekatan yang terbaik atau paling sesuai untuk memodelkan reliabilitas, dalam tulisan ini digunakan nilai MSE dengan rumus sebagai berikut (Al-Fawzan, 2000) : n
MSE =
∑{Fˆ ( x ) − S ( x )} i
i
Algoritma Penentuan Estimator Maksimum Likelihood Distribusi Pareto
2
Memasukkan nilai awal βˆ 0
i =1
………(28) dengan Fˆ ( xi ) adalah fungsi distribusi dugaan
S ( xi ) =
secara parametrik dan
f ( βˆ ) =
⎛ ⎜ ⎝
βˆ ⎜
⎛ ⎜ 2 ⎜ n −⎜ n ⎞ ⎜ ln( βˆ + xi ) − n ln βˆ ⎟ ⎜ ⎟ ⎜ i =1 ⎠ ⎝
∑
Menentukan
nilai
f ( βˆ0 )
dengan
:
i − 0 .5 n ⎞ ⎟ ⎟ ⎛ ⎞ i i =1 ⎜ 1 ⎟⎟ + n ⎜ βˆ + x ⎟ ⎟ i ⎠ ln( βˆ + xi ) − n ln βˆ i =1 ⎝ ⎟⎟ i =1 ⎠ n
n
⎛
⎞
1
∑ ⎜⎜⎝ βˆ + x ⎟⎟⎠
n
∑
∑
………(29) Menentukan nilai f ' ( βˆ 0 ) dengan
n3 − n 2 f ' ( βˆ ) =
n
∑
ln(βˆ + xi ) + n 3 ln βˆ − n 2 βˆ
i =1
n
⎛
⎞
1
∑ ⎜⎜⎝ βˆ + x ⎟⎟⎠ i =1 2
i
+ ⎛ n ⎞ β ln(βˆ + xi ) − n ln βˆ ⎟ ⎜ ⎟ ⎝ i =1 ⎠ 2 ⎞ ⎛ n ⎛ ⎞ ⎛ n ⎛ ⎞⎛ n 1 ⎞ ⎛ n n ⎞⎞ ⎜ ⎜ 1 ⎟ ⎜ ln(βˆ + xi ) − n ln βˆ ⎟⎟ + ⎜n ⎜ 1 ⎟⎜ − ⎟⎟ ⎟ ⎜n ⎜ ˆ ⎜ˆ ⎟⎜ ⎟⎟ ⎜ ˆ ˆ ⎟⎟ ⎜ i=1 ⎝ β + xi ⎟⎠ ⎜⎝ i=1 ⎠⎠ ⎝ i=1 ⎝ β + xi ⎠⎝ i=1 β + xi β ⎠⎠ ⎝
ˆ2⎜
∑
∑
∑
∑
⎛ n ⎞ ⎜ ln(βˆ + xi ) − n ln βˆ ⎟ ⎜ ⎟ ⎝ i=1 ⎠
∑
∑
2
⎛ 1 ⎞ ⎟ + ⎜ ⎜ βˆ + x ⎟ i⎠ i=1 ⎝ n
∑
2
……….(30) Menghitung βˆ k +1
f ( βˆ k ) = βˆ k − untuk iterasi k = 0, 1, 2, 3, … f ' ( βˆ ) k
Menghentikan proses iterasi jika | βˆ k +1 − βˆ k | < n Menghitung αˆ = n . ln βˆ + x − n ln βˆ
∑ ( i =1
i
)
ε
untuk
ε
> 0.
150
Pendekatan Terbaik..................(Toha Saifudin)
Algoritma Penentuan Estimator Maksimum Likelihood Distribusi Pareto Tergeneralisir Untuk menyelesaikan tiga persamaan (13), (14) dan (15) sebagai sistem persamaan akan digunakan metode Newton Raphson sebagai berikut (http://130.179.64.208 /intermath/136212/presentcourse/corrections/m ultiVariableNewtonRaphson.htm ): Memasukkan θˆ 0 = (αˆ 0 , βˆ 0 , γˆ 0 ) T sebagai solusi awal dari sistem persamaan nonlinier. Untuk mempermudah penulisan, persamaan (13), (14) dan (15) masing-masing dapat dinotasikan sebagai berikut : g (θˆ ) = 0 , g (θˆ ) = 0 dan g (θˆ ) = 0
2. Tahap E : Menghitung nilai
1
2
3
………(31) 2. Menentukan jacobian J (θˆ k ) dari sistem persamaan (31) tersebut. −1 3. Menghitung nilai h k = − J(u k ) g(θˆ k )
[
]
dengan g (θˆ ) = ( g1 (θˆ ), g 2 (θˆ ), g 3 (θˆ k ))T . k
k
k
Menghitung θˆ k+1 = θˆ k + hk bila θˆ k diketahui untuk iterasi k = 0, 1, 2, 3, … sehingga diperoleh θˆ 1, 2, θˆ 3 , … θˆ
Menghentikan proses iterasi ketika diperoleh max | θˆ
k +1
− θˆ k | < ε untuk ε >0 .
Algoritma Penentuan Estimator Maksimum Likelihood Distribusi Mixture-Pareto Untuk estimasi pada distribusi mixture (termasuk mixture pareto) tidak bisa langsung digunakan prosedur maksimum likelihood. Pada tulisan ini digunakan pendekatan estimasi dengan algoritma EM (Expectation and Maximization). Teori pendekatan algoritma EM untuk estimasi mixture bisa dilihat dalam McLachlan dan Basford (1988), dan penerapan untuk kasus mixture normal bisa dilihat dalam Bohning dan Nityasuddhi (2003). Adapun algoritma EM untuk menentukan estimator distribusi mixture-pareto yang terdiri dari g sub-populasi adalah : 1. Menentukan nilai awal estimasi parameter dengan langkah-langkah sebagai berikut : a. Membagi {yj ; j=1,2, …,n} dalam g subpopulasi dengan masing-masing sub berukuran lebih besar dari 1 .
ψˆ 0 0 ˆ g 0 , αˆ 1 0 ,.., αˆ g 0 , βˆ1 0 ,.., βˆ g 0 )T ( pˆ 1 ,.., p b.
Menghitung
menggunakannya sebagai nilai awal.
= dan
z ij
(k )
untuk k =
0, 1, 2, … dengan persamaan (24). 3. Tahap M : Menghitung ∧
∧
∧
ψˆ ( k +1) = ( p 1( k +1) ,.., p g ( k +1) , α 1 ( k +1) ,.., ∧
∧
∧
α g ( k +1) , β 1 ( k +1) ,.., β g
( k +1) T
berdasar
)
persamaan (25), (26) dan (27). Iterasi tahap E dan tahap M dihentikan bila L(ψˆ
( k +1)
) – L(ψˆ
Mencetak nilai ψˆ
(k )
) < ε untuk ε > 0.
( k +1)
sebagai hasil estimasi.
Algoritma Pemilihan Distribusi Berdasarkan Kriteria MSE 1. Menginput data. estimator-estimator 2. Menghitung parameter dari ketiga distribusi. 3. Menghitung nilai MSE dari ketiga distribusi. 4. Menentukan distribusi yang paling sesuai berdasarkan nilai MSE terkecil. Model Reliabilitas Model Reliabilitas Pareto Dengan pdf (1), model atau fungsi reliabilitas Pareto diperoleh dengan langkah berikut : ∞
R (t ) =
∫
∞
f (u ) du =
t
⎛ β R ( t ) = ⎜⎜ ⎝β +
αβ α
∫ ( β + u )α
+1
du
t
⎞ ⎟ t ⎟⎠
α
, α > 0, β > 0. ………(32)
Model Reliabilitas Pareto Tergeneralisir Dengan fungsi hazard (2), model atau fungsi reliabilitas Pareto Tergeneralisir diperoleh dengan langkah berikut : ⎡ R (t ) = exp ⎢ − ⎢ ⎣ ⎡ R ( t ) = exp ⎢ − ⎢ ⎣
t
∫ 0
⎤ h ( u ) du ⎥ ⎥ ⎦
t
∫ (α 0
+
⎤ β )du ⎥ γ +u ⎥
⎛ γ = (exp( − α t )) ⎜⎜ ⎝γ +t
⎦
⎞ ⎟⎟ ⎠
β
………(33)
Model Reliabilitas Mixture-Pareto Berdasarkan persamaan (3) dan (32) maka model atau fungsi reliabilitas dari MixturePareto adalah :
Jurnal ILMU DASAR Vol. 7 No. 2, 2006 : 146-154
g g ⎛ βi ⎞ ⎟⎟ R mix (t ) = ∑ p i R i (t ) = ∑ p i ⎜⎜ i =1 i =1 ⎝ βi + t ⎠
………(34) Penerapan Program pada Data Program komputer untuk estimasi dibuat dengan bahasa pemrograman yang tersedia di S-Plus. Dengan bantuan program tersebut dilakukan estimasi dan perbandingan MSE terhadap dua jenis data bangkitan dan data failure time mesin HJS 1 PT. Ajinomoto yang diambil dari referensi Juana, 2003. Untuk mendapatkan data bangkitan akan digunakan metode transformasi invers, langkah-langkahnya adalah mula-mula cari invers dari fungsi distribusinya. Misal u = F(x) merupakan fungsi distribusi pareto maka inversnya adalah x = F-1(u) untuk u berdistribusi uniform(0,1). Kemudian dengan memberikan sebarang nilai α dan β akan menghasilkan data bangkitan sebanyak n yang
αi
151
diinginkan. Dalam tulisan ini, untuk penerapan program digunakan data bangkitan yaitu data.g1 yang dibangkitkan dengan ukuran n = 100, parameter α = 3 dan β = 10 . Sedangkan untuk mendapatkan data bangkitan berdistribusi mixture-pareto dilakukan dengan membangkitkan dua sub bangkitan yang kemudian digabungkan. Dalam tulisan ini data.g2 merupakan bangkitan mixture-pareto dari komponen pertama dengan n = 25, α = 2, β = 0.5 dan komponen kedua dengan n = 75, α = 3, β = 60. Hasil estimasi dan nilai MSE masingmasing distribusi terhadap data.g1 dapat dilihat pada Tabel 1., sedangkan hasil estimasi dan nilai MSE masing-masing distribusi terhadap data.g2 pada Tabel 2., dan pada Tabel 3. tersaji hasil estimasi dan nilai MSE masing-masing distribusi terhadap data failure time mesin HJS 1.
Tabel 1. Nilai estimator dan MSE untuk data.g1 Distribusi Pareto Pareto tergeneralisir
Estimator ˆ ˆ α = 1,997748 ; β = 5,964738 Nilai awal :
MSE 0,0005863329 0,0002636412
αˆ = 0,0005 ; βˆ = 0,1 ; γˆ = 0,5 Akhir :
αˆ = 0,1062205 ; βˆ = 0,4644209 ; γˆ = 1,947842 Mixture-Pareto
pˆ 1 = 0,01897306 ; pˆ 2 = 0,9810269 ; αˆ1 = 1,984829 ; αˆ 2 = 2,006466 ; βˆ1 = 5,90774 ; βˆ = 6,177852
0,0004009368
2
Tabel 2. Nilai estimator dan MSE untuk data.g2 Distribusi Pareto Pareto tergeneralisir
αˆ = 2,0412 ; βˆ = 22,89542
Estimator
MSE 0,007145942
Nilai awal :
0,02192282
αˆ = 0,04 ; βˆ = 0,0008 ; γˆ = 555 Akhir :
αˆ = 0,04466964 ; βˆ = 0,000964854 ; γˆ = 428,7659 Mixture-Pareto
pˆ 1 = 0,9788003 ; pˆ 2 = 0,02119973 ;
0,003658059
153
Jurnal ILMU DASAR Vol. 7 No. 2, 2006 : 146-154
αˆ1 = 1,032431 ; αˆ 2 = 0,02136465 ; βˆ1 = 6,931 ; βˆ 2 = 0,677031 Tabel 3. Nilai estimator dan MSE untuk data failure time mesin HJS 1 Distribusi Pareto
Estimator ˆ αˆ = 1,794215 ; β = 1530,645
MSE 0,001584860
Pareto tergeneralisir
Nilai awal :
0,001209356
αˆ = 0,0001 ; βˆ = 2 ; γˆ = 1500 Akhir :
αˆ = 0,00035403 ; βˆ = 0,3667041 ; γˆ = 368,7914 Mixture-Pareto
pˆ 1 = 0,03810989 ; pˆ 2 = 0,9618901 ; αˆ1 = 2,408977 ; αˆ 2 = 2,533329 ; ˆ ˆ β = 2294,315 ; β = 2687 ,355 1
0,002583291
2
KESIMPULAN 1. Estimator maksimum likelihood yang dihasilkan dari ketiga distribusi masih dalam fungsi implisit sehingga penyelesaiannya memerlukan iterasi numerik. 2. Penentuan nilai awal yang kurang tepat pada estimasi parameter ketiga distribusi akan menyebabkan divergensi, dan pemberian nilai awal yang berbeda akan cenderung menghasilkan estimator yang berbeda pula. 3. Dari hasil perhitungan untuk a. data.g1, diperoleh pendekatan distribusi yang terbaik adalah pareto tergeneralisir dengan estimasi fungsi reliabilitasnya adalah :
⎛ 1,947842 ⎞ Rˆ ( x) = exp(−0,1062205 x)⎜⎜ ⎟⎟ ⎝ 1,947842 + x ⎠
0, 4644209
b. data.g2, diperoleh pendekatan distribusi yang terbaik adalah mixture pareto dengan estimasi fungsi reliabilitasnya adalah : ⎛ 6,931 ⎞ Rˆ ( x) = 0,9788003⎜⎜ ⎟⎟ ⎝ 6,931 + x ⎠
1, 032431
⎛ 0,677031 ⎞ + 0,02119973⎜⎜ ⎟⎟ ⎝ 0,677031 + x ⎠
0, 02136465
c. data failure time HJS1 diperoleh pendekatan distribusi yang terbaik adalah pareto tergeneralisir dengan estimasi fungsi reliabilitasnya adalah :
⎛ 368,7914 ⎞ Rˆ ( x) = exp(−0,00035403 x)⎜⎜ ⎟⎟ ⎝ 368,7914 + x ⎠
0,3667041
DAFTAR PUSTAKA Afify, E. E., 2003. Estimation of Parameters For Pareto Distribution, http:// interstat.stat. vt.edu/InterStat/ARTICLES/2003/abst racts/F03004.html-ssi (akses : 2004, Maret 17). Anonim, Solving A Systems of Nonlinear Equations : Course Notes for 136.212 Introductory Numerical Methods for engineers.http://130.179.64.208
/intermath/136212/ presentcourse /corrections/multiVariableNewton Raphson.htm (akses : 2004, Maret 21). Al-Fawzan, M.A., 2000. Methods for Estimating the Parameters of the Weibull Distribution, King Abdul Aziz City for Science and Technology, Riyadh – Saudi Arabia. Barlow, R. E. and Proschan, F., 1996. Mathematical Theory of Reliability,
154
Pendekatan Terbaik..................(Toha Saifudin)
society for Industrial and Applied Mathematics, Philadelphia. Böhning, D., and Nityasuddhi, D. 2003. Asymtotic properties of the EM algorithm estimate for normal mixture models with component specific variances. Comput. Statist. & Data Analysis. 41:591-601. Bohning, D. and Seidel, W., 2003. Editorial : Recents developments in Mixture Models, Computational statistics & Data Analysis, 41 . Dalrymple M. L., Hudson, I. L. and Ford, R. P. K., 2003. Finite Mixture, Zero Inflated Poisson and Hurdle Models With Application to SIDS, Computational Statistics and Data Analysis, 41. Hogg R.V. and Craig, A.T., 1995. Introduction To Mathematical Statistics, Fifth Edition, Prentice – Hall, Inc., New Jersey.
Juana M.M., 2003. Pemilihan Model Untuk Menyusun Penjadwalan dan Rencana Anggaran Maintenance Mesin (Studi Kasus : Divisi Packing di PT. Ajinomoto), Skripsi, ITS. Lee Elisa T., 1992. Statistical Models for Survival data Analysis, Second Edition, John Wiley & Sons, Inc. McLachlan G.J. and Basford, K., 1988. Mixture Models : inference and application to clustering, Marcel and Decker Inc., New York and Basel. Prihartanti W., 2002. Studi Reliabilitas Model Kerusakan Ganda : Pendekatan Mixture Weibull, Tesis, Pascasarjana, ITS. Wolstenholme L.C., 1999. Reliability Modelling : A statistical Approach, Chapman & Hall, London.