ITERASI NEWTON UNTUK MENGESTIMASI PARAMETER DISTRIBUSI GENERALIZED GAMMA

ITERASI NEWTON UNTUK MENGESTIMASI PARAMETER DISTRIBUSI GENERALIZED GAMMA Moh Rofi 1 STIMIK AKI PATI JL. Kamandowo No 13 Pati E-mail : [email protected]

Abstract In this research, we discuss about finding estimators of three parameters of Generalized Gamma family distribution with Maximum Likelihood Estimation Method. Newton method is selected to calculate numerically for finding the estimators. The estimators of three distributions, Weibull, Gamma and Exponential distributions as the special case of three parameters of generalized gamma family distribution also were found, including Confidence Intervals Bound and Mean Square Error (MSE) value of estimators. The case study which was implementatied is modelling Total Fertility Rate in Indonesian with sample size 48, based on result of goodness of fit test by EasyFit 5.5 Professional software, both Generalized Gamma and Weibull distributions can be used to modelling sample distribution. It is conclused that Generalized Gamma distribution three parameters is bether than Weibull distribution that is special case form of generalized gamma family distribution, based on MSE of the estimators and curve fit. Keywords: Generalized Gamma distribution, Maximum Likelihood Estimation, Newton iteration. 1 PENDAHULUAN Dalam pemodelan data hidup telah dikenal distribusi Generalized Gamma (GG) yang memiliki bermacam-macam distribusi pada kasus khusus, antara lain Weibull, Gamma, Exponential, Erlang, Chi-square, Raylaigh. Karena dapat terbentuk banyak distribusi pada kasus khusus tersebut, maka distribusi GG dianggap sebagai salah satu keluarga distribusi yang memiliki fleksibilitas sangat baik. Distribusi GG memiliki tiga parameter utama, yakni dua parameter bentuk (  dan  ), serta satu pararmeter skala (  ). Fungsi probabilitas distribusi GG tiga parameter dapat dinyatakan sebagai berikut (Crooks, G.E., 2010).

1    x  f x  ,  ,   =                0,   0,   0

 1

e

 x    



,

Distribusi keluarga GG diharapkan dapat menjadi alternatif yang tepat untuk pemodelan data hidup dan data yang menyerupai data hidup Estimasi Parameter Distribusi……. (Moh Rofi)

dari suatu populasi, sehingga hasil estimasi diharapkan lebih akurat. Dalam penelitian kali ini dilakukan estimasi parameter distrubusi GG tiga parameter dengan pendekatan Maximum likelihood Estimation (MLE) untuk diterapkan pada pemodelan Angka Kelahiran Total (Total Fertility Rate-TFR), yaitu rata-rata jumlah anak yang dilahirkan oleh seorang wanita sampai dengan akhir masa reproduksinya, menurut provinsi tahun 991, 1994, 1998, dan 1999, yang diambil dari situs: http://www.bps.go.id. Pengambilan sampel dilakukan secara acak berupa dua belas propinsi yang tersebar di wilayah nusantara.. Sebelum dilakukan estimasi terlebih dahulu dilakukan goodness of fit test dengan bantuan software EasyFit 5.5 Professional untuk menentukan jenis distribusi yang paling mendekati distribusi sesungguhnya. Selanjutnya dilakukan iterasi numerik untuk mencari estimator dari distribusi keluarga Generalized Gamma yang memenuhi keriteria distribusi berdasarkan goodness of fit test tersebut dengan metode Newton melalui STIMIKA Vol. 1, No.1, Agustus 2014: 13-24

13

penghitung Excell 2003. Akhirnya dilakukan perhitungan nilai batas interval kepercayaan dan Mean Square Error (MSE) dari masing-masing estimator dan kurva pemodelan. 2 TINJAUAN PUSTAKA Distribusi Generalized Gamma pada awalnya merupakan merupakan distribusi Amoroso, yang diperkenalkan pertama kali oleh seorang ahli ekonomi asal Italia, Luigi Amoroso pada tahun 1925, dan dapat dinyatakan dengan notasi seperti pada persamaan 1.1 (Crooks, G.E., 2010). Dalam perkembangan selanjutnya distribusi Amoroso sering dikenal sebagai distribusi Generalized Gamma empat parameter seperti pada persamaan (1.1). Kemudian dikembangkan oleh Stacy (1962) dengan menghilangkan parameter lokasi  , sehingga menjadi keluarga distribusi Generalized Gamma tiga parameter atau Stacy Distribution. Pengkajian estimasi parameter distribusi Generalized Gamma telah beberapa kali dilakukan antara lain oleh H.Leon Harter (1967) dengan metode Maximum Likelihood Estimation, yang dihasikan persamaan estimasi tidak dapat diselesaikan secara eksplisit dengan perhitungan biasa, tetapi harus dengan bantuan penghitung elektronik (Harter, 1967). Kemudian dilanjutkan oleh Harold W. Hager dan Lee J. Bain (1970) dengan metode yang sama dengan pendahulunya Harter (1970), dihasilkan kesimpulan hampir sama yaitu kompleksitas perhitungan secara eksplisit yang disebabkan oleh keberadaan tiga parameter yang tidak diketahui mengakibatkan rumitnya perhitungan numerik. Secara umum, dengan dengan mengganti   1 sebagai distribusi Weibull, diperoleh hasil yang memadai dan cukup fleksibel untuk dipilih sebagai penyederhanaan perhitungan Generalized Gamma pada berbagai keadaan data yang diuji (Hager, H.W., dan Bain, L.J., 1970). Atas dasar hasil-hasil sebelumnya mulai dari Stacy dan Mihran pada 1965 hingga Prentice pada 1974, maka Huang, P dan Hwang, T. menawarkan prosedur sederhana untuk memperoleh estimator distribusi GG dengan pendekatan estimasi momen, yang secara sederhana ekspektasi untuk momon ke- m dinyatakan sebagai  m     m    m E X    

 

Estimasi Parameter Distribusi……. (Moh Rofi)

Hasilnya adalah prosedur yang dilakukan lebih efisien dibandingkan dengan metode MLE untuk sampel berukuran kecil (Huang, P dan Hwang, T., 2006). 3. SIFAT-SIFAT DISTRIBUSI GG 3.1 PDF dan CDF Distribusi GG Dimisalkan T terdistribusi generalized gamma tiga parameter, atau dinotasikan T ~ GENG  ,  ,   , maka fungsi probabilitas (PDF) dapat dinyatakan sebagai

1  x          0,   0,   0 . f x; ,  ,   

 1  x   

e

(3.1)

Sedangkan fungsi distribusi kumulatif (CDF) dapat dinyatakan sebagai   x     ,         (3.2) F x; ,  ,      

  0,   0,   0 





dengan   ˆ ,  x   adalah incomplete gamma       function (Meeker Q.W., Escobar, L.A., 1998).    Agar diperoleh nilai   ˆ ,  x   maka       menurut H.P. William (1992) di dalam HandBook on Statistical Distributions for Experimentalist (2007) dapat didekati secara numerik sebagai berikut (Walk, C., 2007).

 ˆ ,  j  = e

 x     

   x     n  0   n  1  

 

 x    

n

(3.3) 3.2 Nilai Fungsi Gamma dan Digamma serta Turunannya Pendekatan secara numerik untuk memperoleh nilai z  dapat digunakan formula Spouge yang disempurnakan oleh Lanczos yang dapat dinyatakan sebagai berikut.



z  1  z   





1

 z    1 z  2  2 e 2 1

N c   2 c0   k   k 1 z  k  

(3.4) dengan  adalah peubah bebas positif dan

N     1 .

STIMIKA Vol. 1, No.1, Agustus 2014: 13-24

14

Untuk z  0 ,   5 , dan n  6 , maka

akan diperoleh     2.10

10

, dengan c0  1 ,

dan nilai c k untuk k  1, 2,, N dapat didekati dengan notasi sebagai berikut.

ck   

 1  k    0,5k  12 e k  0,5 2 k  1! 1

memenuhi (4.1)

d ln L 1 , ..., 2   0 , j  1, ..., k d j

1 K B2 k  2 k  ln z   z  RK z   2 z k 1 2k  n 1 1     z  n    k 0 z  k  1   z     cot z  z 

L x j ,  ,  = 

   

     



n

e

n  x  i  i 1  

  

untuk x  0

dengan n  x0   x , B2 k adalah angka-angka Bernoulli yang dapat dinyatakan dengan B0  1, 1  30 , B10   3617 510 , B18



, B12 

1  30 , 691  2730 ,

43867 798 ,

B20 

B4 

1 42 , B14  76 , 174611  330 .

B6 

Jika dipilih K  10 dan x0  7,0 maka akan diperoleh akurasi yang sangat baik, 15 yakni RK  10 (Walck, C., 2007).

4. ESTIMASI MAKSIMUM LIKELIHOOD 4.1 Estimasi Parameter dengan Metode MLE (Maximum Likelihood Estimation) (Bain,

x

L.J.,

1987) Misalkan     L   f x1 , ..., xn ; ,    merupakan fungsi probabilitas bersama dari


 1 i

i 1

(4.3) ln L  n ln   nˆ ln   n ln    

1 6, 5  66

n

(3.6)

untuk 0  x  x0

B2 

(4.2)

Berdasarkan Definisi 3.1 untuk peubah acak X i ~ GG  ,  ,   dapat dicari MLE-nya dengan membentuk Fungsi Likelihood-nya dan bentuk logaritma naturalnya yang dapat dinyatakan sebagai berikut.

untuk 0  x0  x

Definisi 4.1

 pada keadaan L   maksimum, disebut dengan estimasi maksimum likelihood dari  . Dengan demikian, ˆ adalah nilai  yang

Definisi fungsi likelihood dan MLE dapat diterapkan dalam kasus jumlah parameter lebih dari satu jika  merepresentasikan suatu vektor parameter, namakan   1 , ..., k  , sehingga persamaan (4.1) dimodifikasi menjadi notasi berikut.

1 d ln z    z  =  z  dz

B16

n

 ln z  z

 2  z  dapat didekati secara numerik z 2 dengan notasi berikut

B8 

2

d ln L    0 d

dan

B1   12 ,

1

(3.5) (Ahramowitz, M., dan Irene A.S., 1965). Kemudian untuk perhitungan

X 1 , X 2 , ..., X n . Untuk suatu domain amatan yang diberikan, x , x , ..., x  , nilai ˆ dalam

1



n

n

 xi    1 ln  xi i 1

i 1

(4.4) Selanjutnya persamaan (4.4) diturunkan secara parsial, sehingga diperoleh tiga persamaan sebagai berikut (Cameron, T.A., White, K.J., 1985).

 ln L  ,  ,  xi   n  n    1  xi =    i 1

 ln L  ,  ,  xi  

(4.5)

=

n  1         ln xi  n ln   n  i 1        ln L  ,  ,  xi  =  n  n     xi ln xi   xi ln   n n i  1 i  1    ln x  n ln     i   i 1

(4.6)

(4.7)

Berdasarkan persamaan (4.5), (4.6) dan (4.7) maka dapat diperoleh MLE untuk ketiga STIMIKA Vol. 1, No.1, Agustus 2014: 13-24

15

estimator ˆ , ˆ persamaan berikut.

dan

ˆ dengan sistem

 nˆˆ ˆ n ˆ  ˆ  xi = 0 ˆ ˆ  1 i 1

< 0,

n ˆ  n ˆ    xi ln xi   xi ln ˆ  n n i 1   ˆ ln x  nˆ ln ˆ   i 1  i ˆ ˆ i 1 ˆ 

(4.10)

Dari persamaan (4.5) di atas dapat diturunkan persamaan untuk ˆ yang nilainya bergantung pada ˆ dan ˆ sebagai berikut.. 1

i 1

(4.11)



Untuk memastikan estimator yang diperoleh ini memaksimumkan fungsi log likelihood, maka dapat ditunjukkan oleh turunan kedua fungsi log likelihood yang bernilai negatif, dengan uraian sebagai berikut. n

(i) Karena diketahui

n

berlaku

 x i 1



i

 n 

n   1

, maka <

0,

 2 , ,   0 , yang berarti 2  ln L  ,  ,  xi  < 0 , , ,   0  2  2   (ii) Dari tabel 2.1 berlaku   >  2 2

    maka      2   2  ˆ    ˆ    ˆ         ˆ 2  ˆ   n  ˆ 2    2

  ,  ,   0 , sehingga  2 ln L  ,  ,  xi   2

berlaku   <    

=



  1 ,  ,   0

Meski sistem persamaan likelihood di atas tidak dapat diselesaikan secara eksplisit dan tertutup, tetapi dapat diselesaikan dengan suatu prosedur iterasi numerik (Harter, 1967, Vinod Kumar, V., Shuka, G., 2010).

(4.9)



 2



 1  ˆ   ˆ n     ln xi = 0  n ˆ ln ˆ  n  i 1   ˆ  ˆ 

n ˆ ˆ =  1  xiˆ   nˆ

 2 ln L  ,  ,  xi 

n n  n   2 2   xi ln xi    xi ln    2 xi ln xi ln   n  i1 i 1 i 1   2 

(4.8)

=0

(iii)

4.2 Beberapa Sifat Estimator Parameter yang Baik pada Distribusi Peubah Acak Kontinu Salah satu masalah mendasar dalam statistik adalah cara menentukan estimator  yang paling baik dari suatu populasi. Keriteria nilai estimator yang baik yang diperkenalkan oleh Ronald adalah sebagai berikut. 4.2.1 Estimator tak bias Definisi 4.2 (Bain, L.J., 1987) Deretan estimator ˆ n  disebut estimator tak bias secara asimtotik bagi jika memenuhi  (4.12) lim E ˆ n    ,     n

Untuk menentukan ketakbiasan ketiga estimator ˆ , ˆ dan ˆ , dapat digunakan teorema limit pusat untuk sebarang distribusi yang memiliki fungsi pembangkit momen dengan rata-rata dan varians yang berhingga. Teorema 4.1 (Bain, L.J., 1987) Jika merupakan sampel acak dari suatu distribusi dengan ratarata  dan varians  2 <  , maka limit n

0

< 0 , , ,   0

,

distribusi dari Z n 

X i 1

i

 n

n

standar. Dengan kata lain

N 0, 1 bilamana n   .

adalah normal d Zn   Z

~

Dari teorema limit pusat di atas dapat diperoleh pengertian bahwa estimator ˆ , ˆ dan

ˆ dengan mean masing-masing ˆ , ˆ dan ˆ Estimasi Parameter Distribusi……. (Moh Rofi)


16

dan varians       berdistribusi normal untuk n   . ˆ   ~ N 0, 1 , ˆ   ~ N 0, 1 ,   n n ˆ    ~ N 0, 1  n Salah satu sifat estimator yang baik adalah estimator yang memiliki sifat konvergen stokastik ke nilai parameter ketika ukuran sampel menjadi sangat besar. Dari uraian di atas dapat disimpulkan bahwa estimator ˆ , ˆ dan ˆ merupakan estimator-estimator tak bias secara asimtotik.

Teorema 4.4 (Bain, L.J., 1987) Deretan estimator  ˆ n  bagi  dikatakan konsisten berdasarkan MSE jika deretan tersebut tak bias secara asimtotik atau (4.18) lim B ˆ n ,    0 n

dan memenuhi

lim Var ˆ n   0

Berdasarkan uraian di atas untuk estimator

ˆ dengan mean  dan varians   (berlaku juga untuk estimator ˆ dan ˆ ), maka berlaku pula





Berdasarkan uraian di atas untuk estimator ˆ dengan mean  dan varians   (berlaku juga

ˆ  

untuk ˆ dan ˆ ),   berlaku

~

n



n



(4.20)

    





lim Var ˆ n ,   0

n

Bukti : (i) Akan

ditunjukkan

(4.21)

dahulu

lim Var ˆ n   0

bahwa

n

Jika dimisalkan estimator ˆ1 , ˆ2 , ,ˆn

berdistribusi normal dengan mean  dan varians   (berlaku juga untuk estimator







    

lim Var ˆn ,   0 lim Var ˆ n ,    0

n





n

N 0, 1 , maka

ˆ dan ˆ ), maka jelas berlaku

 lim P ˆn      1    lim P ˆ n       1  n    ˆ lim P  n      1  n   n 



lim B ˆ n ,   0

4.2.2 Estimator Konsisten

n



lim B ˆn ,   0 lim Bˆ n ,    0

n n

Definisi 4.3 (Bain, L.J., 1987) Misalkan ˆ n  merupakan sekuen atau deretan estimator bagi  . Estimator-estimator ini dikatakan sebagai estimator-estimator yang konsisten bagi  jika untuk setiap   0 berlaku (4.13) lim P ˆ n      1 ,   

(4.19)

n

 



n



1 lim Var ˆn = lim  ˆi   n  n n i 1

(4.14) (ii)



2

= 0.

Dari teorema 3.8 akan ditunjukkan bahwa

lim B ˆ n ,    0

n

Teorema 4.2 (Bain, L.J., 1987) Jika T adalah estimator bagi    , maka beasrnya bias adalah B ˆ n ,   = ˆ n   (4.15) dan MSE (Mean Square Error) adalah

MSE  Eˆ n   

2

(4.16) Teorema 4.3 (Bain, L.J., 1987) Jika ˆ adalah estimator bagi  , maka besarrnya MSE adalah

MSE ˆ n  = Var ˆ n   B ˆ n ,  

2

  n n1

E  2 =

 =

Var ˆn

=

2



ˆ  = E  2 





2 1 n E   ˆi     n i 1 

=





2 n 1 1 n ˆ E i      n n  1 i 1  n 1 E S2 = n

 

(4.17)



17

 2

n 1  E 2 S2 n   2 n  1 2  = n  1 = n n n  1 2 Dengan kata lain E  2 = n 2 2 B ˆn ,  = E       =



V

V  31 V32

 A11  =  A21 A  31

 



n  1 2

=



n



 =  2

Berarti lim B ˆn , = lim  n

n 

 2 n

 2 n

=0

n  

 ,  ,  





n

i 1

 

  

1   ln L   E n     (4.26)

2   2  ˆ    ˆ    ˆ         ˆ 2  ˆ    ˆ 2   

(4.22)

      

(4.27)

A13 = A31    2 1   ln L   =  E  n     =





maka n ˆ   , ˆ   , ˆ   adalah normal secara asimtotik dengan vektor mean dan 1 matriks varian kovarian adalah I dengan I dapat dinyatakan sebagai   2L   2L   2L    E 2  E     E               2L   2L  1   2L   E  2  E    I    E  n              2L   2L   2L    E          E    E   2         



1   2 ln L 

adalah estimator-estimator konsisten



(4.24)

A22 =  E  = n   2 

Teorema 4.5 (Miller, 1981) Jika Maximum likelihood estimator ˆ, ˆ , ˆ dari parameter



1

 2 A12 = A21 =  1 E   ln L n   

=

dengan I 1   adalah varian-kovarian dari parameter-parameter yang tak diketahui    ,  ,   .

A13   A23  A 33 

(4.25)

Secara pendekatan interval kepercayaan dari ketiga parameter tersebut dapat diturunkan berdasarkan distribusi asimtotik normal dari MLE ketiga parameter tersebut, yang oleh Miller (1981) diberikan notasi sebagai berikut.



A12 A22 A32

n 2 A11 =  1 E   ln2 L  =  2    2 1 1  xi   

=



V 33 

dengan

4.3 Batas Interval Kepercayaan Asimtotik Estimator dan Mean Square Error

n ˆ     N 0, I 1  

V 

V

11 12 13 I 1 = V = V21 V22 V23 

1   2 ln L E n   

n  n   n      xi    xi ln xi   xi ln    i 1  i 1  =    i 1   1  n

  

(4.28) (4.23)

Agar diperoleh batas interval kepercayaan pada masing-masing ketiga estimator, maka dapat dilakukan dengan menginverskan matriks I sebagai berikut.


A23 = A32 =  = 

1   ln L   E n    

= ln  

A33

1   ln L   E n    

1 n  ln xi n i 1

(4.29)

1   2 ln L  = =  E  n   2 


18

 

MSE ˆn MSE ˆ n  MSE ˆ

n  n   n   n     xi ln xi 2    xi ln xi ln       xi ln xi   xi ln     1  i 1 i 1  i 1    i 1      2 n

ˆ  = ˆ ˆ =

 

Bukti :

Distribusi

asimtotik MLE dari parameter    ,  ,   dapat diberikan sebagai berikut.

 ˆ    n  ˆ  ~  ˆ   

     V11 V 12 V13       N  n    , V21 V22 V23     V V      31 32 V 33 

(4.31) Jika parameter    ,  ,   diganti dengan



Karena

n  1 2 n

berlaku , ˆ ˆ =

V22 =   = V33 =   =

nˆ 2 nVˆ11 = n  1 n  1 nˆ 2 nVˆ 

=

n  1

=

n

, maka berdasarkan

Var ˆn  B ˆn , 

n  1 2



n

= =

+  



2

 2 

 n  nˆ 2  ˆ 2    +  n  1  n  1  n  1ˆ 2 ˆ =  n  1

=



 

22

Perhitungan MSE ˆn kurva pemodelan dapat dilakukan dengan menjumlah nilai selisih kuadrat fungsi distribusi kumulatif hasil estimasi dengan fungsi distribusi kumulatif hasil observasi sebagai berikut (Ley, Y., 2008).

(4.33)

nVˆ33 n  1

 Fˆ x   F x  n

MSE =

2

i 1

4.3.1 Batas Interval Kepercayaan Asimtotik Estimator Pendekatan

ˆ ˆ =

,

4.3.3 MSE Kurva Pemodelan

n  1 n  1 nˆ 2

n  1 2

n

  

 =

MSE ˆn



V11 =   =

n  1 2

ˆ  =

persamaan (4.36) untuk estimator ˆ dapat diperoleh berikut.

ˆ  ˆ , ˆ , ˆ maka diperoleh estimator Vˆ untuk V dengan notasi sebagai berikut.  Vˆ11 Vˆ 12 Vˆ13    (4.32) Vˆ = Iˆ 1 = Vˆ21 Vˆ22 Vˆ23   ˆ  ˆ ˆ  V31 V32 V 33  dan

ˆ ˆ

=

n

(4.30)

(4.35)

interval



i

(4.37)

dengan

kepercayaan

100 1  z % untuk ketiga estimator ˆ , ˆ , ˆ

i



Fˆ xi  = fungsi distribusi kumulatif hasil estimasi F xi  = fungsi distribusi kumulatif hasil

observasi

: n ˆ  Z z

n ˆ  Z z

Iˆ111 ˆ  , 2

n ˆ  Z z

1 ˆ  , Iˆ22 2

1 ˆ  Iˆ33

(4.34)

4.4

Iterasi Newton untuk Sistem Persamaan Non Linear

2

Dengan z  adalah persentil atas ke-  dari distribusi normal standar. 4.3.2 MSE Estimator ˆ , ˆ dan ˆ Sesuai dengan persamaan (3.20) dapat diperoleh nilai MSE masing-masing estimator sebagai berikut.

Jika terdapat dua fungsi non linear, f1 x, y  dan f 2 x, y  , yang namakan membentuk sistem persamaan berikut : f1 x, y  = 0 dan f 2 x, y  = 0, maka

diselesaikan

dengan

persamaan iterasi sebagai berikut. x n 1  x n  h1   y n 1  y n  h2 


dapat

(4.38)


19

dengan

Berdasarkan persamaan (4.8), (4.9), dan (4.10) maka dapat didefinisikan fungsi iterasi non linear dua variabel sebagai berikut.

 D1  h1  D   D2  h2  D  

dimana

f1 x, y  x D f 2 x, y  x

D1 

D2 

(4.39)

n ˆ  1  ˆ   ˆ n      ln xi f1 ˆ , ˆ   n ln  1  xi   n   nˆ i 1    ˆ  ˆ  i 1 (4.40)  n ˆ  xi ln xi   n  n   ˆ  ln xi f 2 ˆ , ˆ   nˆ  i1 n ˆ ˆ  i 1 xi    i1 

 

f1  x, y  y , f 2 x, y  y

f1 x, y 

f 2  x, y 

f1 x, y  y

f 2 x, y  y

f 2  x, y 

f1 x, y 

f 2 x, y  x

f1 x, y  x

 

(4.41)

,

Dan turunan parsial sebagai berikut. 2   2 ˆ    ˆ     ˆ       f1 ˆ , ˆ n  ˆ 2  ˆ     n  ˆ ˆ  ˆ 2     (3.19)

 

(Buchman J.L., dan Turner, P.R., 1992) Secara umum tahapan dan langkahlangkah estimasi dengan metode MLE dengan iterasi di atas dapat diilustrasikan dengan diagram alur pada gambar 4.1.

n

ˆ

xi ln xi n  f1 ˆ , ˆ   n i 1 n   ln xi ˆ ˆ i 1 x i

 

i 1

(4.42)

Mulai

x n 1  x n  h1   y n 1  y n  h2  Tentukan masukan awal x 0 dan y 0

Definisikan persamaan iterasi:

ˆ

xi ln xi n  ˆ f 2 ˆ ,    n i1 n   ln xi (4.43) ˆ ˆ i 1  xi

 

Definisikan fungsi iterasi f dan bentuk  D1 ,  D2 h1  h2  D D

n

i 1

2 n  n ˆ ˆ  n ˆ      xi ln xi 2  xi    xi ln xi      i 1 i 1  i 1    f 2 ˆ , ˆ n   2  nˆ    2 ˆ ˆ  n ˆ    x  i     i 1   

 

(4.44) xn 1  xn ?  yn 1  yn ? 

tidak

xn 1  xn ?  yn 1  yn ?  ya

Selesai

Dengan mengacu pada persamaan (4.38) dan (4.39) maka diperoleh persamaan iterasi Newton secara simultan sebagai berikut.  ˆ n 1  ˆ n  h1    ˆ n 1  ˆ n  h2  

(4.45)

Gambar 3.1 Algoritma metode Newton untuk dua persamaan non linear

dengan



20

  f ˆ , ˆ  f1 ˆ , ˆ 1

h1 

ˆ

 

f1 ˆ , ˆ ˆ f 2 ˆ , ˆ ˆ

 

  f ˆ , ˆ  f 2 ˆ , ˆ 2

h2 

ˆ

 

f 1 ˆ , ˆ ˆ f 2 ˆ , ˆ ˆ

 

4,17; 3,20; 2,85; 2,00; 3,94; 2,25;

  f ˆ , ˆ  f 2 ˆ , ˆ 2

ˆ

 

f1 ˆ , ˆ ˆ f 2 ˆ , ˆ ˆ

 

  f ˆ , ˆ  2

ˆ

 

f1 ˆ , ˆ ˆ f ˆ , ˆ

 

ˆ

Sedangkan untuk ˆ nilainya bergantung pada ˆ dan ˆ sebagaimana dinyatakan pada persamaan (4.11) yakni 1 ˆ   ˆ

 ˆ   1  xi  .  nˆ i 1  n

5

2,87; 2,78; 2,71; 3,17; 2,61; 2,55; 1,79; 2,00; 2,00; 3,64; 3,12; 3,05; 2,33; 2,58; 2,53; 2,92; 2,70; 2,65

5.2. Hasil Fitting Distribusi dengan EasyFit 5.5 Professional dan Hasil Estimasi dengan Iterasi Newton

f1 ˆ , ˆ

2

3,88; 3,08; 3,00; 3,43; 3,45; 2,74; 2,66; 3,00; 2,77; 2,41; 2,37; 2,04; 2,22; 2,02; 2,02; 3,82; 3,34; 2,92; 2,81; 2,70; 2,62; 2,38; 2,36; 3,01;

STUDI KASUS PEMODELAN ANGKA KELAHIRAN DI INDONESIA

5.1 Data Angka Kelahiran Total (Total Fertility Rate-TFR) Beberapa Propinsi Hasil Sensus Badan Pusat Statistik

Untuk menentukan jenis distribusi yang paling mendekati distribusi sampel hasil observasi di atas, dilakukan uji goodness of fit dengan software EasyFit 5.5 Professional yang diperoleh hasil bahwa distribusi Generalized gamma, Weibull, Gamma dan Exponential memenuhi keriteria distribusi sampel yang dimaksud berdasarkan uji Kolmogorov-Smirnov, Anderson-Darling dan Chi-Squared untuk taraf signifikansi  sebesar 0,2, 0,1, 0,05, 0,02 dan 0,01. Selanjutnya dilakukan iterasi Newton untuk distribusi yang memenuhi memenuhi keriteria distribusi sampel. Dipilih distribusi Generalized gamma dan Weibull sebagai dua distribusi yang memenuhi berdasarkan fitting distribusi lewat uji Kolmogorov-Smirnov, Anderson-Darling dan Chi-Squared untuk taraf signifikansi  sebesar 0,2; 0,1; 0,05; 0,02; dan 0,01, dengan software EasyFit 5.5 Professional. Dengan demikian estimasi parameter yang dilakukan adalah estimasi terhadap parameter distribusi GG dan distribusi Weibull yang merupakan salah satu distribusi keluarga GG pada kasus khusus ( parameter   1 ). Hasil iterasi Newton untuk memperoleh estimator ˆ  ˆ dan ˆ pada distribusi GG dan

Untuk memperoleh estimator parameter model sebaran atau distribusi Angka Kelahiran Total (Total Fertility Rate-TFR) menurut provinsi tahun 991, 1994, 1998, dan 1999, yang diambil dari situs: http://www.bps.go.id., yang selengkapnya dapat dilihat pada Lampiran 1, dilakukan pengambilan sampel secara acak berupa dua belas propinsi yang tersebar di belahan wilayah nusantara, yang dapat disajikan sebagai berikut.

estimator ˆ dan ˆ pada distribusi Weibull dengan penghitung Excell 2003 dapat disajikan pada table 5.1 berikut.



21

Tabel 5.1 Hasil iterasi Newton untuk pencarian estimator distribusi GG dengan masukan awal ˆ 0  2 dan

ˆ0  2 Iterasi keˆ

n

ˆ

ˆ

h1

h2

5,0067 dan 1,4326, yang ditunjukkan pada tabel 5.1. Sedangkan hasil iterasi untuk distribusi Weibull yang merupakan distribusi keluarga GG pada kasus khusus ( parameter   1 ) sebagaimana ditunjukkan pada tabel 5.2 terlihat bahwa estimator ˆ dan ˆ masing-masing konvergen pada kisaran 5,3319 dan 3,0362.

0

5,0000

5,0000

2,1882

0,0053

-3,5724

1

5,0053

1,4276

0,9157

0,0006

0,6364

2

5,0059

2,0640

1,3121

0,0001

0,2317

5.3 Batas Interval Kepercayaan Asimtotik Estimator dan MSE Hasil Pemodelan Distribusi Generalized Gamma Untuk

distribusi

Generalized

Gamma

3

5,0060

2,2957

1,4258

0,0001

0,0152

diperoleh estimator Vˆ untuk V berdasarkan

4

5,0061

2,3109

1,4328

0,0001

0,0000

persamaan (4.25) s/d (4.30) diperoleh hasil sebagai berikut.

5

5,0061

2,3109

1,4328

0,0001

0,0000

6

5,0062

2,3109

1,4328

0,0001

0,0000

7

5,0062

2,3109

1,4327

0,0001

0,0000

8

5,0063

2,3109

1,4327

0,0001

0,0000

9

5,0063

2,3109

1,4327

0,0001

0,0000

10

5,0064

2,3108

1,4327

0,0001

0,0000

11

5,0065

2,3108

1,4327

0,0001

0,0000

12

5,0065

2,3108

1,4327

0,0001

0,0000

13

5,0066

2,3108

1,4327

0,0001

0,0000

Distribusi Weibull

14

5,0066

2,3108

1,4327

0,0001

0,0000

15

5,0067

2,3108

1,4326

0,0001

0,0000

Selanjutnya hasil di atas disubstitusikan pada persamaan (3.65) sehingga diperoleh

16

5,0067

2,3108

1,4326

Tabel 5.2 Hasil iterasi Newton untuk pencarian estimator distribusi Weibull dengan masukan awal

ˆ0  1 Iterasi ke- n





f ' ˆ

1

estimator Vˆ untuk V sebagai berikut.

 Vˆ Vˆ 12   Iˆ 1 = Vˆ =  11 ˆ ˆ  V V 22   21  0.0016 0.0146   =   0.0146 1,1783   709,23  8,78   =    8,78 0,96 

 

f ˆ f ' ˆ

1

ˆ

ˆ

0

4,0000

2,9667

5,0099 -4,5957

-1,0901

1

5,0901

3,0238

0,7753 -3,3070

-0,2344

2

5,3245

3,0358

0,0230 -3,1144

-0,0074

Berdasarkan pendekatan interval 100 1   % kepercayaan untuk ketiga

3

5,3319

3,0362

0,0000 -3,1086

0,0000

estimator ˆ , ˆ , ˆ dengan   0,05 yang dari

4

5,3319

3,0362

Dari

hasil

f ˆ

 0,0015 0,0393 0,0130    1 ˆ ˆ =  0,0393 1,7312 0,5343  V = I  0,0130 0.5343 1,1260     1.656,15 - 37,1564 1,4890    - 0,2877  =  - 37,1564 1,5104  1,4890 - 0,2877 1,0418  

5.3.1 Batas Interval Kepercayaan Asimtotik Estimator





tabel distribusi normal diperoleh z  1,96 , 2

iterasi

untuk

distribusi

Generalized Gamma diperoleh ˆ , ˆ dan ˆ

dan mengacu pada persamaan (3.60) dan (3.66), maka dengan penghitung excell 2003 diperoleh hasil yang dapat disajikan pada tabel 5.3 berikut.

masing-masing konvergen pada kisaran 5,0067, Estimasi Parameter Distribusi……. (Moh Rofi)


22

Tabel 5.3 Batas interval kepercayaan asimtotik estimator distribusi pemodelan 1 ˆ  Iˆ22 Iˆ111 ˆ  Distri ˆ ˆ   z

busi

2

  z

n

2

ˆ  z

n

4 - 5 1,0000 1,0000



2

1 ˆ Iˆ33  n

1,4326  0,0307

5,0067  0.0389

2,3108  0,1837

We ibu ll

3,0362  0,1723

1

5,3319  1,1887





ketiga

estimator

ˆ , ˆ , ˆ yang diketahui dan persamaan (3.71),

ˆ maupun ˆ



ˆ ˆ ˆ

2,3108

MSE 0,0017 0,0027

Weibull estimator 3,0362 1

MSE 0,0535 -

0,0608

5,3319

2,5482

lainnya yaitu ˆ maupun ˆ . Disamping itu hasil hitung MSE seluruh estimator dan kurva pemodelan distribusi GG tiga parameter lebih kecil dibandingkan distribusi Weibull dua parameter. Hal tersebut menunjukkan bahwa distribusi Generalized Gamma tiga parameter dapat dinyatakan sebagai model distribusi yang lebih baik dibandingkan distribusi Weibull dua parameter untuk ukuran sampel 48.

Sedangkan untuk MSE kurva pemodelan dapat didekati dengan persamaan (3.72). Untuk kedua distribusi GG dan distribusi Weibull, ringkasan hasil perhitungan MSE kurva di atas dengan penghitung Excell dapat disajikan pada tabel 5.5 berikut.

6. KESIMPULAN DAN SARAN 6.1 Kesimpulan

Tabel 5.5 MSE kurva hasil pemodelan untuk distribusi Weibull dan GG Inter val

F  xi 

GG Fˆ xi 

Weibull

Fˆ x   F x 

2

i

i





2 Fˆ xi  Fˆ xi   F xi 

0 - 1 0,0000 0,0001

0,0000

0,0027

0,0000

1 - 2 0,0625 0,0680

0,0001

0,1023

0,0048

2 - 3 0,6875 0,6440

0,0568

0,6086

0,1867

3 - 4 0,9792 0,9809

0,0000

0,9871

0,0009


menunjukkan bahwa nilai

parameter bentuk ˆ memiliki simpangan yang relatif lebih besar dibandingkan dua parameter

Tabel 5.4 Estimator ˆ , ˆ , ˆ hasil pemodelan untuk distribusi GG, Weibull dan Gamma GG estimator 1,4326 5,0067

0,1924

estimator ˆ baik pada distribusi GG maupun distribusi Weibull dibandingkan MSE estimator

maka diperoleh MSE masing-masing estimator untuk distribusi GG dan Weibull. Hasil perhitungan dengan program excell 2003 diperoleh hasil sebagaimana disajikan pada tabel 5.4 berikut.



0,0000

Dari tabel 5.4 dan 5.5 terlihat bahwa estimasi parameter distribusi Generalized Gamma tiga parameter diperoleh hasil hitung Mean Square Error (MSE) yang lebih kecil dibandingkan distribusi Weibull dua parameter untuk sampel berukuran 48. Hal ini berarti estimator distribusi Generalized Gamma tiga parameter sebagai model distribusi angka kelahiran di Indonesia memiliki galat yang relatif lebih kecil dibandingkan Weibull dua parameter untuk sampel berukuran 48. Lebih besarnya hasil hitung MSE

5.3.2 Mean Square Error Estimator dan Kurva Pemodelan nilai

1,0000

0,0569

GG

Berdasarkan

0,0000

Dari hasil penelitian di atas dapat ditarik beberapa kesimpulan, antara lain : 1. Estimasi parameter distribusi Generalized Gamma dapat dilakukan dengan metode MLE melalui Iterasi Newton dengan penghitung Excell 2003. 2. Hasil studi kasus berupa pemodelan angka kelahiran di Indonesia dalam kurun waktu tahun 991 s/d 1999 dengan ukuran sampel 48, menunjukkan bahwa distribusi Generalized Gamma tiga parameter, dapat dipilih sebagai model yang lebih baik dibandingkan distribusi Weibull yang merupakan salah satu distribusi pada kasus khusus dari distribusi keluarga Generalized Gamma berdasarkan Mean Square Error (MSE) masing-masing estimator dan kurva pemodelan yang diperoleh. STIMIKA Vol. 1, No.1, Agustus 2014: 13-24

23

3. Hasil studi kasus menunjukkan bahwa distribusi Generalized Gamma tiga parameter, dapat dipilih sebagai model distribusi angka angka kelahiran (fertilitas) total (Total Fertility Rate) di Indonesia menurut provinsi dalam kurun waktu tahun 991 s/d 1999 dengan fungsi probabilitas : 

x



   x  f x;1,4326, 1, 2,3108   e  1,4326 .   1,4326  dengan x menyatakan angka kelahiran total (Total Fertility Rate) atau rata-rata jumlah anak yang dilahirkan oleh seorang wanita sampai dengan akhir masa reproduksinya di suatu propinsi di Indonesia. 10,5695

6.2 Saran Agar dilakukan penelitian lebih lanjut untuk kurun waktu dan obyek studi kasus yang berbeda, serta dilakukan perancangan program perhitungan iterasi yang lebih efisien dan fleksibel untuk berbagai distribusi probabilitas. DAFTAR PUSTAKA Ahramowitz, M., dan Irene A.S. 1965, Handbook of Mathematical Functions – with Formulas, Graphs, and Mathematical Tables, Dover Publications, Inc., New York. Bhattacharya, P., 2001, A Study on Weibull Distribution For Estimating the Parameters, Journal of Applied Qantitative Methods, No.2, Vol.5, hal.234-241. Bain, L.J. and M. Engelhardt, 1987, Introduction to Probability and Mathematical Statistics, Duxbury Press, Boston, MA, California Brian P. F., Saul A.T., dan William T.V., 1986, Numerical Recipes (The Art of Scientific Computing), Cambridge University Press, California. Buchanan J.L. and P.T. Turner, 1992, Numerical Methods and Analysis, Edisi internasional, McGraw-Hill, Inc. California. Crooks, G.E., 2010, The Amoroso Distribution, Physical Bioscience, No.003, Vol.6, hal.1-27. DeGroot, M.H., 1986, Probability and Statistics, Edisi ke-2, Addison-Wesley Publishing Company, Inc., California. Evans, M., Hastings, N., dan B. Peacock, 2000, Statistical Distributions, Edisi ke3, John Wiley & Sons, Inc., New York.


Govindarajulu, Zakkula, 1999, Elements of Sampling Theory and Methods, PrenticeHall, New Jersey. Gupta, R.D., dan Kundu, D., 1999, Generalized Exponential Distributions, Austral. & New Zealand J. Statist. No.2, Vol. 41, hal.173– 188 Huang, P.H., dan Hwang, T.Y., 2006, On New Moment Estimation of Parameters of The Generalized Gamma Distribution Using It’s Characterization, Taiwanese Journal of Mathematics, No.4, Vol.10, hal.10831093. Kumar, V., dan Shukla, G., 2010, Maximum Likelihood Estimation in Generalized Gamma Type Model, Journal of Reliability and Statistical Studies, No.1, Vol.3, hal.43-51. Larsen, R.J., Marx, M.L., 2000, An Introduction to Mathematical Statistics and Its Applications., Edisi ke-4, Pearson, New Jersey. Lawless, J.F, 1980, Inference in the Generalized Gamma and Log Gamma Distributions. Journal of Technometrics, No.3, Vol.22, hal.159 Layman O.R., 2001, An Introduction Statistical Methods and Data Analysis, Edisi 4, Thomson Learning, Duxbury Ley, Y., 2008, Evaluation of three methods for estimating the Weibull distribution parameters of Chinese pine (Pinus tabulaeformis), Journal of Forest Science, No.54, Vol.12, hal. 566–571 Meeker Q.W., Escobar, L.A., 1998, Statistical Methods for Reliability Data, Edisi ke1, Department of Experimental Statistics Louisiana State University A Wiley-Interscience Publication John Wiley & Sons, Inc. New York . Miller , Jr. R. G., 1981, Survival Analysis, John Wiley, New York Olver, W.J.O., 2010, NIST Handbook of Mathematical Functions, Edisis ke-1, Cambridge University Press, New York. Ramachandran, K.M., dan Tsokos, C.P., 2009, Mathematical Statistics with Applications, Academic Press, California. Sahoo, P., 2003, Probability and Mathematical Statistics, Department of Mathematics University of Louisville, Louisville. Walck, C., 2007, Hand-Book on Statistical Distributions for Experimentalists, Particle Physics Group Fysikum University of Stockholm, STIMIKA Vol. 1, No.1, Agustus 2014: 13-24

24

ITERASI NEWTON UNTUK MENGESTIMASI PARAMETER DISTRIBUSI GENERALIZED GAMMA

Recommend Documents