ITERASI NEWTON UNTUK MENGESTIMASI PARAMETER DISTRIBUSI GENERALIZED GAMMA Moh Rofi 1 STIMIK AKI PATI JL. Kamandowo No 13 Pati E-mail :
[email protected]
Abstract In this research, we discuss about finding estimators of three parameters of Generalized Gamma family distribution with Maximum Likelihood Estimation Method. Newton method is selected to calculate numerically for finding the estimators. The estimators of three distributions, Weibull, Gamma and Exponential distributions as the special case of three parameters of generalized gamma family distribution also were found, including Confidence Intervals Bound and Mean Square Error (MSE) value of estimators. The case study which was implementatied is modelling Total Fertility Rate in Indonesian with sample size 48, based on result of goodness of fit test by EasyFit 5.5 Professional software, both Generalized Gamma and Weibull distributions can be used to modelling sample distribution. It is conclused that Generalized Gamma distribution three parameters is bether than Weibull distribution that is special case form of generalized gamma family distribution, based on MSE of the estimators and curve fit. Keywords: Generalized Gamma distribution, Maximum Likelihood Estimation, Newton iteration. 1 PENDAHULUAN Dalam pemodelan data hidup telah dikenal distribusi Generalized Gamma (GG) yang memiliki bermacam-macam distribusi pada kasus khusus, antara lain Weibull, Gamma, Exponential, Erlang, Chi-square, Raylaigh. Karena dapat terbentuk banyak distribusi pada kasus khusus tersebut, maka distribusi GG dianggap sebagai salah satu keluarga distribusi yang memiliki fleksibilitas sangat baik. Distribusi GG memiliki tiga parameter utama, yakni dua parameter bentuk ( dan ), serta satu pararmeter skala ( ). Fungsi probabilitas distribusi GG tiga parameter dapat dinyatakan sebagai berikut (Crooks, G.E., 2010).
1 x f x , , = 0, 0, 0
1
e
x
,
Distribusi keluarga GG diharapkan dapat menjadi alternatif yang tepat untuk pemodelan data hidup dan data yang menyerupai data hidup Estimasi Parameter Distribusi……. (Moh Rofi)
dari suatu populasi, sehingga hasil estimasi diharapkan lebih akurat. Dalam penelitian kali ini dilakukan estimasi parameter distrubusi GG tiga parameter dengan pendekatan Maximum likelihood Estimation (MLE) untuk diterapkan pada pemodelan Angka Kelahiran Total (Total Fertility Rate-TFR), yaitu rata-rata jumlah anak yang dilahirkan oleh seorang wanita sampai dengan akhir masa reproduksinya, menurut provinsi tahun 991, 1994, 1998, dan 1999, yang diambil dari situs: http://www.bps.go.id. Pengambilan sampel dilakukan secara acak berupa dua belas propinsi yang tersebar di wilayah nusantara.. Sebelum dilakukan estimasi terlebih dahulu dilakukan goodness of fit test dengan bantuan software EasyFit 5.5 Professional untuk menentukan jenis distribusi yang paling mendekati distribusi sesungguhnya. Selanjutnya dilakukan iterasi numerik untuk mencari estimator dari distribusi keluarga Generalized Gamma yang memenuhi keriteria distribusi berdasarkan goodness of fit test tersebut dengan metode Newton melalui STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
13
penghitung Excell 2003. Akhirnya dilakukan perhitungan nilai batas interval kepercayaan dan Mean Square Error (MSE) dari masing-masing estimator dan kurva pemodelan. 2 TINJAUAN PUSTAKA Distribusi Generalized Gamma pada awalnya merupakan merupakan distribusi Amoroso, yang diperkenalkan pertama kali oleh seorang ahli ekonomi asal Italia, Luigi Amoroso pada tahun 1925, dan dapat dinyatakan dengan notasi seperti pada persamaan 1.1 (Crooks, G.E., 2010). Dalam perkembangan selanjutnya distribusi Amoroso sering dikenal sebagai distribusi Generalized Gamma empat parameter seperti pada persamaan (1.1). Kemudian dikembangkan oleh Stacy (1962) dengan menghilangkan parameter lokasi , sehingga menjadi keluarga distribusi Generalized Gamma tiga parameter atau Stacy Distribution. Pengkajian estimasi parameter distribusi Generalized Gamma telah beberapa kali dilakukan antara lain oleh H.Leon Harter (1967) dengan metode Maximum Likelihood Estimation, yang dihasikan persamaan estimasi tidak dapat diselesaikan secara eksplisit dengan perhitungan biasa, tetapi harus dengan bantuan penghitung elektronik (Harter, 1967). Kemudian dilanjutkan oleh Harold W. Hager dan Lee J. Bain (1970) dengan metode yang sama dengan pendahulunya Harter (1970), dihasilkan kesimpulan hampir sama yaitu kompleksitas perhitungan secara eksplisit yang disebabkan oleh keberadaan tiga parameter yang tidak diketahui mengakibatkan rumitnya perhitungan numerik. Secara umum, dengan dengan mengganti 1 sebagai distribusi Weibull, diperoleh hasil yang memadai dan cukup fleksibel untuk dipilih sebagai penyederhanaan perhitungan Generalized Gamma pada berbagai keadaan data yang diuji (Hager, H.W., dan Bain, L.J., 1970). Atas dasar hasil-hasil sebelumnya mulai dari Stacy dan Mihran pada 1965 hingga Prentice pada 1974, maka Huang, P dan Hwang, T. menawarkan prosedur sederhana untuk memperoleh estimator distribusi GG dengan pendekatan estimasi momen, yang secara sederhana ekspektasi untuk momon ke- m dinyatakan sebagai m m m E X
Estimasi Parameter Distribusi……. (Moh Rofi)
Hasilnya adalah prosedur yang dilakukan lebih efisien dibandingkan dengan metode MLE untuk sampel berukuran kecil (Huang, P dan Hwang, T., 2006). 3. SIFAT-SIFAT DISTRIBUSI GG 3.1 PDF dan CDF Distribusi GG Dimisalkan T terdistribusi generalized gamma tiga parameter, atau dinotasikan T ~ GENG , , , maka fungsi probabilitas (PDF) dapat dinyatakan sebagai
1 x 0, 0, 0 . f x; , ,
1 x
e
(3.1)
Sedangkan fungsi distribusi kumulatif (CDF) dapat dinyatakan sebagai x , (3.2) F x; , ,
0, 0, 0
dengan ˆ , x adalah incomplete gamma function (Meeker Q.W., Escobar, L.A., 1998). Agar diperoleh nilai ˆ , x maka menurut H.P. William (1992) di dalam HandBook on Statistical Distributions for Experimentalist (2007) dapat didekati secara numerik sebagai berikut (Walk, C., 2007).
ˆ , j = e
x
x n 0 n 1
x
n
(3.3) 3.2 Nilai Fungsi Gamma dan Digamma serta Turunannya Pendekatan secara numerik untuk memperoleh nilai z dapat digunakan formula Spouge yang disempurnakan oleh Lanczos yang dapat dinyatakan sebagai berikut.
z 1 z
1
z 1 z 2 2 e 2 1
N c 2 c0 k k 1 z k
(3.4) dengan adalah peubah bebas positif dan
N 1 .
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
14
Untuk z 0 , 5 , dan n 6 , maka
akan diperoleh 2.10
10
, dengan c0 1 ,
dan nilai c k untuk k 1, 2,, N dapat didekati dengan notasi sebagai berikut.
ck
1 k 0,5k 12 e k 0,5 2 k 1! 1
memenuhi (4.1)
d ln L 1 , ..., 2 0 , j 1, ..., k d j
1 K B2 k 2 k ln z z RK z 2 z k 1 2k n 1 1 z n k 0 z k 1 z cot z z
L x j , , =
n
e
n x i i 1
untuk x 0
dengan n x0 x , B2 k adalah angka-angka Bernoulli yang dapat dinyatakan dengan B0 1, 1 30 , B10 3617 510 , B18
, B12
1 30 , 691 2730 ,
43867 798 ,
B20
B4
1 42 , B14 76 , 174611 330 .
B6
Jika dipilih K 10 dan x0 7,0 maka akan diperoleh akurasi yang sangat baik, 15 yakni RK 10 (Walck, C., 2007).
4. ESTIMASI MAKSIMUM LIKELIHOOD 4.1 Estimasi Parameter dengan Metode MLE (Maximum Likelihood Estimation) (Bain,
x
L.J.,
1987) Misalkan L f x1 , ..., xn ; , merupakan fungsi probabilitas bersama dari
Estimasi Parameter Distribusi……. (Moh Rofi)
1 i
i 1
(4.3) ln L n ln nˆ ln n ln
1 6, 5 66
n
(3.6)
untuk 0 x x0
B2
(4.2)
Berdasarkan Definisi 3.1 untuk peubah acak X i ~ GG , , dapat dicari MLE-nya dengan membentuk Fungsi Likelihood-nya dan bentuk logaritma naturalnya yang dapat dinyatakan sebagai berikut.
untuk 0 x0 x
Definisi 4.1
pada keadaan L maksimum, disebut dengan estimasi maksimum likelihood dari . Dengan demikian, ˆ adalah nilai yang
Definisi fungsi likelihood dan MLE dapat diterapkan dalam kasus jumlah parameter lebih dari satu jika merepresentasikan suatu vektor parameter, namakan 1 , ..., k , sehingga persamaan (4.1) dimodifikasi menjadi notasi berikut.
1 d ln z z = z dz
B16
n
ln z z
2 z dapat didekati secara numerik z 2 dengan notasi berikut
B8
2
d ln L 0 d
dan
B1 12 ,
1
(3.5) (Ahramowitz, M., dan Irene A.S., 1965). Kemudian untuk perhitungan
X 1 , X 2 , ..., X n . Untuk suatu domain amatan yang diberikan, x , x , ..., x , nilai ˆ dalam
1
n
n
xi 1 ln xi i 1
i 1
(4.4) Selanjutnya persamaan (4.4) diturunkan secara parsial, sehingga diperoleh tiga persamaan sebagai berikut (Cameron, T.A., White, K.J., 1985).
ln L , , xi n n 1 xi = i 1
ln L , , xi
(4.5)
=
n 1 ln xi n ln n i 1 ln L , , xi = n n xi ln xi xi ln n n i 1 i 1 ln x n ln i i 1
(4.6)
(4.7)
Berdasarkan persamaan (4.5), (4.6) dan (4.7) maka dapat diperoleh MLE untuk ketiga STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
15
estimator ˆ , ˆ persamaan berikut.
dan
ˆ dengan sistem
nˆˆ ˆ n ˆ ˆ xi = 0 ˆ ˆ 1 i 1
< 0,
n ˆ n ˆ xi ln xi xi ln ˆ n n i 1 ˆ ln x nˆ ln ˆ i 1 i ˆ ˆ i 1 ˆ
(4.10)
Dari persamaan (4.5) di atas dapat diturunkan persamaan untuk ˆ yang nilainya bergantung pada ˆ dan ˆ sebagai berikut.. 1
i 1
(4.11)
Untuk memastikan estimator yang diperoleh ini memaksimumkan fungsi log likelihood, maka dapat ditunjukkan oleh turunan kedua fungsi log likelihood yang bernilai negatif, dengan uraian sebagai berikut. n
(i) Karena diketahui
n
berlaku
x i 1
i
n
n 1
, maka <
0,
2 , , 0 , yang berarti 2 ln L , , xi < 0 , , , 0 2 2 (ii) Dari tabel 2.1 berlaku > 2 2
maka 2 2 ˆ ˆ ˆ ˆ 2 ˆ n ˆ 2 2
, , 0 , sehingga 2 ln L , , xi 2
berlaku <
=
1 , , 0
Meski sistem persamaan likelihood di atas tidak dapat diselesaikan secara eksplisit dan tertutup, tetapi dapat diselesaikan dengan suatu prosedur iterasi numerik (Harter, 1967, Vinod Kumar, V., Shuka, G., 2010).
(4.9)
2
1 ˆ ˆ n ln xi = 0 n ˆ ln ˆ n i 1 ˆ ˆ
n ˆ ˆ = 1 xiˆ nˆ
2 ln L , , xi
n n n 2 2 xi ln xi xi ln 2 xi ln xi ln n i1 i 1 i 1 2
(4.8)
=0
(iii)
4.2 Beberapa Sifat Estimator Parameter yang Baik pada Distribusi Peubah Acak Kontinu Salah satu masalah mendasar dalam statistik adalah cara menentukan estimator yang paling baik dari suatu populasi. Keriteria nilai estimator yang baik yang diperkenalkan oleh Ronald adalah sebagai berikut. 4.2.1 Estimator tak bias Definisi 4.2 (Bain, L.J., 1987) Deretan estimator ˆ n disebut estimator tak bias secara asimtotik bagi jika memenuhi (4.12) lim E ˆ n , n
Untuk menentukan ketakbiasan ketiga estimator ˆ , ˆ dan ˆ , dapat digunakan teorema limit pusat untuk sebarang distribusi yang memiliki fungsi pembangkit momen dengan rata-rata dan varians yang berhingga. Teorema 4.1 (Bain, L.J., 1987) Jika merupakan sampel acak dari suatu distribusi dengan ratarata dan varians 2 < , maka limit n
0
< 0 , , , 0
,
distribusi dari Z n
X i 1
i
n
n
standar. Dengan kata lain
N 0, 1 bilamana n .
adalah normal d Zn Z
~
Dari teorema limit pusat di atas dapat diperoleh pengertian bahwa estimator ˆ , ˆ dan
ˆ dengan mean masing-masing ˆ , ˆ dan ˆ Estimasi Parameter Distribusi……. (Moh Rofi)
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
16
dan varians berdistribusi normal untuk n . ˆ ~ N 0, 1 , ˆ ~ N 0, 1 , n n ˆ ~ N 0, 1 n Salah satu sifat estimator yang baik adalah estimator yang memiliki sifat konvergen stokastik ke nilai parameter ketika ukuran sampel menjadi sangat besar. Dari uraian di atas dapat disimpulkan bahwa estimator ˆ , ˆ dan ˆ merupakan estimator-estimator tak bias secara asimtotik.
Teorema 4.4 (Bain, L.J., 1987) Deretan estimator ˆ n bagi dikatakan konsisten berdasarkan MSE jika deretan tersebut tak bias secara asimtotik atau (4.18) lim B ˆ n , 0 n
dan memenuhi
lim Var ˆ n 0
Berdasarkan uraian di atas untuk estimator
ˆ dengan mean dan varians (berlaku juga untuk estimator ˆ dan ˆ ), maka berlaku pula
Berdasarkan uraian di atas untuk estimator ˆ dengan mean dan varians (berlaku juga
ˆ
untuk ˆ dan ˆ ), berlaku
~
n
n
(4.20)
lim Var ˆ n , 0
n
Bukti : (i) Akan
ditunjukkan
(4.21)
dahulu
lim Var ˆ n 0
bahwa
n
Jika dimisalkan estimator ˆ1 , ˆ2 , ,ˆn
berdistribusi normal dengan mean dan varians (berlaku juga untuk estimator
lim Var ˆn , 0 lim Var ˆ n , 0
n
n
N 0, 1 , maka
ˆ dan ˆ ), maka jelas berlaku
lim P ˆn 1 lim P ˆ n 1 n ˆ lim P n 1 n n
lim B ˆ n , 0
4.2.2 Estimator Konsisten
n
lim B ˆn , 0 lim Bˆ n , 0
n n
Definisi 4.3 (Bain, L.J., 1987) Misalkan ˆ n merupakan sekuen atau deretan estimator bagi . Estimator-estimator ini dikatakan sebagai estimator-estimator yang konsisten bagi jika untuk setiap 0 berlaku (4.13) lim P ˆ n 1 ,
(4.19)
n
n
1 lim Var ˆn = lim ˆi n n n i 1
(4.14) (ii)
2
= 0.
Dari teorema 3.8 akan ditunjukkan bahwa
lim B ˆ n , 0
n
Teorema 4.2 (Bain, L.J., 1987) Jika T adalah estimator bagi , maka beasrnya bias adalah B ˆ n , = ˆ n (4.15) dan MSE (Mean Square Error) adalah
MSE Eˆ n
2
(4.16) Teorema 4.3 (Bain, L.J., 1987) Jika ˆ adalah estimator bagi , maka besarrnya MSE adalah
MSE ˆ n = Var ˆ n B ˆ n ,
2
n n1
E 2 =
=
Var ˆn
=
2
ˆ = E 2
2 1 n E ˆi n i 1
=
2 n 1 1 n ˆ E i n n 1 i 1 n 1 E S2 = n
(4.17)
Estimasi Parameter Distribusi……. (Moh Rofi)
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
17
2
n 1 E 2 S2 n 2 n 1 2 = n 1 = n n n 1 2 Dengan kata lain E 2 = n 2 2 B ˆn , = E =
V
V 31 V32
A11 = A21 A 31
n 1 2
=
n
= 2
Berarti lim B ˆn , = lim n
n
2 n
2 n
=0
n
, ,
n
i 1
1 ln L E n (4.26)
2 2 ˆ ˆ ˆ ˆ 2 ˆ ˆ 2
(4.22)
(4.27)
A13 = A31 2 1 ln L = E n =
maka n ˆ , ˆ , ˆ adalah normal secara asimtotik dengan vektor mean dan 1 matriks varian kovarian adalah I dengan I dapat dinyatakan sebagai 2L 2L 2L E 2 E E 2L 2L 1 2L E 2 E I E n 2L 2L 2L E E E 2
1 2 ln L
adalah estimator-estimator konsisten
(4.24)
A22 = E = n 2
Teorema 4.5 (Miller, 1981) Jika Maximum likelihood estimator ˆ, ˆ , ˆ dari parameter
1
2 A12 = A21 = 1 E ln L n
=
dengan I 1 adalah varian-kovarian dari parameter-parameter yang tak diketahui , , .
A13 A23 A 33
(4.25)
Secara pendekatan interval kepercayaan dari ketiga parameter tersebut dapat diturunkan berdasarkan distribusi asimtotik normal dari MLE ketiga parameter tersebut, yang oleh Miller (1981) diberikan notasi sebagai berikut.
A12 A22 A32
n 2 A11 = 1 E ln2 L = 2 2 1 1 xi
=
V 33
dengan
4.3 Batas Interval Kepercayaan Asimtotik Estimator dan Mean Square Error
n ˆ N 0, I 1
V
V
11 12 13 I 1 = V = V21 V22 V23
1 2 ln L E n
n n n xi xi ln xi xi ln i 1 i 1 = i 1 1 n
(4.28) (4.23)
Agar diperoleh batas interval kepercayaan pada masing-masing ketiga estimator, maka dapat dilakukan dengan menginverskan matriks I sebagai berikut.
Estimasi Parameter Distribusi……. (Moh Rofi)
A23 = A32 = =
1 ln L E n
= ln
A33
1 ln L E n
1 n ln xi n i 1
(4.29)
1 2 ln L = = E n 2
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
18
MSE ˆn MSE ˆ n MSE ˆ
n n n n xi ln xi 2 xi ln xi ln xi ln xi xi ln 1 i 1 i 1 i 1 i 1 2 n
ˆ = ˆ ˆ =
Bukti :
Distribusi
asimtotik MLE dari parameter , , dapat diberikan sebagai berikut.
ˆ n ˆ ~ ˆ
V11 V 12 V13 N n , V21 V22 V23 V V 31 32 V 33
(4.31) Jika parameter , , diganti dengan
Karena
n 1 2 n
berlaku , ˆ ˆ =
V22 = = V33 = =
nˆ 2 nVˆ11 = n 1 n 1 nˆ 2 nVˆ
=
n 1
=
n
, maka berdasarkan
Var ˆn B ˆn ,
n 1 2
n
= =
+
2
2
n nˆ 2 ˆ 2 + n 1 n 1 n 1ˆ 2 ˆ = n 1
=
22
Perhitungan MSE ˆn kurva pemodelan dapat dilakukan dengan menjumlah nilai selisih kuadrat fungsi distribusi kumulatif hasil estimasi dengan fungsi distribusi kumulatif hasil observasi sebagai berikut (Ley, Y., 2008).
(4.33)
nVˆ33 n 1
Fˆ x F x n
MSE =
2
i 1
4.3.1 Batas Interval Kepercayaan Asimtotik Estimator Pendekatan
ˆ ˆ =
,
4.3.3 MSE Kurva Pemodelan
n 1 n 1 nˆ 2
n 1 2
n
=
MSE ˆn
V11 = =
n 1 2
ˆ =
persamaan (4.36) untuk estimator ˆ dapat diperoleh berikut.
ˆ ˆ , ˆ , ˆ maka diperoleh estimator Vˆ untuk V dengan notasi sebagai berikut. Vˆ11 Vˆ 12 Vˆ13 (4.32) Vˆ = Iˆ 1 = Vˆ21 Vˆ22 Vˆ23 ˆ ˆ ˆ V31 V32 V 33 dan
ˆ ˆ
=
n
(4.30)
(4.35)
interval
i
(4.37)
dengan
kepercayaan
100 1 z % untuk ketiga estimator ˆ , ˆ , ˆ
i
Fˆ xi = fungsi distribusi kumulatif hasil estimasi F xi = fungsi distribusi kumulatif hasil
observasi
: n ˆ Z z
n ˆ Z z
Iˆ111 ˆ , 2
n ˆ Z z
1 ˆ , Iˆ22 2
1 ˆ Iˆ33
(4.34)
4.4
Iterasi Newton untuk Sistem Persamaan Non Linear
2
Dengan z adalah persentil atas ke- dari distribusi normal standar. 4.3.2 MSE Estimator ˆ , ˆ dan ˆ Sesuai dengan persamaan (3.20) dapat diperoleh nilai MSE masing-masing estimator sebagai berikut.
Jika terdapat dua fungsi non linear, f1 x, y dan f 2 x, y , yang namakan membentuk sistem persamaan berikut : f1 x, y = 0 dan f 2 x, y = 0, maka
diselesaikan
dengan
persamaan iterasi sebagai berikut. x n 1 x n h1 y n 1 y n h2
Estimasi Parameter Distribusi……. (Moh Rofi)
dapat
(4.38)
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
19
dengan
Berdasarkan persamaan (4.8), (4.9), dan (4.10) maka dapat didefinisikan fungsi iterasi non linear dua variabel sebagai berikut.
D1 h1 D D2 h2 D
dimana
f1 x, y x D f 2 x, y x
D1
D2
(4.39)
n ˆ 1 ˆ ˆ n ln xi f1 ˆ , ˆ n ln 1 xi n nˆ i 1 ˆ ˆ i 1 (4.40) n ˆ xi ln xi n n ˆ ln xi f 2 ˆ , ˆ nˆ i1 n ˆ ˆ i 1 xi i1
f1 x, y y , f 2 x, y y
f1 x, y
f 2 x, y
f1 x, y y
f 2 x, y y
f 2 x, y
f1 x, y
f 2 x, y x
f1 x, y x
(4.41)
,
Dan turunan parsial sebagai berikut. 2 2 ˆ ˆ ˆ f1 ˆ , ˆ n ˆ 2 ˆ n ˆ ˆ ˆ 2 (3.19)
(Buchman J.L., dan Turner, P.R., 1992) Secara umum tahapan dan langkahlangkah estimasi dengan metode MLE dengan iterasi di atas dapat diilustrasikan dengan diagram alur pada gambar 4.1.
n
ˆ
xi ln xi n f1 ˆ , ˆ n i 1 n ln xi ˆ ˆ i 1 x i
i 1
(4.42)
Mulai
x n 1 x n h1 y n 1 y n h2 Tentukan masukan awal x 0 dan y 0
Definisikan persamaan iterasi:
ˆ
xi ln xi n ˆ f 2 ˆ , n i1 n ln xi (4.43) ˆ ˆ i 1 xi
Definisikan fungsi iterasi f dan bentuk D1 , D2 h1 h2 D D
n
i 1
2 n n ˆ ˆ n ˆ xi ln xi 2 xi xi ln xi i 1 i 1 i 1 f 2 ˆ , ˆ n 2 nˆ 2 ˆ ˆ n ˆ x i i 1
(4.44) xn 1 xn ? yn 1 yn ?
tidak
xn 1 xn ? yn 1 yn ? ya
Selesai
Dengan mengacu pada persamaan (4.38) dan (4.39) maka diperoleh persamaan iterasi Newton secara simultan sebagai berikut. ˆ n 1 ˆ n h1 ˆ n 1 ˆ n h2
(4.45)
Gambar 3.1 Algoritma metode Newton untuk dua persamaan non linear
dengan
Estimasi Parameter Distribusi……. (Moh Rofi)
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
20
f ˆ , ˆ f1 ˆ , ˆ 1
h1
ˆ
f1 ˆ , ˆ ˆ f 2 ˆ , ˆ ˆ
f ˆ , ˆ f 2 ˆ , ˆ 2
h2
ˆ
f 1 ˆ , ˆ ˆ f 2 ˆ , ˆ ˆ
4,17; 3,20; 2,85; 2,00; 3,94; 2,25;
f ˆ , ˆ f 2 ˆ , ˆ 2
ˆ
f1 ˆ , ˆ ˆ f 2 ˆ , ˆ ˆ
f ˆ , ˆ 2
ˆ
f1 ˆ , ˆ ˆ f ˆ , ˆ
ˆ
Sedangkan untuk ˆ nilainya bergantung pada ˆ dan ˆ sebagaimana dinyatakan pada persamaan (4.11) yakni 1 ˆ ˆ
ˆ 1 xi . nˆ i 1 n
5
2,87; 2,78; 2,71; 3,17; 2,61; 2,55; 1,79; 2,00; 2,00; 3,64; 3,12; 3,05; 2,33; 2,58; 2,53; 2,92; 2,70; 2,65
5.2. Hasil Fitting Distribusi dengan EasyFit 5.5 Professional dan Hasil Estimasi dengan Iterasi Newton
f1 ˆ , ˆ
2
3,88; 3,08; 3,00; 3,43; 3,45; 2,74; 2,66; 3,00; 2,77; 2,41; 2,37; 2,04; 2,22; 2,02; 2,02; 3,82; 3,34; 2,92; 2,81; 2,70; 2,62; 2,38; 2,36; 3,01;
STUDI KASUS PEMODELAN ANGKA KELAHIRAN DI INDONESIA
5.1 Data Angka Kelahiran Total (Total Fertility Rate-TFR) Beberapa Propinsi Hasil Sensus Badan Pusat Statistik
Untuk menentukan jenis distribusi yang paling mendekati distribusi sampel hasil observasi di atas, dilakukan uji goodness of fit dengan software EasyFit 5.5 Professional yang diperoleh hasil bahwa distribusi Generalized gamma, Weibull, Gamma dan Exponential memenuhi keriteria distribusi sampel yang dimaksud berdasarkan uji Kolmogorov-Smirnov, Anderson-Darling dan Chi-Squared untuk taraf signifikansi sebesar 0,2, 0,1, 0,05, 0,02 dan 0,01. Selanjutnya dilakukan iterasi Newton untuk distribusi yang memenuhi memenuhi keriteria distribusi sampel. Dipilih distribusi Generalized gamma dan Weibull sebagai dua distribusi yang memenuhi berdasarkan fitting distribusi lewat uji Kolmogorov-Smirnov, Anderson-Darling dan Chi-Squared untuk taraf signifikansi sebesar 0,2; 0,1; 0,05; 0,02; dan 0,01, dengan software EasyFit 5.5 Professional. Dengan demikian estimasi parameter yang dilakukan adalah estimasi terhadap parameter distribusi GG dan distribusi Weibull yang merupakan salah satu distribusi keluarga GG pada kasus khusus ( parameter 1 ). Hasil iterasi Newton untuk memperoleh estimator ˆ ˆ dan ˆ pada distribusi GG dan
Untuk memperoleh estimator parameter model sebaran atau distribusi Angka Kelahiran Total (Total Fertility Rate-TFR) menurut provinsi tahun 991, 1994, 1998, dan 1999, yang diambil dari situs: http://www.bps.go.id., yang selengkapnya dapat dilihat pada Lampiran 1, dilakukan pengambilan sampel secara acak berupa dua belas propinsi yang tersebar di belahan wilayah nusantara, yang dapat disajikan sebagai berikut.
estimator ˆ dan ˆ pada distribusi Weibull dengan penghitung Excell 2003 dapat disajikan pada table 5.1 berikut.
Estimasi Parameter Distribusi……. (Moh Rofi)
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
21
Tabel 5.1 Hasil iterasi Newton untuk pencarian estimator distribusi GG dengan masukan awal ˆ 0 2 dan
ˆ0 2 Iterasi keˆ
n
ˆ
ˆ
h1
h2
5,0067 dan 1,4326, yang ditunjukkan pada tabel 5.1. Sedangkan hasil iterasi untuk distribusi Weibull yang merupakan distribusi keluarga GG pada kasus khusus ( parameter 1 ) sebagaimana ditunjukkan pada tabel 5.2 terlihat bahwa estimator ˆ dan ˆ masing-masing konvergen pada kisaran 5,3319 dan 3,0362.
0
5,0000
5,0000
2,1882
0,0053
-3,5724
1
5,0053
1,4276
0,9157
0,0006
0,6364
2
5,0059
2,0640
1,3121
0,0001
0,2317
5.3 Batas Interval Kepercayaan Asimtotik Estimator dan MSE Hasil Pemodelan Distribusi Generalized Gamma Untuk
distribusi
Generalized
Gamma
3
5,0060
2,2957
1,4258
0,0001
0,0152
diperoleh estimator Vˆ untuk V berdasarkan
4
5,0061
2,3109
1,4328
0,0001
0,0000
persamaan (4.25) s/d (4.30) diperoleh hasil sebagai berikut.
5
5,0061
2,3109
1,4328
0,0001
0,0000
6
5,0062
2,3109
1,4328
0,0001
0,0000
7
5,0062
2,3109
1,4327
0,0001
0,0000
8
5,0063
2,3109
1,4327
0,0001
0,0000
9
5,0063
2,3109
1,4327
0,0001
0,0000
10
5,0064
2,3108
1,4327
0,0001
0,0000
11
5,0065
2,3108
1,4327
0,0001
0,0000
12
5,0065
2,3108
1,4327
0,0001
0,0000
13
5,0066
2,3108
1,4327
0,0001
0,0000
Distribusi Weibull
14
5,0066
2,3108
1,4327
0,0001
0,0000
15
5,0067
2,3108
1,4326
0,0001
0,0000
Selanjutnya hasil di atas disubstitusikan pada persamaan (3.65) sehingga diperoleh
16
5,0067
2,3108
1,4326
Tabel 5.2 Hasil iterasi Newton untuk pencarian estimator distribusi Weibull dengan masukan awal
ˆ0 1 Iterasi ke- n
f ' ˆ
1
estimator Vˆ untuk V sebagai berikut.
Vˆ Vˆ 12 Iˆ 1 = Vˆ = 11 ˆ ˆ V V 22 21 0.0016 0.0146 = 0.0146 1,1783 709,23 8,78 = 8,78 0,96
f ˆ f ' ˆ
1
ˆ
ˆ
0
4,0000
2,9667
5,0099 -4,5957
-1,0901
1
5,0901
3,0238
0,7753 -3,3070
-0,2344
2
5,3245
3,0358
0,0230 -3,1144
-0,0074
Berdasarkan pendekatan interval 100 1 % kepercayaan untuk ketiga
3
5,3319
3,0362
0,0000 -3,1086
0,0000
estimator ˆ , ˆ , ˆ dengan 0,05 yang dari
4
5,3319
3,0362
Dari
hasil
f ˆ
0,0015 0,0393 0,0130 1 ˆ ˆ = 0,0393 1,7312 0,5343 V = I 0,0130 0.5343 1,1260 1.656,15 - 37,1564 1,4890 - 0,2877 = - 37,1564 1,5104 1,4890 - 0,2877 1,0418
5.3.1 Batas Interval Kepercayaan Asimtotik Estimator
tabel distribusi normal diperoleh z 1,96 , 2
iterasi
untuk
distribusi
Generalized Gamma diperoleh ˆ , ˆ dan ˆ
dan mengacu pada persamaan (3.60) dan (3.66), maka dengan penghitung excell 2003 diperoleh hasil yang dapat disajikan pada tabel 5.3 berikut.
masing-masing konvergen pada kisaran 5,0067, Estimasi Parameter Distribusi……. (Moh Rofi)
STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
22
Tabel 5.3 Batas interval kepercayaan asimtotik estimator distribusi pemodelan 1 ˆ Iˆ22 Iˆ111 ˆ Distri ˆ ˆ z
busi
2
z
n
2
ˆ z
n
4 - 5 1,0000 1,0000
2
1 ˆ Iˆ33 n
1,4326 0,0307
5,0067 0.0389
2,3108 0,1837
We ibu ll
3,0362 0,1723
1
5,3319 1,1887
ketiga
estimator
ˆ , ˆ , ˆ yang diketahui dan persamaan (3.71),
ˆ maupun ˆ
ˆ ˆ ˆ
2,3108
MSE 0,0017 0,0027
Weibull estimator 3,0362 1
MSE 0,0535 -
0,0608
5,3319
2,5482
lainnya yaitu ˆ maupun ˆ . Disamping itu hasil hitung MSE seluruh estimator dan kurva pemodelan distribusi GG tiga parameter lebih kecil dibandingkan distribusi Weibull dua parameter. Hal tersebut menunjukkan bahwa distribusi Generalized Gamma tiga parameter dapat dinyatakan sebagai model distribusi yang lebih baik dibandingkan distribusi Weibull dua parameter untuk ukuran sampel 48.
Sedangkan untuk MSE kurva pemodelan dapat didekati dengan persamaan (3.72). Untuk kedua distribusi GG dan distribusi Weibull, ringkasan hasil perhitungan MSE kurva di atas dengan penghitung Excell dapat disajikan pada tabel 5.5 berikut.
6. KESIMPULAN DAN SARAN 6.1 Kesimpulan
Tabel 5.5 MSE kurva hasil pemodelan untuk distribusi Weibull dan GG Inter val
F xi
GG Fˆ xi
Weibull
Fˆ x F x
2
i
i
2 Fˆ xi Fˆ xi F xi
0 - 1 0,0000 0,0001
0,0000
0,0027
0,0000
1 - 2 0,0625 0,0680
0,0001
0,1023
0,0048
2 - 3 0,6875 0,6440
0,0568
0,6086
0,1867
3 - 4 0,9792 0,9809
0,0000
0,9871
0,0009
Estimasi Parameter Distribusi……. (Moh Rofi)
menunjukkan bahwa nilai
parameter bentuk ˆ memiliki simpangan yang relatif lebih besar dibandingkan dua parameter
Tabel 5.4 Estimator ˆ , ˆ , ˆ hasil pemodelan untuk distribusi GG, Weibull dan Gamma GG estimator 1,4326 5,0067
0,1924
estimator ˆ baik pada distribusi GG maupun distribusi Weibull dibandingkan MSE estimator
maka diperoleh MSE masing-masing estimator untuk distribusi GG dan Weibull. Hasil perhitungan dengan program excell 2003 diperoleh hasil sebagaimana disajikan pada tabel 5.4 berikut.
0,0000
Dari tabel 5.4 dan 5.5 terlihat bahwa estimasi parameter distribusi Generalized Gamma tiga parameter diperoleh hasil hitung Mean Square Error (MSE) yang lebih kecil dibandingkan distribusi Weibull dua parameter untuk sampel berukuran 48. Hal ini berarti estimator distribusi Generalized Gamma tiga parameter sebagai model distribusi angka kelahiran di Indonesia memiliki galat yang relatif lebih kecil dibandingkan Weibull dua parameter untuk sampel berukuran 48. Lebih besarnya hasil hitung MSE
5.3.2 Mean Square Error Estimator dan Kurva Pemodelan nilai
1,0000
0,0569
GG
Berdasarkan
0,0000
Dari hasil penelitian di atas dapat ditarik beberapa kesimpulan, antara lain : 1. Estimasi parameter distribusi Generalized Gamma dapat dilakukan dengan metode MLE melalui Iterasi Newton dengan penghitung Excell 2003. 2. Hasil studi kasus berupa pemodelan angka kelahiran di Indonesia dalam kurun waktu tahun 991 s/d 1999 dengan ukuran sampel 48, menunjukkan bahwa distribusi Generalized Gamma tiga parameter, dapat dipilih sebagai model yang lebih baik dibandingkan distribusi Weibull yang merupakan salah satu distribusi pada kasus khusus dari distribusi keluarga Generalized Gamma berdasarkan Mean Square Error (MSE) masing-masing estimator dan kurva pemodelan yang diperoleh. STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
23
3. Hasil studi kasus menunjukkan bahwa distribusi Generalized Gamma tiga parameter, dapat dipilih sebagai model distribusi angka angka kelahiran (fertilitas) total (Total Fertility Rate) di Indonesia menurut provinsi dalam kurun waktu tahun 991 s/d 1999 dengan fungsi probabilitas :
x
x f x;1,4326, 1, 2,3108 e 1,4326 . 1,4326 dengan x menyatakan angka kelahiran total (Total Fertility Rate) atau rata-rata jumlah anak yang dilahirkan oleh seorang wanita sampai dengan akhir masa reproduksinya di suatu propinsi di Indonesia. 10,5695
6.2 Saran Agar dilakukan penelitian lebih lanjut untuk kurun waktu dan obyek studi kasus yang berbeda, serta dilakukan perancangan program perhitungan iterasi yang lebih efisien dan fleksibel untuk berbagai distribusi probabilitas. DAFTAR PUSTAKA Ahramowitz, M., dan Irene A.S. 1965, Handbook of Mathematical Functions – with Formulas, Graphs, and Mathematical Tables, Dover Publications, Inc., New York. Bhattacharya, P., 2001, A Study on Weibull Distribution For Estimating the Parameters, Journal of Applied Qantitative Methods, No.2, Vol.5, hal.234-241. Bain, L.J. and M. Engelhardt, 1987, Introduction to Probability and Mathematical Statistics, Duxbury Press, Boston, MA, California Brian P. F., Saul A.T., dan William T.V., 1986, Numerical Recipes (The Art of Scientific Computing), Cambridge University Press, California. Buchanan J.L. and P.T. Turner, 1992, Numerical Methods and Analysis, Edisi internasional, McGraw-Hill, Inc. California. Crooks, G.E., 2010, The Amoroso Distribution, Physical Bioscience, No.003, Vol.6, hal.1-27. DeGroot, M.H., 1986, Probability and Statistics, Edisi ke-2, Addison-Wesley Publishing Company, Inc., California. Evans, M., Hastings, N., dan B. Peacock, 2000, Statistical Distributions, Edisi ke3, John Wiley & Sons, Inc., New York.
Estimasi Parameter Distribusi……. (Moh Rofi)
Govindarajulu, Zakkula, 1999, Elements of Sampling Theory and Methods, PrenticeHall, New Jersey. Gupta, R.D., dan Kundu, D., 1999, Generalized Exponential Distributions, Austral. & New Zealand J. Statist. No.2, Vol. 41, hal.173– 188 Huang, P.H., dan Hwang, T.Y., 2006, On New Moment Estimation of Parameters of The Generalized Gamma Distribution Using It’s Characterization, Taiwanese Journal of Mathematics, No.4, Vol.10, hal.10831093. Kumar, V., dan Shukla, G., 2010, Maximum Likelihood Estimation in Generalized Gamma Type Model, Journal of Reliability and Statistical Studies, No.1, Vol.3, hal.43-51. Larsen, R.J., Marx, M.L., 2000, An Introduction to Mathematical Statistics and Its Applications., Edisi ke-4, Pearson, New Jersey. Lawless, J.F, 1980, Inference in the Generalized Gamma and Log Gamma Distributions. Journal of Technometrics, No.3, Vol.22, hal.159 Layman O.R., 2001, An Introduction Statistical Methods and Data Analysis, Edisi 4, Thomson Learning, Duxbury Ley, Y., 2008, Evaluation of three methods for estimating the Weibull distribution parameters of Chinese pine (Pinus tabulaeformis), Journal of Forest Science, No.54, Vol.12, hal. 566–571 Meeker Q.W., Escobar, L.A., 1998, Statistical Methods for Reliability Data, Edisi ke1, Department of Experimental Statistics Louisiana State University A Wiley-Interscience Publication John Wiley & Sons, Inc. New York . Miller , Jr. R. G., 1981, Survival Analysis, John Wiley, New York Olver, W.J.O., 2010, NIST Handbook of Mathematical Functions, Edisis ke-1, Cambridge University Press, New York. Ramachandran, K.M., dan Tsokos, C.P., 2009, Mathematical Statistics with Applications, Academic Press, California. Sahoo, P., 2003, Probability and Mathematical Statistics, Department of Mathematics University of Louisville, Louisville. Walck, C., 2007, Hand-Book on Statistical Distributions for Experimentalists, Particle Physics Group Fysikum University of Stockholm, STIMIKA Vol. 1, No.1, Agustus 2014: 13-24
24