APLIKASI REGRESI SPLINE UNTUK MEMPERKIRAKAN TINGKAT FERTILITAS WANITA BERDASARKAN UMUR Oleh Pembimbing
: Isnia Dwimayanti (1302 109 016) : DR. Drs. I Nyoman Budiantara, MS
ABSTRAK Tingginya tingkat fertilitas menjadikan jumlah penduduk semakin berkembang. Oleh karena jumlah penduduk dikhawatirkan akan membengkak, maka usaha pengendalian penduduk lebih ditekankan kepada usaha untuk menekankan laju pertumbuhan penduduk melalui penurunan fertilitas. Fertilitas adalah terlepasnya bayi dari rahim seorang perempuan dengan adanya tanda-tanda kehidupan. Dan sebagai ukuran dasar dari fertilitas salah satunya adalah Children Ever Born (CEB) atau jumlah anak yang pernah dilahirkan yang mencerminkan banyaknya kelahiran sekelompok atau beberapa kelompok wanita selama reproduksinya dan disebut juga paritas. Penelitian ini bertujuan untuk mendapatkan model regresi spline dari pola hubungan rata-rata paritas berdasarkan umur wanita di beberapa propinsi yang tingkat fertilitasnya tinggi (Nusa Tenggara Barat) dan rendah (D.K.I Jakarta) mulai periode tahun 1980, 1990, dan 2000. Datanya berupa data sekunder yang diambil dari BPS hasil sensus penduduk tahun 1980, 1990, 2000, dan metode yang digunaka adalah regresi spline. Setelah dilakukan analisa didapatkan model optimal yaitu model spline kubik dan hasil estimasi model spline kubik Propinsi Nusa Tenggara Barat dan DKI. Jakarta periode tahun 1980, 1990, dan 2000 secara berurutan sebagai berikut: 1. Propinsi Nusa Tenggara Barat: Yˆ = 0,333t − 0,049t 2 + 0,002t 3 − 0,002(t − 13,59)3+ + 0,001(t − 34,6)3+ ; R 2 = 99,9999% Yˆ = 0,279t − 0,041t 2 + 0,001t 3 − 0,002(t − 14)3+ + 0,0004(t − 32)3+ + 0,0003(t − 40,47)3+ ; R 2 = 99,99999% 2.
Yˆ = 0,173t − 0,026t 2 + 0,0009t 3 − 0,001(t − 13)3+ + 0,0007(t − 41)3+ ; R 2 = 99,99997% Propinsi DKI. Jakarta Yˆ = 0,248t − 0,038t 2 + 0,001t 3 − 0,002(t − 13)3+ + 0,001(t − 37,05)3+ ; R 2 = 99,99997% Yˆ = 0,069t − 0,0101t 2 + 0,0004t 3 − 0,0011(t − 22)3+ + 0,0011(t − 32)3+ − 0,0007(t − 39,92)3+ R 2 = 99,999991% Yˆ = 0,027t − 0,0043t 2 + 0,0002t 3 − 0,0004(t − 23,53)3+ + 0,0008(t − 42)3+ ; R 2 = 99,999995% (t − k j ) m −1 , t ≥ k j (t − k j ) m+ −1 = 0 ,t < k j
I.
PENDAHULUAN
Peningkatan jumlah penduduk yang besar dapat menimbulkan bencana nasional. Karena jumlah penduduk yang dikhawatirkan akan membengkak, salah satu usaha pengendalian penduduk lebih ditekankan pada laju pertumbuhan penduduk melalui penurunan fertilitas. Faktor–faktor yang mempengaruhi tinggi rendahnya fertilitas dapat dibagi menjadi dua yaitu faktor demografi dan non demografi (Mantra, 2003). Faktor demografi diantaranya adalah umur kawin pertama, paritas. Sedangkan faktor non demografi antara lain tingkat pendidikan. Dengan demikian perlu dilakukan upaya-upaya untuk mengetahui seberapa besar tingkat fertilitas wanita dengan cara melihat hubungan antara umur dan rata-rata banyaknya anak yang pernah dilahirkan hidup tiap wanita. Untuk menjelaskan hubungan antara variabel prediktor dengan variabel respon digunakan estimasi kurva regresi (Hardle, 1990). Pendekatan yang paling sering digunakan adalah pendekatan parametrik. Tetapi pada kenyataannya bahwa pola hubungannya tidak sesuai dengan apa yang telah dipelajari, sehingga bersifat nonparametrik. Terdapat beberapa pendekatan dalam regresi nonparametrik. diantaranya adalah spline , kernel (Wahba, 1990). Agung (1988) dalam studinya, yang dilakukan dalam rangka pengembangan suatu metode untuk memperkirakan tingkat fertilitas menurut umur tertentu menggunakan regresi tersegmen untuk
1
mengestimasi model kurva suatu distribusi data yang tidak linear, yang mana data yang dipakai adalah rata-rata banyaknya anak yang pernah dilahirkan hidup tiap wanita berdasarkan umur dari hasil sensus penduduk tahun 1980. Dalam studinya, Agung (1988) menerapkan penggunaan model regresi berganda tersegmen. Motivasi penggunaan regresi tersegmen adalah untuk memperoleh suatu model yang lebih sederhana. Namun hal ini dapat menghasilkan interpretasi yang keliru, karena interpretasinya berupa segmen-segmen. Dari beberapa pendekatan pada regresi nonparametrik pendekatan tersebut dirasakan sulit dan dengan melihat kekurangan dari metode yang dibuat oleh Agung, maka pada penelitian ini dicoba untuk menggunakan pendekatan lain yaitu dengan metode regresi spline. Spline mempunyai kelebihan dibanding dengan estimator yang lain. Regresi spline merupakan estimator yang diperoleh dengan meminimumkan least square (Hardle, 1989). Tujuan penelitian ini adalah untuk mendapatkan model regresi spline dari pola hubungan rata-rata paritas berdasarkan umur wanita, sehingga hasil model dapat digunakan untuk memperkirakan tingkat fertilitas dan memberikan masukan BKKBN tentang keberhasilan program Keluarga Berencana dilihat dari rata-rata anak yang pernah dilahirkan hidup tiap wanita. Penelitian ini dikhususkan untuk Propinsi Nusa Tenggara Barat yang mempunyai tingkat fertilitas yang tinggi dan yang fertilitasnya rendah, yaitu Propinsi DKI. Jakarta. II TINJAUAN PUSTAKA 2.1 Analisa Regresi Analisa regresi merupakan alat statistik yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah bisa diramalkan dari peubah-peubah lainnya. Salah satu tujuan analisa regresi adalah untuk memperkirakan nilai dari peubah tak bebas apabila nilai peubah yang menerangkan sudah diketahui. 2.2 Regresi Parametrik Salah satu pendekatan untuk mengestimasi kurva regresi adalah regresi parametrik yaitu suatu metode yang digunakan untuk mengetahui pola hubungan variabel respon dan prediktor yang diketahui bentuk kurva regresinya. Secara umum regresi linear sederhana dapat ditulis sebagai berikut (Neter et al dalam Sumantri, 1997): (2.1) Yi = β 0 + β1 X i + ε i Y i adalah nilai variabel tak bebas dalam amatan ke-i, β 0 dan β1 adalah parameter regresi, X i adalah konstanta (nilai variabel prediktor), ε i adalah variabel random yang saling bebas dengan asumsi IIDN(0, σ 2 ), i = 1,2,…,n 2.3 Regresi Nonparametrik Metode yang digunakan untuk mengetahui pola hubungan antar variabel respon dan prediktor yang tidak diketahui bentuk kurva regresinya merupakan suatu pendekatan regresi nonparametrik Secara umum bentuk regresi nonparametrik digambarkan sebagai berikut (Hardle, 1989): (2.2) Yi = m( X i ) + ε i , Y i : variabel respon ke-i, m(X i ): fungsi nonparametrik, ε i : residual random yang IIDN (0, σ 2 ), X i : variabel penjelas, i = 1,2,...,n 2.4 Fungsi Spline Spline merupakan suatu polinomial dimana segmen-segmen polinomial yang berbeda digabungkan bersama pada knot k 1 , k 2 ,...,k r dan kontinu sehingga bersifat fleksibel dibandingkan polinomial biasa. Spline mempunyai titik knot yaitu titik perpaduan bersama dimana terjadi perubahan perilaku kurva. Spline orde m dengan titik-titik knots k 1 , k 2 , ...,k r secara umum dapat disajikan dalam bentuk (Eubank, 1988): m −1
r
i =0
j =1
S (t ) = ∑ β it i + ∑ β j + m −1 (t − k j ) +m −1
(2.3)
2
(t − k j ) m −1 , t ≥ k j dengan (t − k j ) m+ −1 = , dimana β adalah konstanta real dan k j adalah titik knot dengan 0 ,t < k j j = 1,2,...,r
2.5 Pemilihan Titik Knot Optimal Salah satu cara untuk menentukan titik knot adalah dengan menggunakan metode Generalized Cross Validation (GCV). GCV didefinisikan sebagai berikut (Eubank, 1988): (2.4) GCV (k ) = MSE (k ) /(n −1tr [I − A(k )]) 2 2
n ∧ dimana MSE (k ) = n −1 ∑ Yi − g (ti ) i =1 Pemilihan titik knot optimal dilakukan dengan melihat nilai GCV yang minimum
(2.5)
2.6 Pengujian Parameter Regresi (Draper,1992) Untuk menguji ketepatan garis regresi yang diduga dapat ditulis dalam bentuk tabel dengan derajat bebas masing-masing sebagai berikut: Tabel 2.1 Tabel ANOVA
Sumber Regresi Residual Total
Derajat bebas (db) p n-p n
Jumlah Kuadrat (JK)
b’X’y y’y-b’X’y y’y
Rata-rata (KT) KS R KT E
Tabel 2.1 dapat digunakan untuk melakukan pengujian secara serentak apakah parameter yang terdapat dalam model signifikan atau tidak, yaitu dengan menggunakan uji F. Uji Serentak (uji F) Hipotesa:
H 0 : β 0 = β1 = ... = β n = 0 H1 : minimal terdapat satu β i ≠ 0 , i =0,1,2,...,n
Statistik uji:
KTR KTE F tabel = F( p , n − p ,α )
F hitung =
(2.6)
Keputusan : H 0 ditolak jika F hitung >F tabel. Uji Parsial (uji t)
Untuk menentukan peubah mana yang signifikan, maka dilakukan uji individu atau parsial. Hipotesa
H 0 : βi = 0 H1 : β i ≠ 0
Statistik Uji
, i = 0,1,2,...,p
: thitung =
βˆi se( βˆi )
(2.7)
Keputusan :
3
Tolak H 0 jika thitung > t
α n − p, 2
Analisa Residual Asumsi Independent : Asumsi ini dapat diperiksa apabila nilai residual berada dalam batas interval
±
(
1,96 n
) , maka dapat disimpulakan bahwa tidak ada autokorelasi antar residual.
Asumsi Identik : Asumsi identik terpenuhi jika datanya menyebar secara acak. Dan untuk menguji apakah asumsi identik ini terpenuhi salah satunya dengan menggunakan uji Glejser Asumsi Distribusi Normal : Hal ini dapat dilakukan dengan melihat normality plot dimana dikatakan berdistribusi normal apabila semua titik menyebar disekitar garis normal atau mendekati garis lurus. Untuk menguji asumsi distribusi normal salah satunya dapat dilakukan dengan menggunakan uji Kolmogorov Smirnov. 2.8 Koefisien Determinasi R2 digunakan untuk mengukur kesesuaian modelnya, JK (2.8) R2 = 1 − E JKT Fertilitas Fertilitas adalah sama dengan kelahiran hidup yaitu terlepasnya bayi dari rahim seorang perempuan dengan ada tanda-tanda kehidupan, misalnya berteriak, bernafas, dan sebagainya. Ukuran dasar yang sering digunakan untuk mengetahui tingkat fertilitas diantaranya adalah Children Ever Born (CEB) atau jumlah anak yang pernah dilahirkan yang mencerminkan banyaknya kelahiran selama reproduksinya dan disebut juga paritas. Rata-rata banyaknya anak yang dilahirkan: =
CEBi Pi f
(2.9)
CEB i : banyaknya anak yang dilahirkan hidup oleh kelompok umur i. Pi f : banyaknya wanita pada kelompok umur i III. METODOLOGI PENELITIAN 3.1 Sumber Data dan Alat Bahan dan alat yang digunakan dalam penelitian ini adalah sebagai berikut: 1. Software Minitab 13, Excel, dan S-Plus 2000 2. Referensi yang terkait dalam permasalahan penelitian 3. Data yang digunakan data sekunder yang diambil dari BPS hasil sensus penduduk tahun 1980, 1990, dan 2000 tentang rata-rata banyaknya anak yang pernah dilahirkan hidup tiap wanita menurut propinsi dan golongan umur. 3.2 Identifikasi Variabel Variabel-variabel yang terlibat dalam penelitian ini adalah terdiri dari variabel respon dan satu variabel penjelas. Variabel tersebut adalah: a. Variabel respon ; y = rata-rata banyaknya anak yang pernah dilahirkan hidup tiap wanita b. Variabel penjelas ; x = umur wanita 3.3 Metode Analisa Metode analisa penelitian yang dilakukan untuk memperoleh tujuan penelitian ini adalah sebagai berikut: 1. Melakukan deskripsi data 2. Menentukan bentuk model (orde) dan titik knot. 3. Menghitung nilai GCV dan memilih nilai GCV minimum 4. Estimasi model Spline
4
5. Melakukan pemeriksaan terhadap parameter model dan residual untuk mengetahui asumsi IIDN(0, σ 2 ) Sebagai perbandingan ditunjukkan model regresi parametrik yang langkah-langkahnya sebagai berikut: 1. Membuat model regresi parametrik (linear dan kubik) 2. Melakukan pemeriksaan terhadap parameter model dan residual untuk mengetahui asumsi IIDN(0, σ 2 ) Setelah mendapatkan estimasi model kurva untuk mendapatkan model terbaik maka dipilih nilai R2 terbesar dan MSE terkecil. IV. ANALISA DATA DAN PEMBAHASAN 4.1 Deskripsi Data
Gambar 4.1 Plot Rata-rata Paritas Berdasarkan Umur Wanita di Propinsi DKI. Jakarta Hasil Sensus Penduduk Tahun 2000
Gambar 4.2 Plot Rata-rata Paritas Berdasarkan Umur Wanita di Propinsi DKI. Nusa Tenggara Barat Hasil Sensus Penduduk Tahun 2000
Dalam penelitian ini, akan dilihat pola hubungan antara umur wanita dan rata-rata paritas dengan menggunakan model spline. Gambar 4.1 dan Gambar 4.2 adalah plot antara variabel respon dan variabel penjelas. Dari Gambar 4.2 dan Gambar 4.3 dapat diketahui bahwa di Propinsi DKI. Jakarta tahun 2000 semakin meningkatnya umur wanita semakin banyak anak yang dilahirkan hidup. 4.2 Pemilihan Titik Knot Untuk mendapatkan model spline yang baik dipilih dari nilai GCV yang minimum, yang dilakukan dengan cara coba-coba mulai dari bentuk spline linear, kuadratik maupun kubik, dengan satu titik knot sampai tiga titik knots. Dari ketiga model spline untuk Propinsi Nusa Tenggara Barat dan DKI. Jakarta semua periode, jika dilihat dari nilai GCV minimum semua ada pada model spline kubik. Hal ini terlihat pada Tabel 4.1 dan Tabel 4.2. Tabel 4.1 Nilai GCV Minimum Propinsi Nusa Tenggara Barat Periode Tahun 1980, 1990, dan 2000. Propinsi NTB 1980 NTB 1990 NTB 2000
Knot/ Orde 2/2 3/3 2/4 2/2 3/3 3/4 2/2 2/3 2/4
Titik Knot k1 k2 18,09 40 15,5 18 13,59 34,6 18,36 40 13 22 14 32 18,6 39,9 13 26,9 13 41
k3 28,5 30 40,5 -
GCV Minimum 0,018940 0,000765 0,000108 0,007328 0,001190 0,000005 0,002160 0,006489 0.001371
Tabel 4.2 Nilai GCV Minimum Propinsi DKI.Jakarta Periode Tahun 1980, 1990, dan 2000. Propinsi Jakarta 1980 Jakarta 1990 Jakarta 2000
Knot/ Orde 2/2 3/3 2/4 3/2 2/3 3/4 3/2 3/3 2/4
k1 18,13 15 13 20 14,49 22 17 14 23,53
Titik Knot k2 k3 39 17 30 37,1 32 40,9 27 32 39,9 22 41,3 32 47 42 -
GCV Minimum 0,010852 0,003093 0,002314 0,009594 0,003001 0,000778 0,006622 0,000674 0,000216
5
4.3 Estimasi Model Spline dan Pengujian Parameter 4.3.1 Estimasi Model Spline Linear dan Pengujian Parameter Nilai GCV minimum pada Propinsi Nusa Tenggara Barat periode tahun 1980, 1990, dan 2000 semua diperoleh dengan dua titik knots. Model spline linear dapat ditulis Y = β1t + β 2 (t − k1 ) + + β 3 (t − k2 ) + + ε . Dengan menggunakan software SPlus 2000 diperoleh estimasi model spline linear sebagai berikut: Tabel 4.3 Estimasi Model Spline Linear Propinsi Nusa Tenggara Barat Model NTB 1980
Estimasi β1 = 0,005
F-hit 4750,93
β 2 = 0,284 β 3 = -0,290
NTB 1990
β1 = 0,004 β 2 = 0,259
10737,2
t-hit 1,223 30,03 -18,04 1,397 43,8
β 3 = -0,205
-20,38 2,578
NTB
β1 = 0,004
2000
β 2 = 0,187
57,89
β 3 = -0,092
-16,89
21482,5
a. Propinsi Nusa Tenggara Barat Tahun 1980 : Yˆ = 0,005t + 0,284(t − 18,09) + − 0,290(t − 40) + b. Propinsi Nusa Tenggara Barat Tahun 1990 : Yˆ = 0,004t + 0,259(t − 18,36) − 0,205(t − 40) +
+
c. Propinsi Nusa Tenggara Barat Tahun 2000 : Yˆ = 0,004t + 0,187(t − 18,6) + − 0,092(t − 39,9) + (t − k j ) m −1 , t ≥ k j (t − k j ) m+ −1 = 0 ,t < k j
Dengan menggunakan α = 5% didapat nilai F hitung > F tabel (4,76) , maka dapat dikatakan bahwa model signifikan. Sedangkan pada pengujian parsial dengan t tab = 2,447 ada beberapa parameter yang tidak signifikan, yaitu pada model spline linear tahun 1980 dan 1990 ada satu parameter ( β1 ) Nilai GCV minimum untuk Propinsi DKI. Jakarta tahun 1980 diperoleh dari dua titik knots, sehingga model spline linear dapat ditulis Y = β1t + β 2 (t − k1 ) + + β3 (t − k2 ) + + ε , sedangkan Propinsi DKI. Jakarta tahun 1990 dan 2000 dapat ditulis Y = β1t + β 2 (t − k1 ) + + β3 (t − k2 ) + + β 4 (t − k3 ) + + ε Tabel 4.4 Estimasi Model Spline Linear Propinsi DKI. Jakarta Propinsi Jakarta 1980 Jakarta 1990
Jakarta 2000
Estimasi β1 = 0,007
F-hit 5705,34
F-tab 4,757
β 2 = 0,236 β 3 = -0,234 β1 = 0,002 β 2 = 0,212 β 3 = -0,048 β 4 = -0,091 β1 = 0,001 β 2 = 0,039 β 3 = 0,105 β 4 = -0,077
3913,8
3056,06
5,192
5,192
t-hit 2,11 31,93 -20,04 0,753 21,99 -2,901 -4,907 0,404 2,432
t-tab 2,447
2,571
2,571
6,397 -7,646
a.Propinsi DKI. Jakarta Tahun 1980 Yˆ = 0,007t + 0,236(t − 18,13) + − 0,234(t − 39) +
6
b.Propinsi DKI. Jakarta Tahun 1990 Yˆ = 0,002t + 0,212(t − 20) + − 0,048(t − 32) + − 0,09(t − 40,89) + c.Propinsi DKI. Jakarta Tahun 2000 Yˆ = 0,001t + 0,039(t − 17) + + 0,105(t − 21,95) + − 0,077(t − 41,33) +
Pengujian parameter secara serentak dengan α = 5% dapat dikatakan bahwa model signifikan. Tetapi pada pengujian parameter secara parsial ada beberapa parameter yang tidak signifikan, yaitu pada model spline linear tahun 1980 dan 1990 ada satu parameter ( β1 ) sedangkan tahun 2000 ada dua parameter β1 dan β 2
Gambar 4.3 Kurva Spline Linear Propinsi Nusa Tenggara Barat Hasil Sensus Penduduk Tahun 2000
Gambar 4.4 Kurva Spline Linear Propinsi DKI.Jakarta Hasil Sensus Penduduk Tahun 2000
4.3.2 Estimasi Model Spline Kubik dan Pengujian Parameter Model spline kubik untuk tahun 1980 Y = β1t + β 2 t 2 + β 3 t 3 + β 4 (t − k1 ) 3+ + β 5 (t − k 2 ) 3+ + ε dan tahun 1990, 2000 dapat ditulis Y = β 1 t + β 2 t 2 + β 3 t 3 + β 4 (t − k 1 ) 3+ + β 5 (t − k 2 ) 3+ + β 6 (t − k3 )3+ + ε , sehingga didapat estimasi model spline kubik sebagai berikut: Tabel 4.5 Estimasi Model Spline Kubik Propinsi Nusa Tenggara Barat Model NTB 1980
Estimasi β1 = 0,333
F-hit 744919,7
F-tab 6,2561
β 2 = -0,049
β 3 = 0,002 β 5 = 0,0006
NTB 2000
β1 = 0,2789
15281014
8,9406
β 2 = -0,0408 β 3 = 0,0015
57,2466 218,761 -260,960
β 4 = -0,0020
309,693 -324,424
β 5 = 0,0004
81,189
β 6 = 0,0003
39,855 8,6509 -10,926
β1 = 0,1732
t-tab 2,776
82,5518 -91,3930
β 4 = -0,002
NTB 1990
t-hit 55,7098 -68,1851
30470,15
β 2 = -0,0264
β 3 = 0,0010
6,2561
β 4 = -0,0012
13,546 -14,940
β 5 = 0,0007
10,181
3,182
2,776
a. Propinsi Nusa Tenggara Barat Tahun 1980 :
Yˆ = 0,333t − 0,049t 2 + 0,002t 3 − 0,002(t − 13,59)3+ + 0,001(t − 34,6)3+ b.Propinsi Nusa Tenggara Barat Tahun 1990 : Yˆ = 0,279t − 0,041t 2 + 0,001t 3 − 0,002(t − 14)3+ + 0,0004(t − 32)3+ + 0,0003(t − 40,47)3+ c.Propinsi Nusa Tenggara Barat Tahun 2000 :
7
Yˆ = 0,173t − 0,026t 2 + 0,0009t 3 − 0,001(t − 13)3+ + 0,0007(t − 41)3+ Semua model spline untuk propinsi Nusa Tenggara Barat tahun 1980, 1990, dan 2000 pada pengujian parameter secara serentak dengan α = 5% dapat dikatakan bahwa model signifikan, hal ini dapat dilihat pada tabel 4.5. Sedangkan pengujian secara individu semua parameter signfikan. Model spline Propinsi DKI. Jakarta sama dengan Propinsi Nusa Tenggara Barat, dengan menggunakan software S-Plus 2000 didapat estimasi model spline kubik sebagai berikut:
Tabel 4.6 Estimasi Model Spline Kubik Propinsi DKI. Jakarta Model DKI.Jakarta 1980
Estimasi β1 = 0,2475
F-hitung 24087,8
F-tabel 6,25606
β 2 = -0,0378
β 3 = 0,0014 β 5 = 0,0005
DKI.Jakarta 1990
19872,4
8,94065
β 2 = -0,0043 β 3 = 0,0002
3,182
14,276
β 6 = -0,0007
β1 = 0,0271
9,2653 9,9885 -14,654 22,127 -24,468
β 4 = -0,0011 β 5 = 0,0011
DKI.Jakarta 2000
t-tabel 2,776
13,457 -15,053
β 4 = -0,0018
β1 = 0,0693 β 2 = -0,0101 β 3 = 0,0004
t-hitung 8,7527 -10,917
159815
6,25606
-6,5882 12,018 -21,634
β 4 = -0,0004
39,925 -53,713
β 5 = 0,0008
27,306
2,776
a.
Propinsi DKI. Jakarta Tahun 1980 : ˆ Y = 0,248t − 0,038t 2 + 0,001t 3 − 0,002(t − 13)3+ + 0,001(t − 37,05)3+ b. Propinsi DKI. Jakarta Tahun 1990 : Yˆ = 0,069t − 0,0101t 2 + 0,0004t 3 − 0,0011(t − 22)3+ + 0,0011(t − 32)3+ − 0,0007(t − 39,92)3+ c. Propinsi DKI. Jakarta Tahun 2000 : Yˆ = 0,027t − 0,0043t 2 + 0,0002t 3 − 0,0004(t − 23,53)3+ + 0,0008(t − 42)3+
Gambar 4.5 Kurva Spline Kubik Propinsi Nusa Tenggara Barat Hasil Sensus Penduduk Tahun 2000
Gambar 4.6 Kurva Spline Kubik Propinsi DKI.Jakarta Hasil Sensus Penduduk Tahun 2000
8
4.4 Estimasi Model Regresi Parametrik dan Pengujian Paramater 4.4.1 Estimasi Model Regresi Parametrik Linear dan Pengujian Parameter Tabel 4.7 Estimasi Model Regresi Linear Propinsi Nusa Tenggara Barat Propinsi NTB 1980 NTB 1990 NTB 2000
Estimasi β1 = 0,125 β1 = 0,117
β1 = 0,090
F-hit 115,146 111,892 104,714
t-hit 10,731 10,578 10,233
Tabel 4.8 Estimasi Model Regresi Linear Propinsi DKI. Jakarta Propinsi Jakarta 1980 Jakarta 1990 Jakarta 2000
Estimasi β1 = 0,104 β1 = 0,085 β1 = 0,062
F-hit 122,922 93,990 75,425
t-hit 11,087 9,695 8,685
Model regresi parametrik linear adalah Y = β1t + ε , dan didapatkan estimasi model parametrik linear sebagai berikut: a. Propinsi Nusa Tenggara Barat Tahun 1980
: Yˆ = 0,125t
b. Propinsi Nusa Tenggara Barat tahun 1990
: Yˆ = 0,117t
c. Propinsi Nusa Tenggara Barat Tahun 2000
: Yˆ = 0,089t .
d. Propinsi DKI. Jakarta Tahun 1980
: Yˆ = 0,104t .
e. Propinsi DKI. Jakarta Tahun 1990
: Yˆ = 0,085t .
f. Propinsi DKI. Jakarta Tahun 2000
: Yˆ = 0,062t
Gambar 4.7 Kurva Regresi Linear Propinsi Nusa Tenggara Barat Hasil Sensus Penduduk Tahun 2000
Gambar 4.8 Kurva Regresi Linear Propinsi DKI.Jakarta Hasil Sensus Penduduk Tahun 2000
Menggunakan α = 5% berdasarkan Tabel 4.7 dan 4.8 didapat nilai F hitung > F tabel (5,3177), maka dapat dikatakan bahwa model signifikan. Sedangkan pada pengujian parsial dengan t tab = 2,306 juga signifikan semua. 4.4.2 Estimasi Model Regresi Parametrik Kubik dan Pengujian Parameter Tabel 4.9 Estimasi Model Regresi Parametrik Kubik Model
Estimasi
NTB
β1 = -0,2274
1980
β 2 = 0,0182
F-hit 811,134
NTB 1990
β 2 = 0,0151
932,644
NTB 2000
β 2 = 0,0095 β 3 = -0,0001
Estimasi
Jakarta
β1 = -0,1833
1980
β 2 = 0,0150
11,733
-9,652
β 3 = -0,0002
-10,658
-7,261
Jakarta
β1 = -0,1358
1990
β 2 = 0,0103
7,932
-8,718
β 3 = -0,0001
-6,458
-7,173
Jakarta
β1 = -0,0938
2000
β 2 = 0,0067 β 3 = -0,0001
-7,538
10,163
β 3 = -0,0002
β1 = -0,1210
Model
10,702
β 3 = -0,0002
β1 = -0,1910
t-hit
1.339,145
Tabel 4.10 Estimasi Model Regresi Parametrik Kubik
10,006 -7,873
F-hit
t-hit
994,274
-8,107
649,438
473,687
-5,918
-4,759 6,052 -4,521
9
Model regresi parametrik kubik secara umum adalah Y = β1t + β 2t 2 + β 3t 3 + ε , berdasarkan Tabel 4.9 dan Tabel 4.10 diperoleh estimasi model regresi parametrik kubik yang dapat ditulis sebagai berikut: a. Propinsi Nusa Tenggara Barat Tahun 1980 : Yˆ = 0,23t + 0,018t 2 − 0,0002t 3 . b. Propinsi Nusa Tenggara Barat Tahun 1990 : Yˆ = −0,191t + 0,015t 2 − 0,0002t 3 . c. Propinsi Nusa Tenggara Barat Tahun 2000 : Yˆ = −0,121t + 0,0095t 2 − 0,0001t 3 . d. Propinsi DKI. Jakarta Tahun 1980 : Yˆ = −0,183t + 0,015t 2 − 0,0002t 3 . e. Propinsi DKI. Jakarta Tahun 1990 : Yˆ = −0,136t + 0,0103t 2 − 0,0001t 3 . f. Propinsi DKI. Jakarta Tahun 2000 : Yˆ = −0,094t + 0,007t 2 − 0,00007t 3 .
Gambar 4.9 Kurva Regresi Kubik Propinsi Nusa Tenggara Barat Hasil Sensus Penduduk Tahun 2000
Gambar 4.10 Kurva Regresi Kubik Propinsi DKI. Jakarta Hasil Sensus Penduduk Tahun 2000
Dengan menggunakan α = 5% berdasarkan Tabel 4.9 dan tabel 4.10 model dapat dikatakan signifikan secara serentak maupun parsial, karena didapat nilai F hitung > F tabel (4,757) dan t hit > t tab (2,447). 4.5 Pengujian Analisa Residual 4.5.1 Asumsi Independent Asumsi independent ini diperiksa melalui plot ACF .
Gambar 4.11 Plot ACF Residual Model Spline Kubik Propinsi DKI.Jakarta Tahun 2000
Gambar 4.11 terlihat bahwa tidak ada nilai residual yang keluar dari batas spesifikasi (± 1,96
n
).
Sehingga residual estimasi model spline kubik Propinsi DKI. Jakarta tahun 2000 memenuhi asumsi independent. Sedangkan untuk model spline lainnya juga sudah memenuhi, hanya saja pada model regresi parametrik linear propinsi Nusa Tenggara Barat dan DKI. Jakarta untuk semua periode tidak memenuhi asumsi independent. 4.5.2 Asumsi Identik Asumsi identik terpenuhi dengan melihat plot penyebaran data antara residual dengan y taksiran plot tampak menyebar, dan asumsi identik untuk model spline kubik Propinsi DKI.Jakarta sudah terpenuhi seperti yang terlihat pada Gambar 4.12. Untuk memastikan asumsi identik terpenuhi digunakan uji glejser. Uji glejser didapatkan hasil P-value > α ( 0,144 > 5%), sehingga dapat diketahui bahwa varians residualnya homogen yang artinya asumsi identik terpenuhi, hal ini dapat dilihat pada tabel 4.11. Sedangkan untuk model regresi linear dan kubik hanya beberapa saja yang memenuhi.
10
Gambar 4.12 Plot antara Residual dengan y Taksiran Model Spline Kubik Propinsi DKI. Jakarta Tahun 2000 Tabel 4.11 Uji Glejser Propinsi DKI. Jakarta Tahun 2000 Source Regresi Residual
DF 1 7
SS 2,243E-05 5,818E-05
Total
8
8,061E-05
MS 2,24E-05 8,31E-06
F 2,7
P 0,144
4.5.3 Asumsi Distribusi Normal.
Gambar 4.13 Plot Probabilitas Normal Model Spline Kubik Propinsi DKI. Jakarta Tahun 2000
P-value > 0,15 dengan menggunakan α =5%, sehingga dapat dinyatakan bahwa residual model spline kubik Propinsi DKI. Jakarta tahun 2000 berdistribusi normal. Untuk model yang lainnya juga sudah memenuhi asumsi residual. 4.6 Perbandingan Model 4.6.1 Perbandingan Model Spline Tabel 4.12 Perbandingan Model Spline Linear dan Kubik Propinsi Nusa Tenggara BaratPeriode Tahun 1980, 1990, dan 2000 Propinsi NTB 1980 NTB 1990 NTB 2000
Model Linear Kubik Linear Kubik Linear Kubik
R2 0,9995792 0,9999989 0,9998138 0,9999999 0,9999069 0,9999737
MSE 0,0126268 4,834E-05 0,0048854 1,72E-06 0,0014406 0,0006094
Dengan melihat nilai R2 terbesar dan nilai MSE terkecil berdasarkan Tabel 4.12 model spline yang terbaik untuk Propinsi Nusa Tenggara adalah model spline kubik. Tabel 4.13 memberikan informasi bahwa model spline yang terbaik untuk Propinsi DKI. Jakarta tahun 1980, 1990, dan 2000 sama seperti dengan Propinsi Nusa Tenggara Barat yaitu model spline kubik.
11
Tabel 4.13 Perbandingan Model Spline Linear dan Kubik Propinsi DKI.Jakarta Periode Tahun 1980, 1990, dan 2000 Propinsi DKI.Jakarta 1980 DKI.Jakarta 1990 DKI.Jakarta 2000
Model Linear Kubik Linear Kubik Linear Kubik
R2 0,9996496 0,999967 0,9996807 0,999991 0,9995911 0,999995
MSE 0,007235 0,001029 0,0053303 0,00026 0,0036792 5,63E-05
4.6.2 Perbandingan Model Regresi Parametrik Kubik dan Spline Kubik Tabel 4.14 Perbandingan Model Spline Kubik dengan Model Regresi Parametrik Kubik Propinsi Nusa Tenggara Barat. Propinsi NTB 1980 NTB 1990 NTB 2000
Model Spline Kubik R2 0,9999989 0,999999 0,9999737
MSE 4,834E-05 1,72E-06 0,0006094
Model Regresi Parametrik Kubik R2 0,99754 0,99786 0,998509
MSE 0,073806 0,056134 0,023077
Tabel 4.15 Perbandingan Model Spline Kubik dengan Model Regresi Parametrik Kubik Propinsi DKI. Jakarta. Propinsi DKI.Jakarta 1980 DKI.Jakarta 1990 DKI.Jakarta 2000
Model Spline Kubik
Model Regresi Parametrik Kubik
R2
MSE
R2
MSE
0,9999668
0,0010285
0,997993
0,041447
0,9999907
0,0002596
0,99693
0,042712
0,999995
5,631E-05
0,995796
0,031529
Model rata-rata paritas berdasarkan umur wanita yang optimal adalah model spline kubik. Hal ini dapat dilihat pada Tabel 4.14 dan Tabel 4.15.
Gambar 4.14 Kurva Spline Kubik Gabungan Propinsi Nusa Tenggara Barat Hasil Sensus Penduduk Tahun 1980, 1990, dan 2000
Gambar 4.15 Kurva Spline Kubik Gabungan Wanita Propinsi DKI.Jakarta Hasil Sensus Penduduk Tahun 1980, 1990, dan 2000
Gambar 4.14 dan 4.15 terlihat dari tahun 1980, 1990, dan 2000 bentuk kurvanya menurun, sehingga usaha penekanan laju pertambahan penduduk yang salah satunya adalah program Keluarga Berencana dapat dikatakan berhasil.
12
V. Kesimpulan dan Saran 5.1 Kesimpulan Dengan ditetapkan pola dari data, maka dapat dibuat model spline yang optimal yaitu dengan model spline kubik. Dari model spline kubik akan didapat estimasi model dengan menggunakan software S-Plus yang hasilnya sebagai berikut: 1. Propinsi Nusa Tenggara Barat a. Propinsi Nusa Tenggara Barat Tahun 1980 0,333t − 0,049t 2 + 0,002t 3 , t < 13,59 2 3 ˆ ,13,59 ≤ t < 34,6 Y = 5,773 − 0,942t + 0,045t − 0,0005t − 19,08 + 1,2132t − 0,018t 2 + 0,0001t 3 , t ≥ 34,6 2 R = 99,9999% dan MSE = 0,00004834 b. Propinsi Nusa Tenggara Barat Tahun 1990: 0,279t − 0,041t 2 + 0,001t 3 , t < 14 2 3 ,14 ≤ t < 32 5,488 − 0,897t + 0,043t − 0,001t Yˆ = 2 3 ,32 ≤ t < 40,47 − 7,622 + 0,0333t + 0,005t − 0,006t 2 3 , t ≥ 40,47 − 27,507 + 1,807t − 0,031t − 0,0003t
R 2 = 99,99999% dan MSE = 0,00000172 c. Propinsi Nusa Tenggara Barat Tahun 2000 0,173t − 0,026t 2 + 0,0009t 3 Yˆ = 2,636 − 0,435t + 0,0204t 2 − 0,0003t 3 2,631 + 3,426t − 0,069t 2 − 0,00043t 3
R 2 = 99,99997% dan MSE = 0,0006094 2. Propinsi DKI. Jakarta a. Propinsi DKI. Jakarta Tahun 1980 : 0,248t − 0,0038t 2 + 0,001t 3 Yˆ = 3,955 − 0,665t + 0,032t 2 − 0,0004t 3 − 21,474 + 1,444t − 0,023t 2 + 0,0001t 3
, t < 13 ,13 ≤ t < 34,6 , t ≥ 41
, t < 13 ,13 ≤ t < 37,05 , t ≥ 37,05
R 2 = 99,99997% dan MSE = 0,00103 b. Propinsi DKI. Jakarta Tahun 1990 0,069t − 0,0101t 2 + 0,0004t 3 2 3 11,782 − 1,522t + 0,0625t − 0,0007t Yˆ = 2 3 − 24,263 + 1,857t − 0,043t + 0,0004t 2 3 20,269 − 1,489t + 0,041t − 0,00034t
, t < 22 ,22 ≤ t < 32 ,32 ≤ t < 39,92 , t ≥ 39,92
R 2 = 99,999991% dan MSE =0,00025963 c. Propinsi DKI. Jakarta Tahun 2000 0,027t − 0,0043t 2 + 0,0002t 3 Yˆ = 5,211 − 0,637t + 0,024t 2 − 0,00023t 3 − 57,764 + 3,861t − 0,083t 2 + 0,0006t 3 2 R = 99,999995% dan MSE = 0,0000563
, t < 23,53 ,23,53 ≤ t < 42 , t ≥ 42
5.2 Saran Disarankan agar estimasi model spline kubik ini dapat digunakan untuk mengestimasi data ratarata paritas berdasarkan umur wanita di Indonesia. Selain itu disarankan juga agar estimasi model spline kubik dapat digunakan untuk memperkirakan tingkat fertilitas wanita berdasarkan faktor-faktor lainnya, misalnya umur pertama kawin.
13
DAFTAR PUSTAKA Agung, I.G.N. (1988), Garis Patah Paritas, Pengembangan Suatu Metode Untuk Memperkirakan Fertilitas, Pusat Penelitian Kependudukan UGM, Yogyakarta. BPS (2001), Penduduk Indonesia Hasil Survey Modul Kependudukan Tahun 2000, BPS Jakarta-Indonesia Draper, N. Dan Smith, H.(1992), Analisis Regresi Terapan, edisi kedua, PT Gramedia Pustaka Utama, Jakarta. Eubank,R.L. (1988), Spline Smoothing and Nonparametric Regression, Marcel Decker, Inc., New York. Hardle, W. (1989), Applied Nonparametrik Regression, Cambridge University Press, New york. Hatmadji, S.H (1981), Fertilitas, Dasar-Dasar Demografi, Lembaga Demografi Fakultas Ekonomi, UI, Jakarta Khair, A. (2006), “Spline Polinomial Truncated untuk Interval Konfidensi Kurva Regresi Nonparametrik”, Tesis, Jurusan Statistika ITS, Surabaya. Mantra, I.B. (2003), Demografi Umum, edisi kedua, Pustaka Pelajar, Yogyakarta, hal.145-169. Singaribuan, M. (1988), Penurunan Angka Kelahiran Aspek-Aspek Program dan Sosial Budaya, http://pk.ut.ac.id/jsi/1masri-sing.htm. Wahba, G. (1990), Spline Models for Observational Data, Society for Industrial and Applied Mathematics, Philadelphia, Pennsylvania. Wiknjosastro, H. (1997), Ilmu Kandungan, edisi kedua, Yayasan Bina Pustaka Sarwono Prawirohardjo, Jakarta.
2