PENERAPAN METODE GSTAR DENGAN PENDEKATAN SPATIO-TEMPORAL UNTUK MEMODELKAN KEJADIAN DEMAM BERDARAH (STUDI KASUS: JUMLAH PENDERITA DEMAM BERDARAH DI KOTA SURABAYA)
1
Novita Dya Gumanti, 2Sutikno, 3Setiawan
1
Mahasiswa Jurusan Statistika FMIPA-ITS (1306 100 020), Dosen Pembimbing, Staf Pengajar Jurusan Statistika FMIPA-ITS, 1
[email protected],
[email protected],
[email protected] 2,3
Abstrak Penyakit Deman Berdarah Dengue (DBD) berkembang menjadi masalah kesehatan yang serius di dunia, terutama di Indonesia. Salah satu kunci tinggi rendahnya jumlah kasus DBD yang terjadi adalah perilaku masyarakat terhadap lingkungan. Kejadian serta perilaku seperti yang tersebut diatas tentunya berbeda di setiap wilayah. Karena itu pemodelan sebaran wilayah rawan penyakit DBD perlu segera dibuat. Metode statistika yang digunakan untuk mencapai tujuan penelitian tersebut adalah GSTAR. Metode GSTAR mampu mempertimbangkan aspek spatial dan waktu (spatiotemporal) sehingga diperkirakan akan meningkatkan tingkat akurasi. Dalam penelitian ini akan dilakukan penerapan model GSTAR dengan tiga bobot lokasi yaitu bobot lokasi seragam, bobot lokasi inverse jarak dan bobot lokasi korelasi silang pada data jumlah penderita demam berdarah di Kota Surabaya. Pemodelan hanya dilakukan terhadap empat kecamatan di wilayah Surabaya Pusat dikarenakan keterbatasan data. Hasil analisis menunjukkan, model yang sesuai dengan data yaitu model GSTAR(11) – I(1) untuk empat lokasi. Dari model GSTAR yang terbentuk dipilih model terbaik dari ketiga bobot lokasi yang menghasilkan kesalahan ramalan terkecil. Pemilihan model terbaik didasarkan pada nilai Root Mean Squared Error (RMSE) data outsampel dari model. Pada penelitian ini, didapatkan kesimpulan bahwa model yang paling sesuai dengan kondisi data adalah model GSTAR(11) – I(1) dengan bobot lokasi seragam dengan nilai RMSE sebesar 5,572. Kata kunci : Model GSTAR, RMSE, Demam Berdarah
1.
Pendahuluan Di Indonesia, penyakit DBD pertama kali ditemukan di Surabaya pada tahun 1968. Sejak pertama kali ditemukan, jumlah kasus menunjukkan kecenderungan meningkat baik dalam jumlah maupun luasan wilayah yang terjangkit. Pada tahun 1970an, kurang dari 10 kota / kabupaten yang terjangkit penyakit DBD, dan pada tahun 2003 sudah menjadi lebih dari 200 kota / kabupaten. Berbagai upaya telah dilakukan, akan tetapi angka kejadian DBD masih terus meningkat. Hal ini menunjukkan bahwa langkah antisipasi masih belum berjalan baik dan langkah penanggulangan belum efektif untuk menekan angka kejadian. Rendahnya hasil antisipasi kejadian DBD antara lain disebabkan karena waktu, tempat dan angka kejadian belum dapat diprediksi dengan baik. Salah satu kunci tinggi rendahnya jumlah kasus DBD yang terjadi adalah perilaku masyarakat terhadap lingkungan. Perilaku tersebut diatas tentunya berbeda di setiap wilayah. Kota Surabaya merupakan kota metropolis dengan kepadatan penduduk yang tinggi. Di samping itu mobilitas penduduknya cukup tinggi, sehingga peluang terjadinya wabah demam berdarah antar kecamatan saling berkaitan. Banyaknya kejadian DBD di Kota Surabaya pada tahun 2005 – 2009 cenderung menurun, namun masih dalam angka yang besar, masing–masing sebanyak 2568; 4187; 3214; 2169; 2268. Berkaitan dengan permasalahan di atas, maka perlu dilakukan penelitian yang bertujuan untuk menyusun model prediksi kejadian penyakit DBD menurut tempat dan waktu. Luaran model tersebut dapat digunakan untuk menentukan wilayah prioritas pelaksanaan program antisipasi dan penanggulangan. Pada penelitian ini dilakukan penyusunan model peramalan yang mempertimbangkan aspek spatial dan waktu (spatio-temporal) sehingga diperkirakan akan meningkatkan tingkat akurasi. Model yang akan dikembangkan adalah Generalized Space Time Autregressive (GSTAR). Pemilihan model terbaik nantinya akan ditetapkan berdasarkan kriteria Akaike’s Information Criterion (AIC) atau nilai Root Mean Squared Error (RMSE). Metode GSTAR telah digunakan beberapa kasus dan menunjukkan 1
kinerja yang cukup baik, diantaranya prediksi curah hujan di Kabupaten Ngawi (Ningrum,2010), ramalan data produksi gas di Joint Operating Body Pertamina-Petrochina East Java (JOB P-PEJ) oleh Shofiya (2009) dan Elliyana (2009). 2.
Tinjauan Pustaka Pustaka yang digunakan dalam penelitian ini meliputi konsep mengenai analisis time series, dan penyakit DBD. Multivariate Time Series Multivariate time series atau deret waktu multivariate merupakan deret waktu yang terdiri dari beberapa variabel. Hal seperti ini sering kali terjadi pada beberapa studi empirik. Contohnya, dalam studi mengenai penjualan. Beberapa variabel yang mungkin terlibat adalah volume penjualan, harga barang, dan biaya iklan. Identifikasi pada model multivariate time series hampir sama dengan model univariate time series. Identifikasi tersebut dapat dilakukan berdasarkan pola atau struktur matriks fungsi korelasi (MACF) dan matriks fungsi korelasi parsial (MACF) setelah data sudah stasioner (Wei, 2006). Secara visual kestasioneran data pada model multivariate time series juga dapat dilihat dari plot MACF dan PACF serta plot Box-Cox. Plot MACF yang turun secara lambat mengindikasikan bahwa data belum stasioner dalam mean sehingga perlu dilakukan differencing untuk menstasionerkan data. Demikian juga dengan kestasioneran dalam varians. Agar data stasioner dalam varians, maka transformasi perlu dilakukan.
Model Generalized Space TimeAutregressive (GSTAR) Model GSTAR merupakan pengembangan dari model STAR model ini cenderung lebih fleksibel dibandingkan model STAR. Secara matematis, notasi dari model GSTAR(p1) adalah sama dengan model STAR(p1). Perbedaan utama dari model GSTAR(p1) ini terletak pada nilai-nilai parameter pada lag spasial yang sama diperbolehkan berlainan. Pada model STAR adalah pada parameter autoregresifnya yang diasumsikan sama pada seluruh lokasi. Dalam notasi matriks, model GSTAR(p1) dapat ditulis sebagai berikut : ∑ Φ Φ
(2.1)
dengan - Φ diag , … , , … , dan Φ diag ∑ 1 - Pembobot dipilih sedemikian hingga 0 dan Penaksir parameter model GSTAR dilakukan dengan menggunakan metode kuadrat terkecil dengan cara meminimumkan jumlah kuadrat simpangannya. Pemilihan Bobot Lokasi pada Model GSTAR Salah satu permasalahan utama pada pemodelan GSTAR adalah pemilihan atau penentuan bobot lokasi. Terdapat beberapa cara penentuan bobot lokasi yang sering digunakan dalam aplikasi model GSTAR yaitu (Suhartono dan Atok, 2006): A 1
2
C
B a.
3 Bobot seragam (Uniform) Nilai dari bobot seragam dihitung dengan rumus dengan " adalah jumlah lokasi yang !
berdekatan dengan lokasi i. Bobot lokasi ini memberikan nilai bobot yang sama untuk masing-masing lokasi. Oleh karena itu, bobot lokasi ini seringkali digunakan pada data yang lokasinya homogen atau mempunyai jarak antar lokasi yang sama.
2
b. Bobot biner (Binary) Nilai dari bobot biner adalah 0 atau 1. Nilai tersebut dipakai tergantung pada suatu batasan tertentu. Untuk contoh kasus pada Gambar 3.1 #$ = 1 dan #% 0 . Nilai #$ lebih besar daripada #% karena jarak antara lokasi A dengan lokasi B lebih dekat dibanding dengan jarak antara lokasi A dengan lokasi C. Jarak yang lebih dekat diduga mempunyai hubungan yang lebih kuat. c. Bobot inverse jarak Nilai dari bobot invers jarak didapatkan dari perhitungan berdasarkan jarak sebenarnya antara lokasi. Lokasi yang berdekatan mendapatkan nilai bobot yang lebih besar. Berikut perhitungan bobotnya. d. Bobot berdasarkan pada semi-variogram atau kovariogram dari variable antar lokasi Bobot lokasi ini digunakan untuk lokasi yang jumlahnya banyak. Penggunaan bobot lokasi ini memungkinkan suatu bobot nilainya bertanda negatif. e. Bobot berdasarkan pada normalisasi inferensia korelasi silang antar lokasi pada lag waktu yang bersesuaian Penggunaan bobot lokasi ini pertama kali diperkenalkan oleh Suhartono dan Atok (2006). Secara umum korelasi silang antar dua variabel atau antara lokasi ke-i dan ke-j pada lag waktu ke-k, corr & '(), '( * +), didefinisikan sebagai : - '+)
.!/ ') 0! 0/
, + 0, 11, 12, …
(2.2)
dengan 3 adalah kovarians silang antara kejadian di lokasi ke-i dan ke-j pada lag waktu ke-k, 4 dan 4 adalah deviasi standar dari kejadian di lokasi ke-i dan ke-j. Kriteria Pemilihan Model Terbaik Akaike’s Information Criterion (AIC) dan nilai Root Mean Squared Error (RMSE) akan digunakan dalam proses pemilihan model terbaik. Pemilihan ini dilakukan berdasarkan kriteria in sample dan out sample. Akaike’s Information Criterion (AIC) digunakan pada in sample dan nilai Root Mean Squared Error (RMSE) untuk out sample. Berikut akan dijelaskan masing-masing kriteria pemilihan model terbaik. a. Akaike’s Information Criteria (AIC) Salah satu kriteria pemilihan dalam penentuan model terbaik pada data training adalah Akaike’s Information Criteria (AIC). Model terbaik adalah model dengan nilai AIC paling kecil. Berikut cara perhitungan nilai AIC (Lutkepohl, 2005): > > 567'8) log ;('∑~ (2.3) = '8)) ? ∑C B AB′ Log adalah notasi logaritma natural, det(.) merupakan notasi determinan, dan ∑~ = '8) @ A adalah matriks taksiran kovarian residual dari model VAR'8).
b.
Root Mean Squared Error (RMSE) Root Mean Squared Error (RMSE) adalah Ukuran perbedaan antara nilai prediksi dari model atau penaksir dengan nilai sebenarnya dari observasi. RMSE digunakan untuk memperoleh gambaran keseluruhan standar deviasi yang muncul saat menunjukkan perbedaan antar model, atau hubungan yang dimiliki. Untuk mengetahui besarnya nilai RMSE, dapat digunakan rumus sebagai berikut : K > DEFG √EFG IJ ∑J *
(2.4)
dimana M merupakan banyak ramalan yang dilakukan. 3.
Metodologi Penelitian Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Departemen Kesehatan Kota Surabaya. Variabel yang digunakan adalah data Penderita DBD bulanan di Surabaya Pusat per kecamatan selama 9 tahun (2000 – 2009). Data penderita demam berdarah didapatkan dari laporan adanya kejadian dari masyarakat ke puskesmas setempat melalui keputusan dokter yang 3
kemudian dikumpulkan di Dinas Kesehatan. Adapun daftar kecamatan di Surabaya adalah sebagai berikut. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Tegalsari Simokerto Genteng Bubutan Gubeng Gunung anyar Sukolilo Tambaksari Mulyorejo Rungkut Tenggilis Mejoyo
12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22.
Bulak Kenjeran Semampir Pabean Cantikan Krembangan Wonokromo Wonocolo Wiyung Karang pilang Jambangan Gayungan
23. 24. 25. 26. 27. 28. 29. 30. 31.
Dukuh Pakis Sawahan Benowo Pakal Aserowo Sukomanunggal Tandes Sambikerep Lakarsantri
Metode time series yang digunakan pada penelitian ini adalah pemodelan GSTAR dengan tiga bobot lokasi yaitu bobot lokasi seragam, bobot lokasi inverse jarak dan bobot lokasi korelasi silang. Pemodelan dilakukan pada data training. Pemilihan model terbaik pada data training berdasarkan pada nilai AIC. Selanjutnya dilakukan peramalan untuk data testing. Dari hasil ramalan tersebut dapat diketahui model terbaik yaitu model dengan nilai RMSE terkecil. Tahapan analisis data yang digunakan dalam penelitian ini dijabarkan secara rinci sebagai berikut : 1. Untuk mencapai tujuan pertama, maka langkah yang akan dilakukan adalah mendeskripsikan pola kejadian DBD di tiap kecamatan dengan menggunakan histogram. 2. Untuk mencapai tujuan kedua yaitu menyusun model kejadian DBD Kota Surabaya dengan menggunakan pendekatan spatio-temporal, akan dilakukan dengan beberapa tahap, yaitu: a. Mengidentifikasi data dengan asumsi-asumsi dasar time series. b. Menentukan estimasi parameter untuk masing-masig bobot lokasi. c. Menetukan orde VAR model GSTAR yang akan dipakai dalam menentukan model tiap wilayah pada masing-masing bobot lokasi. d. Analisis data menggunakan metode GSTAR untuk masing-masing bobot lokasi yaitu bobot lokasi seragam, bobot lokasi inverse jarak, dan bobot lokasi korelasi silang. e. Mendapatkan model GSTAR tiap lokasi pos hujan untuk masing-masing bobot lokasi yaitu bobot seragam dan bobot inverse jarak. f. Melakukan uji asumsi residual dari model yang diperoleh untuk masing-masing bobot lokasi. g. Melakukan forecast / peramalan jumlah penderita demam berdarah masing-masing wilayah dengan data outsampel. h. Menentukan model terbaik berdasarkan nilai RMSE data outsampel dari hasil forecast yang dilakukan untuk masing-masing bobot lokasi. 4.
Analisis dan Pembahasan Pada bagian ini akan dijelaskan secara rinci mengenai hasil serta analisis dari pengolahan data jumlah penderita demam berdarah di empat kecamatan di Surabaya Pusat. Analisis yang dilakukan meliputi pendeskripsian karakteristik data pada tiap wilayak dan pencarian model terbaik untuk meramalkan jumlah penderita demam berdarah pada beberapa waktu kedepan. 4.1 Karakteristik Data Demam Berdarah Data yang digunakan dalam penelitian ini adalah data jumlah penderita demam berdarah di 31 kecamatan di Kota Surabaya selama periode tahun 2001-2009. Karakteristik data demam berdarah diwakili oleh statistika deskriptif. Pada Tabel 4.1 berikut disajikan statistika deskriptif dari data tersebut.
4
Tabel 4.1 Nilai Rataan, Standar deviasi, Minimum, dan Maksimum Data jumlah penderita demam derdarah di setiap kecamatan Kecamatan Sukomanunggal
Mean 7,046
N 108
SD 8,231
Min 0
Max 46
Tandes Asemrowo Benowo Pakal Lakarsantri Sambikerep
7,815 2,565 2,176 1,630 2,981 3,000
108 108 108 108 108 108
8,959 3,256 3,057 2,249 3,727 3,586
0 0 0 0 0 0
40 17 19 12 20 17
Genteng Tegalsari Bubutan Simokerto Pabean Cantikan Semampir Krembangan Kenjeran
6,343 6,889 7,167 6,259
108 108 108 108
6,711 8,023 7,894 7,478
0 0 0 0
31 38 44 32
4,954
108
5,118
0
24
8,546 8,741 6,963
108 108 108
8,516 9,488 7,184
0 0 0
44 50 39
Bulak Tambaksari Gubeng Rungkut T. Mejoyo Gunung Anyar
1,741 14,787 11,444 7,259 5,361 4,231
108 108 108 108 108 108
2,670 17,767 11,117 8,731 6,115 4,773
0 0 0 0 0 0
16 83 55 43 27 24
Sukolilo Mulyorejo Sawahan Wonokromo Dukuh Pakis Karang Pilang
6,639 5,333 14,731 7,574 4,824 4,102
108 108 108 108 108 108
7,652 5,876 12,309 9,360 4,534 5,006
0 0 1 0 0 0
48 39 70 51 22 24
Wiyung Gayungan Wonocolo Jambangan
4,880 3,630 6,778 4,213
108 108 108 108
4,556 4,692 7,467 4,616
0 0 0 0
22 26 29 19
Dari hasil ringkasan pada tabel 4.1 memberikan keterangan bahwa rata-rata jumlah penderita dari tahun 2001-2009 pada masing-masing variabel berbeda. Rata-rata tertinggi terdapat pada Kecamatan Tambaksari yaitu sebesar 14 orang dengan jumlah tertinggi sebesar 83 orang yang terjadi pada bulan Maret 2006 dan jumlah terendah sebesar 0 orang yang terjadi pada beberapa bulan selama tahun 20012009. Sedangkan rata-rata terendah terdapat pada Kecamatan Pakal yaitu sebesar 1 orang. Jumlah tertinggi dan terendah ini tidak terulang pada bulan yang sama di tahun-tahun berikutnya. Pola data jumlah penderita demam berdarah bulanan di tiap Kecamatan selama tahun 2001-2009 menunjukkan rata-rata kejadian yang berbeda tiap bulannya secara jelas dapat dilihat pada Gambar 4.1 di bawah ini. Dari gambar, dapak diketahui bahwa keempat variabel memiliki pola yang hampir sama yaitu mengalami kenaikan serta penurunan pada waktu yang hampir sama
5
Sukomanunggal 20
20
15
15
10
10
5
5
0
0
6 5 4 3 2 1 0
1 2 3 4 5 6 7 8 9 10 11 12
4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12
Lakarsantri 6 5 4 3 2 1 0
15 10 5 0
Bubutan 15
10
10
10
5
5
5
0 1 2 3 4 5 6 7 8 9 10 11 12
20
15
15
10
10
5
5
0
0 1 2 3 4 5 6 7 8 9 10 11 12
20
20
15
15
5
0
0 1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
Sawahan
Mulyorejo 30 25 20 15 10 5 0
14 12 10 8 6 4 2 0
10
T. Mejoyo
1 2 3 4 5 6 7 8 9 10 11 12
Sukolilo 20
1 2 3 4 5 6 7 8 9 10 11 12
12 10 8 6 4 2 0
0 1 2 3 4 5 6 7 8 9 10 11 12
8
0
5
0
10
1
10
5
Gunung Anyar
2
Rungkut
25
1 2 3 4 5 6 7 8 9 10 11 12
3
1 2 3 4 5 6 7 8 9 10 11 12
Gubeng
10
Bulak 4
14 12 10 8 6 4 2 0
15
1 2 3 4 5 6 7 8 9 10 11 12
Kenjeran
1 2 3 4 5 6 7 8 9 10 11 12
Tambaksari
2
1 2 3 4 5 6 7 8 9 101112
Krembangan
20
12 10 8 6 4 2 0
0 1 2 3 4 5 6 7 8 9 10 11 12
Semampir
Pabean Cantikan
Simokerto
15
0
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
15
4
Genteng
Sambikerep
1 2 3 4 5 6 7 8 9 10 11 12
Tegalsari
6
1 2 3 4 5 6 7 8 9 10 11 12
6 5 4 3 2 1 0
1 2 3 4 5 6 7 8 9 10 11 12
35 30 25 20 15 10 5 0
Benowo 5
1 2 3 4 5 6 7 8 9 10 11 12
Pakal 3 2,5 2 1,5 1 0,5 0
Asemrowo
Tandes
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
6
Wonokromo
Dukuh Pakis
20
10
10
15
8
8
6
6
4
4
5
2
2
0
0
10
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
Jambangan
Wonocolo
8
20
8
6
15
6
4
10
4
2
5
2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
12 10 8 6 4 2 0
0 1 2 3 4 5 6 7 8 9 10 11 12
Gayungan
Wiyung
Karang Pilang
0 1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
Gambar 4.1 Rata-Rata Jumlah Penderita Demam Berdarah Bulanan Tiap Kecamatan 4.2 Data Analisis Pembentukan model dalam penelitian ini memprioritaskan kecamatan dengan jumlah penderita tinggi yang terletak dalam satu wilayah/kawasan. Dari 31 kecamatan di Kota Surabaya, hanya digunakan 4 Kecamatan di wilayah Surabaya Pusat. Hal ini juga disebabkan dengan terbatasnya jumlah data. Oleh sebab itu, dalam penelitian ini, pemodelan dilakuan terhadap wilayah Surabaya Pusat yang terdiri dari 4 kecamatan yaitu Genteng, Tegalsari, Bubutan, dan Simokerto. Untuk analisis selanjutnya jumlah penderita demam berdarah di masing-masing kecamatan disebut sebagai variabel. Z1 untuk jumlah penderita demam berdarah di Kecamatan Genteng, Z2 untuk jumlah penderita demam berdarah di Kecamatan Tegalsari, Z3 untuk jumlah penderita demam berdarah di Kecamatan Bubutan, dan Z4 untuk jumlah penderita demam berdarah di Kecamatan Simokerto. 4.3 Korelasi Antar Variabel Nilai korelasi antar variabel dapat digunakan untuk mengetahui besarnya pengaruh atau hubungan keterkaitan antara satu variabel terhadap variabel yang lain. Tabel 4.2 menunjukkan nilai korelasi antar kecamatan melalui matriks korelasi. Tabel 4.2 Matriks Korelasi Antar Kecamatan Variabel Z1 Z2 Z3 Z4
Z1
Z2
Z3
Z4
1 0,628* 0,703* 0,669*
1 0,737* 0,531*
1 0,649*
1
* nyata pada L = 5%
Berdasarkan Tabel 4.2, semua nilai korelasi antar variabel M 0,5 dan memiliki nilai p-value yang lebih kecil dari nilai L yaitu 5%. Hai ini menunjukkan bahwa antar lokasi memiliki hubungan yang signifikan atau mempunyai keterkaitan pada waktu yang sama. Besarnya diagonal pada matriks korelasi di atas adalah 1 karena diagonal tersebut merupakan korelasi variabel dengan dirinya sendiri. 4.4 Model Generalized Space Time Autoregressive Model GSTAR merupakan salah satu model yang ada dalam analisis time series. Ada dua syarat utama yang harus dipenuhi dalam pemodelan time series, yaitu stasioner dan residual white noise. Asumsi yang harus dipenuhi pada langkah awal dalam identifikasi model yaitu data harus stasioner dalam varians maupun mean. Identifikasi awal stasioner mean dan varian dapat dilihat dari plot time series. Ternyata plot menunjukkan bahwa data belum stationer baik terhadap mean maupun varian. Untuk mengetahui kestasioneran dalam varians maka dilakukan Box-Cox Transformation. Adapun hasil dari transformasi terhadap data jumlah penderita demam berdarah dapat dilihat pada Gambar 4.2. 7
Box-Cox Plot of bGenteng Lower CL
20
Box-Cox Plot of bTegalsari
Upper CL
Lower CL
Upper CL
25
Lambda
Lambda
(using 95,0% confidence)
15
Estimate
0,09
Lower CL Upper CL
-0,12 0,31 0,00
StDev
StDev
Rounded Value
(using 95,0% confidence)
20
10
Estimate
0,12
Lower CL Upper CL
-0,09 0,31
Rounded Value
15
0,00
10
5 5
Limit Limit -1
0
1 Lambda
2
0
3
-1
Box-Cox Plot of bBubutan Lower CL
25
0
1 Lambda
2
3
Box-Cox Plot of bSimokerto
Upper CL
Lower CL
30
Lambda
Upper CL Lambda
(using 95,0% confidence)
20
Estimate
0,13
Lower CL Upper CL
-0,09 0,32
20
0,00
15
StDev
StDev
Rounded Value
(using 95,0% confidence)
25
10
Estimate
0,12
Lower CL Upper CL
-0,09 0,31
Rounded Value
0,00
15 10 5
5
Limit Limit -1
0
1 Lambda
2
0
3
-1
0
1 Lambda
2
3
Gambar 4.2 Plot Box-Cox Untuk Z1, Z2, Z3 dan Z4. Dari gambar 4.2, diketahui bahwa nilai batas bawah, batas atas, lambda estimate, dan rounded value masing-masing variabel tidak sama. Karena nilai tersebut tidak sama pada masing-masing variabel, maka jika dilakukan transformasi harus sesuai dengan nilai lambda estimasion masing-masing variabel. Namun pada penelitian ini tidak dilakukan transformasi karena belum ada jaminan bahwa model yang didapatkan dari hasil transformasi akan lebih baik daripada model tanpa transformasi. Minimum Information Criterion Lag AR 0 AR 1 AR 2 AR 3 AR 4 AR 5 AR 6 AR 7 AR 8 AR 9 AR 10
MA 0 14.238808 13.606353 13.781413 13.993212 14.178589 14.435699 14.88719 15.216868 15.921874 16.469161 17.427943
MA 1 13.720354 13.773983 13.899621 14.262957 14.532149 14.814458 15.605475 16.054964 16.914387 17.665682 18.902198
MA 2 13.864419 14.0292 14.239834 14.567211 14.965731 15.286409 16.193542 17.021997 18.075839 19.090113 20.695211
MA 3 14.087346 14.297982 14.675018 14.98536 15.47111 15.867296 16.910012 17.907066 19.453375 20.814424 22.922893
MA 4 14.304841 14.553172 14.945108 15.435766 15.969648 16.259319 17.4709 18.683398 20.568202 22.944455 25.765108
MA 5 14.477839 14.720012 15.10927 15.721029 16.404346 17.099688 18.538043 20.014482 22.337111 25.391095 29.516832
Gambar 4.3 Nilai AIC Gambar 4.3 menunjukkan adanya beberapa lag yang keluar dari batas standar deviasi. Jumlah lag yang keluar lebih dari satu. Hal ini menandakan bahwa model yang terbentuk lebih dari satu. Maka dari itu perlu dilakukan identifikasi terhadap nilai AIC dari masing-masing model. Nilai AIC dalam gambar 4.6 menunjukkan nilai terkecil yaitu 13,606353 pada AR1 dan MA 0. Dengan demikian didaparkan model VAR(1) dengan data hasil differ-rencing tingkat 1. Maka model GSTAR yang digunakan adalah GSTAR (11)-I(1). Langkah selanjutnya adalah penaksiran parameter yang didasarkan pada dugaan model yang telah diperoleh pada tahap identifikasi. Penaksiran parameter dilakukan sesuai dengan bobot lokasi yang digunakan, 0 0,33 0,33 0,33 0,33 0 0,33 0,33 R w P 0,33 0,33 0 0,33 0,33 0,33 0,33 0 0 0,207 0,468 0,325 0,184 0 0,582 0,234 w P0,129 0,361 0 0,510R 0,419 -0,065 0,0646 0
adapun bobot lokasi yang digunakan yaitu: bobot seragam = 0 0,204 0,598 0,198 0,483 0 0,299 0,218 R w P 0,451 0,322 0 0,227 0,272 0,314 0,414 0
, dan bobot korelasi silang =
, bobot invers jarak =
. Setelah didapatkan nilai bobot,
selanjutnya dilakukan estimasi parameter untuk model GSTAR(11) – I(1).
8
Tabel 4.3 Taksiran parameter model GSTAR (11)-I(1) Bobot Seragam Bobot Invers Jarak Bobot Korelasi Silang Parameter Nilai Nilai Nilai p-value p-value p-value Taksiran Taksiran Taksiran 0,330 0,011* 0,3874 0,004* 0,261 0,051** 0,533 0,000* > 0,5678 0,000* 0,460 0,000* 0,267 0,035* 0,349 0,010* Y 0,4145 0,002* 0,573 0,000* 0,547 0,000* Z 0,5466 0,000* 0,651 0,001* 0,508 0,000* 0,4328 0,001* 0,604 0,011* 0,392 0,002* > 0,3457 0,006* 1,129 0,000* 0,595 0,000* Y 0,5116 0,001* -0,098 0,762 0,255 0,048* Z 0,2236 0,049* * nyata pada L = 5% ** nyata pada L = 10%
Tabel diatas menjelaskan bahwa banyak parameter yang signifikan, tetapi ada satu yang tidak signifikan karena nilai p lebih dari [. Parameter yang tidak signifikan tersebut seharusnya tidak dimasukkan dalam persamaan model, namun untuk mengetahui nilai ramalan dari model GSTAR dengan bobot lokasi korelasi silang maka semua parameter akan dimasukkan kedalam model. Tahap selanjutnya yaitu cek diagnosis untuk mengetahui dan memastikan apakah model dugaan sudah merupakan model yang sesuai untuk data yang ada. Model GSTAR(11) – I(1) dikatakan sesuai jika residualnya white noise dan berdistribusi multivariate normal, sehingga perlu dilakukan identifikasi untuk melihat apakah residual dari model sudah white noise dan berdistribusi multivariate normal. Identifikasi white noise dapat dilihat pada skema matriks korelasi silang antar residual pada Gambar 4.4 di bawah ini. Schematic Representation of Cross Correlations Variable/ Lag resiZ1 resiZ2 resiZ3 resiZ4
0
1
2
3
4
5
6
7
++++ ++++ ++++ ++++
-... .... .... ----
.... -.-. .... ...+
.... .... .... ....
.... .... -... ....
.... .... .... ....
.... .... ..+. ....
.... .... .... ....
+ is > 2*std error,
- is < -2*std error,
Schematic Representation of Cross Correlations
8
9
.... .... .... ....
.... .... .... ..-.
10
11
12
.-.. .-.. .-.. ....
.... .... .... ....
.... .... .... ....
Variable/ Lag resiZ1 resiZ2 resiZ3 resiZ4
0
1
2
3
4
5
6
7
++++ +++. ++++ +.++
.... .... -... -.--
.... .... .... ....
.... .+.. .... ....
.... .... -... ....
.-.. .... .... +...
.... .... ..+. ....
.... .... .... ....
+ is > 2*std error,
. is between
- is < -2*std error,
8
9
.... .... .... ....
.... .... .... ..-.
10
11
12
.-.. .... .-.. ....
.... .... .... ....
.... .... .... ....
. is between (b)
(a)
Schematic Representation of Cross Correlations Variable/ Lag resiZ1 resiZ2 resiZ3 resiZ4
0
1
2
3
4
5
6
7
++++ +++. ++++ +.++
-... .-.. .... ----
... .... .... ....
.... .... .... ....
.... .... .... ....
.... .... .... ....
.... .... .... ....
.... .... .... ....
+ is > 2*std error,
- is < -2*std error,
8
9
.... .... .... ....
.... .... .... ..-.
10
11
12
.... .... .... ....
.... .... .... ....
.... .... .... ....
. is between (c)
Gambar 4.4 Skema MatrikKorelasi Silang Residual Z1, Z2, Z3, Z4 dengan (a) Bobot Lokasi Seragam, (b) Bobot Lokasi Invers Jarak, dan (c) Bobot Lokasi Korelasi Silang. Ketiga skema diatas menyajikan banyaknya simbol (.) daripada (+) dan (-) pada lag 1. Hal ini berarti tidak ada nilai korelasi silang yang keluar secara bersama-sama melampaui batas standar dari masing-masing variabel pada lag 1 dan sebelumnya, sehingga dpat dikataan bahwa hasil residual model dengan bobot lokasi seragam, invers jarak, maupun korelasi silang adalah saling bebas atau white noise. Setelah asumsi white noise dipenuhi, maka asumsi berikut-nya yang juga harus dipenuhi adalah residual berdistribusi normal. Hasil pengujian distribusi normal dari residual model GSTAR (11)-I(1) dengan bobot lokasi seragam, invers jarak dan korelasi silang selengkapnya ditampilkan pada tabel 4.4
9
Tabel 4.4 Normality Test Residual Bobot Lokasi Nilai Seragam Invers Jarak Korelasi Silang Rata-rata -0,02473 -0,02855 -0,01992 Standar Deviasi 8,569 8,535 9,137 N 376 376 376 Kolmogorov Smirnov 0,117 0,109 0,130 Nilai P 0,010 0,010 0,010 Dari Tabel diatas dapat disimpulkan bahwa residual model GSTAR (11)-I(1) dengan bobot lokasi seragam, invers jarak dan korelasi silang tidak berdistribusi normal. Hal ini ditunjukkan dengan nilai Pvalue kurang dari 5%. Ketidaknormalan pada residual model ini mungkin saja terjadi karena adanya nilai ekstrim (outlier). Peramalan Model GSTAR (11)-I(1) Model GSTAR yang telah didapatkan digunakan untuk mendapatkan nilai pada periode yang akan datang atau peramalan untuk setiap lokasi dengan ketiga bobot lokasi. Hasil peramalan selama 12 bulan dapat dilihat pada gambar 4.5 berikut. Genteng
Tegalsari Jan/2009
50
Variable Asli Seragam Jarak Korelasi
30
40
20
30
10
Jan/2009 Variable Asli Seragam Jarak Korelasi
50
Data
Data
40
60
20 10
0
0
-10
-10
-20 Month Jan Jan Jan Jan Jan Jan Jan Jan Jan Year 2001 2002 2003 2004 2005 2006 2007 2008 2009
Month Jan Jan Jan Jan Jan Jan Jan Jan Jan Year 2001 2002 2003 2004 2005 2006 2007 2008 2009
Bubutan
Simokerto Jan/2009
50 40
Jan/2009
60
Variable Asli Seragam Jarak Korelasi
60
Variable Asli Seragam Jarak Korelasi
50 40 30 Data
Data
30 20 10 0
20 10
-10
0
-20 -10
-30 Month Jan Jan Jan Jan Jan Jan Jan Jan Jan Year 2001 2002 2003 2004 2005 2006 2007 2008 2009
Month Jan Jan Jan Jan Jan Jan Jan Jan Jan Year 2001 2002 2003 2004 2005 2006 2007 2008 2009
Gambar 4.5 Plot Nilai Asli dan Nilai hasil Peramalan Model GSTAR (11)-I(1) dengan Bobot Lokasi Seragam, Invers Jarak, dan Korelasi Silang di Kecamatan Genteng, Tegalsari, Bubutan, dan Simokerto.
Hasil peramalan dibandingkan dengan data out sample yaitu data pada tahun 2009. Hasil peramalan model GSTAR (11)-I(1) yang terletak setelah garis vertikal selalu mengalami nilai yang hampir konstan, padahal nilai sebenarnya mengalami perubahan yang cukup besar. Pemilihan Model Terbaik Pemilihan model terbaik dilakukan dengan membandingkan nilai RMSE yang mewakili ketepatan ramalan untuk masing-masing pos dengan ketiga bobot lokasi pada data jumlah penderita demam berdarah. Tabel 4.5 RMSE Out-Sample Model GSTAR (11)
Kecamatan Genteng Tegalsari Bubutan Simokerto Rata-rata
Seragam 4,402 6,174 7,044 4,667 5,572
RMSE Invers Jarak 4,845 6,301 7,852 4,642 5,910
Korelasi Silang 4,045 6,281 6,455 5,869 5,662 10
Dari tabel 4.5 dapat diketahui bahwa tingkat ketepatan ramalan untuk model GSTAR(11)-I(1) dengan rata-rata RMSE terkecil terletak pada bobot seragam yaitu 5,572. Namun karena hasil rata-rata RMSE ketiga bobot hampir sama, maka dilakukan pengujian dengan Anova. Hasil dari pengujian menunjukkan bahwa nilai rata-rata RMSE dari ketiga bobot lokasi berbeda. Dengan demikian dapat disimpulkan bahwa model yang terbaik adalah model dengan bobot seragam yaitu: 1. Model untuk kecamatan Genteng (Z1) Z1 't)1,33Z1 't‐1)‐0,33Z 't‐2)0,17Z> 't‐1)‐0,17Z> 't‐2)0,17ZY 't‐1)‐0,17Z3 't‐2)0,17Z4 't‐1)‐0,17Z4 't‐2)e1 't)
2. Model untuk kecamatan Tegalsari (Z2)
Z2 't)0,13Z1 't‐1)‐0,13Z1 't‐2)1,53Z2 't‐1)‐0,53Z2 't‐2)0,13ZY 't‐1)‐0,13ZY 't‐2)0,13ZZ 't‐1)‐0,13Z4 't‐2)e1 't)
3. Model untuk kecamatan Bubutan (Z3) Z3 't)0,2Z1 't‐1)‐0,2Z1 't‐2)0,2Z2 't‐1)‐0,2Z> 't‐2)1,35Z3 't‐1)‐0,35Z3 't‐2)0,2ZZ 't‐1)‐0,2Z4 't‐2)e1 't)
4. Model untuk kecamatan Simokerto (Z4) Z4 't)0,09Z1 't‐1)‐0,09Z1 't‐2)0,09Z> 't‐1)‐0,09Z2 't‐2)0,09Z3 't‐1)‐0,09Z3 't‐2)1,55ZZ 't‐1)‐0,55Z4 't‐2)e1 't)
5. Kesimpulan dan Saran 5.1 Kesimpulan Berdasarkan hasil penelitian dan analisis yang dilakukan pada tahapan sebelumnya, diperoleh beberapa kesimpulan sebagai berikut : 1. Karakteristik data demam berdarah pada masing-masing kecamatan di Kota Surabaya berbeda. Hal ini ditunjukkan oleh nilai rata-rata. Rata-rata tertinggi penderita dari tahun 2001-2009 terdapat pada Kecamatan Tambaksari yaitu sebesar 14 orang. Sedangkan rata-rata terendah terdapat pada Kecamatan Pakal yaitu sebesar 1 orang. 2. Bobot lokasi yang optimal untuk model GSTAR adalah bobot seragam karena mempunyai RMSE out-sample terkecil yaitu sebesar 5,572. 5.2 Saran Untuk penelitian selanjutnya, sebaiknya dipertimbangkan juga faktor-faktor lain yang mempengaruhi kejadian demam berdarah termasuk faktor alam. Hal ini diperkirakan dapat meningkatkan akurasi model. Selain itu, dalam penelitian ini pemodelan jumlah penderita demam berdarah hanya dilakukan terhadap empat kecamatan. Untuk penelitian selanjutnya disarankan untuk menambah jumlah data sehingga dapat memodelkan seluruh kecamatan di Kota Surabaya Daftar Pustaka Borovkova, S.A., Lopuhaa, H.P., dan Ruchjana, B.N. (2008). Consistency and Asymptotic Normality of Least Squares Estimators in Generalized STAR Models, Statistica Neerlandica, vol.62, pp. 482-508. Box, G.E.P., Jenkins, G.M., dan Reinsel, G.C. (1994). Time Series Analysis: Forecasting and Control. 3rd edition, Englewood Cliffs: Prentice Hall. Cryer, J.D. (1986). Time Series Analysis. PWS-Kent Publishing Co: Boston. Depkes RI. (2005). Pencegahan dan Pemberantasan Demam Berdarah Dengue Di Indonesia. Direktorat Jenderal Pengendalian Penyakit dan Penyehatan Lingkungan. Departemen Kesehatan RI. Ellyana, M. (2009). Penerapan GSTAR dan Model ARIMA Untuk Peramalan Data Produksi Minyak Bumi di Joint Operating Body Pertamina-Petrochina East Java (JOB P-PEJ). Tugas Akhir Statistika FMIPA-ITS. Surabaya. Lopuhaa, H.P. (2002). Space Time Autoregressive Models. Delft University of Technology. Jerman. Ningrum, S.P. (2010). Pemodelan spatio-temporal dengan metode gstar pada data curah hujan bulanan Di kabupaten ngawi. Tugas akhir Statistika FMIPA-ITS. Surabaya. Sasmito, Gunawan H, Widiatmoko H.(2006). Informasi Meteorologi Untuk Peringatan Dini Bahaya Demam Berdarah Dengue (DBD) di Wilayah DKI Jakarta. Laporan Proyek Pengembangan Meteorologi dan Geofisika Tahun 2006. BMKG Jakarta. Shofia, M.A. (2009). Peramalan Data Produksi Gas Di Joint Operating Body Pertamina-Petrochina East Java (Job P-PEJ) Dengan Model Gstar Dan Arima. Tugas Akhir Statistika FMIPA-ITS. Surabaya Suhartono dan Atok, R.M. (2006). Pemilihan Bobot Lokasi yang Optimal pada Model GSTAR, Prosiding Konferensi Nasional Matematika XIII, Universitas Negeri Semarang, 24-27 Juli 2006, hal. 571-580. (ISBN : 979-704-457-2). Wei, W.W.S. (2006). Time Series Analysis: Univariate and Multivariate Methods. Addison-Wesley Publishing Co., USA. 11