PEMODELAN JUMLAH KASUS KANKER SERVIKS DI JAWA TIMUR MENGGUNAKAN ANALISIS
GENERALIZED POISSON REGRESSION (GPR)
FINAL PROJECT PRESENTATION
12/06/2012
Oleh:
RIZA INAYAH / 1309.030.042
Dosen Pembimbing: DR. Purhadi, M.Sc
Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2012 FINAL PROJECT PRESENTATION
Outline
PENDAHULUAN
TINJAUAN PUSTAKA
FINAL PROJECT PRESENTATION
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN
PENDAHULUAN
TINJAUAN PUSTAKA
FINAL PROJECT PRESENTATION
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN
Data count
Regresi
Poisson Generalized Poisson Regression (GPR) dsb.
FINAL PROJECT PRESENTATION
PENELITIAN SEBELUMNYA Analisis Regresi Poisson dan
Generalized Poisson R egression (GPR) Listiani (2010) PEMODELAN REGRESI POISSON PADA FAKTORFAKTOR YANG MEMPENGARUHI ANGKA KEMATIAN BAYI DI JAWA TIMUR TAHUN 2007 FINAL PROJECT PRESENTATION
Kanker Serviks Khasbiyah (2004) BEBERAPA FAKTOR RISIKO KANKER SERVIKS UTERI (Studi Pada Penderita Kanker Serviks Uteri Di Rumah Sakit Dokter Kariadi Semarang Pada Bulan Agustus-September 2004)
Rumusan Masalah
Tujuan
model terbaik untuk pemodelan jumlah kasus kanker serviks di Jawa Timur tahun 2010 menggunakan analisis Generalized Poisson Regression (GPR) berdasarkan kriteria nilai AIC terkecil yang dihasilkan
FINAL PROJECT PRESENTATION
BATASAN MASALAH
Data yang digunakan: jumlah kasus kanker serviks yang terjadi di 29 kabupaten dan 8 kota yang ada di provinsi Jawa Timur tahun 2010. Kota Batu tidak diikutsertakan dalam penelitian ini karena dari pihak dinas kesehatan provinsi Jawa Timur tidak menerima laporan data kasus kanker serviks yang terjadi di kota Batu. Untuk mendapatkan model terbaik berdasarkan kriteria nilai AIC yang paling kecil. FINAL PROJECT PRESENTATION
PENDAHULUAN
TINJAUAN PUSTAKA
FINAL PROJECT PRESENTATION
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN
REGRESI POISSON Regresi Poisson digunakan untuk menganalisis variabel respon bertipe diskrit dan integer tidak negatif. Metode ini biasanya diterapkan pada penelitian kesehatan masyarakat, biologi, dan teknik dimana observabel responnya (y) berupa cacahan objek yang merupakan fungsi dari sejumlah karakteristik tertentu (x). Probabilitas dari Y “banyaknya suatu kejadian” yang berdistribusi Poisson yaitu (Agresti, 2002).
e −µ µ y P ( y; µ ) = y!
y = 0,1,2,...
dengan µ adalah rata-rata jumlah kejadian yang distribusi Poisson. FINAL PROJECT PRESENTATION
REGRESI POISSON Beberapa karakteristik percobaan yang mengikuti sebaran distribusi Poisson (Cameron dan Trivedi, 1998): a. kejadian yang terjadi pada populasi yang besar dengan probabilitas yang kecil b. Bergantung pada interval waktu tertentu c. Kejadian yang termasuk dalam counting process d. Perulangan dari kejadian yang mengikuti sebaran distribusi binomial
FINAL PROJECT PRESENTATION
REGRESI POISSON Asumsi pokok Equi dispersi E(Y) = Var (Y)
Penaksir parameter:
Maximum Likelyhood Estimation (MLE)
µ i = exp(x Ti β) = exp( β 0 + β1 x1i + β 2 x 2i + ... + β k x ki ) FINAL PROJECT PRESENTATION
GENERALIZED POISSON REGRESSION (GPR) Model ini merupakan suatu model yang sesuai untuk jenis data count yang apabila
dilakukan
analisis
regresi
Poisson,
ditemukan
adanya
ketidaksamaan antara nilai mean dan varians dari variabel respon atau terjadi over/under dispersi. Dalam GPR selain ada parameter µ juga ada θ sebagai parameter dispersi. (Famoye dkk, 2005)
µ i = exp(x Ti β) = exp( β 0 + β 1 x1i + β 2 x 2i + ... + β k x ki ) y = 0,1,2,...
FINAL PROJECT PRESENTATION
Akaike Information Criterion (AIC) Akaike Information Criterion (AIC) merupakan salah
satu kriteria dalam menentukan model terbaik regresi. Menurut Bozdogan dalam Listiani (2010) Akaike Information Criterion (AIC) didefinisikan sebagai berikut.
( )
( )
AIC = −2 ln L β + 2k
L β adalah nilai Likelihood, dan k adalah jumlah
parameter. Model terbaik adalah model yang mempunyai nilai AIC terkecil
FINAL PROJECT PRESENTATION
Multikolinieritas Multikolinearitas adalah kondisi terdapatnya hubungan linier atau • korelasi tinggi antaravariabel Koefisien yang korelasi (rij) antara masing-masing variabelprediktor independen dalamdari model Koefisien lebih besar 0,95 Korelasi regresi. VIF = Nilai VIF
Nilai Eigen
FINAL PROJECT PRESENTATION
1 1 − R 2j
• Nilai eigen minimum untuk matriks korelasi antar variabel prediktor kurang dari 0,05.
Over/Under Dispersi Var (Y) > E (Y) : Over dispersi
Hipotesis: H0 : θ = 0 (tidak terjadi kasus over dispersi) H1 : θ ≠ 0 (terjadi kasus over dispersi) H0 ditolak jika P_value dari estimasi θ yang dihasilkan kurang dari α. (Y)dengan < E (Y)nilai : Taksiran dispersi Var diukur Under dispersi devians atau Pearson's Chi-Square yang dibagi derajat bebas. Data over dispersi jika taksiran dispersi lebih besar dari 1 dan under dispersi jika taksiran dispersi kurang dari 1. FINAL PROJECT PRESENTATION
Kanker serviks Kanker serviks adalah penyakit kanker yang terjadi pada daerah leher rahim, yaitu daerah pada organ reproduksi wanita yang merupakan pintu masuk ke arah rahim. Kanker serviks 99,7 % disebabkan oleh Human Papilloma Virus (HPV) onkogenik yang menyerang leher rahim. Jenis virus HPV yang menyebabkan kanker serviks dan paling fatal akibatnya adalah virus HPV tipe 16 dan 18.
FINAL PROJECT PRESENTATION
PENDAHULUAN
TINJAUAN PUSTAKA
FINAL PROJECT PRESENTATION
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN
SUMBER DATA
• Data dari Dinas Kesehatan propinsi Jawa Variabel Timur tentang jumlah kasus kanker Respon serviks yang terjadi di kabupaten/ kota yang ada di Jawa Timur tahun 2010
Variabel Prediktor
• Data hasil Survey Sosial Ekonomi Nasional (SUSENAS) BPS Jawa Timur tahun 2010
FINAL PROJECT PRESENTATION
VARIABEL PENELITIAN Y
Jumlah kasus kanker serviks di setiap kabupaten/kota di Jawa Timur Tahun 2010
X1
Persentase sarana kesehatan di tiap kabupaten/kota di Jawa Timur
X2
Persentase tenaga medis di tiap kabupaten/kota di Jawa Timur
X3
X5
Persentase penduduk perempuan yang umur kawin pertama ≤16 tahun di tiap kabupaten/kota di Jawa Timur Persentase penduduk dan Rumah Tangga (RT) perempuan di tiap kabupaten/kota di Jawa Timur Persentase daerah yang berstatus desa di tiap kabupaten/kota di Jawa Timur
X6
Persentase penduduk yang tamat SMA di tiap kabupaten/kota di Jawa Timur
X7
Persentase penduduk miskin di tiap kabupaten/kota di Jawa Timur
X8
Persentase penduduk yang menggunakan kondom di tiap kabupaten/kota di Jawa Timur
X9
Persentase perempuan yang pernah kawin dan jumlah anak yang dilahirkan lebih dari 4 di tiap kabupaten/kota di Jawa Timur
X4
X10
Persentase penduduk perempuan yang berstatus kawin di tiap kabupaten/kota di Jawa Timur
X11
Persentase penduduk perempuan usia 35 tahun ke atas di tiap kabupaten/kota di Jawa Timur
FINAL PROJECT PRESENTATION
LANGKAH ANALISIS Mendeskripsikan data dari setiap variabel yang digunakan Melakukan deteksi multikolinieritas terhadap variabelvariabel bebas yang digunakan dan antisipasi penanggulangannya jika memang ditemukan terjadi kasus multikolinieritas. Mendapatkan model regresi Poisson dengan cara menaksir parameter model, menguji signifikansi parameter model (serentak dan parsial), serta mendapatkan nilai AIC dari model Regresi Poisson. Melakukan pengecekan asumsi regresi Poisson yaitu equi-dispersi dari variabel respon. Jika terjadi kasus over/under dispersi, dilanjutkan analisis GPR dengan tahapan seperti analisis regresi poisson. Menentukan model terbaik yaitu model dengan menghasilkan nilai AIC terkecil. FINAL PROJECT PRESENTATION
PENDAHULUAN
TINJAUAN PUSTAKA
FINAL PROJECT PRESENTATION
METODOLOGI PENELITIAN
ANALISIS DAN PEMBAHASAN
KESIMPULAN
Deskriptif Data Variabel
Rata-rata
Varians
Minimum
Maksimum
Y
45,600
7493,5
0,00
479,00
X1
0,1135
0,0155
0,02
0,73
X2
1,4380
1,2820
0,20
7,52
X3
29,640
173,95
12,12
62,70
X4
50,669
1,1600
48,49
53,33
X5
60,830
1064,29
0,00
93,55
X6
11,292
34,805
2,50
25,58
X7
15,110
38,280
5,90
32,47
X8
0,2241
0,0975
0,00
1,35
X9
9,692
13,008
2,95
21,50
X10
62,035
15,267
54,68
68,92
X11
46,985
21,098
38,38
55,19
FINAL PROJECT PRESENTATION
Deteksi Multikolinieritas Koefisien korelasi Pearson antar Xi # r (X1, X2) = 0,900 # r (X6,X5) = 0,897
FINAL PROJECT PRESENTATION
Xi
Nilai VIF
X1
11.3866
X2
9.10336
X3
5.94377
X4
3.48244
X5
9.05666
X6
10.6304
X7
4.92309
X8
1.38389
X9
2.58328
X10
5.67317
X11
2.50300
No. 1
Nilai Eigen 4,36744
2
2,11208
3
1,43356
4
1,03309
5
0,86567
6
0,65703
7
0,17109
8
0,14837
9
0,10923
10
0,05864
11
0,04380
X1
dikeluarkan
Dicek nilai VIF
Analisis Regresi FINAL PROJECT PRESENTATION
X6
dikeluarkan
X1 dan X6 tidak ikut dimodelkan
Dicek nilai VIF
Analisis Regresi Poisson
Estimasi parameter
FINAL PROJECT PRESENTATION
Uji signifikansi parameter (serentakParsial)
Pembentukan model
Estimasi Parameter Regresi Poisson Parameter Estimasi SE β0 29,4017 2,6780 β2 0,2563 0,0169 β3 0,0615 0,0048 β4 -0,2792 0,0416 β5 -0,0018 0,0020 β7 -0,1293 0,0102 β8 -0,6100 0,0953 β9 0,0386 0,0134 β10 -0,2150 0,0151 β11 0,0243 0,0095 FINAL PROJECT PRESENTATION
Z 10,98 15,17 12,71 -6,71 -0,87 -12,69 -6,40 2,89 -14,28 2,56
P-value <0,0001 <0,0001 <0,0001 <0,0001 0,3879 <0,0001 <0,0001 0,0064 <0,0001 0,0146
Uji signifikansi Parameter (serentak) H0: β2 = β3 = β4 = β5 = β7= β8 = β9 = β10 = β11 = 0 H1: paling sedikit ada satu βj ≠ 0 dengan j= 2,3,4,5,7,8,9,10,11
χ (29;0,15)
Nilai devians :1724,6
Tolak H0 FINAL PROJECT PRESENTATION
= 14,027
Uji signifikansi Parameter (Parsial) H0: βj = 0 (pengaruh variabel ke-j tidak signifikan) H1: βj ≠ 0 (pengaruh variabel ke-j signifikan)
FINAL PROJECT PRESENTATION
Parameter
Estimasi
SE
Z
P-value
β0
29,4017
2,6780
10,98
<0,0001
β2
0,2563
0,0169
15,17
<0,0001
β3
0,0615
0,0048
12,71
<0,0001
β4
-0,2792
0,0416
-6,71
<0,0001
β5
-0,0018
0,0020
-0,87
0,3879
β7
-0,1293
0,0102
-12,69
<0,0001
β8
-0,6100
0,0953
-6,40
<0,0001
β9
0,0386
0,0134
2,89
0,0064
β10
-0,2150
0,0151
-14,28
<0,0001
β11
0,0243
0,0095
2,56
0,0146
Model Regresi Poisson 29,4017 + 0,2563 X 2 + 0,0615 X 3 − 0,2792 X 4 − 0,1293 X 7 µˆ = exp − 0,6100 X 8 + 0,0386 X 9 − 0,2150 X 10 + 0,0243 X 11 Nilai AIC :1744,6 Kriteria
Nilai
db
Nilai/db
Pearson Chi-Square
1807,0600
28
64,5379
FINAL PROJECT PRESENTATION
Analisis Generalized Poisson Regression (GPR)
Estimasi parameter
FINAL PROJECT PRESENTATION
Uji signifikansi parameter (serentakParsial)
Pembentukan model
Kemungkinan Model GPR dengan AIC Minimum
351,3
Parameter Signifikan β0
X2, X5
351,5
β2 , β5, θ
X2, X8, X10
345,3
θ
X2, X8, X9, X10
345,2
β8, β9, θ
X2, X4, X7, X8, X9
341,7
θ
X2, X4, X5, X7, X10, X11
343,8
θ
X2, X3, X7, X8, X9, X10, X11
338,9
θ
X2, X4, X5, X7, X8, X9, X10, X11
339,6
θ
X5
Kemungkinan Model (Y dengan Xi )
FINAL PROJECT PRESENTATION
AIC
Uji signifikansi Parameter (serentak) H0: β2 = β8 = β9 = β10 = 0 H1: paling sedikit ada satu βj ≠ 0 dengan j= 2,8,9,10
χ (24;0,15)
Nilai devians :333,2
Tolak H0 FINAL PROJECT PRESENTATION
= 7,359
Uji signifikansi Parameter (Parsial) H0: βj = 0 (pengaruh variabel ke-j tidak signifikan) H1: βj ≠ 0 (pengaruh variabel ke-j signifikan) Parameter
Estimasi
SE
Z
P-value
β0
15,5210
12,4912
1,24
0,2219*
β2
24,5522
17,8650
1,37
0,1776
β8
31,6841
20,6906
1,53
0,1342
β9
0,7642
0,4901
1,56
0,1274
β10
-0,7201
0,5102
-1,41
0,1665
0,3467
0,0635
5,46
θ
*Tolak H0 pada taraf signifikan 23%
FINAL PROJECT PRESENTATION
< 0,0001
Uji keberadaan Over dispersi H0 : θ = 0 (tidak terjadi kasus over dispersi) H1 : θ ≠ 0 (terjadi kasus over dispersi)
Parameter
Estimasi
SE
Z
P-value
θ
0,3467
0,0635
5,46
< 0,0001
FINAL PROJECT PRESENTATION
Model GPR 15,5210 + 24,5522 X 2 + 31,6841X 8 µˆ = exp + 0,7642 X 9 − 0,7201X 10 ln E ( µˆ ) = 15,5210 + 24,5522 X 2 + 31,6841X 8 + 0,7642 X 9 − 0,7201X 10
Nilai AIC :345,2
FINAL PROJECT PRESENTATION
Pemilihan Model Terbaik
Model
Nilai AIC
Regresi Poisson
1744,6
GPR
345,2
FINAL PROJECT PRESENTATION
Kesimpulan Model terbaik terjadinya kasus kanker serviks di Jawa Timur menggunakan analisis GPR karena nilai AIC minimum. Faktor-faktor yang mempengaruhi jumlah kasus kanker serviks yang terjadi di kabupaten/kota di Jawa Timur meliputi persentase tenaga medis di tiap kabupaten/kota di Jawa Timur (X2), persentase penduduk yang menggunakan kondom (X8), persentase perempuan yang pernah kawin dan jumlah anak yang dilahirkan lebih dari 4 (X9) dan persentase penduduk perempuan yang berstatus kawin di tiap kabupaten/kota di Jawa Timur (X10). Peningkatan maupun penurunan jumlah kasus kanker serviks yang terjadi di kabupaten/ kota di Jawa Timur tergantung dari nilai koefisien variabel-variabel yang berpengaruh. FINAL PROJECT PRESENTATION
Saran Selama proses analisis, peneliti menemukan beberapa hal yang dirasa penting untuk dijadikan bahan pertimbangan dan pemikiran dalam penelitian ini, diantaranya adalah pemilihan variabel bebas yang diduga menjadi faktor-faktor yang mempengaruhi terjadinya kasus kanker serviks di kabupaten/kota di Jawa Timur serta metode analisis lain yang memungkinkan untuk dibandingkan hasilnya dengan analisis regresi Poisson dan GPR. Variabel bebas yang perlu dipertimbangkan misalnya tentang faktor geografis suatu daerah.
FINAL PROJECT PRESENTATION
Daftar Pustaka (1)
Agresti, A. 2002. Categorical Data Analysis Second Edition, John Wiley & Sons, New York. Anonim, 2011. http://chuzblog.blogspot.com/2011/03/kanker-serviks-tanda-tandapenyebab. html. Diakses pada 4 Desember 2011 pukul 14.00. Assriyanti, Novia. 2011. Perbandingan Analisis Regresi Poisson, Generalized Poisson Regression dan Geographically Weighted Poisson Regression (Studi Kasus: Permodelan Jumlah Kasus AIDS di JATIM tahun 2008). Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Bozdogan, H. 2000. Akaike's Information Criterion and Recent Developments in Information Complexity, Mathematical Psychology, 44, 62-91. Cameron, A.C. dan Trivedi, P.K. 1998. Regression Analysis of Count Data. Cambridge: CambCambridge University Press. Diananda, R. 2009. Panduan Lengkap Mengenai Kanker. Yogyakarta: Mirza Media Pustaka. FINAL PROJECT PRESENTATION
Daftar Pustaka (2)
Khasbiyah, 2004. Beberapa Faktor Risiko Kanker Serviks Uteri (Studi Pada Penderita Kanker Serviks Uteri Di Rumah Sakit Dokter Kariadi Semarang Pada Bulan Agustus-September 2004). Program sarjana. Universitas Diponegoro. Listiani, Y. (2010). Pemodelan Regresi Generalized Poisson pada Faktor-Faktor yang mempengaruhi Angka Kematian Bayi di Jawa Timur Tahun 2007. Surabaya: Program Sarjana, Institut Teknologi Sepuluh Nopember. Rasjidi, 2007. Panduan Pelaksanaan Kanker Ginekologi. Jakarta:EGC. Sari, Novita. 2011. Aplikasi Regresi Cox Proportional Hazard pada Analisis Kesintasan dan Identifikasi Faktor Resiko (Studi Kasus Penderita Kanker Serviks Pasien RSUP H. Adam Malik Medan tahun 2009). Medan: Program Sarjana, Universitas Sumatera Utara. •S. Bae, F. Famoye, J.T. Wulu, A.A. Bartolucci, K.P. Singh. 2005. A Rich Family of Generalized Poisson Regression Models With Applications. Mathematics and Computers in Simulation 69 (2005) 4–11. FINAL PROJECT PRESENTATION
Daftar Pustaka (3) Smith, H dan Draper,N.H., 1992. Analisis Regresi Terapan. Jakarta: PT Gramedia Pustaka Utama. Tresna, K. 2009. Deteksi Human Papiloma Virus Pada Sediaan Sitologi Papanicolau Smear Lesi Serviks: Suatu Uji Diagnostik. MOGI. Jakarta: Bina Pustaka Prawiroharjo.
FINAL PROJECT PRESENTATION
PEMODELAN JUMLAH KASUS KANKER SERVIKS DI JAWA TIMUR MENGGUNAKAN ANALISIS GENERALIZED POISSON REGRESSION (GPR)
Oleh: Riza inayah 1309.030.042
FINAL PROJECT PRESENTATION
12/06/2012