EKSPLORASI MODEL TINGKAT KECELAKAAN LALU-LINTAS JALAN TOL DENGAN TEKNIK GLM (GENERALIZED LINEAR MODELING) Bambang Haryadi Jurusan Teknik Sipil, Fakultas Teknik, Universitas Negeri Semarang (UNNES) Gedung E4, Kampus Sekaran Gunungpati Semarang 50229, Telp. (024) 8508102
Abstract: The objectives of the presents study was to explore mathematical models that could be used to estimate the number of accidents on inter-urban toll roads. Preditive models were developed by relating traffic exposure (average daily traffic and road section length) with the number of accidents per unit of time.Accident, roadway section and traffic volume data were obtained from Jagorawi, Jakarta-Cikampek, padaleunyi, and palikanci toll road. Accident rate models were developed from those data using generalized linear modelling (GLM) techniques. The conclusions from the study were: (1) linier regression model was not appropriate to be used to predict accidents number, because accident occurence did not follow normal distribution, (2) Poisson regression possessed accident occurence characteristics: descrete, rare and random, and (3) Negative Binomial distribution was more appropriate to represent accident occurence phenomenon with overdispersion. Keywords: accident rate, generalized linear modelling, Poisson regression, nagative binomial regression. Abstrak: Penelitian ini bertujuan untuk mengeksplorasi model matematis yang dapat digunakan untuk meramalkan jumlah kecelakaan, pada suatu ruas jalan tol antar kota. Model prediksi dikembangkan dengan menghubungkan paparan lalulintas, yang dinyatakan dengan volume lalulintas dan panjang ruas jalan, dengan keselamatan, yang dinyatakan dalam jumlah kecelakaan per satuan waktu. Data jalan, kecelakaan, dan lalulintas selama dua tahun, diambil dari jalan tol antar kota Jagorawi, Jakarta-Cikampek, Padaleunyi dan Palikanci. Model tingkat kecelakaan dikembangkan dari data tersebut dengan teknik generalized linear modelling (GLM), dan dikalibrasi dengan menggunakan teknik-teknik statistik. Beberapa kesimpulan yang dapat ditarik dari penelitian ini adalah: (1) Model regresi linier dengan distribusi normal tidak memadai untuk memprediksi kecelakaan; tingkat kecelakaan tidak terbukti mengikuti distribusi normal; (2) Penggunaan regresi Poisson lebih mencerminkan karakteristik kejadian kecelakaan: diskrit, acak, langka; dan (3) Distribusi Binomial Negatif paling baik merepresentasikan kejadian kecelakaan dengan adanya gejala overdispersi pada data. Kata kunci: tingkat kecelakaan, generalized linear modelling, regresi poisson, regresi binomial negatif.
PENDAHULUAN
volume lalulintas. Sebagai gambaran, apabila
Tingkat Kecelakaan (TK) (accident rate)
suatu ruas jalan mempunyai banyak kecelakaan
adalah persamaan matematis yang menyatakan
dan sekaligus mempunyai volume lalulintas
hubungan antara faktor-faktor dominan yang
yang
mempengaruhi
Dengan
mempunyai TK yang kecil dan oleh sebab itu
TK memungkinkan kita
dapat dikategorikan lebih aman dibandingkan
melakukan perbandingan tingkat keselamatan
ruas jalan lain dengan jumlah kecelakaan yang
antar berbagai lokasi yang berbeda. Hal ini
lebih sedikit tetapi dengan LHR (lalulintas harian
dimungkinkan
menormalisasi
rata-rata) yang jauh lebih rendah. TK biasanya
jumlah kecelakaan yang terjadi di suatu ruas
dinyatakan sebagai perbandingan antara jumlah
kecelakaan.
menggunakan nilai
dengan
cara
sangat
besar,
ruas
tersebut
bisa
jalan dengan periode waktu, panjang ruas, dan
Eksplorasi Model Tingkat Kecelakaan Lalu-lintas Jalan Tol Dengan Teknik GLM (Generalized Linear Modeling) – Bambang Haryadi 91
kecelakaan
dibagi dengan jumlah
panjang
perjalanan atau vehicle-km traveled (VKT).
memprediksi terjadinya kejadian tertentu. Model prediksi kecelakaan adalah persamaan yang
Bagian penting dalam penilaian resiko
menyatakan
frekuensi
kecelakaan
sebagai
kecelakaan adalah identifikasi ukuran paparan
fungsi dari arus lalu lintas dan karakteristik jalan
(exposure) yang tepat terhadap resiko yang
yang lain. Banyak isu yang muncul berkaitan
sedang dikaji (Qin, et al, 2005). Jumlah
dengan pemodelan maupun dengan sifat daari
perjalanan atau paparan menunjukkan peluang
kecelakaan lalu lintas itu sendiri. Sejumlah isu
terjadinya
penting dibahas dalam bagian berikut.
masing-masing
kecelakaan
(Saccomano & Buyco, 1988). Arus lalulintas
GLM (Generalized Linear Modeling)
merupakan ukuran paparan yang paling umum.
merupakan metode yang paling langsung yang
Misalnya, pengelola jalan tol
digunakan
mempunyai
tolok
ukur
tingkat
kecelakaan
sebagai
berikut:
keselamatan,
(TK), TK =
PT Jasamarga
dengan
yaitu definisi
JK ×100 juta kendaraan LHR × L × jumlah hari
untuk
mengembangkan
model
matematis. GLM biasanya terdiri dari tiga komponen:
komponen
sistematik,
dan
random,
fungsi
menghubungkan
komponen
penghubung
dua
komponen
yang untuk
Dimana JK adalah jumlah kecelakaan, LHR
menghasilkan prediktor linier (Lord & Persaud,
adalah lalu lintas harian rata-rata, dan L adalah
2000). Asumsi penting alam pemodelan linier
panjang ruas jalan.
tergeneralisasi adalah bahwa random error
Kekurangan dari pendekatan ini adalah
terjadi hanya pada variabel terikat dan bahwa
asumsi adanya hubungan linier antara jumlah
variabel-variabel bebas diketahui tanpa error
kecelakaan dengan VKT. Pada kenyataannya
(Maher & Summersgill, 1996). Ini merupakan
terdapat bukti bahwa hubungan tersebut tidak
asumsi penting yang harus selalu diperhatikan
linier, dan asumsi linieritas melemahkan akurasi
karena tidak semua variabel yang diperlukan
prediksi kecelakaan (Qin, dkk., 2005). Sebagai
yang berkontribusi pada kecelakaan kendaraan
alternatif, perlu eksplorasi bentuk hubungan
diketahui tanpa error. Untuk variabel geometri
antara jumlah kecelakaan dengan jumlah dan
dan kontrol seperti jumlah lajur dan keberadaan
panjang perjalanan tanpa disaumsikan secara
median, variabel ini diketahui tanpa error, tetapi
apriori adanya hubungan linier antara jumlah
tidak
kecelakaan
karakteristik lalu lintas seperti volume dan
dengan
(exposure)
paparan
perjalanan tersebut dengan menggunakan data aktual. Tulisan ini bertujuan untuk mengkaji
demikian
dengan
semua
variabel
persen kendaraan berat. Pilihan
distribusi
probabilitas
dalam
hubungan antara jumlah kejadian kecelakaan
GLM fleksibel untuk komponen random, yang
dengan volume lalulintas harian rata-rata (LHR).
membuat model ini efektif untuk keselamatan
Termasuk didalamnya adalah kajian mengenai
lalu lintas dimana jumlah kecelakaan dan
asumsi distribusional dan bentuk fungsional.
variabel lain mengikuti distribusi Poisson atau binomial
METODOLOGI PENELITIAN
negatif
dan
mengikuti distribusi normal.
Pemodelan matematis adalah teknik untuk
membuat
metode
kuantifiabel
variabel
untuk
92 JURNAL TEKNIK SIPIL & PERENCANAAN, Nomor 1 Volume 13 – Januari 2011, hal: 91 – 100
yang
lain
Model Linier
pada kasus lain selain distribusi normal. Nilai R
2
penelitian
yang rendah tidak hanya berarti model tidak
tentang hubungan kecelakaan lalu lintas dengan
cocok untuk data yang bersangkutan, tetapi juga
faktor penyebabnya, seperti misalnya volume
tidak ada hubungan linier antara variabel-
lalu lintas, menggunakan analisis regresi linier
variabel yang dikaji, dan harus digunakan
konvensional,
bentuk-bentuk fungsi atau distribusi yang lain.
Secara
historis
yang
mayoritas
mengasumsikan
bahwa
variabel terikat adalah kontinyu dan berdistribusi normal dengan varian error konstan. Pada
Regresi Poisson
umumnya koefisien regresi didapatkan dengan
Beberapa
peneliti
percaya
bahwa
metode kuadrat terkecil tradisional (ordinary
koefisien model prediksi kecelakaan tidak dapat
least squares). Metode ini menghasilkan point
dengan benar ditaksir dengan metode regresi
estimator, β, yang mempunyai varian minimum.
kuadrat-terkecil
Pendekatan analisis varian (ANOVA) biasanya
terbobot. Hal ini dikarenakan jumlah kecelakaan
digunakan dan memisahkan sum of squares
bersifat
diskrit,
non-negatif
(jumlah kuadrat) dan derajad kebebasan yang
bahwa
varian
jumlah
berkaitan dengan variabel terikat. Mean squared
membesar seiring dengan semakin besarnya
error, MSE, dapat diperoleh dari tabel ANOVA
arus lalu lintas tetapi tidak secara linier (Lord &
2
biasa
atau
kuadrat-terkecil
dan
kenyataan
kecelakaan
makin
dan merupakan taksiran varian (σ ) tak-bias.
Persaud, 2000).
Varian error terms (εi) juga merupakan indikasi
lognormal konvensional tidak memiliki sifat-sifat
varian dari distribusi probabilitas variabel terikat.
statistis yang diperlukan untuk mendeskripsikan
Varian digunakan untuk menghitung
kecelakaan kendaraan. Masalah utama dengan
koefisien
2
determinasi,
R,
Model regresi normal atau
yang
pemodelan linier/multilinier adalah bahwa model
merepresentasikan proporsi variabilitas yang
ini mempunyai kemungkinan untuk memprediksi
dijelaskan
kecelakaan
oleh
fungsi
regresi.
Koefisien
negatif,
dimana
tidak
mungkin
derterminasi merupakan metode yang paling
terjadi dalam kenyataan (Miaou et al., 1992).
umum untuk menentukan kualitas model yang
Suatu lokasi tanpa kejadian kecelakaan dapat
dicari dan mempunyai rentang nilai antara nol
terjadi, tetapi tidak ada lokasi dengan jumlah
dan
satu.
Nilai
R
2
mendekati
nol
kecelakaan
negatif.
Hubungan
antara
mengindikasikan tidak adanya hubungan linier
kecelakaan dengan faktor-faktor yang berkaitan
yang kuat antara variabel bebas dan terikat.
tidak selalu refleksi perilaku linier yang berakibat
Nilai
R
2
mendekati
satu
mengindikasikan
kecocokan linier yang kuat dimana model menjelaskan variabilitas pada data. R
2
harus
regresi multi-linier tidak tepat untuk analisis sebab-sebab
kecelakaan
(Saccomanno
&
Buyco, 1988). Di lain pihak, dengan semakin
digunakan dengan hati-hati untuk menjamin
mudahnya
interpretasi
digabungkan
canggih dan user friendly, para peneliti mulai
dengan pemerikasaan dengan diagram pencar
menaksir koefisien model dengan menggunakan
yang
benar
dan
atau scatter plot (Garber & Ehrhart, 2000). R
2
metode
program
pemodelan
maximum-likelihood
diakses,
(kecocokan
merupakan parameter yang bermanfaat hanya
maksimum) untuk kalibrasi model-model linier
dalam model regresi linier; ia tidak aplikabel
tergeralisasi
(generalized
linear
models).
Eksplorasi Model Tingkat Kecelakaan Lalu-lintas Jalan Tol Dengan Teknik GLM (Generalized Linear Modeling) – Bambang Haryadi 93
Penggunaan tipe distribusi lain juga menjadi
yang merupakan fungsi dari satu set variabel
semakin polular. Pilihan model yang disukai
bebas X. Xi adalah vektor variabel bebas untuk
adalah distribusi Poisson. Pilihan fungsi sesuai
ruas i. Fungsi µi =µ(Xi,β), yang menghubungkan
dengan
fungsi
rerata distribusi pada varaiabel bebas, adalah
luas
fungsi penghubung µi = µ(Xi,β)= e X i β . Variabel
dan
bebas adalah item-item seperti arus lalu lintas
sifat
kecelakaan
adalah
eksponensial,
dimana
sudah
secara
digunakan
oleh
statistikawan
ekonometrikawan (Miaou et al., 1992). Regresi pendekatan
Poisson
pemodelan
dan karakteristik geometrik. Vektor X, yang
adalah nonlinier
suatu
terdiri dari variabel bebas mempunyai nilai 1
dimana
sebagai faktor (term) pertamanya sehingga
variabel terikatnya adalah hitungan (count), atau
faktor
kejadian diskrit yang langka (Nater et al., 1999).
interseptor atau konstan. Apabila lokasi yang
Data hitungan telah dianalisis dengan regresi
dikaji berupa suatu panjang jalan, bukan berupa
linier biasa, tetapi ada keuntungan dengan
persimpangan, biasanya diasumsikan bahwa µi
menggunakan
dari
juga proporsional terhadap panjang Li maupun
kenyataan bahwa distribusi ini digunakan atau
terhadap periode waktu, sehingga λi adalah
dirancang untuk distribusi variabel terikat diskrit
dalam bentuk kecelakaan per kilometer per
dan yang seringkali sangat menceng (skewed).
tahun.
regresi
Distribusi probabilitas P (Y ) =
e
Poisson
Poisson
kejadian
yaitu
memodelkan
diskrit
dengan
−µ Y
µ
. dan dapat diturunkan sebagai
Y!
pertama
dalam
vektor
β
adalah
Satu masalah utama adalah fenomena overdispersi
dimana
asumsi
struktur
error
Poisson murni dapat dilihat tidak memadai. Model binomial negatif sering dipilih untuk
limit distribusi binomial dimana jumlah ulangan
mengatasi masalah ini sebagai ekstensi dari
(trial), n, mendekati tak-hingga dan probabilitas
model Poisson. Tetapi seringkali varian lebih
sukses
nol
besar dari rerata terjadi disebabkan sebagian
sedemikian rupa sehingga np=λ (Rice, 1988).
karena tidak dimasukkannya semua variabel
Dimana Y adalah jumlah kejadian pada periode
yang relevan ke dalam model (Knuiman et al.,
yang dipilih dan µ adalah jumlah rata-rata
1993). Bila yang terjadi varian lebih besar
kejadian pada periode yang dipilih. Model
dibandingkan dengan rerata hal ini disebut
regresi Poisson mengasumsikan bahwa jumlah
dengan overdispersi.
tiap
ulangan,
p,
mendekati
kejadian rata-rata merupakan fungsi variabelvariabel regresor. Untuk menaksir frekuensi kecelakaan,
ia
diasumsikan
Distribusi binomial negatif merupakan
dengan
ekstensi alamiah dari distribusi Poisson, yang
sama
memperhitungkan variabilitas yang berlebihan
Poisson P (Y = Yi ) =
e
−µ( Xi β )
[ µ i ( X i , β )] Yi !
Yi
.
Regresi Binomial Negatif
berdistribusi
Yi
yang kadang ditemukan dalam model prediksi
dengan jumlah kecelakaan pada ruas jalan ‘i’
kecelakaan. Distribusi ini mulai diminati untuk
untuk periode waktu yang dipilih. Β adalah
digunakan
vektor parameter yang ditaksir. µi =µ(Xi,β)
digunakan untuk membantu mengatasi masalah
adalah jumlah kecelakaan rata-rata pada ruas ‘i’
yang
terjadi
dalam
penelitian
dengan
94 JURNAL TEKNIK SIPIL & PERENCANAAN, Nomor 1 Volume 13 – Januari 2011, hal: 91 – 100
transportasi,
pemodelan
Poisson,
khususnya varian dimungkinkan untuk berbeda
dengan cara berikut: Dari asumsi independen
dari rerata dalam regresi binomial negatif (Hadi
setiap
et al., 1995). Kedua distribusi berkaitan dengan
p r (1 − p )k −r . Ulangan terakhir sukses, dan r-1
sekuen Bernoulli. Model binomial negatif dapat
sekuen
data
model
hitungan
Poisson
dibandingkan
disebabkan
dengan
k −1
(Rice, 1988). Jika 1 sisanya dengan cara r −1
faktor
kejadian ke-r terjadi pada ulangan ke-k, akan
pengganggu (disturbance term) yang membantu
ada tepat r-1 kejadian sebelum ulangan ke-n-1
untuk mengatasi masalah overdispersi yang
dan pada ulangan ke-k kejadiannya juga terjadi.
terjadi pada pemodelan Poisson (Allison, 1999).
‘X’ biasanya didefinisikan sebagai jumlah total
Koefisien beta pada model ditaksir dengan
ulangan dalam distribusi, tetapi kadang-kadang
metode quasi-likelihood (Knuiman et al.,1993).
didefinisikan sebagai jumlah total kegagalan
Estimasi maximum likelihood juga merupakan
dalam distribusi (Rice, 1988). Cara penulisan
cara yang efisien untuk menaksir parameter
fungsi
dalam regresi binomial negatif. Model regresi
hubungan
binomial
distribusi binomial negatif. Kedua distribusi
mempunyai
karena
probabilitas
sukses sisanya dapat diberikan pada ulangan k-
dianggap sebagai distribusi yang lebih umum untuk
mempunyai
bentuk
Log
massa
probabilitas
antara
distribusi
memungkinkan binomial
dan
λi=β0+β1Xi1+...+βkXik+σεi
,
dimana
variabel
terikat
mengikuti
distribusi
Dalam distribusi binomial negatif, rerata
Poisson dengan nilai harapan λi kondisional
tidak harus sama dengan varian. Rerata untuk
terhadap εi (Allison, 1999). Nilai harapan εi
variabel randon binomial negatif sama dengan:
Y
diasumsikan
diasumsikan
mengikuti
distribusi
gamma
standard. Selanjutnya distribusi unconditional Yi mengikuti distribusi negatif binomial (Allison,
terdiri dari sekuen ulangan independen.
µ = E( x ) = σ 2 = V( x) =
1993). Distribusi negatif binomial didasarkan
r . Sedangkan varian sama dengan: p r (1 − p ) p2
(Montgomery
&
Runger,
2003).
pada variabel random binomial negatif dimana jumlah sukses tetap dan jumlah ulangan random
DATA
(Devore, 1999). Variabel random yang menjadi
Data penelitian diambil dari tiga lokasi
perhatian adalah X=jumlah kegagalan yang
jalan tol, yaitu Jalan Tol Jagorawi (Jakarta-
mendahului
mempunyai
Bogor-Ciawi), Jalan Tol Jakarta-Cikampek, dan
kemungkinan nilai 0, 1, 2, ... Fungsi massa
Jalan Tol Padaleunyi (Padalarang-Cileunyi).
probabilitas untuk distribusi binomial negatif
Tipe data yang digunakan dalam penelitian
dapat
adalah data ruas jalan, data lalu lintas, dan data
sukses
ke-r.
dituliskan
k − 1 r p (1 − p )k − r P ( X = k ) = r −1
Misalnya
X
urutan
ulangan
sebagai dimana k=r,r+1,... bebas
dilakukan
kecelakaan. Data dikumpulkan dari pengelola masing-masing jalan tol, yaitu PT Jasamarga cabang
yang
bersangkutan.
Secara
sampai seluruhnya ada r sukses; dengan X
keseluruhan, dari ketiga jalan tersebut ada 57
menyatakan
Untuk
ruas jalan yang masing-masing relatif homogen
mendapatkan P(X=k), kita dapat melakukan
sepanjang ruas baik dalam aspek lalu-lintas
jumlah
total
ulangan.
Eksplorasi Model Tingkat Kecelakaan Lalu-lintas Jalan Tol Dengan Teknik GLM (Generalized Linear Modeling) – Bambang Haryadi 95
maupun karakteristik geometri jalan. Untuk
panjang ruas versus jumlah kecelakaan total
keperluan analisis digunakan periode data dua
mengikuti
tahun agar diperoleh data jumlah kecelakaan
menjelaskan sebagian besar variasi dalam data,
yang memadai untuk analisis.
maka
distribusi
diperlukan
normal
tetapi
model
tidak
dengan
mengkombinasikan kedua variabel bebas dalam HASIL
satu model. Berikut ini adalah hasil keluaran
Model Regresi Linier
regresi linier dan anova hubungan kecelakaan
Ada kemungkinan hubungan antara volume versus jumlah kecelakaan total maupun
total dengan panjang ruas dan LHR dari fungsi lm (linear model) dari perangkat lunak R .
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.459e+01 1.695e+01 1.451 0.1526 Panjang 5.217e+00 2.008e+00 2.598 0.0120 * lhrt 1.298e-04 2.043e-04 0.635 0.5280 Residual standard error: 44.75 on 54 degrees of freedom Multiple R-Squared : 0.1131, Adjusted R-squared: 0.08027 F-statistic : 3.444 on 2 and 54 DF, p-value: 0.03911
Bentuk model yang dihasilkan dari
kenyataan, oleh karena itu model ini tidak dapat
output fungsi lm perangkat lunak R adalah:
digunakan untuk menunjukkan hubungan antara
Total=24.59+5.217*Panjang+0.0001298*lhrt.
jumlah kecelakaan total dengan panjang ruas
Taksiran
ruas
dan volume lalulintas. Dari analisis statistik
signifikan bertanda positif yang berarti semakin
diketahui bahwa hanya parameter panjang ruas
panjang ruas jalan semakin banyak terjadi
yang signifikan diatas lima persen, sedangkan
kecelakaan.
intersep
parameter
untuk
Koefisien
panjang
untuk
LHR
tidak
dan
parameter
untuk
LHR
tidak
signifikan, juga positif yang berarti semakin
signifikan dan tidak banyak membantu dalam
besar
menjelaskan variasi dalam data.
volume
kecelakaan
lalulintas yang
semakin terjadi.
banyak Dengan
Untuk menguji apakah asumsi model
mengkombinasikan kedua variabel bebas dalam
terpenuhi, dikaji hubungan antara nilai predikasi
satu model lebih banyak variabilitas yang dalam
dan nilai residu seperti disajikan pada Gambar
model yang dijelaskan, yaitu sebesar 11.31
1(a)
persen, lebih besar dibandingkan bila hanya
ketidakseimbangan antara titik-titik di atas dan
menggunakan variabel bebas volume
(0.22
di bawah garis nol, tetapi tidak menunjukkan
persen) atau hanya menggunakan variabel
adanya penyimpangan linieritas dan kesamaan
bebas panjang ruas (10.65 persen).
varian yang substansial pada data. Tidak
Kedua variabel bebas, Panjang dan lhrt
plot
residu
memperlihatkan
terdapat pola yang nyata pada titik-titik data dan
bertanda positif seperti yang diharapkan, tetapi
dengan
adanya intersep merupakan suatu masalah.
kurang lebih terdistribusi seimbang antara nilai
Positif intersep menunjukkan bahwa walaupun
positif dan nilai negatif, meskipun dengan jelas
tidak terdapat lalulintas dan panjang ruas sama
terlihat di bawah garis nol titik tersebar pada
dengan nol model meramalkan terjadinya lebih
rentang 0 hingga -50 sedangkan di atas garis
dari 24 kejadian kecelakaan per dua tahun. Hal
nol posisi nilai residual lebih menyebar pada
ini tentu saja tidak tidak mungkin dalam
rentang nilai antara 0 hingga 100 bahkan ada
sedikit
pengecualian
96 JURNAL TEKNIK SIPIL & PERENCANAAN, Nomor 1 Volume 13 – Januari 2011, hal: 91 – 100
titik
tersebut
satu titik menyebar jauh dari yang lain pada nilai
gambar terlihat adanya penyimpangan dari data
150.
terhadap Normal quantile plot untuk kecelakaan
normalitas.
penyimpangan
Pada
ada
di
bagian
bagian
kemudian
awal
atas
berangsur
garis
total, panjang ruas dan LHR ditunjukkan pada
normalitas
turun
Gambar 1(b). Garis lurus pada Gambar 1(b)
menyimpang di bagian bawah garis normalitas
menunjukkan normalitas sedang garis berupa
di bagian tengan dan kemudian naik lagi
titik-titik merepresentasikan data aktual. Dari
menyimpang di bagian atas garis normalitas. 150 100 50
Raw residuals
-50
0
50 -50
0
Residuals
100
150
Normal Q-Q Plot
40
50
60
70
80
90
100
-2
Fitted
-1
0
1
2
Theoretical Quantiles
(a) (b) Gambar 1. (a) Nilai prediksi vs. residu untuk kecelakaan total, panjang ruas dan volume lalulintas, (b) Normal quantile plot untuk kecelakaan total, panjang ruas dan volume lalulintas dengan regresi linier.
Model Poisson
Oleh karena itu distribusi yang berdasarkan
Model regresi linier berdasarkan pada asumsi
distribusi
normal
yang
merupakan
count data dikaji kemungkinan lebih tepat untuk memprediksi jumlah kecelakaan.
distribusi kontinyu. Hal ini menjadi alasan untuk
Fungsi glm (generalized linear model)
melakukan eksplorasi terhadap distribusi lain
dari perangkat lunak R digunakan untuk fitting
karena data kecelakaan lalulintas pada suatu
model
ruas
tertentu
kecelakaan total dengan panjang ruas dan
merupakan data hitungan (count) diskrit non-
lalulintas harian rata-rata (LHR). Ringkasan
negatif yang tidak mengikuti distribusi normal.
disajikan berikut ini.
jalan
pada
periode
waktu
Poisson
hubungan
antara
jumlah
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 3.503e+00 5.224e-02 67.063 < 2e-16 *** Panjang 7.792e-02 5.204e-03 14.973 < 2e-16 *** lhrt 2.622e-06 5.934e-07 4.419 9.93e-06 *** Signif. Codes : 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Null deviance : 1891.6 on 56 degrees of freedom Residual deviance : 1677.6 on 54 degrees of freedom AIC : 2004.7
Model yang dihasilkan adalah Ln(Total) = 3.503+0.07792(Panjang)+0.000002622(LHR),
Asumsi dasar dari distribusi Poisson
atau
adalah adanya kesamaan nilai rerata dan
Total = e 3.503 * e 0.07792 ( Panjang ) * e 0.000002622 ( LHR )
varian. Model yang dikembangkan dengan menggunakan distribusi Poisson menunjukkan nilai
overdispersi
yang
besar,
dimana
Eksplorasi Model Tingkat Kecelakaan Lalu-lintas Jalan Tol Dengan Teknik GLM (Generalized Linear Modeling) – Bambang Haryadi 97
merupakan indikasi bahwa nilai rerata jauh
varian. Hal ini juga mengindikasikan bahwa data
berbeda dari nilai varian. Hal ini melanggar
tidak cocok dengan jenis fungsi dari model.
asumsi
yang
paling
dasar.
Dari
keluaran
Dari
keluaran
perangkat
lunak,
perangkat lunak R diatas memperlihatkan gejala
walaupun semua variabel signifikan pada taraf
overdispersi yang besar. Nilai residual deviance
lebih dari 95 persen, tetapi dapat dilihat adanya
adalah 1677.6 dengan 54 derajad kebebasan
kemungkinan nilai koefisien panjang ruas dan
memberikan rasio deviance dibagi derajad
LHR dapat sama dengan nol. Gagasan bahwa
kebebasan
sebesar
sebuah
angka
volume dan panjang ruas tidak mempunyai
Nilai
satu
pengaruh pada jumlah kecelakaan yang terjadi,
mengindikasikan tidak ada masalah dengan
berdasarkan pengamatan, merupakan ide yang
overdispersi, semakin besar nilainya, semakin
sulit diterima. Karena asumsi model tidak benar
besar pula perbedaan nilai antara rerata dan
hubungan ini invalid.
perbandingan
31.07,
yang
besar.
15 10 5
sorted deviance residuals
-5
0
5 -5
0
deviance residuals
10
15
Normal Q-Q Plot
40
50
60
70
80
90
100
110
-2
-1
fiited values
0
1
2
Theoretical Quantiles
(a) (b) Gambar 2. (a) Nilai prediksi vs. residu, dan (b) Normal quantile plot untuk kecelakaan total, panjang ruas dan volume lalulintas dengan regresi Poisson.
Model Binomial Negatif
distribusi Poisson, tetapi masalah overdispersi
Fungsi generalized linear model untuk
hampir sepenuhnya dapat diatasi. Nilai intersep
binomial negatif (glm.nb) dari perangkat lunak R
dan koefisien untuk panjang ruas dan volume
untuk mencocokkan model binomial negatif
sangat
hubungan
total dengan
overdispersi membuat data lebih cocok dengan
panjang ruas dan volume lalulintas. Ringkasan
distribusi ini. Nilai deviance dibagi dengan
luarannya adalah sebagai berikut.
derajad
antara
kecelakaan
mirip,
tetapi
kebebasan
eliminasi
adalah
masalah
1.133278,
Penggunaan distribusi binomial negatif
merupakan
memodelkan
volume
menjadikannya model yang sangat bagus untuk
mengatasi
variabelnya. Nilai sebesar 1.0 menunjukkan
masalah overdispersi. Model yang dihasilkan
tidak ada masalah varian lebih besar dari pada
mirip dengan model yang dihasilkan dengan
yang diijinkan.
untuk
lalulintas
dan
panjang
kecelakaan
ruas, total
nilai
Coefficients: Estimate (Intercept) 3.491e+00 Panjang 7.591e-02
Std. Error 2.732e-01 3.221e-02
z value 12.776 2.357
Pr(>|z|) <2e-16 *** 0.0184 *
98 JURNAL TEKNIK SIPIL & PERENCANAAN, Nomor 1 Volume 13 – Januari 2011, hal: 91 – 100
yang
sangat
kecil,
lhrt 3.108e-06 3.285e-06 0.946 Null deviance : 67.734 on 56 degrees of freedom Residual deviance : 61.197 on 54 degrees of freedom AIC : 574.75
maupun
Variabel panjang ruas signifikan pada
0.3442
distribusi
negatif
memberikan
signifikan. Sebagaimana dengan model yang
membangun
dikembangkan dengan distribusi Poisson, baik
dilakukan transformasi logaritma variabel LHR.
koefisien
LHR
Dengan transformasi logaritma variabel LHR
mempunyai peluang untuk bernilai nol. Model,
output yang diberikan oleh fungsi glm.nb dari
baik dengan menggunakan distribusi Poisson
perangkat lunak R adalah sebagai berikut.
ruas
maupun
tingkat
yang
baik
tidak
level 95 persen, tetapi variabel LHR tidak
panjang
metode
binomial
kecelakaan.
untuk
Untuk
itu
Coefficients: Estimate Std. Error z value (Intercept) -0.42665 1.71063 -0.249 Panjang 0.07448 0.03131 2.379 log(lhrt) 0.38224 0.15864 2.410 Null deviance : 71.362 on 56 degrees of freedom Residual deviance : 60.939 on 54 degrees of freedom AIC : 571.31
Pr(>|z|) 0.8030 0.0174 * 0.0160 *
3 2 1 -1
0
sorted deviance residuals
1 0 -1
deviance residuals
2
3
Normal Q-Q Plot
30
40
50
60
70
80
90
-2
-1
fiited values
0
1
2
Theoretical Quantiles
(a) (b) Gambar 3. (a) Nilai prediksi vs. residu untuk kecelakaan total, panjang ruas dan volume lalulintas dengan regresi binomial negatif, (b) Normal quantile plot untuk kecelakaan total, panjang ruas dan volume lalulintas dengan regresi binomial negatif
Sehingga model yang dihasilkan adalah: Ln(Total)=-0.427+0.075(Panjang)+0.382*Ln(LHR).
Gambar 3(b) menunjukkan penyimpangan yang kecil terhadap distribusi normal.
Variabel panjang ruas dan ln(LHR) signifikan pada level 95 persen. Nilai deviance dibagi
KESIMPULAN
dengan derajad kebebasan mendekati satu. Gambar 3(a) yang merupakan plot deviance
residual
terhadap
nilai
Formula accident rate yang selama ini digunakan
kurang
valid,
karena
hubungan
prediksi
antara jumlah kecelakaan dengan LHR maupun
menunjukkan gejala varian konstan, dimana
panjang ruas pada kenyataannya tidak bersifat
sebagian besar titik terletak pada rentang yang
linier. Model regresi linier dengan distribusi
konstan disekitar nol. Normal quantile plot pada
normal
tidak
memadai
untuk
memprediksi
kecelakaan, karena dari data yang digunakan
Eksplorasi Model Tingkat Kecelakaan Lalu-lintas Jalan Tol Dengan Teknik GLM (Generalized Linear Modeling) – Bambang Haryadi 99
dalam penelitian ini ditemukan bahwa tingkat kecelakaan tidak terbukti mengikuti distribusi
hyghway types using negative binomial regression. Transport. Res. Record. 1500:169-176.
normal. Regresi Poisson lebih mencerminkan karakteristik
kejadian
kecelakaan,
yang
diketahui bersifat diskrit, acak (random), dan langka. Namun, penggunaan distribusi Poisson yang mengasumsikan kesamaan varian dan mean tidak
tercermin dalam data; kejadian
kecelakaan yang dikaji dalam penelitian ini mengindikasikan gejala overdispersi. Sebagai alternatif dari regresi Poisson, regresi
dengan
menggunakan
distribusi
Binomial Negatif paling baik merepresentasikan kejadian kecelakaan dengan adanya gejala overdispersi pada data.
DAFTAR PUSTAKA Allison, Paul D. 1999. Logistic Regression Using the SAS System: Theory and Application. Cary, NC.: SAS Institute Inc. Bonneson, J. A., and P. T. McCoy. 1997. “Effect of Median Treatment on Urban Arterial Safety: An Accident Prediction Model,” Highway Research Record 1581, Highway Research Board, Washington, D.C.
Knuiman, M. W., Council, F.M. and D. W. Reinfurt. 1993. “Association of Median Width and Highway Accident Rates,” Highway Research Record 1401, Highway Research Board, Washington, D.C. Lord, D. 2002. Application of Accident Prediction Models for Computation of Accident Risk on Transportation Network, Highway Research Records 1784, Highway Research Board, Washington, D.C. Lord, D., and B. N. Persaud. 2000. “Accident Prediction Models With and Without Trend: Application of the Generalized Estimating Equations Procedure,” Highway Research Record 1717, Highway Research Board, Washington, D.C. Maher, M.J. and I. Summersgill, 1996. A comparative methodology for the fitting of predictive accident models. Accid. Anal. And Prev., 28(3): 281-296. Miaou, S., Hu, P. S., Wright, T., Rathi, A. K. and S. C. Davis. 1992. “Relationship Between Truck Accidents and Highway Geometric Design: A Poisson Regression Approach,” Highway Research Record 1376, Highway Research Board, Washington, D.C. Neter, J., W. Wasserman, and M.H. Kutner, nd 1999. Applied Regression Models, 2 ed. Richard D. Irwin, Inc., Boston.
Brown, H. C. and A. P. Tarko. 1999. “Effects of Access Control on Safety on Urban Arterial Streets,” Highway Research Record 1665, Highway Research Board, Washington, D.C.
Petruccelli, Joseph D, B. Nandram and M. Chen. 1999. Applied Statistics for Engineers and Scientists. New Jersey; Prentice Hall.
Devore, Jay L., 1991. Probability and Statistics for Engineering and the Sciences. Brooks/Cole Publishing Company, Pasific Grove, California.
Qin, X; Ivan, J.N.; Ravishanker, N., & Liu, J. 2005. Hierarchical Bayesian Estimation of Safety Performance Functions for Two-Lane Highways Using Markov chain Monte Carlo Modeling, Journal of Transportation Engineering, Vol. 131, No. 5.
Garber, N.J. and A.A. Ehrhart, 2000. The effects of speed, flow, and geometric characteristics on crash rates for different types of virginia highways. Final Report, Virginia Transportation Research Council, VTRC 00-R15. Hadi, M., J. Aruldhas, L.F. Chow, and J.J.A. Wattleworth, 1995. Estimating safety effects of cross-section design of various
Rice, John A. 1988. Mathematical Statistics and Data Analysis. California; Wadsworth & Brooks/Cole Advanced Books & Software. Saccomano, F.F. & C. Buyco. 1988. Generalized Loglinear Models of Truck Accident Rates, Highway Research Record 1172, Highway Research Board, Washington, D.C.
100 JURNAL TEKNIK SIPIL & PERENCANAAN, Nomor 1 Volume 13 – Januari 2011, hal: 91 – 100