Studi Simulasi Model Nested Logit dan Paired Combinatorial Logit pada Respon Multinomial Jaka Nugraha Program Studi Statistika UII email :
[email protected]
ABSTRACT Multinomial logit model (MNL) is based on independent irrelevant alternatives assumption. If there was a correlation, MNL would result bias estimator. Correlation among of choices could be accommodated by Nested logit Model (NL) and Paired Combinatorial Logit Model (PCL). This research discuss how NL and PCL model can be used for estimating parameters (regression coefficient and correlation) and comparing to MNL in discrete choice model. Correlation structure is tested nesting correlation and correlation overlap. Paramaters in the models are estimated using maximum likelihood method. Simulated data generated using software R.3.0.1. Based on simulations data with nested correlation, NL model more appropriate than do MNL. But on data with overlapping correlation, the maximum likelihood estimator is not unique. Keywords : Multinomial logit, Nested logit, Paired Combinatorial Logit, maximum likelihood.
ABSTRAK Model Multinomial Logit (MNL) berdasarkan asumsi bahwa antar pilihan saling independen (independent irrelevant alternatives). Jika terdapat korelasi antar pilihan, maka MNL akan menghasilkan penaksir yang bersifat bias. Model Nested Logit (NL) dan Model Paired Combinatorial Logit (PCL) dapat mengakomudasi adanya korelasi tersebut. Penelitian ini membahas akurasi penaksir atas parameter koefisien regresi dan korelasi yang dihasilkan dari model MNL, NL dan PCL. Struktur korelasi yang diujikan adalah korelasi nested dan korelasi overlap. Penaksiran parameter dalam ketiga model mengunakan metode maksimum likelihood. Data simulasi dibangkitkan menggunakan software R.3.0.1. Berdasarkan hasil data simulasi, pada data nested model NL lebih akurat dibandingkan dengan model MNL. Sedangkan pada data overlap, estimasi menggunakan metode maksimum likelihood hasilnya tidak tunggal. Kata-kata Kunci : Multinomial logit, Nested logit, Paired Combinatorial Logit, maximum likelihood.
PCL. Model NL telah diaplikasikan dalam
Pendahuluan Model Generalize Extreme Value (GEV)
berbagai
bidang
seperti
bidang
energi,
merupakan pengembangan dari MNL. Dalam
transportasi, perumahan, telekomonikasi (Train
MNL,
sifat
(1986), Forinash dan Koppelman (1993), Lee
independence from irrelevant alternatives (IIA)
(1999)). Model GEV masih sangat terbatas
(Train, 2003). GEV disusun berdasarkan adanya
pengembangan maupun aplikasinya, sehingga
korelasi antar alternatif pilihan. Model GEV
masih sangat terbuka untuk mendapatkan
yang telah banyak digunakan adalah NL dan
model-model GEV yang lebih powerfull (Train
diasumsikan
memenuhi
Physical-Mechanical Properties And Microstructure Of Breadfruit … (Cut Fatimah Zuhra Marpongahtun)
63
2003). Karlstrom (2001) telah menunjukkan
himpunan bagian yang dinamakan nests. Sifat
fakta-fakta bahwa model GEV dapat disusun
sifat dalam nested logit adalah
dengan menyesuaikan kondisi data yang ada.
1.
Untuk sebarang dua alternatif yang
Beberapa jenis model GEV yang telah
terletak pada nests yang sama memenuhi
dikembangkan untuk overlapping nest adalah
sifat IIA terhadap anternatif lain pada
model Cross-Nested Logit (CNLs) (Vovsha
nest tersebut.
(1997), Bierlaire (1998), dan Ben-Akiva dan
2.
Sifat IIA tidak berlaku untuk dua
Bierlaire (1999)). Chu (1989) mengusulkan
alternatif yang terletak pada nest yang
model Paired Combinatorial Logit (PCL). Jika
berbeda.
terdapat J alternatif maka dapat disusun J-1 nest. Wen
dan
Koppelman
mengembangkan
generalized
(2001) nested
telah
Misalkan himpunan alternatif j dapat
logit
dipartisi menjadi K bagian yang saling asing
(GNL), yang termasuk didalamnya model PCL. Nugraha dkk (2009) telah menunjukkan berdasarkan
data
simulasi
bahwa
adanya
korelasi antar pilihan pada model multinomial
yaitu B1, B2,….,BK. Partisi ini dinamakan nest. Utilitas untuk pembuat keputusan i yang memilih alternatif j dalam nest Bk dapat dinotasikan sebagai
logit mengakibatkan estimator parameternya
Uij = Vij + ij
bias. Dalam penelitian ini dibahas model NL dan PCL untuk mengakomodasi adanya korelasi
(1)
Vij adalah faktor terobservasi yang
antar pilihan. Aplikasi model NL dan PCL pada
merupakan fungsi dari xij
data dengan struktur korelasi diketahui yang
dinamakan representative utility.
dibangkitkan secara simulasi dan dibandingkan
atribut pembuat keputusan (responden) ke-i. ij
hasilnya dengan model MNL. Struktur korelasi yang dibahas adalah korelasi nested dan korelasi overlapping. Pembangkitan data dan estimasi parameter
disusun
menggunakan
(Vij= V(xij)) dan xij
adalah
merupakan faktor tidak terobservasi dalam utilitas. i = (i1, ….,iJ) mempunyai distribusi kumulatif
program
R.3.0.1.
k K ij F ( i ) exp exp( ) k 1 jB k k
(2)
Model Nested Logit Model nested logit akan cocok ketika
Distribusi ini merupakan jenis distribusi
himpunan alternatif yang dijumpai pembuat
GEV (Heiss, 2002). Distribusi marginal untuk
keputusan dapat dibagi menjadi himpunan64
EKSAKTA Vol. 13 No. 1-2 Agustus 2013, 63-71
masing-masing ij adalah univariate extreme value. Diantara ij yang terletak pada nest yang
Nilai probalitas dalam model PCL dapat dinyatakan sebagai
sama adalah saling berkorelasi, k merupakan derajad independensi diantara alternatif yang
Pij
terletak pada nest ke-k. Ukuran korelasi dapat
j j
exp(Vij / jr )(exp(Vij / jr exp(Vij / jr ) J 1
J
(exp(V
ik
k 1 l k 1
/ kl exp(Vil / kl )
jr 1
(4)
kl
dinyatakan sebagai dari pasangan sebanyak J-1, masing-masing k = 1- k
pasangan mempunyai
Untuk dua alternatif yang terletak pada nest yang berbeda adalah saling independen
tingkat
independensi
sebesar jr (Koppelman dan Wen , 2000). Jika masing-masing independen (jr=1 r,j) maka model PCL menjadi model logit standar.
atau
Estimasi parameter dapat dilakukan Cov(ij, im) = 0
dengan prosedur maksimum likelihood. Dengan
untuk sebaran Bk dan m Bl dengan k l. Probabilitas memilih alternatif j Bk adalah
mengasumsikan bahwa setiap keputusan antar individu saling independen maka probabilitas masing-masing individu dalam sampel memilih sebuah alternatif adalah
V V exp( ij ) jB exp( ij ) k k k Pij k Vij k jB exp( ) l l l i
k 1 n
L( ) ( Pij )
(3)
i 1
y ij
(5)
j
Dengan yij = 1 jika individu i memilih j
Jika untuk setiap ij adalah independen
dan nol jika memilih yang lainnya dan
atau k = 1 maka model nested logit ini akan
merupakan vektor parameter dalam model.
sama dengan model logit standar.
Fungsi Log likelihood adalah n
LL( ) yij ln( Pij )
Model Overlapping Nest
i 1
(6)
j
Dalam model nested logit di atas diasumsikan bahwa setiap alternatif hanya
Penaksir
adalah
nilai
yang
menjadi anggota satu nest. Dalam kenyataan
memaksimumkan fungsi LL(). Parameter
sering dijumpai bahwa antar nest mempunyai
terdiri
interseksi (saling beririsan).
parameter korelasi ()
dari
parameter
Studi Simulasi Model Nested Logit dan Paired Combinatorial Logit ada Respon Multinomial (Jaka Nugraha)
koefisien
()
dan
65
Untuk mendapatkan data multivariat
Metode Simulasi Data diperoleh dari membangkitkan data dengan
nilai
ditentukan.
korelasi
antar
Pengamatan
alternatifnya
dilakukan
normal dengan matrik kovariansi digunakan persamaan
dengan
= L dan = LLt
mengambil model untuk tiga alternatif dengan pembuat
dimana ~N(0,1) dan L didefinisikan sebagai
keputusan (Xi) dan variabel atribut masing
matrik segi tiga bawah dari faktor Cholesky.
masing alternatif (Zij). Variabel Xi biasa disebut
Program
variabel demografi, misalnya penghasilan, jenis
membangkitkan data multivariat normal dalam
kelamin, asal daerah, jumlah anak. Sedangkan
library ”MASS” dan program estimasi MLE
variabel Zij misalkan untuk pilihan penggunaan
terdapat
alat tranportasi (Bus, mobil pribadi, sepeda
(Henningsen, 2007).
memasukkan
variabel
atribut
motor) maka Zij dapat berupa waktu tempuh,
R
library
dalam
fasilitas
”MicEcon”
Data i dibangkitkan dari distribusi multivariat
biaya. Model utilitasnya adalah
menyediakan
normal,
sementara
itu
MNL
didasarkan pada distribusi nilai ekstrim, oleh
Uij = Xij + Zij + ij
karena itu
untuk i=1,2,...,n dan j=1,2,3.
diperlukan normalisasi sebagai
berikut :
Ui1 = 01 + Xi1 + Zi1 + i1
~ U i = U*i.
Ui2 = 02 + Xi1 + Zi2+ i2 Ui3 = 03 + Xi3 + Zi3 + i3
2 / 6 = U*i. 1.6
Persamaan (10) menjadi ~ U i1 = (*01 + Xi13 + Zi1) 1.6
Alternatif ke-tiga diambil sebagai base line, sehingga model terestimasinya menjadi
~ U i2 = (*02 + Xi23 + Zi2 ) 1.6
U*i1 = *01 + Xi13 + Zi1+ i1
+ i2 1.6 ;
U*i2 = *02 + Xi23 + Zi2 + i2; U*i3 = Zi3 + i3
+ i1 1.6 ;
(10)
~ U i3 = Zi3 1.6 + i3 1.6
dengan 13 = 1 – 3 , 23 = 2 – 3, *01 = 01 – 03
Data dibangkitkan pada nilai parameter 01 =2 ,
dan *02 = 02 – 03.
02 =, 03 =0.2, 1=-3, 2=-2, 3 =-1 dan =0.8.
Jadi terdapat 5 buah parameter yang akan diestimasi.
66
Jadi *01 = 1.8, *02 = 0.8, 13 = -2, 23 = -1 dan =0.8. Dengan adannya faktor pengali 1.6
EKSAKTA Vol. 13 No. 1-2 Agustus 2013, 63-71
maka estimator targetnya (yang diharapkan)
dan probabilitas masing-masing alternatinya
adalah B01= 2.27684, B02 = 1.011929, B1=-
adalah 1
2.529822 , B2= -1.264911 dan C=1.011929. Diambil 3 struktur kovariansi i , Cov() = yaitu
0 1 0 0 1 0 A = 0 1 0 , B= 0 1 0.9 dan 0 0 1 0 0.9 1
Pi1
V exp( i1 ) 1
1
V exp( i1 ) 1 2 Vi 2 Vi 3 exp( ) exp( ) 2 2 2 1
V V V exp( i 2 ) exp( i 2 ) exp( i 3 ) 2 2 2 Pi 2 1 2 Vi1 Vi 2 Vi 3 exp( ) exp( ) exp( ) 1 2 2
1 0.7 0.7 C= 0.7 1 0.7 0.7 0.7 1
2 1
V V V exp( i 3 ) exp( i 2 ) exp( i 3 ) 2 2 2 Pi 3 1 2 Vi1 Vi 2 Vi 3 exp( ) exp( ) exp( ) 1 2 2
Xi ~ NID(0,1) , Zij ~ NID(0,1) dan i ~ N(0,) Model 1 dengan matrik kovariansi A
dengan
sebagai model independen. Model 2 dengan
Vi1 = (*01 + Xi13 + Zi1) 1.6 ;
matrik B sebagai model nested. Model 3
Vi2 = (*02 + Xi23 + Zi2 ) 1.6 ;
dengan matrik kovariansi C sebagai model
Vi3 = Zi3 1.6
overlapping nest. Agar
parameter
dalam
model
terestimasi, dengan model tersebut di atas dibutuhkan sampel minimal n=500 (Nugraha, 2007).
Replikasi
pada
masing-masing
kovariansi dilakukan sebanyak 30 kali.
Nilai probalitas dalam model PCL dapat dinyatakan sebagai Pi1
A12 1 . exp(Vi1 / 12 ) B 131 . exp(Vi1 / 13 ) A12 B 13 C 23
Pi 2
A12 1 . exp(Vi 2 / 12 ) C 231 exp(Vi 2 / 23 ) A12 B 13 C 23
Pi 3
B 13 1 . exp(Vi1 / 13 ) C 231 exp(Vi 2 / 23 ) A12 B 13 C 23
Misal untuk j=1,2,3 yang terbagi ke dalam 2 nest. Alternatif j=2,3 masuk dalam satu nest. Distribusi kumulatif untuk model NL adalah 2 F ( i ) exp [exp( i1 )]1 exp( i 2 ) exp( i 3 ) 1 2 2
(11)
dengan
A [exp(Vi1 / 12 ) exp(Vi 2 / 12 )] B [exp(Vi1 / 13 ) exp(Vi 3 / 13 )]
C [exp(Vi 2 / 23 ) exp(Vi 3 / 23 )]
Studi Simulasi Model Nested Logit dan Paired Combinatorial Logit ada Respon Multinomial (Jaka Nugraha)
67
Program disusun dalam dua tahap, pertama adalah proses membangkitkan data dengan distribusi
dan struktuk
estimator
untuk
parameter
korelasi
antar
alternatifnya (Gambar .2).
kovariansi
tertentu. Kedua, adalah melakukan estimasi parameter pada masing-masing model.
Hasil dan Pembahasan Dalam bab ini dibahas hasil estimasi
Gambar 1. Grafik log-likehood model 1.
parameter menggunakan tiga model yaitu MNL, NL dan PCL. Model MNL menghasilkan 5 parameter, model NL dan PCL menghasilkan 6 parameter. Uji statistika untuk masing-masing parameter tidak ditampilkan disini karena semua estimator yang dihasilkan adalah signifikan. Untuk menguji kecocokan model digunakan
Gambar 2. Grafik korelasi pada model 1
nilai log-likelihood. Pada Gambar (2) merupakan grafik korelasi respon dua dan respon tiga (r23) pada
Model MNL dan Model NL Probabilitas pilihan (Pij) pada Model
korelasi aktual dan korelasi prediksi. Perbedaan
MNL dan Model NL berbentuk persamaan
kedua nilai tidak signifikan, dari pengujian
tertutup.
diperoleh
merupakan
Fungsi fungsi
likelihood yang
kedua
mempunyai
model titik
maksimum tunggal, sehingga dengan MLE
nilai
disimpulkan
p-value
bahwa
0.2511.
model
Dapat
Nested
dapat
memprediksi dengan baik parameter korelasi.
untuk masing-masing parameter juga tunggal. Waktu yang diperlukan untuk mendapatkan penaksir juga relatif cepat. Pada data dengan tingkat korelasi nol, nilai likelihood pada model MNL adalah relatif sama dengan nilai like-lihood pada model NL (Gambar 1.). Demikian juga estimasi dari kelima parameter, hasilnya juga relatif sama.
Gambar 3. Nilai Log likelihod model 2.
Pada model NL, kita juga mendapatkan 68
EKSAKTA Vol. 13 No. 1-2 Agustus 2013, 63-71
Pada data dengan tingkat korelasi antara
global maksimum. Nilai awal yang beda
alternatif 2 dan alternatif 3 sama dengan 0.9,
menghasilkan nilai MLE yang berbeda. Dari
nilai log likelihood pada model MNL lebih kecil
gambar
dibanding dengan model NL (Gambar. 3).
likelihoodnya 0, sehingga nilai MLE tidak
Dapat disimpulkan model NL lebih tepat untuk
diperoleh. Untuk mengatasi keadaan ini, perlu
memprediksi model yang memuat korelasi.
dilakukan pembatasan terhadap nilai , yaitu
(5),
jika
-
maka
fungsi
>0. Selanjutnya untuk mendapatkan estimator dalam model PCL, perlu memvariasi nilai awal dari dengan nilai antar 0 s/d 1.
Gambar 4. Korelasi pada model 2
Dengan
model
NL,
kita
dapat
memprediksi besarnya korelasi antar respon, walaupun
nilai
estimatornya
masih
Gambar 5. Grafik fungsi parameter .
likelihood
dengan
bias.
Gambar (4) menunjukkan selisih antara korelasi
Cara ke dua untuk mengatasi keadaan
aktual dan korelasi prediksi pada tingkat
tersebut diatas, agar MLE dapat diperoleh
korelasi alternatif 2 dan alternatif 3 sebesar 0,9.
adalah
Estimasi parameter yang lain, menunjukan
langkah estimasi dalam model MNL dan model
bahwa selisih estimator model MNL terhadap
PCL.
nilai parameter target adalah lebih besar
berikut :
dibandingkan dengan selisih estimasi parameter
1.
2.
pada model MNL.
Langkah-langkahnya
adalah
langkah-
sebagai
Estimasi parameter menggunakan model
Estimasi parameter korelasi dengan = ˆ1 menggunakan model overlaping logit, hasil dinyatakan dengan ˆ
Model PCL Fungsi Log likelihood pada model PCL
menggabungkan
MNL, hasilnya dinyatakan dengan ˆ1
model NL terhadap nilai parameter targetnya. Bias pada model NL lebih kecil dibanding bias
dengan
3.
Estimasi parameter korelasi dengan
merupakan fungsi yang tidak global concave
= ˆ menggunakan model overlaping
(cekung bawah) sehingga sulit mencari titik
logit, hasil dinyatakan dengan
Studi Simulasi Model Nested Logit dan Paired Combinatorial Logit ada Respon Multinomial (Jaka Nugraha)
ˆ2 . 69
Sehingga estimator parameternya adalah
Ouyang (2009) telah mengembangkan model
ˆ (ˆ2 , ˆ)
PCL dengan memodifikasi parameter nya secara terpadu sedemikian hingga parameternya lebih
Selanjutnya
Gambar
6.
nilai
log
sederhana..
likelihood pada model 3 menunjukkan bahwa model MNL dan model overlaping logit tidak
Kesimpulan Dalam model DCM, jika antar respon
jauh berbeda.
memiliki struktur korelasi nested maka model NL lebih sesuai dibanding dengan model MNL. Model NL dapat mengurangi bias dan dapat mengestimasi korelasi pada masing-masing nest. Jika Gambar 6. Grafik log likelihood model 3
respon
memiliki
struktur
overlapping, estimator pada model PCL tidak tunggal. Pengambilan penduga awal yang berbeda akan menghasilkan estimator yang berbeda.
Untuk
mengatasi
hal
ini
dapat
dilakukan dengan cara mencoba beberapa penduga awal untuk parameter dengan nilai antar 0.5 s/d 1.5 dan memilih salah satu hasil
Gambar 7. Grafik nilai korelasi model 3
estimasi ini. Cara kedua adalah menggabungkan Estimasi parameter korelasi pada model
model MNL dan model PCL.
3 menggunakan model overlapping memberikan hasil yang tidak cukup baik. Demikian juga estimasi parameter yang lain, model PCL tidak
teori,
model
PCL
dapat
mengukur korelasi antar nest. Namun demikian berdasarkan data simulasi,
Dari hasil penelitian ini disarankan kepada para peneliti yang akan mengaplikasikan
lebih baik dibanding dengan model MNL. Secara
Saran-saran
model PCL tidak
model DCM, sebaiknya menggunakan model NL dari pada model MNL. Untuk penelitian lebih lanjut, dapat
baik
dilakukan pengamatan terhadap model DCM
dibandingkan dengan model MNL. Li dan
yang lain seperti model mixed logit. Masalah
mengahasilkan
penaksir
yang
lebih
lain yang belum banyak mendapat perhatian 70
EKSAKTA Vol. 13 No. 1-2 Agustus 2013, 63-71
para peneliti adalah pengembangan model DCM pada respons multinomial multivariat
Daftar Pustaka Ben-Akiva,M. dan M. Bierlaire, 1999, „Discrete choice methods and their applications in short term travel decisions‟, in R. Hall, ed., The Handbook of Transportation Science, Kluwer, Dordrecht, The Netherlands, pp. 5–33. Bierlaire, M., 1998, Discrete choice models, in M. Labbe, G. Laporte, K. Tanczos, and P. Toint, eds., Operations Research and Decision Aid Methodologies in Traffic and Transportation Management, Springer-Verlag, Heidelberg, Germany, pp. 203–227. Chu, C., 1989, A paired combinational logit model for travel demand analysis, Proceedings of Fifth World Conference on Transportation Research 4, 295–309. Forinash, C. and F. Koppelman, 1993, Application and interpretation of nested logit models of intercity mode choice, Transportation Research Record 1413, 98–106. Heiss, F., 2002, Structural Choice Analysis with Nested Logit Models, STATA Journal 2:227–252.
Koppelman, F. dan C. Wen, 2000, The paired combination logit model: Properties, estimation and application, Transportation Research B 34, 75–89. Nugraha J., Haryatmi S., Guritno S., 2009, Pengaruh Korelasi Antar Respon pada Model Multinomial Logit, Jurnal Matematika dan Sains (JMS), Vol. 14 No. 3, FMIPA-ITB. Lee, B., 1999, Calling patterns and usage of residential toll service under selfselecting tariffs, Journal of Regulatory Economics 16, 45–82. Li, J. dan Ouyang, J., 2009, A Modified Paired Combinatorial Logit Route Choice Model with Unified Parameter, Logistics, 367503680. Train, K.,1986, Qualitative Choice Analysis, MIT Press, Cambridge, MA. Train, K., 2003, Discrete Choice Methods with Simulation, UK Press, Cambridge Vovsha, P.,1997, The cross-nested logit model: Application to mode choice in the Tel Aviv metropolitan area, Conference Presentation, 76th Transportation Research Board Meetings, Washington. Wen, C.-H. dan Koppelman, F., 2001, „The generalized nested logit model‟, Transportation Research B 35, 627–641.
Henningsen, A., 2007, The micEcon Package, http://www.r-project.org/. diakses tanggal 10 Desember 2013 Karlstrom, A., 2001, Developing generalized extreme value models using the Piekands representation theorem‟, Working Paper, Infrastructure and Planning, Royal Institute of Technology, Stockholm, Sweden.
Studi Simulasi Model Nested Logit dan Paired Combinatorial Logit ada Respon Multinomial (Jaka Nugraha)
71