ANALISIS REGRESI MENGGUNAKAN METODE KUANTIL
ROHMATUL FITRIAH
DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009
ABSTRACT ROHMATUL FITRIAH. Regression Analysis Uses Quantile Method. Supervised by RETNO BUDIARTI and I GUSTI PUTU PURNABA. Regression analysis is applied to analyze relation between response variable with one or more predictor variable, especially to construct a model that has not been known. In order to estimate the regression parameters, certain estimation method of regression coefficients are carried out. In this paper quantile regression method is applied to asymmetric data. This method divides data into two or more groups, where existence of different estimated values at different quantiles are suspected. In this regression analysis, the regression coefficients are estimated using quantiles regression approximation properties, i.e. weighted least square approximation with all predictor variables included and the suites approximation with partial regression decomposition for certain predictor variables. Quantile regression approximation property explains that the quantile regression coefficient vector can minimize the expected value of weighted mean square error, which will give the best fit. The quantile regression with suites approximation is used to omit predictor variables which do not have influence to the model. The approximation properties of quantile regression are illustrated with the salary data from the U.S. census at 1980, 1990, and 2000. Key word: quantiles regression, asymmetric data, weighted least square, partial regression.
ABSTRAK
ROHMATUL FITRIAH. Analisis Regresi Menggunakan Metode Kuantil. Dibimbing oleh RETNO BUDIARTI dan I GUSTI PUTU PURNABA. Analisis regresi digunakan untuk menelaah hubungan antara peubah respon dengan satu atau lebih peubah prediktor, terutama untuk menelusuri model yang belum diketahui. Dalam rangka untuk menduga model regresi, dilakukan pendugaan koefisien regresi. Untuk menduga koefisien regresi pada data yang berbentuk tidak simetris menggunakan metode regresi kuantil. Pendekatan metode ini dengan membagi data menjadi dua atau lebih kelompok, dimana dicurigai adanya perbedaan nilai dugaan pada kuantil-kuantil tertentu. Untuk mengetahui nilai dugaan koefisien regresi pada analisis regresi ini menggunakan sifat hampiran bagi regresi kuantil yang terdiri dari dua sifat yaitu hampiran kuadrat terkecil terboboti dengan seluruh peubah prediktor dan hampiran yang bersesuaian dengan penguraian regresi parsial. Sifat hampiran regresi kuantil menyatakan bahwa vektor parameter regresinya dapat meminimumkan nilai harapan dari kuadrat tengah error terboboti yang membuat penduga parameter regresi kuantil memperoleh garis hampiran terbaik. Untuk menghilangkan peubah prediktor yang tidak terlalu berpengaruh dalam menduga model menggunakan sifat hampiran regresi kuantil yang sesuai dengan pengembangan dari penguraian regresi parsial. Sifat hampiran bagi regresi kuantil ini diilustrasikan dengan data gaji pada sensus U.S. tahun 1980, 1990 dan 2000. Kata kunci: regresi kuantil, data asimetrik, kuadrat terkecil terboboti, regresi parsial.
ANALISIS REGRESI MENGGUNAKAN METODE KUANTIL
ROHMATUL FITRIAH
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains pada Departemen Matematika
DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009
Judul Skripsi : Analisis Regresi Menggunakan Metode Kuantil Nama : Rohmatul Fitriah NIM : G54053067
Disetujui Komisi Pembimbing
Ir. Retno Budiarti, MS Pembimbing I
Dr. Ir. I Gusti Putu Purnaba, DEA. Pembimbing II
Diketahui
Dr. drh. Hasim, DEA. Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Tanggal Lulus : 01 September 2009
PRAKATA Puji Syukur penulis panjatkan kepada Allah SWT atas segala karunianya sehingga penulis dapat menyelesaikan tugas akhir yang berjudul Analisis Regresi Menggunakan Metode Kuantil. Shalawat dan salam semoga senantiasa tercurah kepada Rasulullah Muhammad SAW beserta keluarga, sahabat dan pengikutnya hingga akhir zaman. Keterbatasan dan ketidaksempurnaan membuat penulis membutuhkan bantuan , dukungan dan semangat dari orang-orang secara langsung maupun tidak langsung berkontribusi besar dalam pembuatan tugas akhir ini. Oleh karena itu penulis ingin mengucapkan terima kasih yang sebesarbesarnya kepada : 1. Ibu Retno Budiarti selaku Pembimbing I, yang sabar telah membimbing dan mengarahkan selama penulisan karya ilmiah ini, Bapak I Gusti Putu Purnaba selaku Pembimbing II atas bimbingan dan saran yang telah diberikan, dan Bapak I Wayan Mangku sebagai penguji serta saran dan masukkan yang telah diberikan. 2. Ibuku tercinta, terima kasih atas semua dukungan baik moral maupun materiil, doa, semangat dan kasih sayang yang tiada henti. Mas Oden, terima kasih atas semangat, doa dan pengorbanan moral maupun materiil selama ini. Adik-adikku (Opek dan Alit), atas doa dan semangatnya. Mbak Ida beserta keluarga, terima kasih atas doa dan dukungannya. Seluruh keluarga besarku yang sangat aku sayangi, terima kasih untuk seluruh doanya. 3. Om To, yang telah memberikan bantuan, semangat dan doanya. 4. Ibu Teduh Wulandari, yang telah memberikan bantuan, nasehat dan semangat. 5. Seluruh dosen Departemen Matematika IPB, atas ilmu yang telah diberikan. 6. Bu Susi, Pak Yono, dan Bu Ade, atas saran-saran dan informasi yang telah diberikan. 7. Lela, kamu sahabat terbaik yang pernah ada dan selalu menemani saat senang dan susah. 8. Puput dan Pipit sahabatku yang selalu memberikan doa dan semangat. 9. Siti, Tia, dan Lina, kalian teman terbaik yang selalu memberikan yang terbaik untukku. 10. Rima, Siti dan Yuni atas kesediaannya menjadi pembahas pada saat seminar. 11. Keluarga besar Matematika ’42 : Lela, Tia, Lina, Eko, Dimas, Iput, Dewi, Dian, Budhe, Awi, Zil, Oby, Warno, Lisda, Rima, Siti, Ety, Yuni, Yusep, Nyoman, Mega, Idha, Niken, Bima, Ilyas, Vera, Gita, Octa, Hikmah, Hap-hap, Ocoy, Nola, Mira, Agnes, Ricken, Vita, Luri, Ryu, Rita, Dendi, Danu, Ridwan, Rendi, Ardy, Djawa, Eyyi, Jane, Vino, Heri, Ayu, Achy, Hesti, Fachri, Bayu, Septian, mas Ayeep, Erlin, Boy, Yudi, Sapto, Nofi, Wiwi, Acuy, terima kasih atas persahabatan, kebersamaan, dan keceriaan yang telah kita lewati bersama selama perkuliahan. Kalian adalah sebaik-baiknya teman yang menjadikan masa-masa kebersamaan kita penuh warna. Semoga kebersamaan kita ini akan abadi. 12. Kak Fred, kak Abay, kak Ari, mbak Uli, dan mbak Jaja, mbak Yuda atas semua saran, informasi, bantuan, doa dan semangat yang telah diberikan. 13. Kak Rusan yang, yang telah membantu dalam menyelesaikan pembuatan abstrak. 14. Anak-anak “Fauziah Atas Crew” (Kak Ira, Lalis, Dewi, Selly, Ine, dan Tuty), yang telah memberikan bantuan, saran, semangat dan doa. 15. Seluruh mahasiswa Matematika, kakak kelas dan adik kelas yang telah membantu dan memberikan semangatnya. 16. Serta kepada semua pihak yang telah banyak membantu selama proses penyelesaian tugas akhir ini. Mohon maaf karena keterbatasan penulis tidak dapat menyebutkan satu per satu. Penulis menyadari masih ada kekurangan dalam tugas akhir ini. Oleh karena itu, kritik dan saran dari berbagai pihak akan sangat membantu menyempurnakan tulisan ini. Akhir kata, kami berharap semoga tugas ini dapat memberikan manfaat bagi kita semua
Bogor, Agustus 2009
Rohmatul Fitriah
RIWAYAT HIDUP Penulis dilahirkan di Pekalongan pada tanggal 17 Mei 1988 sebagai anak ketiga dari lima bersaudara. Ayah bernama Slamet Mukhlas (alm) dan ibu bernama Joharanah. Penulis menyelesaikan pendidikan Sekolah Dasar pada tahun 1999 di SD Negeri Kauman Wiradesa Kab. Pekalongan, Sekolah Lanjutan Tingkat Pertama Negeri I Wiradesa Kab. Pekalongan tahun 2002, Sekolah Menengah Atas Negeri I Wiradesa Kab. Pekalongan tahun 2005 dan diterima sebagai mahasiswa Institut Pertanian Bogor melalui jalur USMI pada tahun yang sama. Masuk Departemen Matematika Fakultas Matematika dan IPA Institut Pertanian Bogor tahun 2006. Selama mengikuti perkuliahan, penulis pernah menjadi pengajar privat mahasiswa Tingkat Persiapan Bersama dan menjadi pengajar SD, SMP serta SMA di bimbingan belajar sampai sekarang. Penulis juga aktif dalam kepengurusan organisasi antara lain: staf Departemen Kewirausahaan Gugus Mahasiswa Matematika (GUMATIKA) pada tahun 2006, kegiatan dalam Ikatan Mahasiswa Pekalongan pada tahun 2005/2007, anggota rohis matematika’42. Penulis juga aktif dalam kegiatan kepanitiaan, antara lain: kepanitiaan kegiatan Matematika Ria (MR) 2007 sebagai anggota Sie. Konsumsi, kepanitiaan kegiatan Masa Perkenalan Departemen (Welcome Ceremony of Mathematic) Matematika tahun 2007 sebagai Sie. Keamanan Acara, kepanitiaan kegiatan Masa Perkenalan Fakultas (G-Force’43) Matematika dan IPA tahun 2007 sebagai Sie. Medis.
DAFTAR ISI Halaman Daftar Gambar................................................................................................................... Daftar Tabel ...................................................................................................................... Daftar Lampiran ................................................................................................................
ix ix ix
I
PENDAHULUAN .................................................................................................. 1.1. Latar Belakang ............................................................................................... 1.2. Tujuan ............................................................................................................ 1.3. Sistematika Penulisan .......................................................................................
1 1 1 1
II
LANDASAN TEORI .............................................................................................. 2.1 Analisis Regresi .............................................................................................. 2.2 Ordinary Least Square (Metode Kuadrat Terkecil) ......................................... 2.3 Quantiles (Kuantil) .......................................................................................... 2.4 Peubah Acak .................................................................................................... 2.5 Fungsi Distribusi/Fungsi Sebaran ..................................................................... 2.6 Fungsi Sebaran Bersyarat .................................................................................. 2.7 Koragam (Covarian) ......................................................................................... 2.8 Loss Function .................................................................................................... 2.9 Norma ................................................................................................................ 2.10 Weighting Function ........................................................................................... 2.11 Proyeksi Orthogonal ..........................................................................................
2 2 2 2 3 3 3 4 4 4 4 4
III PEMBAHASAN ...................................................................................................... 3.1 Sifat Hampiran Regresi Kuantil ......................................................................... Teorema 1 ........................................................................................................... 3.2 Regresi Kuantil Parsial dan Bias Peubah yang dihilangkan ................................ Teorema 2 ...........................................................................................................
5 5 6 9 6
IV CONTOH KASUS ..................................................................................................... 4.1 Analisis Regresi Kuantil dengan seluruh peubah prediktor ............................... 4.2 Analisis Regresi Kuantil dengan peubah pendidikan .......................................... 4.3 Perbandingan antara Analisis Menggunakan Seluruh Peubah Prediktor dengan Menggunakan peubah pendidikan .......................................................................
11 11 13
V
13
SIMPULAN ............................................................................................................... 15
DAFTAR PUSTAKA .................................................................................................... 15 LAMPIRAN ..................................................................................................................... 16
viii
DAFTAR TABEL Halaman Tabel 1 Koefisien Nilai Dugaan Regresi Kuantil dari Seluruh Peubah Prediktor ............. 11 Tabel 2 Perbandingan Jarak Antar Kuantil dari CQF dengan Sebaran QR Dasar dengan Seluruh Peubah Prediktor .................................................................................... 11 Tabel 3 Koefisien Nilai Dugaan Regresi Kuantil dari Peubah Pendidikan ....................... 12 Tabel 4 Perbandingan Jarak Antar Kuantil dari CQF dengan Sebaran QR Dasar dengan Peubah Pendidikan ............................................................................................... 13
DAFTAR GAMBAR Halaman Gambar 1 Plot Sebaran log-earning pada Sebaran Kuantil Tertentu dengan Tingkat Kepercayaan 95% dengan Seluruh Peubah Prediktor ...................................... 12 Gambar 2 Plot Sebaran log-earning pada Sebaran Kuantil Tertentu dengan Tingkat Kepercayaan 95% dengan Seluruh Peubah Prediktor ...................................... 13 Gambar 3 Plot antara peubah Pendidikan dengan Nilai Pembobot pada τ = 0.10 pada Sensus Tahun 2000........................................................................................... 12 Gambar 4 Plot antara peubah Pendidikan dengan Nilai Pembobot pada τ = 0.50 pada Sensus Tahun 2000........................................................................................... 12 Gambar 5 Plot antara peubah Pendidikan dengan Nilai Pembobot pada τ = 0.90 pada Sensus Tahun 2000........................................................................................... 12
DAFTAR LAMPIRAN Halaman Lampiran 1 Keterangan Data Koefisien Pendidikan pada Sensus Tahun 1980................. 16 Lampiran 2 Keterngan Data Koefisien Pendidikan pada Sensus Tahun 1990 dan 2000... 17 Lampiran 3 Grafik Importance dan Density Weights pada Sensus Tahun 1980 ............... 18 Lampiran 4 Grafik Importance dan Density Weights pada Sensus Tahun 1990 ............... 19 Lampiran 5 Pembuktian Kuantil (Quantiles) .................................................................... 20 Lampiran 6 Pembuktian Loss Function Asimetrik ............................................................ 21 Lampiran 7 Pembuktian Proyeksi Orthogonal .................................................................. 22 Lampiran 8 Pembuktian Persamaan (30) .......................................................................... 23
ix
I PENDAHULUAN 1.1 Latar Belakang Analisis regresi digunakan untuk menelaah hubungan antara peubah respon ( y ) dengan satu atau lebih peubah prediktor terutama untuk menelusuri pola hubungan yang modelnya belum diketahui. Dalam rangka untuk menduga model regresi, dilakukan pendugaan koefisien regresi. Ada beberapa metode untuk menduga koefisien regresi, salah satu yang paling sering digunakan adalah metode kuadrat terkecil (OLS). Dalam OLS disyaratkan untuk memenuhi asumsi-asumsi yang ada. Namun metode ini dikenal peka terhadap penyimpangan asumsi pada data, misalnya jika data tidak memenuhi salah satu asumsi regresi maka penduga OLS tidak lagi baik digunakan. Salah satu asumsi terpenting adalah asumsi sebaran normal (normalitas). Asumsi normalitas seringkali dilanggar pada saat data mengandung pencilan (outlier). Jika terdapat pencilan dalam data, maka bentuk sebaran data tidak lagi simetrik sehingga melanggar asumsi normalitas. Terkadang untuk mengatasi hal ini seorang peneliti melakukan transformasi tehadap data dengan maksud agar asumsi dapat terpenuhi, namun seringkali transformasi yang dilakukan terhadap data juga tidak dapat memenuhi asumsi pada akhirnya menyebabkan dugaan berbias. Akibatnya metode kuadrat terkecil dianggap kurang tepat untuk menganalisis sejumlah data yang tidak simetris, maka berkembanglah metode regresi median (Median Regression). Metode regresi median dilakukan dengan pendekatan Least Absolute Deviation (LAD) yang dikembangkan dengan mengganti pendekatan rataan (mean) pada OLS menjadi median. Hal ini dilakukan dengan mempertimbangkan apabila data berbentuk lonceng tidak simetris. Tetapi pada kenyataannya, pendekatan regresi median juga dianggap kurang tepat karena regresi ini
hanya melihat pada dua kelompok data. Padahal ada kemungkinan data bisa terbagi menjadi lebih dari dua kelompok, sehingga dikembangkanlah metode regresi kuantil (Quantile Regression). Metode regresi kuantil adalah suatu metode yang berasal dari metode regresi median (Median Regression) yang diperumum. Regresi kuantil merupakan suatu metode statistika yang pada umumnya digunakan untuk menyelesaikan permasalahan yang terdapat dalam kasus ekonometrika. Regresi ini berguna untuk menganalisis sejumlah data yang bentuknya lonceng tak simetris. Pendekatan metode regresi kuantil dengan memisahkan atau membagi data menjadi dua atau lebih kelompok (group). Dimana dicurigai adanya perbedaan nilai dugaan pada kuantil-kuantil tertentu. 1.2 Tujuan Tujuan dari karya ilmiah ini adalah untuk mempelajari sifat-sifat hampiran bagi regresi kuantil. 1.3 Sistematika Penulisan Karya ilmiah ini terdiri atas lima bagian. Bagian pertama berupa pendahuluan, terdiri dari latar belakang, tujuan, dan sistematika penulisan. Bagian kedua adalah landasan teori yang menyajikan aspek teoritis penulisan karya ilmiah. Bagian ketiga merupakan pembahasan, yang membahas metode regresi kuantil dan sifat hampiran regresi kuantil. Bagian keempat adalah contoh kasus, yang membahas contoh analisis regresi kuantil dengan seluruh peubah prediktor, analisis regresi kuantil dengan peubah pendidikan saja serta perbandingan kedua analisis tersebut. Sedangkan bagian terakhir adalah kesimpulan, merupakan hasil yang diperoleh dari pembahasan karya ilmiah.
2
II LANDASAN TEORI Pada bab ini diberikan teori yang menjadi landasan pengerjaan karya ilmiah ini. Berikut diberikan beberapa definisi dan teorema yang berkaitan dengan penulisan karya ilmiah ini.
jumlah
2.1 Analisis regresi Analisis regresi adalah analisis statistika yang digunakan untuk melihat hubungan antara peubah respon dengan satu atau beberapa peubah prediktor. Hubungannya dinyatakan dalam model linear atau nonlinear. Pemilihan bentuk model berdasarkan pengetahuan sebelumnya atau melalui proses eksplorasi. Misalkan y menunjukkan peubah tunggal tergantung pada p buah prediktor x , maka y dapat digambarkan dengan model regresi berikut: (1) y = f ( x1 , x 2 , x3 ,..., x p ) + ε
2.3 Quantiles (Kuantil) Misalkan X adalah peubah acak yang kontinu dengan fungsi distribusi kumulatif (cdf) F ( x ) , definisi kuantil ke-p dari X
p
dengan daerah asal (domain) D ⊂ R . (Aunuddin 1989) 2.2 Ordinary Least Square (Metode Kuadrat Terkecil) Pada analisis regresi linear Yi = β 0 + β1 X i + ε i untuk i = 1, 2,..., n dengan
merupakan
Yi
ke − i untuk
peubah
respon
pengamatan dan
Xi
merupakan pengamatan ke − i untuk peubah prediktor. Komponen β 0 dan β1 merupakan parameter yang belum diketahui dan akan diduga dengan metode kuadrat terkecil. Sedangkan ε i merupakan komponen galat yang diasumsikan menyebar normal, bebas terhadap sesamanya dan identik, mempunyai nilai tengah nol dan varian homogen. Penilaian ketepatan model regresi didasarkan 2
pada besarnya R . (Aunuddin 1989) Definisi 2.2.1 (Metode Kuadrat Terkecil) Metode kuadrat terkecil adalah suatu metode untuk memperoleh persamaan prediksi linear Yˆ = a + bX yang memiliki
kuadrat galat 2 ˆ JKG = ∑ (Yi − Yi ) terkecil
(JKG)
(Agresti & Finlay 1999)
−1
adalah ξ p = F ( p ) , untuk 0 < p < 1 . X 1 , X 2 ,..., X n
Misalkan
adalah suatu
contoh barisan dari sebaran acak X dan Y1 < Y2 < ... < Yn adalah statistik tataan dari contoh barisan dari sebaran acak X . Jika k = [ p ( n + 1)] , daerah di bawah fungsi kepekatan peluang f ( x ) dan sebelah kiri dari Yk adalah F (Yk ) maka nilai harapan untuk daerah ini adalah E ( F (Yk )) =
∫
b
a
F ( yk )g k ( yk ) dyk
dengan: g k ( yk ) = fungsi kepekatan peluang dari Yk ⎧ n! ⎪ ⎪ ⋅ θ , a < y k
dan dengan: k −1
n− k
θ = [ F ( yk ) ]
[1− F ( yk )] f ( yk ) . Jika peubah F (Yk ) ditransformasi menjadi z maka nilai harapannya menjadi 1 n! k n −k E( F (Yk )) = E( z) = z (1 − z) dz. 0 (k − 1)!(n − k )!
∫
Dengan menggunakan fungsi kepekatan peluang beta, maka persamaan tersebut dapat dinyatakan menjadi n !k !(n − k )! k = . E( F (Yk )) = ( n +1) (k − 1)!(n − k )!(n + 1)! (Bukti: lihat Lampiran 5) (Hogg et al. 2005)
3
FY | X ( y | x ) = P (Y ≤ y | X = x )
2.4 Peubah Acak Definisi 2.4.1 (Peubah Acak) Misalkan Ω adalah ruang contoh dari suatu percobaan acak. Fungsi X yang terdefinisi pada Ω yang memetakan setiap unsur ω ∈ Ω ke satu dan hanya satu bilangan real X (ω ) = x disebut peubah acak. Ruang dari X adalah himpunan bagian bilangan real A = { x : x = X (ω ), ω ∈ Ω} . (Hogg et al. 2005) Definisi 2.4.2 (Peubah Acak Diskret) Peubah acak X dikatakan diskret jika himpunan semua nilai { x1 , x2 ,...} merupakan himpunan tercacah. (Grimmett & Stirzaker 1992) Definisi 2.4.3 (Peubah Acak Kontinu) Peubah acak X dikatakan kontinu jika fungsi distribusi kumulatifnya FX ( x ) adalah fungsi kontinu untuk setiap x ∈ R . (Hogg et al. 2005) 2.5 Fungsi Distribusi/Fungsi Sebaran Definisi 2.5.1 (Fungsi Distribusi) Jika X suatu peubah acak, fungsi distribusinya didefinisikan sebagai FX ( x ) = P[ X ≤ x ] untuk setiap x ∈ ( −∞, +∞ ) . (Edward & Satya 1995)
y
=
∫
fY | X (t , x ) dt .
−∞
Sehingga, d F ( y | x ) = fY | X ( y , x ) . dt Y | X
(Ghahramani 2005) Definisi 2.6.2 (Fungsi Kepekatan Bersyarat) Fungsi kepekatan bersyarat dari suatu peubah acak Y dengan syarat X = x , dapat didefinisikan: fY , X ( y , x ) fY | X ( y , x ) = dengan f X ( x ) > 0 . f X ( x) (Ghahramani 2005) Definisi 2.6.3 (Nilai Harapan Bersyarat) Nilai harapan bersyarat dari suatu peubah acak Y dengan syarat X = x , dapat didefinisikan: ∞
E (Y | X = x ) =
∫ yf
Y |X
( y , x ) dy ,
−∞
dimana f X ( x ) > 0 . (Ghahramani, 2005) Definisi 2.6.4 (Varian Bersyarat) Nilai varian bersyarat dari suatu peubah acak Y dengan syarat X = x , dapat didefinisikan: ∞
Teorema 2.5.2 (Sifat Fungsi Distribusi) Apabila X suatu peubah acak, maka fungsi distribusinya FX ( x ) mempunyai sifat berikut: i. FX ( x ) tak turun [yaitu FX ( x ) ≤ FX ( y ) , jika x ≤ y ]
Var(Y | X = x) =
∫ (y − E(Y | X = x)) f 2
Y| X ( y, x)dy,
−∞
sehingga simpangan didefinisikan oleh:
σ Y |X =x
baku
bersyaratnya
= Var (Y | X = x ) .
(Ghahramani 2005)
ii. FX ( −∞ ) = lim FX ( x ) = 0, dan x →−∞
FX ( +∞ ) = lim FX ( x ) = 1 x →+∞
iii. FX ( x ) kontinu dari kanan (Edward & Satya 1995) 2.6 Fungsi Sebaran Bersyarat Definisi 2.6.1 (Fungsi Sebaran Bersyarat) Jika Y suatu peubah acak kontinu dengan syarat X = x maka fungsi sebaran peluang bersyaratnya
Teorema 2.6.5 Jika ( X , Y ) adalah suatu vektor dengan varian dari Y terbatas, maka dapat didefinisikan: a. E[ E (Y | X )] = E (Y ) b. Var[ E (Y | X )] ≤ Var (Y ) . (Ghahramani 2005)
4
iii. v + w ≤ v + w
2.7 Koragam (Covarian) Definisi 2.7.1 Jika X dan Y merupakan suatu peubah acak, maka kovarian dari X dan Y adalah Cov ( X , Y ) = E[( X − E ( X ))(Y − E (Y ))] . (Ghahramani 2005) Teorema 2.7.2 Jika X dan Y adalah suatu peubah acak, dengan μ X = E ( X ) dan μY = E (Y ) maka: Cov ( X , Y ) = E[( X − E ( X ))(Y − E (Y ))] = E ( XY ) − μ X μY
untuk
semua
v, w ∈ V . (Leon 2001) 2.10 Weighting Function Definisi 2.10.1(Weighting function) Weighting function adalah suatu fungsi kepekatan rata-rata dari variable dependent atau peubah respon yang mendekati fungsi kuantil bersyarat yang sebenarnya. (Angrist et al. 2006) 2.11 Proyeksi Orthogonal
= E ( XY ) − E ( X ) E (Y ) . (Ghahramani 2005)
2.8 Loss Function
Definisi 2.11.1 (Basis Orthonormal) Suatu famili orthonormal di V yang juga menyatakan suatu basis disebut basis orthonormal bagi V . Jika u1 , u2 , ..., un adalah
Definisi 2.8.1(Loss Function asimetrik) Jika L p adalah loss function yang tidak
suatu basis orthonormal bagi V , maka untuk setiap v di V , dapat dinyatakan sebagai:
simetrik ke-p maka: L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u
(i)
n
v=
∑
v | u j .u j
j =1
= [ p − I (u < 0)]u .
(2) , jika u ≥0 ⎪⎧ pu ( 1) , jika u <0 − p u ⎪⎩
Sehingga diperoleh L p = ⎨
n
(ii)
| v |2 = ∑ v | u j
2
j =1
=
dengan v | u j
vT u j .
(3) dengan : u = error dari pendugaan I (u ) = fungsi indikator yang didefinisikan ⎪⎧ 1 ⎪⎩ 0
I (u ≥ 0) = ⎨
, jika u ≥0 , jika u <0 .
(Bukti: lihat Lampiran 6) (Koenker 2005) 2.9 Norma Definisi 2.9.1 Sebuah ruang vektor V dikatakan ruang linear bernorma (normed linear space) jika untuk setiap vektor v ∈ V dikaitkan dengan
sebuah bilangan real
v =
∑
n 2 i =1 i
v
yang
disebut norma dari v yang memenuhi: i. v ≥ 0 dengan kesamaan berlaku jika dan hanya jika v = 0 ii. α v = α v untuk setiap skalar α
(Valenza 1993) Definisi 2.11.2 (Proyeksi Orthogonal) Jika v ∈ V dan u ∈ V adalah suatu vektor satuan, maka pru (v) = v | u u disebut sebagai proyeksi orthogonal dari v atas u . Secara umum, jika W adalah subspace dari V dengan basis orthonormal u1 , u2 ,..., um maka m
prW (v) = ∑ v | u j u j i =1
merupakan proyeksi orthogonal dari v atas W. Berdasarkan definisi tersebut maka untuk setiap v di V (v − prW (v)) ⊥ uk (k = 1, 2,..., m) sehingga v − prW (v) adalah orthogonal atas setiap vektor di W . (Bukti: lihat Lampiran 7) (Valenza 1993)
5
III PEMBAHASAN Metode regresi kuantil merupakan salah satu metode regresi yang diperoleh dari metode regresi median yang diperumum, dimana metode regresi ini sering digunakan untuk permasalahan yang terdapat dalam kasus ekonometrika. Penggunaan metode regresi ini dengan pembagian atau pemisahan data menjadi dua atau lebih kelompok yang mana dicurigai mempunyai perbedaan nilai dugaan pada kuantil-kuantil tertentu. Regresi kuantil dapat digunakan untuk mengatasi keterbatasan regresi linear dalam menganalisis sejumlah data yang berbentuk lonceng tidak simetris. Regresi kuantil adalah suatu metode pendugaan yang digunakan sebagai pencocokan seluruh model-model kecil sebaran bersyarat. Menurut Roger Koenker masalah regresi dapat digunakan untuk memecahkan masalah dalam rataan contoh: n
min μ∈R
∑( y − μ)
2
i
i =1
.
(4)
Jika μ = X' β maka persamaan (4) menjadi: n
minp
β ∈R
∑( y − X 'β ) i
i =1
2
(5)
i
dengan: X i = peubah prediktor ke − i
β
= parameter
yi
= peubah respon ke − i .
n
β ∈R
∑ y − X 'β . i
i =1
(6)
i
Kemudian secara umum dispesifikasikan dalam fungsi kuantil bersyarat ke − τ dengan mempertimbangkan penduga bagi β (τ ) ( βˆ (τ ))
sehingga
diperoleh
ide
bahwa
masalah tersebut dapat dinyatakan: n
minp
β ∈R
∑ ρτ ( y i =1
i
X' β (τ ) = fungsi kuantil ke − τ
dari Y dengan syarat X . (Koenker 2005) Hal pertama yang harus diperhatikan dalam regresi kuantil adalah fungsi kuantil bersyarat (Conditional Density Function/ CQF). Jika Y merupakan sebaran peubah acak kontinu dan x adalah salah satu vektor regresor X , maka CQF dalam fungsi kuantil ke − τ dapat didefinisikan Qτ (Y | X ) = inf{ y : FY ( y | X ) ≥ τ } dengan: FY ( y | X ) = fungsi sebaran dari Y dengan syarat X dan fungsi kepekatan bersyaratnya fY ( y | X ) . Berdasarkan asumsi integrabilitas, CQF dapat diperoleh dari masalah minimisasi Qτ (Y | X ) ∈ arg min E[ ρτ (Y − q ( X ))]. q( X )
(8) Regresi kuantil dapat terpenuhi dengan mengganti suatu model linear q ( X ) pada persamaan (8) sehingga diperoleh masalah minimisasi: β (τ ) = arg mind E[ ρτ (Y − X' β )]. β ∈R
Basset dan Koenker (1978), dalam papernya membahas masalah regresi tersebut, yang kemudian berkembang menjadi median contoh yang dinyatakan: minp
Qτ (Y | X ) =
− Qτ (Y | X ) )
dengan:
τ
= indeks kuantil ∈ (0,1)
ρτ (.)
= loss function yang asimetrik
(7)
(9) Apabila dalam hampiran OLS dari suatu model linear terhadap Y diperoleh dengan meminimumkan nilai harapan kuadrat error, sedangkan dalam hampiran regresi kuantil dari suatu model linear terhadap Y diperoleh dengan meminimumkan nilai harapan loss function yang tak simetrik yaitu meminimumkan nilai harapan ρτ (u ) .
3.1. Sifat Hampiran Regresi Kuantil Hasil teori utama dari prinsip regresi kuantil adalah suatu vektor parameter regresi kuantil yang dapat meminimumkan jumlah kuadrat error terboboti. Jika indeks kuantil τ ∈ (0,1) , maka error dari regresi kuantil : Δτ ( X , β ) = X' β − Qτ (Y | X ).
(10) Misalkan ετ adalah error dari regresi kuantil yaitu penyimpangan peubah respon dari kuantil bersyarat, ditulis ετ = Y − Qτ (Y | X ), (11)
6
Dari asumsi-asumsi tersebut maka diperoleh persamaan: 2 β (τ ) = arg mind E[ wτ ( X , β ).Δτ ( X , β )],
dengan fungsi kepekatan bersyarat fετ (e | X ) pada ετ = e .
β ∈R
(12)
Teorema berikut menunjukkan bahwa regresi kuantil merupakan hampiran kuadrat terkecil terboboti dengan seluruh peubah prediktor.
dengan:
β (τ )
= vektor parameter regresi kuantil
Δτ ( X , β ) = kuadrat error dari regresi kuantil 2
Teorema 1 Asumsi yang digunakan pada teorema ini adalah: 1. Terdapat fungsi kepekatan bersyarat fY ( y | X ) .
wτ ( X , β ) = fungsi pembobot (importance
2. E[Y ], E[Qτ (Y | X )], dan E X terbatas
dan dengan: ψ = fY (u. X' β + (1 − u ).Qτ (Y | X ) | X ) .
weights)
= ∫ 0 (1 − u ). fετ (u Δτ ( X , β ) | X ) d 1
= ∫ 0 (1 − u ).ψ du ≥ 0, 1
3. β (τ ) solusi unik bagi persamaan (9).
Bukti : Diketahui persamaan (9), persamaan tersebut dapat dikurangi tanpa optimisasi karena tak tergantung pada β dan terbatas pada asumsi (2) maka
{
(
}
)
' (13) β (τ ) = arg min E ⎡ ρτ Y − X β ⎤ − E ⎡⎣ ρτ (Y − Qτ (Y | X ) )⎤⎦ . ⎣ ⎦ d β ∈R Dengan menggunakan error regresi kuantil yang didefinisikan pada persamaan (10) dan (11). Sehingga dituliskan ' E ⎡ ρτ Y − X β ⎤ − E ⎡⎣ ρτ (Y − Qτ (Y | X ) )⎤⎦ ⎣ ⎦
(
)
(
' = E ⎡ ρτ Y − Qτ (Y | X ) + Qτ (Y | X ) − X β ⎣
( (
))
)⎤⎦ − E [ρτ (ετ )]
' = E ⎡ ρτ ετ − X β − Qτ (Y | X ) ⎤ − E [ ρτ (ετ )] ⎣ ⎦ = E ⎡⎣ ρτ (ετ − Δτ ( X , β ) )⎤⎦ − E [ ρτ (ετ )]
(
; dengan ρτ (ετ ) = (τ −1{ετ <0}) ετ
)
= E ⎡⎣ τ −1{(ετ −Δτ ( X , β ) )<0} (ετ − Δτ ( X , β ) )⎤⎦ − E ⎣⎡(τ −1{ετ <0}) (ετ )⎦⎤ = E ⎡⎣(τ −1{ετ <Δτ ( X ,β )}) (ετ − Δτ ( X , β ) )⎤⎦ − E ⎡⎣(τ −1{ετ <0} ) (ετ )⎤⎦
= E ⎡⎣τ ετ −τΔτ ( X , β )−1{ετ <Δτ ( X ,β )}ετ +1{ετ <Δτ ( X ,β )}Δτ ( X ,β ) ⎤⎦ − E [τ ετ − 1{ετ <0} ετ ]
(
)
(
) ετ ⎤⎦ − E (τ ετ ) + E [1{ετ <0} ετ ] = E⎡ (14) ⎣(1{ετ < Δτ ( X , β )} − τ ) Δτ ( X , β )⎤⎦ − E ⎡⎣(1{ετ < Δτ ( X , β )} − 1{ετ <0}) ετ ⎤⎦ . = E (τ ετ ) + E ⎡⎣ 1{ετ < Δτ ( X , β )} − τ Δτ ( X , β ) ⎤⎦ − E ⎡⎣ 1{ετ < Δτ ( X , β )}
Misalkan
( X , β ) = E ⎡⎣(1{ετ
( X , β ) = E ⎡⎣(1{ετ Maka
β (τ ) = arg mind {E[ β ∈\
} )
< Δτ ( X , β ) − τ Δτ ( X , β ) | X ⎤
}
)
⎦
< Δτ ( X , β ) − 1{ετ < 0} ετ | X ⎤ . ( X , β )] − E[
( X , β )]} .
⎦
7
Sehingga perlu membuktikan:
( X , β ) = E ⎡⎣(1{ετ
} )
< Δτ ( X , β ) − τ Δτ ( X , β ) | X ⎤
⎦
(
)
= E ⎡ E ⎡⎣ 1{ετ < Δτ ( X , β )} − τ | X ⎤⎦ Δτ ( X , β ) ⎤ ⎣ ⎦ = E ⎡⎣ ⎡⎣ Fετ ( Δτ ( X , β ) | X ) − Fετ ( 0 | X ) ⎤⎦ Δτ ( X , β ) ⎤⎦
(15)
⎡⎛ 1 ⎤ ⎞ = E ⎢⎜ ∫ fετ ( u Δτ ( X , β ) | X )Δτ ( X , β ) du ⎟ Δτ ( X , β ) ⎥ ⎠ ⎣⎢⎝ 0 ⎦⎥ ⎡⎛ 1
⎞
⎤
∫ f ( uΔτ ( X , β ) | X ) du ⎟⎠ .Δτ ( X , β ) ⎥⎥ . ⎢⎝
= E ⎢⎜
⎣
Jika
2
ετ
(16)
⎦
0
uτ = ετ Δτ ( X , β ) , untuk nilai Δτ ( X , β ) > 0.
( X , β ) = E ⎡⎣(1{ετ
)
}
< Δτ ( X , β ) − 1{ετ < 0} ετ | X ⎤
⎦
{ } = E ⎡ ⎡⎣1{uτ ∈ [0,1]} .uτ | X ⎤⎦ Δτ ( X , β ) ⎤ ⎣ ⎦ = E ⎡⎣1 uτ ∈ [0,1] .uτ .Δτ ( X , β ) | X ⎤⎦
⎡⎛ 1 ⎤ ⎞ = E ⎢⎜ ∫ ufuτ ( u | X )du ⎟ .Δτ ( X , β ) ⎥ ⎠ ⎣⎢⎝ 0 ⎦⎥ ⎡⎛ 1
(
⎤
⎞
)
= E ⎢⎜ ufετ u Δτ ( X , β ) | X .Δτ ( X , β )du ⎟ .Δτ ( X , β ) ⎥
∫ ⎢⎝
⎥⎦
⎠ ⎣ 0 ⎡⎛ 1 ⎤ ⎞ 2 = E ⎢⎜ ∫ ufετ ( u Δτ ( X , β ) | X )du ⎟ .Δτ ( X , β ) ⎥ ⎠ ⎣⎢⎝ 0 ⎦⎥
⎡⎛ 1 ⎤ ⎞ = E ⎢⎜ ∫ ufετ ( u Δτ ( X , β ) | X ) ⎟ .Δτ2 ( X , β ) ⎥ . ⎢⎣⎝ 0 ⎥⎦ ⎠
(17)
Dari persamaan (16) dan (17) maka ' E ⎡ ρτ Y − X β ⎤ − E ⎣⎡ ρτ (Y − Qτ (Y | X ) )⎤⎦ ⎣ ⎦
(
=
)
(X,β) ⎡⎛ 1
= E ⎢⎜
−
(X,β)
∫0 (
)
⎞
⎤
⎡⎛ 1
2
⎞
⎤
∫ uf ( uΔτ ( X , β ) | X ) ⎟⎠ .Δτ ( X , β )⎥⎥ ⎢⎝
fετ u Δτ ( X , β ) | X du ⎟ .Δτ ( X , β ) ⎥ − E ⎢⎜
⎢⎣⎝ ⎥⎦ ⎠ ⎣ 1 ⎡⎛ ⎤ ⎞ 2 = E ⎢⎜ ∫ (1 − u ) fετ ( u Δτ ( X , β ) | X ) du ⎟ .Δτ ( X , β ) ⎥ ⎠ ⎣⎢⎝ 0 ⎦⎥
2
ετ
⎦
0
= E ⎡⎣ wτ ( X , β ) .Δτ ( X , β ) ⎤⎦ . 2
Terbukti.
8
Teorema 1 ini menyatakan bahwa vektor parameter regresi kuantil ( β (τ ) ) dapat meminimumkan nilai harapan dari kuadrat tengah terboboti yaitu kuadrat dari selisih antara fungsi kuantil bersyarat yang sebenarnya dan hampiran garis yang linear dengan fungsi pembobot wτ ( X , β ) . wτ ( X , β ) ,
Fungsi
( X ) yang diberikan. Untuk menentukan bentuk dari importance weights tersebut menggunakan pendugaan berikut:
( (
)
)
1 . f Qτ Y | X | X + τ ( X ) , 2 Y
dengan: τ ( X ) =
∫ (1 − u) ( f 1
0
ετ
(u.Δτ ( X , β ) | X ) − fετ (0 | X )
)
1
≤ Δτ ( X , β ) . f '( X ) .∫ (1− u ).udu
3.2. Regresi Kuantil Parsial dan Bias Peubah yang Dihilangkan Berikut teorema yang menunjukkan sifat hampiran yang khas, sesuai dengan prinsip pengembangan dari penguraian regresi parsial dan penurunan dari rumus bias peubah yang dihilangkan. Teorema 2 Dalam teorema ini terdapat beberapa asumsi yang digunakan yaitu: a) Terdapat fungsi kepekatan bersyarat fY ( y | X ) yang terbatas c) β (τ ) solusi unik bagi persamaan (9).
= 1 6. | Δτ ( X , β ) | . f '( X ).
(18) dan dengan: τ ( X ) = sisaan
wτ ( X , β ) = fungsi pembobot (importance
weights) fY ( y | X ) = fungsi kepekatan bersyarat yang
'( X )
pada model yang berbanding terbalik dengan simpangan baku bersyaratnya.
b) E[Y ], E[Qτ (Y | X )], dan E X terbatas
0
f
2
penentu bagi importance weights. Dengan fY ( Qτ (Y | X ) | X ) adalah nilai tetap dari X
yang didefinisikan
sebagai fungsi pembobot (importance weights), merupakan fungsi yang menentukan regresi kuantil yang dapat meminimumkan nilai peubah respon (Y ) dari peubah prediktor
wτ ( X , β ) =
Dalam beberapa kasus, fungsi kepekatan yang terboboti (density weights) yaitu 1 merupakan faktor . fY ( Qτ (Y | X ) | X ) ,
diasumsikan mempunyai turunan pertama pada y yang terbatas pada nilai mutlaknya = turunan pertama pada y dari
Dan dari asumsi-asumsi tersebut apabila β (τ ) = β (τ ) merupakan solusi unik maka diperoleh suatu persamaan 2 β (τ ) = arg mind E[ wτ ( X , β (τ )).Δτ ( X , β )], β ∈R
(19) dengan:
(
)
wτ X , β (τ ) = =
1 2
1 2
1
∫ f ( u .Δτ ( X , β (τ )) | X ) du ετ
0
1
∫ f ( u . X' β (τ ) + (1 − u ) .Qτ (Y | X ) | X ) du ≥ 0. Y
0
fungsi kepekatan fY ( y | X )
Bukti: Untuk membuktikan β (τ ) = β (τ ) menggunakan persamaan (9) dan (19). Dari persamaan (9) diperoleh turunan pertama : ( β ) = 2.E[ wτ ( X , β ) Δτ ( X , β ) X ] = 0 .
(20)
Dari persamaan (19) diperoleh turunan pertama : ( X , β ) := E[ E[(1{ετ < Δτ ( X , β )} − τ ) X | X ]] = 0 .
(21)
9
Sehingga dari persamaan (15) diperoleh: ( X , β ) = E[ E[(1{ετ < Δτ ( X , β )} − τ ) | X ]. X ]
(
)
= E ⎡ Fετ ( Δτ ( X , β ) | X ) − Fετ (0 | x ) . X ⎤
⎣ ⎦ ⎡⎛ 1 ⎞ ⎤ = E ⎢⎜ ∫ fετ ( u.Δτ ( X , β ) | X ) .Δτ ( X , β ) du ⎟ . X ⎥ ⎢⎣⎝ 0 ⎠ ⎥⎦ ⎡⎛ 1 ⎤ ⎞ = E ⎢⎜ ∫ fετ ( u.Δτ ( X , β ) | X ) du ⎟ .Δτ ( X , β ). X ⎥ ⎠ ⎣⎢⎝ 0 ⎦⎥ = E[ 2.wτ ( X , β ).Δτ ( X , β (τ )). X ]
(22)
= 2 E[ wτ ( X , β ).Δτ ( X , β (τ )). X ] . ( β ) dan
Dari pembuktian tersebut dapat dikatakan bahwa fungsi
β = β (τ )
memberikan
solusi
unik
( β ) =0,
bagi
dan
( β ) identik, karena ( β ) =0
juga
maka
β = β (τ ) = β (τ ) merupakan solusi unik bagi keduanya. Terbukti.
Pada Teorema 2 ini, regresi kuantil memiliki solusi bagi masalah penduga kuadrat terkecil terboboti yaitu 2 β (τ ) = arg mind E[ wτ ( X , β ).Δτ ( X , β )], β ∈R
(23)
Regresi kuantil parsial didefinisikan dengan membagi X menjadi X 1 dan X 2 ,
dengan koefisien QR β (τ ) dibagi dalam
β1 (τ ) dan β 2 (τ ) . Selanjutnya Qτ (Y | X )
dengan: wτ ( X ) = wτ ( X , β (τ )) adalah suatu fungsi dari
dan
X saja (dalam Teorema 1, fungsi pembobot bergantung pada β ). Teorema ini digunakan apabila nilai peubah prediktor yang tidak terlalu berpengaruh dihilangkan. Seperti halnya pada Teorema 1, nilai weighting function wτ ( X , β (τ )), dihubungkan dengan fungsi
wτ ( X ) = wτ ( X , β (τ ))
kepekatan bersyarat dari peubah tak bebas yang didefinisikan wτ ( X , β (τ )) = 1 2 . fY (Qτ (Y | X ) | X ) + ( X ), dengan: τ ( X ) = sisaan yaitu Δτ ( X , β (τ ))
diurai
menggunakan
orthogonal terhadap
proyeksi
X 2 , terboboti oleh
yang
didefinisikan
pada Teorema 2 sehingga dapat didefinisikan menjadi: (25) Qτ (Y | X ) = X 2'π Q + qτ (Y | X ), dengan: E[wτ ( X ).X 2 .qτ (Y | X )] = 0, X1 = X 2'π1 + V1, E[ wτ ( X ). X 2 .V1 ] = 0, π Q = E [ wτ ( X ). X 2 X 2' ] .E [ wτ ( X ). X 2 .Qτ (Y | X ) ] , −1
π 1 = E [ wτ ( X ). X 2 X 2' ] × E [ wτ ( X ). X 2 . X 1 ] . −1
τ ( X ) ≤ 1 4 . Δτ ( X , β (τ )) . f '( x ) .
Apabila nilai
X1
dan
(24) f '( X )
kecil, maka diperoleh wτ ( X, β(τ )) ≈ wτ (X, β(τ )) ≈ 1 2. fY (Qτ (Y | X ) | X ), karena cara memperoleh nilai hampiran bagi weighting function ini dari penurunan sifat hampiran pada Teorema 1.
Penguraian regresi ini mengakibatkan qτ (Y | X ) dan V1 menjadi residual yang dibuat oleh suatu nilai proyeksi yang linear dari Qτ (Y | X ) dan X 1 pada X 2 dengan nilai pembobot menggunakan diperoleh
wτ ( X ) .
standar
Sehingga
dengan
kuadrat
terkecil
10
β1 (τ ) = arg min E[ wτ ( X ) ( qτ (Y | X )−V1β1 ) ], 2
β1
(26) dan juga
β1 (τ ) = arg min β E[ wτ ( X ) ( Qτ (Y | X )−V1β1 ) ],
Jika panjang vektor koefisien regresinya (β1(τ )', β2 (τ )')' = argminβ1,β2 E[ρτ (Y − X1'β1 − X2'β2 )]. maka:
γ 1 (τ ) = arg min γ 1 E[ w τ ( X ).Δτ ( X , γ 1 )] . 2
2
1
(27)
yang
dapat
menyatakan
β1 (τ )
bahwa
merupakan koefisien regresi kuantil parsial dari regresi kuadrat terkecil terboboti bagi Qτ (Y | X ) di X 1 . Sedangkan rumusan bias peubah yang dihilangkan pada regresi kuantil dapat diduga dengan peubah yang bersifat menjelaskan
[
]
yaitu X = X 1' , X 2' ' . Pada model regresi kuantil ini yang digunakan hanyalah peubah X 1 sehingga vektor koefisien regresinya
γ 1 (τ ) = arg min γ1 E[ ρτ (Y − X 1' γ 1' )] . (28)
(29) Tetapi apabila E[ w τ ( X ). X 1 X 1' ) mempunyai invers maka: −1
γ1 (τ ) = β1 (τ ) + (E[wτ ( X ). X1 X1' ) E[wτ ( X ). X1Rτ ( X )] (30) dengan: Rτ ( X ) = Qτ (Y | X ) − X 1' β1 (τ ) = bias 1 w τ ( X ) = ∫ 0 f∈τ (u.Δτ ( X , γ 1 (τ )) | X ) du / 2
Δτ ( X , γ 1 ) = X 1' γ 1 − Qτ (Y | X ) = error
(Bukti: lihat Lampiran 8). Dengan Rτ ( X ) merupakan bagian dari fungsi kuantil bersyarat yang tidak dijelaskan oleh fungsi linear dari X 1 pada panjang regresi kuantil.
IV CONTOH KASUS Contoh kasus dalam masalah regresi kuantil menggunakan sebaran gaji yang diperoleh dari himpunan data mikro sensus di Amerika Serikat pada laki-laki yang berumur 40-49 tahun pada sensus tahun 1980, 1990 dan tahun 2000. Dari penelitian yang dilakukan oleh Ruggles (2004), semuanya diperoleh dari website Integrated Public Use Microdata Series (IPUMS). Peubah respon (Y ) yang digunakan adalah log gaji mingguan yang dihitung dari log gaji tahunan yang dilaporkan dari lamanya kerja dibagi dengan minggu yang dikerjakan pada tahun sebelumnya. Sedangkan peubah prediktor yang digunakan adalah pendidikan ( X 1 ) yang dihitung dari lamanya sekolah dalam satuan tahun, pengalaman kerja
( X2 )
yang didefinisikan sebagai fungsi kuadratik dan penghargaan yaitu dihitung dari banyaknya penghargaan yang diperoleh berdasar pada banyaknya perlombaan yang diikuti ( X 3 ) .
4.1
Analisis Regresi Kuantil dengan Seluruh Peubah Prediktor Dari penelitian Ruggles tersebut diperoleh suatu koefisien nilai dugaan dari seluruh peubah prediktor yang ditunjukkan pada Tabel 1. Pada Tabel 1 juga terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah prediktor yang semakin beragam dari tahun sebelumnya. Tabel tersebut juga menjelaskan terjadinya perbedaan nilai dugaan pada koefisien kuantil yang berbeda, sehingga metode regresi kuantil dapat digunakan pada kasus sebaran gaji ini. Karena apabila kasus sebaran gaji ini diduga menggunakan metode kuadrat terkecil akan mengakibatkan ketidakcocokan model. Untuk melihat besarnya keragaman koefisien pendidikan, pengalaman kerja dan banyaknya penghargaan yang diperoleh dapat dilihat pada Tabel 2. Bagian kolom QR menjelaskan dugaan regresi kuantil dari log gaji mingguan (log-earning) pada rata-rata jarak antar kuantil 90-10 yang bergantung pada koefisien pendidikan, pengalaman kerja dan penghargaan.
11
peningkatan yang lebih tinggi untuk lulusan perguruan tinggi (College Graduates) daripada lulusan sekolah menengah (High School Graduates). Pada Tabel 2 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dijelaskan bahwa gaji lebih dominan berada dibawah median.
Nilai jarak antar kuantil ini meningkat dari 1.19 menjadi 1.35 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya gaji dari tahun 1980 sampai tahun 2000. Pada jarak antar kuantil ini, nilai dugaan regresi kuantil hampir mendekati tingkat kebenaran tetapi hampiran ini menjadi tidak baik digunakan pada saat rataan koefisien pendidikan dihitung pada kelompok yang khusus seperti terlihat pada Tabel 2 bagian B dan C. Tabel 2 juga menjelaskan
Tabel 1 Koefisien nilai dugaan regresi kuantil dari seluruh peubah prediktor Census
Obs.
1980
65,023
1990
86,785
2000
Desc. Stat.
Mean
SD
6.40
0.67
6.49
97,397
Penduga Regresi Kuantil
0.69
6.50
0.1
0.75
0.5
Penduga OLS
0.9
Coeff.
7.42
6.98
7.48
6.39
(0.223)
(0.067)
(0.100) (0.080)
[0.239]
[0.067]
[0.110] [0.087]
10.04
8.93
(0.130)
(0.075)
(0.169) (0.082)
11.59
[0.135]
[0.075]
[0.178] [0.087]
9.80
11.05
(0.201)
(0.109)
(0.624) (0.092)
[0.208]
[0.109]
[0.669] [0.113]
15.51
Root MSE
0.63
9.78 0.64
11.71 0.69
Tabel 2 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dengan seluruh peubah prediktor. jarak antar kuantil Census
Obs.
90‐10 CQ
90‐50 QR
50‐10
CQ
QR
CQ
QR
A. Overall 1980
65,023
1.2
1.19
0.52
0.51
0.68
0.67
1990
86,785
1.35
1.35
0.60
0.61
0.75
0.74
2000
97,397
1.43
1.45
0.67
0.70
0.76
0.75
1980
25,020
1.09
1.17
0.44
0.50
0.65
0.67
1990
22,837
1.26
1.31
0.52
0.55
0.74
0.76
2000
25,963
1.29
1.32
0.59
0.60
0.70
0.72
B. High School Graduates
C. College Graduates 1980
7,158
1.26
1.19
0.61
0.54
0.65
0.64
1990
15,517
1.44
1.38
0.70
0.66
0.74
0.72
2000
19,388
1.55
1.57
0.75
0.80
0.80
0.78
Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 1. Gambar tersebut
menunjukkan bahwa pada selang kepercayaan 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan.
12
Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan, pengalaman kerja dan penghargaan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman seluruh peubah prediktor pada tahun tersebut.
4.2
Analisis Regresi Kuantil dengan Peubah Pendidikan Dari penelitian ini juga diperoleh koefisien nilai dugaan dari peubah pendidikan, yang ditunjukkan oleh Tabel 3. Dari Tabel 3 terlihat bahwa nilai standar deviasi pada tahun 1980, 1990 dan 2000 semakin meningkat, hal ini dikarenakan peubah pendidikan yang semakin beragam dari tahun sebelumnya. Untuk melihat besarnya keragaman koefisien pendidikan dapat dilihat pada Tabel 4. Bagian kolom QR menjelaskan dugaan regresi kuantil dari log gaji mingguan (logearning) pada rata-rata jarak antar kuantil 9010 yang bergantung pada koefisien pendidikan. Nilai jarak antar kuantil ini meningkat dari 1.2 menjadi 1.37 pada tahun 1980 sampai 1990, kemudian kembali meningkat menjadi 1.45 dari tahun 1990 sampai 2000. Jarak antar kuantil yang meningkat menandakan semakin beragamnya koefisien pendidikan dari tahun 1980 sampai tahun 2000. Pada Tabel 4 juga terlihat pada rata-rata jarak antar kuantil 90-50 dengan rata-rata kuantil 50-10 nilainya berbeda. Hal ini menandakan bahwa sebaran data tidaklah simetris sehingga dari Tabel 2 ini juga dapat disimpulkan bahwa analisis data lebih tepat menggunakan metode kuantil. Dari tabel ini juga dapat dikatakan bahwa gaji lebih dominan untuk kuantil dibawah median.
Gambar 1 Plot Sebaran log-earning pada sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan seluruh peubah prediktor.
Tabel 3 Koefisien nilai dugaan dari peubah pendidikan Census
Obs.
1980
65,023
1990
86,785
2000
Desc. Stat.
SD
0.1
0.5
0.9
Coeff.
6.40
0.67
7.35
6.83
7.91
7.20
(0.190)
(0.099)
(0.145)
(0.120)
[0.199]
[0.099]
[0.153]
[0.127]
11.15
10.62
13.69
11.36
(0.274)
(0.104)
(0.252)
(0.117)
[0.285]
[0.104]
[0.263]
[0.122]
0.69
6.50
Penduga OLS
Mean
6.49
97,397
Penduga Regresi Kuantil
0.75
9.16
11.13
15.73
11.71
(0.195)
(0.126)
(0.385)
(0.117)
[0.204]
[0.126]
[0.401]
[0.141]
Root MSE 0.63
0.64
0.69
13
Tabel 4 Perbandingan jarak antar kuantil dari CQF dengan sebaran QR dasar dari peubah pendidikan jarak antar kuantil Census
Obs.
90‐10 CQ
90‐50 QR
50‐10
CQ
QR
CQ
QR
A. Overall 1980
65,023
1.2
1.2
0.51
0.52
0.69
0.68
1990
86,785
1.37
1.36
0.61
0.61
0.76
0.75
2000
97,397
1.45
1.45
0.69
0.69
0.77
0.76
1980
25,020
1.1
1.2
0.42
0.51
0.67
0.69
1990
22,837
1.27
1.33
0.51
0.56
0.76
0.77
2000
25,963
1.32
1.34
0.6
0.61
0.72
0.73
B. High School Graduates
C. College Graduates 1980
7,158
1.25
1.19
0.58
0.55
0.67
0.64
1990
15,517
1.49
1.4
0.69
0.67
0.77
0.73
2000
19,388
1.57
1.57
0.75
0.78
0.82
0.78
pada tahun tersebut hanya terletak pada kuantil diatas median, karena pada kuantil tersebut peubah pendidikan telah berbeda. Sedangkan plot yang kelihatan sangat berbeda adalah plot antara tahun 1980 dan 1990, hal ini dikarenakan perbedaan gaji dan perbedaan keragaman koefisien pendidikan pada tahun tersebut. Dari Gambar 2 juga dapat dijelaskan bahwa pada tahun 1980, 1990 maupun 2000 memberikan kesimpulan bahwa semakin tinggi peubah pendidikan, maka tingkat pendapatan atau gaji akan cenderung lebih besar (tinggi) pada tingkatan kuantil yang lebih tinggi pula. Hal ini dapat mengindikasikan bahwa terjadinya perbedaan gaji yang sangat signifikan berdasarkan tingkat pendidikan seseorang.
Gambar 2 Plot Sebaran log-earning pada sebaran kuantil tertentu dengan tingkat kepercayaan 95% dengan peubah pendidikan. Perubahan pada pendugaan kuantil bersyarat pada tahun 1980, 1990 dan 2000 dapat dilihat pada Gambar 2. Gambar tersebut menunjukkan bahwa pada selang kepercayaan bersama 95% merepresentasikan antara tahun 1990 dan 2000 tidak terjadi perubahan yang signifikan. Hal ini ditunjukkan oleh plot yang tidak jauh berbeda. Perbedaan yang signifikan
Pada analisis regresi kuantil yang hanya menggunakan peubah pendidikan juga dihasilkan plot antara nilai pembobot dengan nilai kepekatan terbobotinya, seperti terlihat pada Gambar 3, 4 dan 5. Pada Gambar 3 terlihat plot antara peubah pendidikan dengan nilai pembobot (weights) yang menunjukkan nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights). Pada plot tersebut terlihat bahwa nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights) relatif tidak jauh berbeda, yang menandakan bahwa nilai error regresi kuantilnya relatif kecil. Hal
14
ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi kelas pendidikannya tidak terlalu berbeda jauh sehingga besar gaji yang diperoleh juga tidak berbeda jauh.
Pada Gambar 5 terlihat plot antara peubah pendidikan dengan nilai pembobot (weights) yang menunjukkan nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights). Pada plot tersebut nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights) terlihat sedikit berbeda tetapi plot ini mempunyai nilai error regresi kuantil yang kecil karena perbedaan plotnya tidak terlalu jauh. Hal ini dikarenakan peubah pendidikan yang dikelompokkan berdasarkan tingkat variansi data dari kelas pendidikannya sedikit berbeda sehingga besar data gajinya juga agak berbeda, akibatnya error yang diperoleh juga sedikit lebih besar dari error data berdasarkan pengelompokkan yang lain.
Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada τ = 0.10 pada sensus tahun 2000. Pada Gambar 4 terlihat plot antara peubah pendidikan dengan nilai pembobot (weights) yang menunjukkan nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights). Pada plot tersebut nilai kepekatan bersyarat terboboti (density weights) dengan nilai pembobot (importance weights) terlihat serupa tetapi tidak identik, yang menandakan bahwa nilai error regresi kuantilnya sangat kecil. Hal ini dikarenakan peubah pendidikan yang tingkat variansi pengelompokan data berdasarkan kelas pendidikannya hampir serupa sehingga besar gaji yang diperoleh juga hampir serupa.
Gambar 4 Plot antara peubah pendidikan dengan nilai pembobot pada τ = 0.50 pada sensus tahun 2000.
Gambar 5 Plot antara peubah pendidikan dengan nilai pembobot pada τ = 0.90 pada sensus tahun 2000.
4.3 Perbandingan antara menggunakan seluruh peubah prediktor dengan menggunakan peubah pendidikan Dari dua analisis yang dilakukan, pada analisis data menggunakan seluruh peubah prediktor, diperoleh nilai dugaan dan nilai jarak antar kuantil yang tidak jauh berbeda dengan analisis data menggunakan peubah pendidikan saja, hal ini ditunjukkan pada Tabel 1 dan 3, sehingga dapat disimpulkan bahwa peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh dalam memprediksi nilai peubah respon. Karena peubah prediktor pengalaman kerja dan penghargaan tidak terlalu berpengaruh maka peubah tersebut dapat dihilangkan.
15
V SIMPULAN Berdasarkan penduga parameter regresi kuantil, diperoleh garis hampiran regresi terbaik. Sifat hampiran regresi kuantil menyatakan bahwa vektor parameter regresinya dapat meminimumkan nilai harapan dari kuadrat tengah error terboboti. Sifat hampiran yang sesuai dengan prinsip pengembangan dari penguraian regresi persial dapat digunakan untuk menghilangkan peubah prediktor yang tidak terlalu berpengaruh dalam menduga model. Akibat dari menghilangkan peubah prediktor tersebut diperoleh nilai bias, yaitu: Rτ ( X ) = Qτ (Y | X ) − X 1' β1 (τ ) . Berdasarkan contoh kasus yang digunakan, dapat disimpulkan bahwa analisis regresi kuantil digunakan untuk memodelkan
gaji pada koefisien pendidikan, pengalaman kerja serta penghargaan pada tahun 1980, 1990, dan 2000. Pada contoh kasus tersebut dilakukan dua analisis, yaitu analisis regresi kuantil menggunakan seluruh peubah prediktor dengan analisis regresi kuantil yang hanya menggunakan peubah pendidikan. Dari dua analisis yang dilakukan, disimpulkan bahwa peubah pengalaman kerja dan penghargaan tidak terlalu berpengaruh dalam model akibatnya peubah tersebut dapat dihilangkan. Dari analisis regresi kuantil yang menghilangkan peubah pengalaman kerja dan penghargaan, diperoleh error yang relatif kecil seperti yang digambarkan pada plot antara nilai pembobot dengan nilai kepekatan bersyaratnya.
DAFTAR PUSTAKA Agresti A, Finlay B. 1999. Metode Statistika untuk Ilmu-ilmu Sosial. Bambang S, penerjemah. Bogor: Institut Pertanian Bogor. Terjemahan dari: Statistical Methods for the Social Sciences. Angrist J, Chernozhukov V, & FernandezVal I. 2006. Quantile Regression Under Misspesification With An Application To The U.S. Wage Structure, Jurnal Econometrica , Vol. 74, No. 2. Pp: 539563. Aunuddin. 1989. Analisis Data. Pusat Antar Universitas Ilmu Hayat. Institut Pertanian Bogor. Bogor. Edward JD, Satya NM. 1995. Statistika Matematika Modern . Sembiring RK, penerjemah. Bandung: Institut Teknik Bandung. Terjemahan dari: Modern Mathematical Statistics. Ghahramani S. 2005. Fundamental of Probability. Ed. Ke-2. Prentice Hall, Inc. New Jersey.
Grimmett GR, Stirzaker DR. 1992. Probability and Random Processes. Ed. Ke-2. Clarendon Press. Oxford. Hogg RV, AT Craig, & McKean JW. 2005. Introduction to Mathematical Statistics. Ed. Ke-6. Prentice Hall, Inc. New Jersey. Koenker R. 2005. Quantile Regression. Cambridge University Press. New York. Leon SJ. 1998. Aljabar Linear dan Aplikasinya. Ed. Ke-5. Bondan A, penerjemah. Jakarta: Erlangga. Terjemahan dari: Linear Algebra with Aplications. Valenza RJ. 1993. Linear Aljebra An Introduction to abstract mathematics. Department of Mathematics. Claremont McKenna College. Claremont, CA USA.
16
LAMPIRAN
17 16
Lampiran 1 Keterangan Data Koefisien Pendidikan pada Sensus Tahun 1980 Tahun pada pendidikan 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Kelas tertinggi dari sekolah secara lengkap kelas ke-5 dari sekolah dasar kelas ke-6 dari sekolah dasar kelas ke-7 dari sekolah dasar kelas ke-8 dari sekolah dasar kelas ke-9 dari sekolah menengah kelas ke-10 dari sekolah menengah kelas ke-11 dari sekolah menengah kelas ke-12 dari sekolah menengah tahun pertama di perguruan tinggi tahun kedua di perguruan tinggi tahun ketiga di perguruan tinggi tahun keempat di perguruan tinggi tahun kelima di perguruan tinggi tahun keenam di perguruan tinggi tahun ketujuh di perguruan tinggi tahun kedelapan atau lebih di perguruan tinggi
18 17
Lampiran 2 Keterangan Data Koefisien Pendidikan pada Sensus Tahun 1990 dan 2000 Tahun pada pendidikan 8 9 10 11 12 13 14 15 16 17 18 19 20
Gelar Pendidikan kelas 5,6, 7 atau 8 dari sekolah dasar kelas ke-9 dari sekolah menengah kelas ke-10 dari sekolah menengah kelas ke-11 dari sekolah tinggi, tanpa diploma lulusan sekolah tinggi, diploma atau GED pendidikan dibeberapa perguruan tinggi, tetapi tidak punya gelar lulusan perguruan tinggi pada bagian program tertentu lulusan perguruan tinggi (PT)pada program pendidikan bergelar sarjana muda, tetapi tidak sekolah bergelar sarjana muda, tetapi sekarang masih terdaftar di PT bergelar master bergelar tenaga ahli bergelar doktor
19 18
Lampiran 3 Grafik Importance and Density Weights pada Sensus Tahun 1980 a. Pada τ = 0.10
b. Pada τ = 0.50
c. Pada τ = 0.90
20 19
Lampiran 4 Grafik Importance and Density Weights pada Sensus Tahun 1990 a. Pada τ = 0.10
b. Pada τ = 0.50
c. Pada τ = 0.90
21 20
Lampiran 5 Pembuktian Quantiles (Kuantil) E ( F (Yk )) =
∫
b
a
F ( yk )g k ( yk ) dyk
dimana: g k ( yk ) = fungsi kepekatan peluang dari Yk ⎧⎪ n! n− k ⎪⎪ [ F ( yk )][1− F ( yk )] f ( yk ) , a
n!
1
n !k !(n − k )!
∫ (k −1)!(n − k )!z (1 − z) dz , sehingga E(F (Y )) = (k −1)!(n − k )!(n + 1)! = (n+1) . k
k
k
k
0
Bukti: E ( F (Yk )) =
∫
b
a
F ( yk )g k ( yk )dyk
b
n!
a
( k − 1)!( n − k )!
= ∫ F ( yk ) = =
n!
( k − 1)!( n − k )! ∫
b
a
n!
( k − 1)!( n − k )! ∫
b
a
⎡⎣ F ( yk ) ⎤⎦
k −1
⎡⎣1− F ( yk ) ⎤⎦
n−k
F ( yk ) ⎡⎣ F ( yk ) ⎤⎦
k −1
⎡⎣1− F ( yk ) ⎤⎦
n−k
k
⎡⎣ F ( yk ) ⎤⎦ ⎡⎣1− F ( yk ) ⎤⎦
Dengan mengambil z = F ( yk ) maka dz = f ( yk )
n−k
f ( yk ) dyk f ( yk ) dyk
f ( yk ) dyk .
dyk
a
yk = a
⇔ z = F (a) =
∫
f ( yk ) dyk = 0 = P ( yk ≤ a )
−∞ a
yk = b
⇔ z = F (b) = 1− ∫ f ( yk ) dyk = 1− 0 = P ( yk > a ) −∞
1 n! n−k E ( F (Yk )) = [ z ]k [1 − z ] dz . ∫ 0 (k − 1)! (n − k )! Dari sebaran beta: 1 (a −1)!(b − 1)! Γ(a)Γ(b) a−1 b−1 Β(a, b) = = x (1 − x) dx = 0 Γ(a + b) (a + b − 1)! a = k +1
∫
b = n − k +1 1 n! n−k E ( F (Yk )) = [ z ]k [1 − z ] dz ∫ 0 (k − 1)! (n − k )! n! k !(n − k )! = . (k − 1)! (n − k )! (n + 1)! n! k ! = (k − 1)! (n + 1)!
=
n ! k (k − 1)! k . = (k − 1)! (n + 1).n ! (n + 1)
Terbukti.
22 21
Lampiran 6 Pembuktian Loss Function Asimetrik Diketahui L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u
(1)
= [ p − I (u < 0)]u
(2)
dengan
u = error dari pendugaan I (u ) = fungsi indikator yang didefinisikan
⎧1 , jika u ≥ 0 ⎪ I (u ≥ 0) = ⎨ ⎪⎩0 , jika u < 0. Sehingga : , jika u ≥ 0 ⎧ pu ⎪ Lp = ⎨ ⎪⎩( p − 1)u , jika u < 0
dengan
u =
⎧ u , jika u ≥ 0 ⎪ ⎨ ⎪⎩−u , jika u < 0.
Bukti: Untuk u ≥ 0 Persamaan (1)
L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u
[ ] [ ] = [ p + (1− I (u ≥0) ) − p. (1− I (u ≥0) )] u = [ p + (1−1) − p. (1−1) )] u = pu . = p .1 + (1 − p ) I (u < 0) u = p + I (u < 0) − pI (u < 0) u
Persamaan (2)
L p = [ p − I (u < 0)]u = [ p − (1− I (u ≥0) )] u
[
]
= p − (1−1) u = pu .
Jadi terbukti bahwa L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u = [ p − I (u < 0)]u , untuk u ≥ 0 . Untuk u < 0 Persamaan (1)
L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] ( −u )
[ ] [( p−1) I (u < 0)] u = [( p −1) . (1− I (u ≥0) )] u = [( p −1) . (1−0) )] u = ( p −1) u . = p .0 + (1 − p ) I (u < 0) ( −u ) =
Persamaan (2)
L p = [ p − I (u < 0)]u = [ p − (1− I (u ≥0) )] u
[
]
= p − (1−0 ) u = ( p −1) u .
Jadi terbukti bahwa L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u = [ p − I (u < 0)]u , untuk u < 0 . Akibatnya dari pembuktian diatas dapat disimpulkan bahwa
L p = [ p I (u ≥ 0) + (1 − p ) I (u < 0)] u = [ p − I (u < 0)]u untuk setiap u .
Terbukti.
23 22
Lampiran 7 Pembuktian Proyeksi Orthogonal v − prW (v) | uk = v | uk − prW (v) | uk
= v | uk −
m
∑ j =1
v | u j u j | uk
m
= v | uk − ∑ v | u j j =1
= v | uk − v | uk
u j | uk
uk | uk
= 0.
Terbukti.
24 23
Lampiran 8 Pembuktian Persamaan (30) Untuk membuktikan persamaan ini ditetapkan persamaan (30) yaitu −1 γ1 (τ ) = β1 (τ ) + (E[wτ ( X ). X1 X1' ) E[wτ ( X ). X1Rτ ( X )]
= ( E [ wτ ( X ).X1 X1' ]) E ⎡⎣wτ ( X ). X1 ( X1' β1 (τ ) + Rτ ( X ) ) ⎤⎦ . −1
Pada regresi kuantil bersyarat: E ⎡⎢(1{Y ≤ X 1' γ1 (τ )} − τ ) X 1 ⎤⎥ = 0 . ⎣ ⎦ Apabila ετ = Y − Qτ (Y | X ) dan Δτ ( X , γ 1 (τ )) = X 1' γ 1 (τ ) − Qτ (Y | X ) maka E ⎡⎢(1{ετ + Qτ (Y | X ) ≤ Δτ ( X , γ1 (τ )) + Qτ (Y | X )} − τ ) X 1 ⎤⎥ = 0 ⎣ ⎦ E ⎡⎢(1{ετ ≤ Δτ ( X , γ1 (τ ))} − τ ) X 1 ⎤⎥ = 0 ⎣ ⎦ ⎡ E ⎢(1{ετ ≤ Δτ ( X , γ1 (τ ))} −1{ετ ≤ 0} | X 1 ) X 1 ⎤⎥ = 0 , karena ⎣ ⎦ P {ετ ≤ 0 | X 1 } = E ( P {ετ ≤ 0 | X 1 , X 2 } X 1 ) = E (τ X 1 ) = τ .
Sehingga dapat dituliskan E ⎡⎢(1{ετ ≤ Δτ ( X , γ1 (τ ))} −1{ετ ≤ 0} | X 1 ) X 1 ⎤⎥ ⎣ ⎦ = E ⎡⎢ E (1{ετ ≤ Δτ ( X , γ1 (τ ))} −1{ετ ≤ 0} | X ) X 1 ⎤⎥ ⎣ ⎦ ⎡ ⎤ = E ⎢( Fετ (Δτ ( X , γ1 (τ )) | X ) − Fετ (0 | X )) X 1 ⎥ ⎣ ⎦ ⎡⎛ 1 ⎤ ⎞⎟ = E ⎢⎢⎜⎜⎜ ∫ fετ (uΔτ ( X , γ1 (τ )) | X )Δτ ( X , γ1 (τ )) du ⎟⎟ X 1 ⎥⎥ ⎢⎣⎜⎝ 0 ⎥⎦ ⎠⎟⎟ ⎡⎛ 1 ⎤ ⎞⎟ = E ⎢⎢⎜⎜⎜ ∫ fετ (uΔτ ( X , γ1 (τ )) | X )du ⎟⎟ Δτ ( X , γ1 (τ )) X 1 ⎥⎥ . ⎢⎣⎜⎝ 0 ⎥⎦ ⎠⎟⎟ 1 Karena w τ ( X ) = ∫ 0 f∈τ (u.Δτ ( X , γ 1 (τ )) | X ) du / 2 maka mengakibatkan
E ⎡⎢(1{ετ ≤ Δτ ( X , γ1 (τ ))} −1{ετ ≤ 0} | X 1 ) X 1 ⎤⎥ ⎣ ⎦ τ ( X )Δτ ( X , γ1 (τ )) | X 1 ). X 1 ⎤⎦ = 2 E ⎡⎣ E ( w τ ( X )Δτ ( X , γ1 (τ )). X 1 ] = 0. = 2E [w
Terbukti.