Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009
BENTUK FUNGSI KEANGGOTAAN PADA MODEL REGRESI DENGAN VARIABEL DEPENDEN FUZZY SIMETRIS Iqbal Kharisudin Jurusan Matematika FMIPA Universitas Negeri Semarang Email:
[email protected] Abstrak Dalam tulisan ini dibahas suatu model regresi fuzzy dengan variabel dependen fuzzy simetris dan variabel independen tegas menggunakan pendekatan kuadrat terkecil. Ditunjukkan bahwa solusi model ini merupakan generalisasi dari model regresi biasa. Selanjutnya ditunjukkan bentuk solusi untuk beberapa jenis fungsi keanggotaan variabel dependen fuzzy simetris yang berbeda dan pengaruhnya terhadap model yang diperoleh. Kata kunci: fungsi keanggotaan, variabel fuzzy simetris, solusi iteratif. Pendahuluan Analisis regresi linear dengan model fuzzy pertama kali diusulkan oleh Tanaka, dkk. [21] pada tahun 1982. Berdasarkan metode ini, koefisien regresi merupakan bilangan fuzzy yang dapat dinyatakan sebagai interval dengan fungsi keanggotaan. Perkembangan teori fuzzy pada analisis regresi sejak dikemukakan oleh Tanaka dkk. sangat pesat. Referensi yang cukup lengkap berkaitan dengan perkembangan metode regresi fuzzy diantaranya seperti Chang dan Ayyub [3] dan Shapiro [19]. Pendekatan lain yang juga banyak diteliti adalah kuadrat terkecil dalam analisis regresi fuzzy. Pendekatan ini telah banyak diteliti dalam dua dekade terakhir, di antaranya oleh Celmins [1], Diamond [8], Chang dan Lee [2], Ma dkk. [18], Wu [22]. Penalaran statistik dipengaruhi oleh beberapa jenis sumber ketidakpastian, seperti: keacakan, ketidaktepatan, ketidakjelasan, ketidaktahuan sebagian, dan sebagainya. Dalam konteks analisis regresi, terdapat beberapa aspek ketidakpastian yang sering diperhatikan, yaitu ketidakpastian berkaitan dengan: (1) hubungan antara variabel dependen dengan variabel independen, (2) hubungan antara data terobservasi dengan "semesta" data yang mungkin, dan (3) ketidakpastian nilai-nilai variabel terobservasi (Coppi [4]). Dalam paradigma statistik tradisional, ketidakpastian (1) dan (2) telah banyak ditangani dengan sangat memuaskan. Untuk menjawab permasalahan ketidakpastian (3), telah banyak para peneliti yang mencoba mengusulkan berbagai metode sebagai alternatif. I. Kharisudin, Jurusan Matematika FMIPA UNNES email:
[email protected]. Makalah diseminarkan pada Seminar Nasional Statistika IX ITS, 7 November 2009.
Seiring dengan perkembangan penelitian, pada dekade terakhir, telah banyak penelitian yang berupaya mengembangkan koalisi antara teori himpunan fuzzy dan teori statistik. Tujuan yang hendak dicapai di antaranya adalah untuk: (1) memperkenalkan permasalahan analisis data baru berkaitan dengan ralasional fuzzy, (2) membangun model formal yang menggabungkan randomness dengan fuzziness, (3) mengembangkan metodologi statistik univariate dan multivariate dalam menangani data bernilai fuzzy, dan (4) menyertakan konsep fuzzy dalam membantu menyelesaikan permasalahan statistik tradisional dengan data non-fuzzy (Coppi dkk. [7]). Dalam tulisan ini dibahas salah satu pendekatan kuadrat terkecil dalam analsis regresi fuzzy yang diusulkan oleh D'Urso dkk. Metode yang digunakan untuk menemukan model linear adalah meminimalkan fungsi jarak fuzzy antara variabel terobservasi dan variabel output yang didefinisikan dalam suatu ruang metrik tertentu. Tulisan yang membahas masalah ini di antaranya D'Urso dan Gastaldi [10], [11], Coppi dan D'Urso [5], D'Urso [9], D'Urso dan Giordani [12], D'Urso dan Giordani [13], Coppi dkk. [6], D'Urso dan Santoro [15], [14]. Dalam makalah ini dilakukan investigasi terhadap beberapa jenis fungsi keanggotaan variabel dependen fuzzy simetris. Variabel ini menggambarkan data fuzzy yang dibedakan berdasarkan nilai , yaitu nilai yang merepresentasikan kekaburan data di sekitar nilai pusatnya. Akan diselidiki pengaruh perbedaan tingkat kekaburan terhadap bentuk solusi dan hasil estimasi model.
1. Beberapa Pengertian dalam Konsep Fuzzy Teori himpunan fuzzy didasarkan pada logika multi nilai sehingga fungsi karakteristiknya memetakan nilai-nilai kedalam suatu range tertentu yang menunjukkan derajat keanggotaan setiap anggota. Dalam konteks ini, fungsi karakteristik disebut dengan fungsi keanggotaan dan range adalah interval [0,1]. Fungsi keanggotaan memetakan setiap anggota himpunan fuzzy ke dalam derajat keanggotaan dari 0 sampai dengan 1, yaitu:
1.1. Bilangan Fuzzy. Bilangan fuzzy didefinisikan berdasarkan konsep himpunan fuzzy. Bilangan fuzzy dapat didefinisikan secara umum dengan menggunakan konsep himpunan fuzzy normal dan konveks maupun secara khusus dengan menggunakan fungsi keanggotaan.
2
Definisi 1.1.1. (Taheri [20], Giachetti dan Young [16]). Bilangan fuzzy fuzzy normal dan konveks pada garis real dengan
dan (ii)
adalah himpunan
yang memenuhi (i) terdapat tepat satu
bersifat upper semi-continuous.
Definisi 1.1.2. (Zimmermann [24]). Misalkan L (dan R) adalah fungsi berbentuk turun dari ke
dengan atau (
untuk setiap
untuk setiap
jika untuk
dimana
;
dalam
).
, fungsi keanggotaan
disebut nilai mean dari
dan tepi kanan. Bilangan fuzzy
dan
dan
dan
;
untuk setiap
;
disebut bilangan fuzzy
didefinisikan
masing-masing disebut tepi (spread) kiri
dinyatakan dengan
1.2. Jarak dan Ruang Metrik Bilangan Fuzzy. Pada bagian ini dikemukakan definisi jarak antara dua bilangan fuzzy simetris dan sifat ruang metrik berdasarkan definisi jarak tersebut. Misalkan
menyatakan himpunan semua bilangan fuzzy simetris.
Definisi 1.2.1. (Yang dan Ko [23]). Misalkan adalah bilangan fuzzy
di dalam
dan Jarak antara dua bilangan fuzzy
dan
didefinisikan dengan
dengan Nilai
dan dan
.
menyatakan pengaruh bentuk dari fungsi keanggotaan terhadap jarak
antara dua bilangan fuzzy. Nilai
dan
memiliki peran ganda, yaitu berhubungan dengan
variabilitas fungsi keanggotaan dan menurunkan penekanan pada tepi, karena pada kenyataannya bobot pusat lebih besar daripada bobot tepi. Selanjutnya pada definisi 1.2.1, jika kedua bilangan adalah bilangan fuzzy simetris (
,
), maka diperoleh jarak antara dua bilangan fuzzy simetris yaitu:
3
, dan dan ,
2. Model Regresi Fuzzy dengan Variabel Dependen Fuzzy Simetris Ide dasar analisis regresi fuzzy yang dikembangkan adalah memodelkan pusat (center) dari variabel dependen fuzzy simetris dengan mengadopsi model regresi klasik, selanjutnya secara simultan memodelkan tepi variabel dependen fuzzy melalui regresi linear sederhana. Hubungan antara
(variabel dependen fuzzy simetris) dengan
(variabel independen tegas) dinyatakan dengan model ([15],[10]):
dengan
dan
dimana
adalah vektor 1-an berukuran
vektor
dan variabel input
, ;
,
(2.0.1) matriks berukuran
masing-masing adalah vektor pusat
terobservasi dan vektor pusat interpolasi berukuran
; ,
masing-masing adalah
vektor tepi terobservasi dan vektor tepi interpolasi berukuran koefisien/parameter regresi untuk regresi untuk model tepi; serta ,
berisi
berukuran
;
vektor
; b dan d koefisien/parameter
adalah vektor residual.
Model regresi tersebut di bangun atas tiga model linear. Pertama interpolasi pusat dari observasi fuzzy, kedua dan ketiga adalah model untuk batas bawah (pusat – tepi) dan model untuk batas atas (pusat + tepi) yang dibangun berdasarkan model pertama. Dalam kasus variabel output adalah simetris, maka tepi kiri sama dengan tepi kanan, sehingga model kedua dan model ketiga mempunyai estimasi tepi yang sama. 2.1. Optimasi Fungsi Objektif. Berdasarkan kriteria kuadrat terkecil, parameter dari model (2.0.1) diestimasi dengan meminimalkan kuadrat jarak antara variabel dependen terobservasi
dengan nilai teoritis yang berkorespondensi
yang didefinisikan melalui
model (2.0.1). Untuk tujuan ini, digunakan konsep jarak Euclid untuk bilangan fuzzy (seperti pada definisi 1.2.1), yaitu:
Nilai parameter
berkaitan dengan bentuk fungsi dari jenis variabel fuzzy.
Berdasarkan jenis fungsi keanggotaan bilangan fuzzy simetris, nilai
pada dasarnya
merupakan penyesuaian tepi kiri dan tepi kanan pada saat perhitungan batas bawah dan batas atas bilangan fuzzy
,
. Pada persamaan (2.1) 4
menyatakan bobot
yang berbeda antara pusat dengan tepi (kiri maupun kanan). Dalam estimasi parameter regresi, nilai
didefinisikan secara subjektif sesuai dengan bobot pusat dan tepi variabel
fuzzy dengan memperhatikan bentuk spesifik dari fungsi keanggotaan yang memberikan karakter setiap datum fuzzy. Secara umum bobot tersebut selalu kurang dari satu, dengan alasan bahwa bobot untuk tepi selalu kurang dari bobot untuk pusat variabel fuzzy. Berdasarkan model (2.0.1), basis jarak (2.1) dapat ditulis menjadi
Dengan demikian fungsi objektif kuadrat terkecil menjadi
(2.1.1) 2.2. Solusi Kuadrat Terkecil Iteratif. Untuk menentukan solusi masalah (2.1.1), dicari turunan parsial
terhadap parameter a, b, dan d untuk nilai sama dengan nol, sehingga
diperoleh sistem persamaan sebagai berikut. (2.2.1) (2.2.2) (2.2.3) Solusi iteratif dari sistem persamaan di atas diperoleh dengan mengasumsikan bahwa X mempunyai rank penuh. Prosedur optimisasi dengan menggunakan algoritma iteratif berdasarkan persamaan (2.2.1) - (2.2.3) tidak dijamin diperolehnya minimum global, hanya minimum lokal saja. Dengan demikian, sangat disarankan untuk menggunakan algoitma iterasi dengan beberapa nilai awal untuk mengetahui stabilitas solusi ([15], [6]). Selanjutnya dapat dilihat bahwa pada kasus variabel dependen tegas (crisp) yaitu dan
maka estimasi
yang termuat dalam (2.2.1) akan menghasilkan solusi
kuadrat terkecil biasa yaitu
. Dengan demikian model dan solusi pada sistem
persamaan di atas merupakan generalisasi dari model regresi linear klasik, jika variabel dependen memuat ketidakpastian.
3. Solusi Iteratif pada Variabel Fuzzy Simetris Khusus Dalam bagian ini dibahas bentuk-bentuk solusi kuadrat terkecil iteratif pada model regresi fuzzy dengan varaibel dependen fuzzy simetris khusus. Variabel fuzzy simetris dinyatakan dengan
, dengan
menyatakan pusat dan menyatakan tepi kiri dan
tepi kanan (tepinya simetris) dengan fungsi keanggotaan sebagai berikut. 5
dengan
adalah fungsi dari untuk setiap
;
ke
dengan
;
( atau
untuk setiap
untuk setiap
dan
; ).
Bentuk khusus variabel fuzzy simetris seperti Berdasarkan
fungsi
keanggotaan tersebut, dapat didefinisikan beberapa jenis topologi dari variabel fuzzy simetris, yaitu variabel fuzzy dengan fungsi keanggotaan segitiga simetris, normal, parabolik, dan akar kuadrat. Setiap jenis fungsi keanggotaan tersebut menyebabkan perbedaan tingkat ketidakpastian di sekitar pusat variabel fuzzy yang bersangkutan. Gambar 1 menyatakan representasi geometris dari beberapa jenis variabel fuzzy di atas.
: parabolik : segitiga : normal : akar kuadrat Gambar 1. Fungsi keanggotaan beberapa jenis variabel fuzzy simetris 3.1. Fungsi Keanggotaan Segitiga Simetris. Fungsi keanggotaan bilangan (variabel) fuzzy segitiga simetris merupakan jenis fungsi keanggotaan yang paling umum digunakan dalam aplikasi teori fuzzy. Variabel fuzzy segitiga simetris segitiga simetris, L, yang mempunyai bentuk
dinyatakan dengan fungsi
untuk
yang lain. Fungsi keanggotaan yang bersesuaian berbentuk
dan 0 untuk untuk
dan 0 untuk yang lain. Dalam hal ini, diambil nilai , dengan
untuk
dan 0 untuk yang lain,
sehingga diperoleh Dengan demikian diperoleh solusi iteratif model (2.0.1) yaitu bentuk khusus dari persamaan (2.2.1) s.d. (2.2.3) untuk fungsi keanggotaan segitiga: (3.1.1) (3.1.2) 6
(3.1.3) Sebagai catatan, bahwa (3.1.2) dan (3.1.3) sama dengan solusi iteratif yang bersesuaian dari model umum (2.2.2) dan (2.2.3) (juga pada kasus fungsi keanggotaan simetris lain). 3.2. Fungsi Keanggotaan Normal. Variabel fuzzy normal (simetris) dinyatakan dengan
dikatakan sebagai variabel fuzzy
(dengan menetapkan
) didefinisikan
dengan fungsi keanggotaan berbentuk
Pada variabel fuzzy normal, diperoleh nilai
. Dengan demikian diperoleh solusi
iteratif model (2.0.1) dengan bentuk khusus persamaan (2.2.1) untuk fungsi keanggotaan normal yaitu: (3.2.1) 3.3. Fungsi Keanggotaan Parabolik. Variabel fuzzy parabolik fungsi L, yang mempunyai bentuk Fungsi
keanggotaan
yang
untuk
bersesuaian
dinyatakan dengan dan 0 untuk yang lain.
berbentuk
untuk
dan 0 untuk yang lain. Dalam hal ini, diambil nilai , dengan
, untuk
dan 0 untuk yang lain,
sehingga diperoleh Dengan demikian diperoleh solusi iteratif model (2.0.1) dengan bentuk khusus persamaan (2.2.1) untuk fungsi keanggotaan parabolik yaitu: (3.3.1) 3.4. Fungsi Keanggotaan Akar Kuadrat. Variabel fuzzy akar kuadrat dengan fungsi L, yang mempunyai bentuk
, untuk
yang lain. Fungsi keanggotaan yang bersesuaian berbentuk
dinyatakan dan 0 untuk , untuk
dan 0 untuk yang lain. Dalam hal ini, diambil nilai , dengan
, untuk
dan 0 untuk yang lain,
sehingga diperoleh Dengan demikian diperoleh solusi iteratif model (2.0.1) dengan bentuk khusus persamaan (2.2.1) untuk fungsi keanggotaan akar kuadrat yaitu: (3.4.1) 7
4. Hasil dan Pembahasan Pada bagian ini, ditunjukkan hasil analisis regresi fuzzy untuk beberapa jenis fungsi keanggotaan dengan data simulasi. Dilakukan simulasi dengan 6 variabel independen masing-masing sebanyak 25 unit sampel dan untuk setiap unit dibangkitkan variabel dependen fuzzy, seperti dirangkum dalam tabel 1. Berdasarkan tabel 1 diharapkan variabel dependen fuzzy bergantung pada variabel independen dengan estimasi koefisien ,
, dan
Diperhatikan model untuk beberapa fungsi keanggotaan variabel dependen fuzzy, yaitu fungsi keanggotaan segitiga simetris fungsi keanggotaan parabolik
, fungsi keanggotaan normal , dan fungsi keanggotaan akar kuadrat
, .
Penentuan model dan seleksi variabel dilakukan dengan menggunakan kriteria koefisien determinasi dan indeks Mallows ([17]). Perhitungan dibuat dengan menggunakan program MATLAB. Tabel 1. Pembangkitan data simulasi Variabel independen tegas
Variabel dependen fuzzy
Nilai
diekstrak dari v.r. uniform pada interval [0,20]
Nilai
diekstrak dari v.r. uniform pada interval [30,55]
Nilai
diekstrak dari v.r. uniform pada interval [10,25]
Nilai
diekstrak dari v.r. uniform pada interval [25,50]
Nilai
diekstrak dari v.r. uniform pada interval [40,60]
Nilai
diekstrak dari v.r. uniform pada interval [0,100]
Catatan v.r.: variabel random Nilai pusat dan tepi variabel dependen fuzzy
dibangkitkan dari:
dan dengan
: matriks berukuran
yang berisi vektor kolom
dan nilai-nilai variabel independen tegas hasil simulasi; : vektor
variabel random normal dengan mean 0
dan standar deviasi 1. Parameter yang diharapkan dari model adalah
Untuk menentukan banyaknya variabel independen yang sesuai (signifikan), diestimasi model regresi fuzzy untuk setiap nilai
dengan
banyaknya variabel independen.
Untuk setiap , diperhatikan kombinasi yang mungkin dengan 6 variabel independen. 8
variabel independen dari
Tabel 2. Kandidat model dengan
Variabel independen 1
23444.418098
0.704598 0.662398 5136.0332
2
11250.053080
0.858248 0.829898 2457.7377
3
2971.749611
0.962556 0.952702
640.1842
4
87.760782
0.998894 0.998526
8.2896
5
73.684916
0.999072 0.998689
7.1958
6
72.794153
0.999083 0.998624
9.0000
Pada tabel 2 didaftar nilai-nilai minimum JKE, nilai maksimum minimum
yang diperoleh untuk setiap model dengan
catatan bahwa jika diperoleh nilai untuk suatu nilai
dan
, dan nilai
variabel independen. Sebagai
yang sama, maka diperhatikan beberapa kombinasi
[17]. Berdasarkan kriteria
(maksimum) dan indeks
(minimum)
untuk keempat nilai lambda (fungsi keanggotaan: akar kuadrat, segitiga, parabolik, dan normal)
diperleh
model
terbaik
untuk
,
dengan
. Hasil seleksi variabel khusus untuk nilai
variabel
independen
dirangkum pada tabel
2. Tabel 3. JKE,
,
, dan
untuk beberapa nilai
JKE 0.333 0.500 0.667
67.137342 73.684916 82.851094
0.999154 0.999072 0.998956
0.998805 0.998689 0.998527
7.221020 7.195788 7.167365
98.922575
0.998755
0.998242
7.130646
Tabel 4. Hasil estimasi untuk beberapa nilai
0.333
0.046945 2.020674
0.500
0.046945 2.020617
0.667
0.046945 2.020538 0.046946 2.020399
9
Selanjutnya pada tabel 3 dirangkum JKE, berbeda. Terlihat bahwa jika nilai
,
, dan
untuk beberapa nilai
yang
semakin besar maka Jumlah Kuadrat Error (JKE) juga
semakin besar. Sedangkan kecenderungan nilai
,
, dan
semakin kecil. Hal ini
menggambarkan bahwa semakin kecil nilai , yaitu semakin kecil ukuran "fuzziness" pada data, maka akan semakin besar kontribusi variabel independen terhadap varaibel dependen. Sebagai perbandingan jika dilakukan estimasi dengan menggunakan regresi kuadrat terkecil biasa atau dengan mengambil nilai
pada model regresi fuzzy, yaitu dengan
mengasumsikan tepi variabel dependen fuzzy sama dengan nol, diperoleh estimasi:
Berdasarkan tabel 4, terlihat bahwa hasil estimasi pusat model regresi fuzzy sedikit berbeda untuk nilai
yang berlainan, namum demikian hasil tersebut berkisar pada nilai
estimasi dengan menggunakan regresi kuadrat terkecil biasa. Dengan menggunakan model regresi fuzzy, selain model pusat, dapat diestimasi model tepi.
Daftar Pustaka 1. 2. 3. 4. 5.
6.
7. 8. 9. 10. 11. 12. 13.
A. Celmins, Multidimensional least-squares fitting of fuzzy models, Math. Model. 9 (1987), 669-690. P. T. Chang and E. S. Lee, A generalized fuzzy weighted least-squares regression, Fuzzy Sets and Systems 82 (1996), 289-298. Y.-H. O. Chang and B. M. Ayyub, Fuzzy regression methods-a comparative assessment, Fuzzy Sets and Systems 119 (2001), 187-203. R. Coppi, Management of uncertainty in statistical reasoning: The case of regression analysis, International Journal of Approximate Reasoning 47 (2008), 284-305. R. Coppi and P. D'Urso, Regression analysis with fuzzy informational paradigm: a least squares approach using membership function information, Int. J. Pure Appl. Math. 8 (2003), no. 3, 279-306. R. Coppi, P. D'Urso, P. Giordani, and A. Santoro, Least squares estimation of a linear regression model with LR fuzzy response, Computational Statistics & Data Analysis 51 (2006), 267-286. R. Coppi, M. A. Gil, and H. A. L. Kiers, The fuzzy approach to statistical analysis, Computational Statistics & Data Analysis 51 (2006), 1-14. P. Diamond, Fuzzy least squares, Information Sciences 46 (1988), 141-157. P. D'Urso, Linear regression analysis for fuzzy/crisp input and fuzzy/crisp output data, Computational Statistics & Data Analysis 42 (2003), 47-72. P. D'Urso and T. Gastaldi, A least-squares approach to fuzzy linear regression analysis, Computational Statistics & Data Analysis 34 (2000), 427-440. -------, An "orderwise" polynomial regression procedure for fuzzy data, Fuzzy Sets and Systems 130 (2002), 1-19. P. D'Urso and P. Giordani, Fitting of fuzzy linear regression models with multivariate response, Int. Math. J. 3 (2003), no. 6, 655-664. -------, A weighted fuzzy c-means clustering model for fuzzy data, Computational Statistics & Data Analysis 50 (2006), no. 6, 1496-1523. 10
14. P. D'Urso and A. Santoro, Fuzzy clusterwise linear regression analysis with symmetrical fuzzy output variable, Computational Statistics & Data Analysis 51 (2006), 287-313. 15. -------, Goodness of fit and variable selection in the fuzzy multiple linear regression, Fuzzy Sets and Systems 157 (2006), 2627-2647. 16. R. E. Giachetti and R. E. Young, A parametric representation of fuzzy numbers and their arithmetic operators, Fuzzy Sets and Systems 91 (1997), 185-202. 17. I. Kharisudin and Subanar, Fuzzy regression analysis with symmetrical fuzzy dependent variable, submitted to The Proceeding of IICMA 2009, Yogyakarta, October 12-13, 2009. 18. M. Ma, M. Friedman, and A. Kandel, General fuzzy least squares, Fuzzy Sets and Systems 88 (1997), 107-118. 19. A. F. Shapiro, Fuzzy regression and the term structure of interest rates revisited, Unpublished paper, Penn State University, 2005. 20. S. M. Taheri, C-fuzzy numbers and a dual of extension principle, Information Sciences 178 (2008), 827-835. 21. H. Tanaka, S. Uejima, and K. Asai, Linear regression analysis with fuzzy model, IEEE Transactions on Systems, Man and Cybernetics 12 (1982), no. 6, 903-907. 22. H. C. Wu, Fuzzy least squares estimators in linear regression analysis for imprecise input and output data, Computational Statistics & Data Analysis 42 (2003), 203217. 23. M.-S. Yang and C.-H. Ko, On a class of fuzzy c-numbers clustering procedures for fuzzy data, Fuzzy Sets and Systems 84 (1996), 49-60. 24. H. J. Zimmermann, Fuzzy set theory and its applications, Kluwer Academic Publisher, Boston, 1991.
11