1
I PENDAHULUAN
1.1 Latar Belakang Kata-kata manusia pada data mempunyai perbedaan batas pengertian. Beberapa kata mungkin mempunyai arti yang lebih umum dibandingkan dengan yang lainnya. Derajat kemiripan dari dua kata tidak perlu simetris atau transitif. Sebagai contoh, warna “merah” mempunyai pengertian yang lebih umum dan lebih luas dibandingkan dengan warna “merah tua” yang mempunyai arti lebih spesifik. Kata “merah” mempunyai interval yang lebih luas daripada kata “merah tua” sehingga interval dari pengertian warna adalah berbeda untuk dua kata. Biasanya kalimat “merah tua seperti merah” lebih benar dan biasa digunakan daripada kalimat “merah seperti merah tua”. Selain itu, dapat dikatakan bahwa derajat kemiripan dari “merah dengan diberikan merah tua” adalah berbeda dengan “merah tua dengan diberikan merah”. Dalam kehidupan sehari-hari seringkali ditemui suatu fenomena yaitu data mengandung sesuatu yang tidak akurat dengan derajat keakuratan data yang berbeda. Data yang tidak akurat tersebut dapat berupa kata-kata manusia yang bersifat relatif. Himpunan fuzzy dapat merepresentasikan data yang tidak akurat tersebut. Pada tulisan ini, relasi peluang bersyarat fuzzy atau fuzzy conditional probability relations (FCPR) digunakan untuk merepresentasikan relasi kemiripan antara dua himpunan fuzzy yang tidak perlu simetris atau transitif. Konsep dari FCPR akan difokuskan pada relasi kemiripan yang lemah yaitu relasi fuzzy biner dengan perumuman relasi kemiripan (Zadeh 1970 dalam Intan dan Mukaidono 2004). Sistem informasi fuzzy yang digunakan pada tulisan ini adalah tabel data fuzzy
sederhana yang merupakan aplikasi dari knowledge discovery and data mining (KDD). Pertama, akan diperkenalkan FCPR dari dua himpunan fuzzy pada sistem informasi fuzzy yang diberikan. Kemudian, dengan memanfaatkan derajat kemiripan dari FCPR, maka tulisan ini akan memperkenalkan aplikasi FCPR pada sistem informasi fuzzy yang diberikan. Aplikasi tersebut adalah konsep α-objek redundan, ketergantungan atribut, pendekatan data reduksi dengan operator proyeksi, dan aplikasi yang terakhir adalah pendekatan data query yang berdasarkan pada input bergantung dan input bebas. 1.2 Tujuan Tujuan penulisan ini adalah : 1. Merekonstruksi FCPR dari dua himpunan fuzzy pada sistem informasi fuzzy. 2. Merekonstruksi α-objek redundan berdasarkan pada FCPR pada sistem informasi fuzzy. 3. Merekonstruksi ketergantungan atribut berdasarkan pada FCPR pada sistem informasi fuzzy. 4. Merekonstruksi pendekatan data reduksi dengan operator proyeksi, dan pendekatan data query pada sistem informasi fuzzy. 1.3 Ruang Lingkup Ruang lingkup penulisan ini adalah : 1. Tulisan ini dibatasi pada rujukan utama jurnal Fuzzy Conditional Probability Relations and Their Applications in Fuzzy Information Systems (Intan dan Mukaidono 2004). 2. Sistem informasi fuzzy yang digunakan dibatasi pada tabel data fuzzy yang sederhana (ukuran tabel tidak besar). 3. Konsep FCPR hanya difokuskan pada relasi kemiripan yang lemah yaitu relasi fuzzy biner dengan perumuman relasi kemiripan.
II TINJAUAN PUSTAKA 2.1 Himpunan Crisp dan Himpunan Fuzzy Definisi 1 Himpunan Crisp Himpunan crisp A didefinisikan oleh elemen-elemen yang ada pada himpunan itu. Jika a ∈ A , maka nilai yang berhubungan dengan a adalah 1. Namun jika
a ∉ A , maka nilai yang berhubungan dengan a adalah 0. Keanggotaan himpunan crisp selalu dapat dikategorikan secara penuh tanpa ada ambiguitas. (Kusumadewi 2002)
2
Definisi 2 Himpunan Fuzzy Misalkan Dˆ j = { dˆ 1j , dˆ 2j , ..., dˆ nj } adalah himpunan dengan domain crisp dan Dj adalah himpunan dengan domain tidak akurat. dˆ ij adalah nilai data crisp ke-i dari domain Dˆ j dan Dˆ j ⊆ D j . Data tidak akurat, x ∈ Dj, menganggap himpunan fuzzy x pada Dˆ adalah definisi yang sederhana dari Dˆ j
j
ke selang tertutup [0,1] dengan fungsi keanggotaan μ x : Dˆ j → [0 ,1] . Himpunan fuzzy x didefinisikan oleh :
{
}
x = μ x ( dˆ ij ) dˆ ij dˆ ij ∈ Dˆ j ,
μ x ( dˆ ij )
dengan
adalah
nilai
(1) derajat
Himpunan fuzzy didasarkan pada gagasan untuk memperluas jangkauan fungsi karakteristik sedemikian sehingga fungsi tersebut akan mencakup bilangan real pada interval [0,1]. Nilai keanggotaannya menunjukkan bahwa suatu elemen dalam semesta pembicaraannya tidak hanya berada pada 0 atau 1, namun juga nilai yang terletak di antaranya. Dengan kata lain, nilai kebenaran suatu elemen tidak hanya bernilai benar atau salah, dan masih ada nilai-nilai yang terletak antara benar dan salah. Himpunan fuzzy memiliki 2 atribut, yaitu: a. Linguistik, yaitu penamaan suatu grup yang mewakili suatu keadaan atau kondisi tertentu dengan menggunakan bahasa alami, seperti : muda, probaya, tua. b. Numeris, yaitu suatu nilai (angka) yang menunjukkan ukuran dari suatu variabel seperti : 40, 25, 50, dan lainnya. (Kusumadewi 2002) Definisi 3 Fungsi Keanggotaan Fungsi keanggotaan μ dari himpunan fuzzy x adalah pemetaan dari himpunan dengan domain crisp Dˆ j ke selang tertutup
{
x
j
j
j
j
adalah himpunan nilai dari atribut aj dengan data Dj adalah data tidak akurat (bernilai fuzzy). (Intan dan Mukaidono 2004) Definisi 5 Total Ketidaktahuan Misalkan Dˆ j = { dˆ 1j , dˆ 2j , ..., dˆ nj }
},
(2) (Intan dan Mukaidono 2004)
Definisi 4 Sistem Informasi Fuzzy Sistem informasi fuzzy didefinisikan sebagai pasangan I = (U, A), dengan U
adalah
himpunan dengan domain crisp dan Dj adalah himpunan dengan domain tidak akurat. dˆ ij adalah nilai data crisp ke-i dari domain Dˆ j dan Dˆ j ⊆ D j .
keanggotaan dari dˆ ij pada x. (Intan dan Mukaidono 2004)
[0,1], dinotasikan dengan : x = μ ( dˆ i ) dˆ i dˆ i ∈ Dˆ
adalah himpunan semesta dari objek dan A adalah himpunan semesta dari atribut sedemikian sehingga a j : U → Dj , ∀a j ∈ A . Dj
Total
ketidaktahuan
Dˆ j merupakan representasi didefinisikan oleh : ignorance (TI) atas
{ = {0 dˆ ,..., 0 dˆ
atau
dengan
dˆ ij ∈ Dˆ j
sederhana
yang
}
T I = 1 dˆ 1j ,1 dˆ 2j , ...,1 dˆ nj , dˆ ij
1 j
i −1 j
total
}
,1 dˆ ij , 0 dˆ ij+1 ,..., 0 dˆ nj ,
(3) (4)
dengan μ T I ( dˆ 1j ) = 1 yang diwakili oleh 1 dˆ 1j . TI dianggap seperti himpunan fuzzy yang merepresentasikan himpunan semesta dengan diberikan domain crisp. (Intan dan Mukaidono 2000a) Definisi 6 Relasi Kemiripan Relasi kemiripan adalah pemetaan s j : D j x D j → [0,1] , dengan x , y , z ∈ D j , a) Refleksif s j ( x , x ) = 1,
(5)
b) Simetris
s j ( x , y ) = s j ( y , x ),
(6)
c) Max-min transitif
s j ( x , z ) ≥ max {min[ s j ( x , y ), s j ( y , z )]} .
(7)
(Zadeh 1970 dalam Intan dan Mukaidono 2004) Definisi 7 Relasi Kemiripan yang Lemah Relasi kemiripan yang lemah adalah dengan pemetaan S j : D j x D j → [0,1] , x, y, z ∈ D j .
a.) Refleksif S j ( x , x ) = 1,
b.) Simetris Jika S j ( x, y) > 0, maka S j ( y, x) > 0,
(8) (9)
3
⎧1, x = y I j ( x, y ) = ⎨ ⎩ 0, lainnya.
c.) Transitif Jika Sj (x, y) ≥Sj (y, x) >0 dan Sj (y, z) ≥Sj (z, y) >0 maka Sj (x, z) ≥ Sj (z, x).
(10) (Intan dan Mukaidono 2004)
(14)
(Intan dan Mukaidono 2004)
Definisi 8 Kardinalitas Himpunan Fuzzy Misalkan y adalah himpunan dengan domain tidak akuratik Dj dan dˆ ij adalah nilai data crisp ke-i dari domain crisp Dˆ ,
2.3 Ketergantungan Atribut
maka kardinalitas himpunan didefinisikan sebagai berikut :
himpunan semesta dari objek dan A adalah himpunan semesta dari atribut. C , B ⊆ A . sebagai derajat δ i ( C , B ) didefinisikan
j
y =
∑
i
fuzzy
μ y ( dˆ ij ).
y
(11) (Klir dan Yuan 1995)
Definisi 9 Relasi Peluang Bersyarat Fuzzy (FCPR) Misalkan µx dan µy adalah dua fungsi keanggotaan dengan diberikannya domain Dˆ j untuk dua himpunan fuzzy dan misalkan
x, y ∈ Dj maka
FCPR adalah pemetaan
R j : D j x D j → [0,1] yang didefinisikan oleh :
R j ( x, y ) =
x∩ y y
=
∑ min {μ (dˆ ), μ ∑ μ (dˆ ) i j
x
i
i
y
i j
y
},
( dˆ ij )
(12) Rj(x, y) merupakan derajat y yang serupa dengan x. (Intan dan Mukaidono 2004) 2.2
α -Objek Redundan
Definisi 10 α - Objek Redundan Objek ui ∈U dianggap sebagai α‐objek
redundan pada sistem informasi fuzzy I(U, A) jika terdapat objek u j ∈ U yang mencakup semua karakteristik dari ui sedikitnya dengan derajat dari yaitu apabila α = (α 1 , α 2 , ..., α m ) memenuhi : Rk (ak (u j ), ak (ui )) ≥ α k , ∀k ∈ ` m , (13) dengan Rk adalah FCPR antara dua elemen data pada domain Dk, dan α k ∈ [0,1] .
ak (uj ), ak (ui ) ∈Dk melambangkan pemetaan dari atribut ak ke objek uj dan ui. (Intan dan Mukaidono 2004) Definisi 11 Relasi Identitas Relasi identitas adalah pemetaan I j : D j x D j → {0,1} , untuk x , y ∈ D j ,
Definisi 12 Derajat Ketergantungan Atribut Misalkan I = (U, A) adalah sistem informasi adalah fuzzy, dengan U = { u 1 , ..., u n }
ketergantungan C menentukan B pada objek ui dengan : δ i (C , B ) =
∑ ∑
u∈U
min a j ∈C ∪ B R j ( a j (u i ), a j (u ))
u∈U
min a j ∈C R j ( a j (u i ), a j (u ))
.
(15) (Intan dan Mukaidono 2004)
Definisi 13 Ketergantungan Fungsi Fuzzy (FFD) Ketergantungan fungsi fuzzy atau fuzzy functional dependency (FFD) C menentukan B (C→B) pada sistem informasi I (U, A) yaitu jika memenuhi : δ i (C , B ) ≥ δ i ( B , C ) , ∀ i ∈ ` n . (16)
(Intan dan Mukaidono 2004) 2.4
Pendekatan Data Operator Proyeksi
Reduksi
dengan
Definisi 14 Tabel Keputusan Misalkan I(U, A) adalah sistem informasi dan misalkan Con , Dec ⊂ A dengan Con
adalah atribut kondisi dan Dec adalah atribut keputusan. Sistem informasi yang membedakan antara Con dan Dec disebut dengan tabel keputusan dan dilambangkan dengan : ℘= (U , Con, Dec, α(Con,Dec ) ), (17) dengan α ( Con , Dec ) ∈ [0,1] menentukan derajat ketergantungan keputusan diberikan kondisi (Con).
(Dec)
dengan
(Pawlak 1991) Definisi 15 Relasi ℜ ℜ adalah relasi R(D) yang ada pada I(U, A), dengan setiap tuple pada relasi ℜ berhubungan ke objek pada himpunan objek U dan himpunan domain D = {D1, D2,…, D3} berhubungan ke himpunan atribut A = {a1 , a2 ,..., am } .
(Intan dan Mukaidono 2004)
4
Definisi 16 Proyeksi Relasi ℜ Proyeksi relasi ℜ pada dom(Con ∪ Dec) (domain atribut pada Con ∪ Dec ) didapatkan dengan mengambil pembatasan dari tuple ℜ ke dom(Con ∪ Dec) .
Proyeksi dari ℜ di atas dom(Con ∪ Dec) adalah relasi ℜ ' yang didefinisikan dengan : πCon∪Dec (ℜ) = ℜ'{t(dom(Con ∪ Dec)) | t ∈ℜ}. (18) (Intan dan Mukaidono 2004) Definisi 17 Fuzzy c-Partition Misalkan Dˆ j = { dˆ 1j , dˆ 2j , ..., dˆ nj } adalah
himpunan dengan domain crisp dan Dj adalah himpunan dengan domain tidak akurat. Dˆ j ⊆ D j dan dˆ ij adalah nilai data crisp ke-i dari domain Dˆ j . Fuzzy c-partition dari Dˆ adalah keluarga dari anak j
himpunan fuzzy atau kelas fuzzy dari P, dengan yang P = { p1 , p 2 , ..., p c } , memenuhi : c
∑
i =1
μ
pi
( dˆ kj ) = 1 , ∀ k ∈ ` n ,
dan 0 <
n
∑μ k =1
pi
(dˆ kj ) < n , ∀ i ∈ ` c ,
(19) (20)
dengan c adalah bilangan bulat positif dan μ pi ( dˆ kj ) ∈ [0, 1]. (Intan dan Mukaidono 2004) Definisi 18 Derajat Ketergantungan pada Relasi ℜ Misalkan X = {x1, x2, …, xn} adalah himpunan fuzzy (hasil dari fuzzy partition) yang akan menjadi himpunan atribut Con = {a1, a2, …, ar} dan misalkan Y = {xr+1, .…, xw} adalah himpunan fuzzy (hasil dari fuzzy partition) yang akan menjadi himpunan atribut Dec={ar+1,…,aw}. Jika ada n tuple di derajat ketergantungan Y ℜ , maka diberikan X pada relasi ℜ diberikan oleh :
ϕ ℜ (Y , X ) =
∑ ∑
n i =1 n i =1
m in wj=1 R j ( x j , a j ( t i )) m in rj =1 R j ( x j , a j ( t i ))
.
(21) (Intan dan Mukaidono 2004)
Definisi 19 Ketergantungan Fungsi Fuzzy pada Relasi ℜ Misalkan himpunan fuzzy X dan Y merepresentasikan dom(Con) dan dom(Dec), maka ketergantungan fungsi fuzzy pada relasi p
ℜ dilambangkan dengan X → Y yaitu jika memenuhi : ϕ ℜ (Y , X ) ≥ ϕ ℜ ( X , Y ).
(22) Persamaan tersebut adalah bagian dari FFD. (Intan dan Mukaidono 2004) Definisi 20 (α(X,Y)) α ( X ,Y ) adalah definisi seperti
α
–cut yaitu
derajat ketergantungan X dalam menentukan Y yang memenuhi persamaan berikut : (23) α( X ,Y ) = 0 ⇔ϕℜ(Y, X ) < α,
ϕℜ( X ,Y) = ϕℜ(Y, X ) ⇔ϕℜ (Y, X ) ≥ α, (24) dengan α ∈ [0, 1]. (Intan dan Mukaidono 2004) 2.5 Pendekatan Data Query Definisi 21 Peluang Query untuk Input Bergantung Misalkan {A1, A2, …, An} adalah himpunan input domain, B adalah himpunan output domain dari data query, D adalah himpunan semesta dari domain (A1, A2, …, An, B ∈ D), dan ℜ adalah relasi pada R(D). Peluang query untuk b* diberikan input yang bergantung dilambangkan dengan a * 1 , ..., a * n
Qˆ ℜ (b* | a*1 ,..., a*n )α ∈ [0,1] , dengan α ∈[0,1] dan b* , a*1 ,..., a*n adalah himpunan fuzzy pada B , A1 ,..., An . t melambangkan tuple pada relasi
ℜ , dan R ( − , − ) adalah FCPR.
Jika ada m tuple, maka untuk t r (a r 1 , ..., a r n , b r ) ∈ ℜ : ⎛ ⎞ ∑m r =1 min ⎜⎝ R A1 ( a*1 , ar 1 ),..., R An ( a* n , arn ), RB ( b* , br ) ⎟⎠ , σ = ⎛ ⎞ min ⎜ R A ( a*1 , a r 1 ),..., R A ( a* n , arn ) ⎟ ∑m r =1 n ⎝ 1 ⎠
Untuk σ < α , maka Qˆ ℜ ( b* | a * 1 , ..., a * n ) α = 0 , Untuk σ ≥ α , maka Qˆ ℜ ( b* | a * 1 , ..., a * n ) α = σ .
(25) (26) (27) (Intan dan Mukaidono 2004)
5
Definisi 22 Relasi Fuzzy Query Misalkan D adalah himpunan semesta dari domain. R ( A1 , A2 ,..., An → B )α adalah definisi relasi fuzzy query untuk membuat query untuk B diberikan input A 1 , A 2 , . . . , A n dengan α ∈ [0,1], dengan A1, A2 ,..., An , B ∈ D . (Intan dan Mukaidono 2004)
Definisi 23 Peluang Query untuk Input Bebas Misalkan { A1 , A2 ,..., An } adalah himpunan
input domain, B adalah himpunan output domain dari data query, D adalah himpunan semesta dari domain ( A1 , ..., A n , B ∈ D ), dan
ℜ adalah relasi pada R(D). Peluang query untuk b* diberikan input yang bebas dilambangkan dengan a*1 , ..., a* n Qˆ ℜ (b* | a*1 ,..., a*n )α ∈ [0,1] , dengan α ∈[0,1] dan b* , a*1 ,..., a*n adalah himpunan fuzzy pada B , A1 ,..., An . t melambangkan tuple pada relasi ℜ , dan R ( − , − ) adalah FCPR.
Jika ada m tuple, maka untuk t r (a r 1 , ..., a rn , b r ) ∈ ℜ , ⎛ ⎛ ⎞⎞ ⎛ ⎞ ∑m r =1 max ⎜ min ⎜⎝ R A1 ( a*1 , ar 1 ), RB ( b* , br )⎟⎠ ,...,min ⎜⎝ R An ( a* n , arn ), RB ( b* , br )⎟⎠⎟ ⎝ ⎠ , λ = ⎛⎛ ⎞⎞ m ∑ r =1 max ⎜⎜ R A ( a*1 , ar 1 ),..., R A ( a* n , arn )⎟⎟ n ⎠⎠ ⎝⎝ 1
Untuk λ < α , maka Qˆ ℜ ( b * | a * 1 , ..., a * n ) α = 0 ,
(28) (29)
Untuk
(30)
λ ≥ α , maka Qˆ ℜ ( b*
| a * 1 , ..., a * n ) α = λ .
(Intan dan Mukaidono 2004)
2.6 Fungsi Keanggotaan Pada Toolbox MATLAB Fungsi keanggotaan fuzzy biasanya digambarkan dalam bentuk kurva yang menunjukkan titik-titik input data ke dalam nilai keanggotaannya yang memiliki interval antara 0 sampai 1. Software MATLAB 7.0.1 menyediakan beberapa tipe fungsi keanggotaan yang dapat digunakan. Tipe-tipe tersebut antara lain : a. Trimf Fungsi ini berguna untuk membuat fungsi keanggotaan dengan kurva segitiga
Fungsi keangotaannya : ⎧ 0, x < a ⎪x−a ⎪ ,a ≤ x ≤ b ⎪b − a f ( x; a , b , c ) = ⎨ ⎪c − x ,b ≤ x ≤ c ⎪c −b ⎪ 0, c ≤ x ⎩
µ[x] 1
0
a
b
c
x
Gambar 1 Kurva Segitiga b. Trapmf Fungsi ini berguna untuk membuat fungsi keanggotaan dengan kurva trapesium. Fungsi keanggotaannya : ⎧0, x ≤ a ⎪x−a ⎪ ,a ≤ x ≤ b ⎪b − a ⎪ f ( x ; a , b , c , d ) = ⎨ 1, b ≤ x ≤ c ⎪d − x ⎪ ,c ≤ x ≤ d ⎪d −c ⎩⎪ 0 , d ≤ x
6
µ[x] 1
0
a
x d b c Gambar 2 Kurva Trapesium
(Kusumadewi 2002)
III METODOLOGI PENELITIAN Dalam melakukan penelitian ini, langkahlangkah yang ditempuh adalah sebagai berikut : Penggalian Informasi atau Studi Pustaka Pengumpulan bahan pustaka yang berkaitan dengan himpunan crisp, himpunan fuzzy, relasi peluang bersyarat fuzzy, fungsi ketergantungan fuzzy (FFD), fuzzy integrity constraints (FIC), knowledge discovery and data mining (KDD), dan data query. Pengumpulan Data Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari rujukan utama jurnal Fuzzy Conditional Probability Relations and their Applications in Fuzzy Information Systems (Intan dan Mukaidono 2004). Rekonstruksi FCPR dari Dua Himpunan Fuzzy Pada sistem informasi fuzzy yang diberikan, akan ditentukan himpunan fuzzy dan fungsi keanggotaan kemudian akan ditentukan derajat dari relasi kemiripan antara dua himpunan fuzzy tersebut. Selain itu, akan dibuat grafik fungsi keanggotaan dari himpunan fuzzy dengan menggunakan software MATLAB 7.0.1. Rekonstruksi Konsep α‐Objek Redundan berdasarkan FCPR Pada sistem informasi fuzzy yang diberikan, akan dibuktikan bahwa salah satu
objek mengandung α-objek redundan. Konsep α-objek redundan ditentukan dalam kaitannya dengan sistem informasi fuzzy dengan memanfaatkan derajat dari dasar kemiripan FCPR. Rekonstruksi Ketergantungan Atribut berdasarkan FCPR Pada sistem informasi fuzzy yang diberikan, akan ditentukan ketergantungan dari dua atribut menggunakan definisi ketergantungan fungsi fuzzy (FFD). Rekonstruksi Pendekatan Data Reduksi dengan Operator Proyeksi. Untuk menghasilkan relasi di antara himpunan fuzzy, akan dibentuk tabel keputusan dengan pendekatan data reduksi dengan operator proyeksi dari sistem informasi fuzzy yang diberikan. Pertama, akan dibuat fuzzy partition yang menghasilkan anak himpunan fuzzy. Kemudian, akan ditentukan ketergantungan atribut dari dua anak himpunan fuzzy. Selanjutnya akan ditetapkan α(Con,Dec) ≥ 0.2 untuk mendapatkan relasi dari dua anak himpunan fuzzy tersebut. Terakhir, akan didapatkan dua tabel keputusan. Rekonstruksi Pendekatan Data Query Pendekatan data query berdasarkan pada dua kerangka, yaitu input yang bergantung dan input yang bebas. Relasi fuzzy query mengenalkan hasil dari proses pendekatan data query.