M. Zidny Naf’an Gasal 2016/2017
Ketidakpastian Probabilitas Teorema Bayes
Dalam kenyataan sehari-hari banyak masalah didunia ini tidak dapat dimodelkan secara lengkap dan konsisten.
• Premis -1 : Aljabar adalah pelajaran yang sulit • Premis -2 : Geometri adalah pelajaran yang sulit • Premis -3 : Kalkulus adalah pelajaran yang sulit Konklusi : Matematika adalah pelajaran yang sulit Munculnya premis baru bisa mengakibatkan gugurnya konklusi yang sudah diperoleh, misal Premis -4 : Kinematika adalah pelajaran yang sulit Premis tersebut menyebabkan konklusi : ”Matematika adalah pelajaran yang sulit” menjadi salah karena Kinematika bukan merupakan bagian dari Matematika, sehingga bila menggunakan penalaran induktif sangat dimungkinkan adanya ketidakpastian.
Suatu penalaran dimana adanya penambahan fakta baru mengakibatkan ketidakkonsistenan, disebut dengan “Penalaran Non Monotonis”. Ciri-ciri penalaran tsb sebagai berikut : mengandung ketidakpastian adanya perubahan pada pengetahuan adanya penambahan fakta baru dapat mengubah
konklusi yang sudah terbentuk
Misalkan S adalah konklusi dari D, bisa jadi S tidak dibutuhkan sebagai konklusi D + fakta baru Untuk mengatasi ketidakpastian maka digunakan penalaran statistik.
Probabilitas menunjukkan kemungkinan sesuatu akan terjadi atau tidak. Probabilitas adalah suatu nilai untuk mengukur tingkat kemungkinan terjadinya suatu kejadian yang tidak pasti (uncertain event)
Misal dari 10 orang sarjana, 3 orang menguasai cisco, sehingga peluang untuk memilih sarjana yang menguasai cisco adalah: p(cisco) = 3/10 = 0.3
Nilai probabilitas dapat dihitung berdasarkan nilai hasil observasi (sifatnya subyektif) atau berdasarkan pertimbangan pembuat keputusan atau tenaga ahli dalam bidangnya secara subyektif.
Peluang terjadinya suatu kejadian A bila diketahui bahwa kejadian B telah terjadi disebut peluang bersyarat dan dinyatakan dengan P(A|B).
Teorema Bayes dikemukakan Thomas Bayes th. 1763.
Teorema Bayes digunakan untuk menghitung probabilitas terjadinya suatu peristiwa berdasarkan pengaruh yang didapat dari hasil observasi.
Teorema ini menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syarat peristiwa B telah terjadi dan probabilitas terjadinya peristiwa B dengan syarat peristiwa A telah terjadi.
Teorema ini didasarkan pada prinsip bahwa tambahan informasi dapat memperbaiki probabilitas.
p(Hi | E) = probabilitas hipotesis Hi benar jika diberikan evidence (fakta) E p( E | Hi) = probabilitas munculnya evidence (fakta) E jika diketahui hipotesis Hi benar p(Hi) = probabilitas hipotesis Hi (menurut hasil sebelumnya) tanpa memandang evidence (fakta) apapun n = jumlah hipotesis yang mungkin
Di sebuah sekolah terdapat 60% pelajar laki-laki dan 40% pelajar perempuan. Pelajar perempuan mengenakan celana atau rok dalam angka yang sama. Sedangkan pelajar laki-laki semuanya mengenakan celana.
Seorang pengamat melihat seorang pelajar secara acak dari jauh, mereka semua dapat melihat bahwa pelajar ini mengenakan celana. Berapa peluang bahwa pelajar ini adalah seorang anak perempuan ?
Andaikan kejadian A adalah pelajar yang diamati adalah perempuan, dan kejadian B adalah pelajar yang diamati mengenakan celana. Untuk menghitung P(A|B), terlebih dahulu kita harus mengetahui : P(A), atau peluang bahwa pelajar adalah seorang anak perempuan dengan mengabaikan informasi lain yaitu 0,4. P(A’), atau peluang bahwa pelajar adalah seorang anak laki-laki dengan mengabaikan informasi lain. Peluangnya adalah 0,6. P(B) atau peluang pelajar yang mengenakan celana dengan mengabaikan informasi lain. P(B|A), atau peluang pelajar yang mengenakan celana dengan syarat pelajar itu adalah seorang anak perempuan. Peluangnya adalah 0,5. P(B|A’), atau peluang pelajar yang mengenakan celana dengan syarat pelajar itu adalah seorang anak laki-laki. Peluangnya = 1.
maka peluang dari pelajar yang diamati adalah anak perempuan yang mengenakan celana adalah :
Diketahui: probabilitas munculnya bintik-bintik di wajah, jika Asih terkena cacar: p(bintik I cacar) = 0.8 probabilitas Asih terkena cacar tanpa memandang gejala apapun: p(cacar) = 0.4 probabilitas munculnya bintik-bintik di wajah, jika Asih terkena alergi: p(bintik | alergi) = 0.3 probabilitas Asih terkena alergi tanpa memandang gejala apapun: p(alergi) = 0.7 probabilitas munculnya bintik-bintik di wajah, jika Asih jerawatan: p(bintik | jerawatan) = 0.9 probabilitas Asih jerawatan tanpa memandang gejala apapun: p(jerawatan) = 0.5
Maka probabilitas Asih terkena cacar karena ada bintik-bintik di wajahnya :
probabilitas Asih terkena alergi karena ada bintik-bintik di wajahnya :
probabilitas Asih jerawatan karena ada bintik-bintik di wajahnya:
A. B.
Suatu generator telekomunikasi nirkabel mempunyai 3 pilihan tempat untuk membangun pemancar sinyal yaitu didaerah tengah kota, daerah kaki bukit dikota itu dan derah tepi pantai, dengan masing-masing mempunyai peluang 0.2; 0.3 dan 0.5. Bila pemancar dibangun ditengah kota, peluang terjadi ganguan sinyal adalah 0.05. Bila pemancar dibangun dikaki bukit, peluang terjadinya ganguan sinyal adalah 0.06.Bila pemancar dibangun ditepi pantai, peluang ganguan sinyal adalah 0.08. Berapakah peluang terjadinya ganguan sinyal? Bila diketahui telah terjadinya gangguan pada sinyal, berapa peluang bahwa operator tsb ternyata telah membangun pemancar di tepi pantai?
Seorang ahli geologi dari suatu perusahaan minyak, akan memutuskan melakukan pengeboran minyak di suatu lokasi tertentu. Diketahui sebelumnya, probabilitas untuk memperoleh minyak, katakan usaha berhasil adalah H sebesar 0,20 dan akan gagal adalah G (tidak memperoleh) minyak sebesar 0,80. Sebelum keputusan dibuat, akan dicari tambahan informasi dengan melakukan suatu eksperimen yang disebut pencatatan seismografis (seismographic recording). Hasil eksperimen berupa diketemukan tiga kejadian yang sangat menentukan berhasil tidaknya pengeboran, yaitu: Kejadian R1, tidak terdapat struktur geologis Kejadian R2, strutur geologis terbuka Kejadian R3, struktur geologis tertutup Berdasarkan pengalaman masa lampau, probabilitas dari ketiga kejadian ini untuk dapat memperoleh minyak yaitu berhasil H, masing-masing sebesar 0,30 ; 0,36 dan 0,34. Sebaliknya untuk tidak memperoleh minyak yaitu gagal G, masingmasing sebesar 0,68 ; 0,28 dan 0,04.
Hitunglah: 1. P(H|R1), atau probabilitas bahwa diperoleh minyak dengan syarat tidak terdapat struktur geologis. 2. P(H|R2), atau probabilitas bahwa diperoleh minyak dengan syarat struktur geologis terbuka. 3. P(H|R3), atau probabilitas bahwa diperoleh minyak dengan syarat struktur geologis tertutup.
Adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayes dengan asumsi bahwa setiap variabel bersifat bebas (independen)
Dengan kata lain, Naïve BayesClassifier mengansumsikan bahwa keberadaan sebuah atribut (variabel) tidak ada kaitannya dengan keberadaan atribut (variabel) yang lain
Contoh implementasi: Klasifikasi teks Klasifikasi gambar
Karena asumsi atribut tidak saling terkait (conditionally independent), maka:
Bila P(X|Ci) dapat diketahui melalui perhitungan di atas, maka klas (Cnew) dari data sampel X adalah klas (label) yang memiliki P(X|Ci)*P(Ci) maksimum 𝑪𝒏𝒆𝒘
𝒂𝒓𝒈 max 𝑷 𝑪 = 𝑪𝒊 ← 𝑪𝒊
𝑷(𝑿𝒊𝒏𝒆𝒘 |𝑪 = 𝑪𝒊) 𝒊
Dataset Class: C1: buys_computer = ‘yes’ C2:buys_computer= ‘no’
Bila data baru yang belum memiliki class adalah: X =(age<=30, Income=medium, Student=yes, Credit_rating= Fair)
Hitung P(xk|Ci) untuk setiap Class i:
P(age=“<30” | buys_computer=“yes”) P(age=“<30” | buys_computer=“no”) P(income=“medium” | buys_computer=“yes”) P(income=“medium” | buys_computer=“no”) P(student=“yes” | buys_computer=“yes”) P(student=“yes” | buys_computer=“no”) P(credit_rating=“fair” | buys_computer=“yes”) P(credit_rating=“fair” | buys_computer=“no”)
= 2/9=0.222 = 3/5 =0.6 = 4/9 =0.444 = 2/5 = 0.4 = 6/9 =0.667 = 1/5=0.2 =6/9=0.667 =2/5=0.4
X=(age<=30 ,income =medium, student=yes,credit_rating=fair)
Hitung P(X|Ci) untuk setiap Class: P(X|buys_computer=“yes”) = 0.222 x 0.444 x 0.667 x 0.667 = 0.044 P(X|buys_computer=“no”) = 0.6 x 0.4 x 0.2 x 0.4 =0.019
P(X|Ci)*P(Ci ): P(X|buys_computer=“yes”) x P(buys_computer=“yes”) = 0.028 P(X|buys_computer=“no”) x P(buys_computer=“no”) = 0.007
X memiliki klas “buys_computer=yes” karena P(X|buys_computer=“yes”) memiliki nilai maksimum pada perhitungan di atas
Dataset di bawah ini menggambarkan keadaan apakah seseorang akan bermain tenis atau tidak berdsarkan keadaan-keadaan yang terjadi
Lakukan prediksi apakah seseorang akan bermain tenis atau tidak jika diketahui: (Outlook=Sunny, Temperature=Cool, Humidity=High, Wind=Strong)
Kerjakan secara berkelompok (maks. 4 orang) dan hasil dilaporkan secara tertulis dan dikumpulkan tgl 7 Desember 2016
https://en.wikipedia.org/wiki/Bayes%27_theo rem
Minarni, Bahan Ajar Mata Kuliah Kecerdasan Buatan, ITP Teuku Hilman, Bahan Ajar Kecerdasan Buatan, Univ. Gunadarma PENS ITS, http://kangedi.lecturer.pens.ac.id/materi%20kuliah/m atakuliah%20statistik/Teorema%20Bayes.ppt USU, http://repository.usu.ac.id/bitstream/123456789/17756 /3/Chapter%20II.pdf Tom M. Mitchell, Machine Learning 10-701 Taufik Fuadi Abidin, Naïve Bayesian Classifier, Prodi. Teknik Informatika, Univ. Syiah Kuala