BAB II LANDASAN TEORI
2.1. Web-based Learning Memenuhi kebutuhan belajar siswa merupakan tantangan yang selalu ada bagi para pendidik, terutama pada pelajaran-pelajaran yang rumit dan memiliki aturan-aturan tertentu. Pendidik harus selalu mampu beradaptasi terhadap gaya belajar siswa dengan berbagai macam preferensi mereka agar dapat membantu kegiatan belajar mereka secara efektif. Oleh karena itu, kemampuan pendidik melihat situasi dan memperkenalkan metode belajar yang inovatif adalah mutlak diperlukan untuk menangani siswa di generasi saat ini yang hidupnya dikelilingi oleh komputer, multimedia, internet, handphone, dan permainan-permainan elektronik lainnya. (Pergola & Walters, 2011:2). Salah satu cara yang dapat menarik minat siswa di era ini adalah dengan menggunakan metode web-based learning. Yaitu sebuah metode pembelajaran yang diberikan kepada para peserta didik lewat jaringan internet. Metode ini sebenarnya telah mulai banyak diminati sejak awal tahun 2000-an. Menurut McGee (2002:5), metode pembelajaran seperti ini menjadi populer karena kemampuannya menyampaikan materi pelajaran tanpa terkendala jarak antara lembaga yang memberikan materi pelajaran dan para peserta didik. Peserta didik tidak lagi harus datang ke lembaga pendidikan untuk mempelajari suatu materi melainkan cukup duduk di depan komputer yang terhubung dengan internet dan pelajaran bisa dimulai. Menurut Inan (2010:3-4), sistem pembelajaran berbasis web dibagi menjadi 2 (dua) berdasarkan kemampuannya beradaptasi dengan kemampuan siswa: - Non-Adaptive Web-based Learning yang hanya memberikan konten statis dan
6
7
berharap semua siswa dapat mempelajarinya dengan cara yang sama tanpa memperhitungkan latar belakang siswa. - Adaptive Web-based Learning yang merupakan kumpulan instruksi adaptif yang memiliki mekanisme untuk dapat menyesuaikan diri dengan perbedaan karakteristik tiap-tiap individu.
2.1.1. Non-adaptive Web-based Learning Web-based learning yang bermunculan pertama kali adalah non-adaptive webbased learning yaitu metode pembelajaran berbasis web yang bersifat statis di mana materi yang diberikan sama untuk semua peserta didik tanpa memperhitungkan perbedaan-perbedaan daya tangkap dan latar belakang peserta didik. Padahal perbedaan-perbedaan inilah yang menjadi salah satu kendala dalam penerapan metode pembelajaran berbasis web (Inan, Flores, & Grant, 2010:149). Pendidik yang kurang berpengalaman biasanya gagal dalam memberikan halhal seperti: masukan yang tepat, menerapkan strategi pengajaran yang memadai, menciptakan interaksi yang memadai, membuat materi ajar yang berkualitas tinggi, membentuk komunitas belajar-mengajar yang terintegrasi secara sosial, dan pemantauan kemajuan belajar siswa secara individual. Hal-hal ini jugalah yang menjadikan pembuatan sistem pembelajaran berbasis web menemui banyak rintangan (Inan, 2010:3) Dalam tulisannya, Mustafa (2005:13-18) menjabarkan perbedaan-perbedaan karakteristik peserta didik yang membuat non-adaptive web-based learning dapat menemui kegagalan, yakni: - Karakteristik Kognitif yang menyangkut bagaimana preferensi seorang individu untuk belajar dengan baik, metode apa yang diinginkan tiap
8
individu, dan seberapa banyak materi yang dapat ditangkap dalam rentang waktu tertentu. - Karakteristik Afektif yang menyangkut tentang bagaimana kondisi mental seorang individu dapat berubah-ubah saat mengikuti pelajaran. Kondisi mental yang berbeda saat sedang mempelajari materi yang sama dapat memberikan hasil yang berbeda kepada peserta didik. - Karakteristik Sosial-Budaya yang menyangkut tentang bagaimana lingkungan sekitar dapat berperan dalam membentuk karakteristik kognitif dan afektif. Sebagai contoh, para peserta didik Anglo-Saxon lebih nyaman dengan pendekatan student-centered sedangkan para peserta didik dari Asia lebih nyaman dengan pendekatan teachercentered. Sebuah sistem pembelajaran berbasis web yang baik haruslah secara adaptif mampu mengenali kebutuhan siswa dan memberikan kemampuan kepada para siswa untuk melakukan personalisasi terhadap sistem tersebut, karena sistem ini akan digunakan oleh siswa dengan tingkat kemampuan dan gaya belajar yang berbeda-beda. (Garcia, Amandi, Schiaffino, Campo, 2007: 794).
2.1.2. Adaptive Web-based Learning Adaptive Web-based Learning adalah sebuah sistem yang dapat memberikan materi pelajaran kepada para peserta didik secara on-line dengan kemampuan menyesuaikan diri dengan perbedaan-perbedaan karakteristik peserta didik dengan cara mencari dan mengenali lewat rangkaian soal-soal untuk kemudian menentukan mana informasi yang paling berguna bagi siswa dengan mempertimbangkan waktu dan kemajuan yang dicapai oleh siswa (Simko, Barla, & Bielikova, 2010:2).
9
Sejumlah adaptive web-based learning yang telah ada dikembangkan dengan menggunakan teknologi Artificial Intelligence (AI) sebagai otak yang menentukan apa yang harus dilakukan oleh sistem berdasarkan input yang diberikan. Contohnya seperti pada AIWBES yang menggabungkan beberapa konsep AI seperti Adaptive Hypermedia Systems, Machine Learning, Data Mining, dan Intelligent Tutoring Systems
(Brusilovsky
&
Peylo,
2003:159),
implementasi
Expert
Model
menggunakan algoritma-algoritma seperti Best-first Search, Greedy, dan A* Search pada penelitian Kochakornjarupong (2010:42.3), dan pemanfaatan Artificial Neural Network (ANN) sebagai engine dari Adaptive Instructional Planner (Seridi, Sari, & Sellami, 2006:183-190).
2.1.3. Student Modelling Gong, Beck, dan Heffernan (2010:1-2) mengungkapkan bahwa Student Modelling merupakan salah satu mekanisme yang penting dalam pengembangan sistem pembelajaran adaptif karena dua fungsi utamanya, yaitu: - Menebak tingkah laku siswa dalam proses belajar. Proses pengenalan model belajar siswa ini dapat dimanfaatkan untuk selanjutnya menebak hasil dari proses pembelajaran. - Mendapatkan perkiraan yang masuk akal dan dapat dijelaskan tentang parameter-parameter pada jawaban siswa, utamanya untuk masalahmasalah seperti apakah siswa telah menggunakan sistem pembelajaran adaptif sebagaimana mestinya dengan tidak mencoba menipu sistem. Sedemikian pentingnya, Student Modelling telah mendorong para periset untuk semakin dalam melakukan riset pada bidan ini. Riset-riset tersebut dilakukan untuk meningkatkan kemampuan Student Modelling agar semakin mampu
10
mendapatkan tingkat akurasi prediksi yang lebih tinggi dan masuk akal. (Gong, Beck, & Heffernan, 2010: 2). Beberapa riset tersebut di antaranya seperti yang dilakukan Conati dkk. (1997: 1) yang mencoba membuat sistem pemodelan siswa menggunakan jejaring Bayesian untuk menentukan topik yang tepat untuk dipelajari oleh siswa berdasarkan topik sebelumnya. Menggunakan jejaring Bayesian Garcia dkk. (2007: 797) juga telah mencoba membuat sebuah sistem pemodelan siswa untuk mendapatkan cara belajar siswa berdasarkan tabel dimensi Felder, namun hasil yang didapatkan kurang memuaskan. Gong, Beck, & Heffernan (2010:5-7) juga telah mencoba membandingkan metode pemodelan siswa antara yang menggunakan pendekatan Knowledge Tracing (KT)
dengan
yang
menggunakan
Performance
Factor
Analysis
(PFA).
Penelitiannya menyimpulkan bahwa pemodelan siswa dengan menggunakan metode PFA dapat memberikan hasil yang lebih baik karena PFA mampu memperhitungkan progress siswa seiring berjalannya waktu. Sedangkan metode KT dianggap kurang mampu menangani topik-topik yang membutuhkan penguasaan terhadap lebih dari satu materi. Adapun Seridi, Sari, dan Sellami (2005: 190) melakukan penelitian untuk mengembangkan sebuah sistem pemodelan siswa menggunakan pendekatan Artificial Neural Network (ANN) dengan tingkat akurasi sangat baik yang terentang dari angka 85%-96% dengan catatan penelitian mereka menentukan batasan nilai error di bawah 5%, sehingga jika tingkat akurasi yang melewati 95% sudah dicapai maka iterasi pelatihan akan dihentikan.
11
2.2. Artificial Intelligence (AI) Russel dan Norvig (2010: 1-5) menjabarkan ada empat karakteristik yang harus dipenuhi agar sebuah sistem dapat disebut memiliki AI: − Bertindak seperti manusia, yaitu sebuah mesin harus mempu memiliki kemampuan-kemampuan manusiawi, yaitu Natural Language Processing (NLP), menyimpan pengetahuan, penalaran terhadap aksi yang diterima berdasarkan pengetahuan yang telah disimpan, kemampuan beradaptasi terhadap situasi baru, dan kemampuan mengenali pola. − Berpikir seperti manusia, yaitu kemampuan untuk menjawab berdasarkan pola pikir manusia yang bisa didapatkan dengan cara introspeksi terhadap pola pikir kita sendiri, memperhatikan tingkah laku orang lain, dan dengan melakukan pengamatan langsung terhadap yang dilakukan otak ketika bereaksi terhadap aksi tertentu. − Berpikir secara rasional, yaitu kemampuan berpikir logis berdasarkan aturan-aturan silogisme. − Bertindak secara rasional, yaitu menghasilkan tindakan yang diharapkan berdasarkan lingkungannya dengan menggunakan pengetahuan yang telah disimpan.
2.2.1. Agen ”Agen
adalah
segala
sesuatu
yang
dipandang
dapat
merasakan
lingkungannya melalui sensor dan bertindak berdasarkan (apa yang didapat) dari lingkungannya tersebut melalui aktuator.” (Russell & Norvig, 2010:34). Sensor adalah alat yang dapat menangkap informasi dari lingkungan untuk kemudian diproses lebih lanjut oleh agen, sedangkan aktuator adalah alat yang
12
berfungsi untuk bertindak berdasarkan informasi yang sudah diolah oleh agen (Russell & Norvig, 2010:34).
2.2.2. Inferensi Manusia dikatakan sebagai makhluk yang pintar karena mereka tahu banyak hal dan mereka tahu apa saja yang dapat membantu mereka melakukan hal-hal yang diinginkan. Demikian juga dalam bidang AI, mesin membutuhkan proses reasoning untuk dapat melakukan pengambilan keputusan tentang apa yang harus dilakukan selanjutnya berdasarkan data yang ada pada basis pengetahuan (Russell & Norvig, 2010:234). Proses pengambilan keputusan tentang reaksi yang harus dilakukan inilah yang disebut sebagai inferensi. Sebuah sistem agen harus mampu menangani ketidak-pastian apakah karena pengamatan yang tidak sempurna, tidak ada sesuatu yang dapat menentukan, atau gabungan dari keduanya (Russell & Norvig, 2010:480). Dalam melakukan inferensi, konsep peluang dapat digunakan sebagai rumus utama dengan asumsi bahwa ditengah-tengah ketidak-pastian, reaksi yang ditimbulkan haruslah reaksi yang memiliki kemungkinan terbesar untuk terjadi. Agen yang rasional adalah agen yang mampu melakukan prinsip yang disebut Maximum Expected Utility (MEU) ini (Russell & Norvig, 2010:483).
2.3. Peluang ”Peluang adalah kemungkinan terjadinya suatu kejadian yang merupakan hasil dari serangkaian percobaan dalam bentuk bilangan real yang terentang dari 0 sampai 1.” (Walpole, 2012:53).
13
Secara matematis dapat digambarkan sebagai berikut:
P( A) =
n , N
di mana P(A) adalah peluang terjadinya kejadian A jika diketahui n adalah kejadian yang hasilnya berhubungan dengan A dan N adalah jumlah variasi kejadian yang mungkin yang tiap-tiap kejadiannya memiliki peluang yang sama untuk terjadi.
2.4. Teorema Bayes Teorema Bayes adalah kumpulan rumus-rumus yang digunakan secara khusus dalam bidang statistik untuk melakukan inferensi terhadap sejumlah data hasil eksperimen (Walpole, 2012:72). Walpole (2012:63) memberi contoh jika diketahui A adalah kejadian yang mendahului kejadian B, maka peluang terjadinya kejadian B bila diketahui kejadian A telah terjadi adalah:
P ( B | A) =
P( A ∩ B) , di mana P(A) > 0. P( A)
Jika A dan B adalah dua kejadian yang saling mempengaruhi tanpa tergantung waktu, maka dari persamaan di atas ditambah: P( A | B) =
P ( B ∩ A) , di mana P(B) > 0, P( B)
dapat menghasilkan persamaan:
P( B | A) =
P( A | B) P( B) P( A)
Dalam kasus yang lebih umum, teorema Bayes dapat juga diterapkan pada variabel dengan banyak nilai dengan notasi sebagai berikut:
14
P( X | Y , e) P(Y | e) , P ( X | e)
P(Y | X , e) =
di mana e adalah bukti latar-belakang atas kejadian sebelumnya (Russell & Norvig, 2010:496).
2.5. Jejaring Bayesian Russel & Norvig (2010:511) menyampaikan bahwa jejaring Bayesian adalah graph asiklik terarah dengan parameter-parameter numerik pada tiap-tiap node dengan syaratsyarat sebagai berikut: −
- Tiap-tiap node berisi variable acak.
−
- Dua node dihubungkan dengan sebuah panah yang searah sedemikian sehingga jika ada panah yang berasal dari node X ke node Y, maka node X akan disebut sebagai node parent. Pada jaringan Bayesian, tidak boleh ada hubungan antar node yang sirkular.
−
- Tiap-tiap node harus memiliki distribusi peluang P(Xi|Parents(Xi)) untuk menghitung dampak yang ditimbulkan oleh parent terhadap node.
Jejaring
ini
dinamakan
jejaring
Bayesian
karena
jejaring
ini
mampu
mengaplikasikan secara tepat teori-teori Bayes pada jaringan yang kompleks dengan mengatur secara tepat perhitungan yang cocok terhadap jaringan tersebut (West, Rutstein, Mislevy, Liu, Choi, Levy, Crawford, di Cerbo, Chappel, & Behrens, 2009:12-13). Berkat interpretasinya yang sederhana, konsisten, dan kokoh, Jaringan Bayesian telah menjadi kerangka kerja yang banyak diaplikasikan pada bidang-bidang di mana sistem yang dimiliki dituntut dapat memberikan penalaran yang masuk akal dalam lingkungan yang penuh ketidak-pastian pada bidang ilmu komputer, ilmu kognitif, statistika, hingga filsafat (Kosarzycki, 2011:8).
15
2.6. Inferensi Pada Jejaring Bayesian Inferensi Peluang adalah metode penghitungan peluang-peluang bersyarat jika kejadian yang mendahuluinya telah diketahui. Metode paling umum yang dapat digunakan untuk melakukan inferensi peluang pada Jejaring Bayesian adalah dengan melakukan full-Joint probability distribution. (Russell & Norvig, 2010:490). Namun cara ini dianggap serakah karena cara ini secara naif akan melakukan perhitungan-perhitungan yang sama secara berulang-ulang. (Amir, Richards, 2008:2-3). Cara lainnya adalah dengan menghilangkan perhitungan-perhitungan yang dilakukan lebih dari sekali dengan tujuan mengurangi kompleksitas algoritma dan mendapatkan hasil yang lebih cepat pada perhitungan-perhitungan berikutnya, yaitu dengan menggunakan konsep Variable Elimination. (Amir, Richards, 2008:2-3).
2.6.1. Full-joint Probability Distribution Full-joint Probability Distribution adalah metode untuk menentukan penghitungan peluang terjadinya suatu kejadian dengan menghitung keseluruhan node penyebab di mana distribusi peluang tiap-tiap kejadian dihitung dengan notasi sebagai berikut: n
P( x1 ,..., x n ) = ∏ P( xi | xi −1 ,..., x1) i =1
Metode ini membutuhkan sebuah tabel yang berisi kumpulan variable yang mewakili full-joint probability distribution (Russell & Norvig, 2010:488). Tabel ini disebut Conditional Probability Table (CPT) yang akan dibahas pada sub-bab berikut.
16
2.6.2. Conditional Probability Table (CPT) CPT merupakan tabel dua dimensi yang merupakan representasi dari full-joint probability distribution (Kosarzycki, 2011:25-26). Setiap node pada jejaring Bayesian harus memiliki CPT yang menggambarkan informasi tentang quantitative probability, yakni sebuah tabel yang menggambarkan peluang terjadinya kemungkinan berdasarkan kombinasi perbedaan state dari semua parent yang dimiliki node tersebut (Garcia, Amandi, Schiaffino, Campo, 2007:798). Sebagai contoh jika terdapat node A yang memiliki parent node X dan Y, maka CPT dapat dibangun sebagaimana ditunjukkan gambar berikut:
X
Tabel 2.1 – CPT Y A P(X,Y,A)
False
False
False
0.25
False
False
True
0.75
False
True
False
0.10
False
True
True
0.9
True
False
False
0.30
True
False
True
0.70
True
True
False
0.50
True
True
True
0.50
P(X,Y,A) merupakan kemungkinan terjadinya kejadian A jika diketahui terjadinya kejadian X dan Y yang berhubungan dengan A. Pada kondisi X dan Y yang sama, jumlah P(X,Y,A=true) dan P(X,Y,A=false) harus sama dengan 1 (satu).
17
2.6.3. Variable Elimination Variable Elimination adalah metode yang dapat mempersingkat proses inferensi pada Jaringan Bayesian dengan mengurangi kompleksitas dari O(n2n) menjadi O(2n) (Amir, Richards, 2008:1-2). Russell & Norvig (2010:523-524) menyatakan perlunya variable elimination karena algoritma yang melakukan enumerasi untuk menyelidiki probabilitas suatu peluang dapat ditingkatkan secara substansial dengan menghilangkan perhitungan berulang. Sementara ide dasar dari variable elimination ini sebenarnya cukup sederhana, yakni: hitung sekali dan gunakan untuk keperluan selanjutnya (Russell & Norvig, 2010:524). Pada jejaring Bayesian, konsep ini pertama akan melakukan sum-over terhadap CPT yang dimiliki node-node yang tidak diketahui terjadi atau tidaknya. Amir & Richards (2008:2-4) mendefinisikan sum-over sebagai teknik yang terdiri atas dua operasi, yakni multiplication dan sum-out. Multiplication adalah proses penyatuan dua buah CPT yang setidaknya berisi satu node yang sama menjadi satu CPT secara iteratif hingga semua CPT yang memiliki node yang ingin di-sum-over tergabung menjadi satu CPT saja.
Gambar 2.1 – Multiplication
Setelah proses multiplication selesai, maka pada CPT tersebut harus dilakukan eliminasi terhadap variabel node yang sedang di-sum-over. Proses inilah yang disebut dengan metode sum-out sebagaimanakan disajikan dalam Gambar 2.2 berikut:
18
Gambar 2.2 – Sum-out
Hasil dari proses sum-over akan menyisakan CPT yang hanya memiliki node kejadian yang peluangnya ingin diketahui. CPT ini kemudian dinormalisasi agar jumlah peluang true dan falsenya menjadi 1 dengan menggunakan metode prosentase (Amir & Richards, 2008:1). Misalnya jika peluang truenya = 0.30 dan peluang falsenya = 0.45, maka peluang truenya akan menjadi 0.4 dan peluang falsenya menjadi 0.6.
2.6.4. Mekanisme Inferensi Pengujian yang dilakukan Amir dan Richards (2008:2-5) termasuk studi kasus sederhana yang dapat terjadi pada kehidupan sehari-hari. Pada uji kasus ini, kita ingin mengetahui peluang terjadinya gempa bumi (Earthquake) jika diketahui Mary dan John melakukan panggilan (Mary Calls dan John Calls) dengan diketahui kejadian-kejadian yang berhubungan adalah sebagai berikut: − -
Alarm dapat berbunyi jika ada perampokan
− -
Alarm dapat berbunyi jika ada gempa bumi.
− -
John dapat melakukan panggilan jika alarm berbunyi.
− -
Mary dapat melakukan panggilan jika alarm berbunyi.
Berikut gambar skema kasus yang diujikan:
19
Gambar 2.3 – Skema kasus yang diujikan
Pertama-tama, kita akan menjabarkan rumusan yang digunakan untuk mendapatkan jawaban agar dapat dipisahkan ke dalam faktor-faktor CPT yang baru.
P( E , j , m) = ∑∑ P( E , j , m, b, a) b a
P( E , j , m) = ∑∑ P(b) P( E ) P(a | b, E ) P( j | a) P(m | a) b a
P( E , j , m) = P( E )∑ P(b)∑ P(a | b, E ) P( j | a) P(m | a) b
a
Kemudian kita petakan tiap-tiap notasi fungsi ke dalam nama-nama faktor sebagai berikut: Tabel 2.2 – Pemetaan Notasi ke Nama Faktor Notasi Nama-nama
Fungsi
Faktor
P(E)
fE(E)
P(b)
fB(B)
P(a|b, E)
fA(A, B, E)
P(j|a)
fA(J)
P(m|a)
fA(M)
Sehingga persamaan di atas dapat ditulis ulang menjadi: P( E , j , m) = P( E )∑ P(b)∑ P(a | b, E ) P( j | a) P(m | a) b
a
P( E , j, m) = f E ( E )∑ f B ( B)∑ f A ( A, B, E ) f A ( J ) f A ( M ) b
a
Faktor-faktor CPT yang digunakan dalam pengujian ini adalah sebagai
20
berikut:
Gambar 2.4 – CPT yang digunakan
Setelah CPT-CPT ini didapatkan, langkah berikutnya kita harus mengeliminasi kejadian-kejadian yang tidak berhubungan dengan pertanyaan, yakni kejadian A dan B. Pertama, kita akan mengeliminasi kejadian A dengan melakukan multiplikasi terhadap faktor-faktor yang di dalamnya terdapat kejadian A hingga hanya tersisa satu faktor. Tidak ada perbedaan hasil, apakah A atau B yang terlebih dahulu dieliminasi, namun pada kasus ini, Amir dan Richards mengeliminasi A terlebih dahulu sebelum mengeliminasi B. Dapat diperhatikan ada 3 (tiga) faktor yang memiliki kejadian A di dalamnya, yaitu fA(A,B,E), fJ(A), dan fM(A). Pada tahap ini juga tidak ada urutan yang wajib diikuti, kita bisa memilih menggabungkan fA(A,B,E) dengan fJ(A) terlebih dahulu ataupun fJ(A) dengan fM(A), namun pada pengujiannya, Amir dan Richards melakukan yang terakhir. Hasil penggabungan fJ(A) dengan fM(A) adalah sebuah faktor baru yang diberi nama fJM(A) sebagaimana ditunjukkan gambar di bawah ini:
21
Gambar 2.5 – fJM(A) sebagai hasil penggabungan fJ(A) dengan fM(A)
Setelah fJM(A) terbentuk, langkah selanjutnya adalah menggabungkan fJM(A) dengan fA(A,B,E) menjadi fAJM(A,B,E). Gambar di bawah menunjukan proses pembentukannya.
Gambar 2.6 – fAJM(A,B,E) sebagai hasil penggabungan fJM(A) dengan fA(A,B,E)
Pada tahap ini kita dapat menulis persamaan matematikanya sebagai berikut:
P( E , j, m) = f E ( E )∑ f B ( B)∑ f AJM ( A, B, E ) b
a
Karena hanya tinggal satu faktor yang di dalamnya terdapat kejadian A tersisa, maka langkah selanjutnya adalah kita harus membuang A dari persamaan dengan proses sum-out.
Gambar 2.7 – Hasil summing-out fA(A,B,E)
Perhatikan huruf A diberi over bar sebagai tanda bahwa kejadian ini telah tereliminasi.
22
Pada tahap ini, rumusan matematikanya dapat digambarkan sebagai berikut: P( E , j , m) = f E ( E )∑ f B ( B) f AJM ( B, E ) b
Setelah kejadian A tereliminasi seluruhnya, maka selanjutnya kita akan mengeliminasi kejadian B. Dengan mengikuti tahapan-tahapan seperti yang sudah dijabarkan ketika mengeliminasi kejadian A, maka didapatkan hasil penggabungan fB(B) dengan fAJM(B,E) sebagai berikut:
Gambar 2.8 – fBAJM(B,E) sebagai hasil penggabungan fB(B) dengan fAJM(B,E)
Setelah menggabungkan kedua faktor di atas, maka persamaannya menjadi: P( E , j , m) = f E ( E )∑ f B AJM ( B, E ) b
Karena fBAJM(B,E) adalah satu-satunya faktor yang terdapat kejadian B di dalamnya, maka langkah berikut adalah kita harus melakukan sum-out terhadap faktor ini.
Gambar 2.9 – Hasil summing-out fBAJM(B,E)
Pada tahap ini, rumus matematikanya menjadi: P ( E , j , m) = f E ( E ) f BAJM ( E )
Karena semua kejadian yang tidak berhubungan dengan pertanyaan sudah tereliminasi, maka langkah selanjutnya adalah menggabungkan kejadian yang
23
ditanyakan hingga tersisa satu faktor. Pada langkah ini, kita tidak akan melakukan summing-out, karena jika dilakukan kita tidak dapat melakukan query terhadap faktor ini.
Gambar 2.10 – Hasil akhir proses variable elimination
Setelah sampai pada tahap ini, maka langkah terakhir yang harus dilakukan adalah normalisasi. Normalisasi memastikan jumlah faktor tersebut ketika diketahui E=true dan E=false adalah 1. Caranya adalah dengan menghitung prosentase masing-masing terhadap penjumlahan E=true dan E=false.
P( E = true | j , m) = 0.003699 /(0.003699 + 0.01717) = 0.1172 P( E = false | j, m) = 0.01717 /(0.003699 + 0.01717) = 0.8228 Dengan demikian jawaban dari seberapa besar peluang terjadinya gempa bumi jika John dan Mary melakukan panggilan adalah sebesar 11.72%.
2.7. Student Modelling menggunakan Jejaring Bayesian Telah banyak penelitian sebelumnya yang menggunakan jejaring Bayesian sebagai arsitektur pengenalan dengan berbagai macam alasan. Salah satu yang pertama menggunakan jejaring Bayesian untuk melakukan pemodelan adalah Conati , Gertner, van Lehn, dan Druzdzel (1997:1) dalam proyek mereka yang bertajuk ANDES. ANDES adalah proyek hasil kolaborasi antara University of Pittsburgh dan Akademi Kelautan yang melibatkan 10 periset dan programmer. Mulai tahun 1998, ANDES dirancang untuk digunakan oleh lebih kurang 200 siswa per semester pada mata
24
kuliah Pengenalan Fisika di Akademi Kelautan Amerika. ANDES diprogram menggunakan Common Lisp dan C++ (Conati dkk, 1997:3). Mereka menggunakan dua jenis jejaring Bayesian, yaitu statis dan dinamis. Jejaring statis digunakan pada permasalahan yang sudah didefinisikan pada domain pengetahuan ANDES, sedangkan jejaring dinamis dibangun ketika siswa memilih permasalahan baru dan akan dibuang ketika siswa sudah berhasil memecahkan permasalahan tersebut (Conati dkk, 1997:3). Jejaring Bayesian terpilih sebagai model mesin inferensi pada ANDES karena kemampuannya untuk secara dinamis diubah sesuai keperluan berdasarkan masukan dari 3 (tiga) profesor yang menjadi domain expert dari Akademi Kelautan Amerika. Selain itu karena kemampuan jejaring Bayesian untuk menyediakan gambaran kemungkinan yang menghubungkan tiap-tiap topik terhadap strategi dan tujuan belajar yang dapat disesuaikan sesuai dengan kemampuan siswa (Conati dkk, 1997:5-7). Contoh lainnya adalah pada penelitian Garcia, Amandi, Schiaffino, dam Campo (2007:797-798). Mereka mencoba memodelkan cara belajar siswa berdasarkan tabel Felder yang membagi karakteristik siswa berdasarkan persepsi, input yang diharapkan, organisasi, cara memproses informasi, dan tingkat pemahaman. Jejaring Bayesian terpilih sebagai arsitektur mesin inferensi mereka karena jejaring ini dianggap mampu untuk menggambarkan dengan jelas hubungan antara cara belajar dan faktor-faktor yang mempengaruhi mereka (Garcia dkk, 2007:798). Garcia dkk. mengambil informasi dari log keaktifan siswa di forum sebagai bagian dari knowledge base bagi jerjaring mereka. Contoh lain lagi adalah West dkk (2009:12) yang memilih menggunakan Jejaring Bayesian dalam upaya mereka menggolongkan proses yang dicapai siswa dalam proses pembelajaran pada semester keempat Cisco Certified Network Associate (CCNA) karena
25
selain Jejaring Bayesian telah lama digunakan sebagai metode yang tepat untuk melakukan assessment terhadap variabel tertentu, Jejaring Bayesian juga mampu menggambarkan hubungan antara teori probabilitas dalam model grafis yang mewakili hubungan probabilitas di antara beragam variabel. Dalam pembangunan jejaringnya, West dkk. menggunakan Evidence Centre Design (ECD) sebagai framework untuk membantu mereka menentukan konfigurasi jejaring yang tepat berdasarkan scoring yang dihasilkan oleh ECD (West dkk, 2009:5). Setelah melalui serangkaian proses inferensi, keluaran dari jejaring Bayesian akan dimanfaatkan untuk penanganan lebih lanjut terhadap proses pembelajaran siswa (West dkk, 2009:5). Pada penelitiannya tentang assessment terhadap siswa pada sebuah sistem elearning, Mangalwede dan Rao (2010:24-25) juga menggunakan jejaring Bayesian untuk merepresentasikan matriks stokastik yang dapat menentukan tingkat setelah seorang siswa melewati pelajran tertentu. Jejaring Bayesian digunakan karena jaringan ini dianggap mampu meng-update suatu nilai kejadian akibat jika ada nilai penyebab lain yang mempengaruhi kejadian akibat ini. Konsep ini dimanfaatkan untuk mewakili proses perubahan nilai pemahaman siswa ketika topik baru ditambahkan dalam sebuah proses belajar-mengajar. Kemudian pada penelitian yang terbaru tentang perancangan sebuah framework untuk sistem pembelajaran adaptif, Mislevy, Almond, Yan, dan Steinberg (2013:438) memilih menggunakan jejaring Bayesian untuk mendapatkan karakteristik siswa dari sisi pengetahuan dan kemampuannya berdasarkan pengetahuan yang tidak pasti. Mereka juga memanfaatkan mekanisme Monte Carlo Markov Chain (MCMC) untuk memperkirakan conditional probabilities yang diperlukan berdasarkan data awal yang disediakan berdasarkan penilaian dari para ahli (Mislevy dkk, 2013:437).
26
Gambar berikut ini merupakan pemetaan jejaring Bayesian yang dilakukan Mislevy dkk (2013:442-443) di dalam penelitiannya:
Gambar 2.11 – Skill yang dibutuhkan untuk menjawab soal.
Skill ke-1 adalah kemampuan dasar melakukan pengurangan terhadap pecahan, skill ke-2 adalah kemampuan menyederhanakan bilangan pecahan atau bilangan campuran, skill ke-3 adalah kemampuan memisahkan bilangan dari pecahan, skill ke-4 adalah kemampuan meminjam satu dari keseluruhan angka di dalam bilangan campuran, dan skill ke-5 adalah kemampuan mengubah keseluruhan angka menjadi pecahan (Mislevy, 2013:442-443). Sedangkan EM merupakan singkatan dari Evidence Model yang merupakan gambaran model kemampuan siswa berdasarkan jawaban yang diberikan selama proses assessment (Mislevy, 2013:438).
27
2.8. Pengujian Jejaring Bayesian Morvant, Koço, dan Ralaivola menyarankan penggunaan Confusion Matrix sebagai alat pengukur sistem yang mengandalkan probabilitas karena sistem ini cocok untuk menggambarkan pemisahan multi-kelas yang dapat mengukur kesalahan dengan cara yang lebih lengkap ketimbang hanya memisahkan antara yang benar dan salah saja. (2012:1-3). Ralaivola
bersama
dengan
Machart
juga
menulis
jurnal
lainnya
yang
menggambarkan stabilitas confusion matrix ketika digunakan untuk mengukur tingkat akurasi suatu hasil inferensi (2012:8). Pada bidang bio-informatika, Raval, Ghahramani, dan Wild (2002:792-795) juga menggunakan confusion matrix untuk menggambarkan kemampuan jejaring probabilistik Bayesian dalam menggolongkan jenis-jenis protein. Confusion Matrix berisi informasi yang membandingkan hasil yang diperoleh sebuah sistem klasifikasi dengan keadaan yang sesungguhnya. Dimensi confusion matrix adalah L x L, di mana L adalah jumlah nilai yang ingin dibandingkan (Kohavi & Provost, 1998:271). Tabel 2.3. merupakan contoh confusion matrix pada sistem penggolongan pada 4 (empat) kelas, sebagaimana yang dipakai juga pada penelitian ini: Tabel 2.3 – Confusion Matrix Empat Dimensi Nilai hasil inferensi Nilai sebenarnya 1 2 3 4
1
X
2
X
3
X
4
X
Tiap-tiap sel kosong diisi dengan nilai hasil inferensi dengan terlebih dahulu membandingkan nilai tersebut dengan nilai yang sebenarnya. Sel-sel kosong yang
28
ditandai dengan ‘X’ merupakan sel-sel yang mesti diamati, karena sel-sel yang diberi tanda ‘X’ ini akan menggambarkan tingkat ketepatan inferensi dalam memvonis kebenaran suatu nilai. Ada beberapa hasil ukur penting yang digunakan pada confusion matrix, yaitu: − True Positive (TP), yang artinya vonis positif yang tepat. − True Negative (TN), yang artinya vonis negatif yang tepat. − False Positive (FP), yang artinya vonis positif yang keliru. − False Negative (FN), yang artinya vonis negatif yang keliru. Dari keempat nilai di atas kita dapat mengukur tingkat akurasi ketika melakukan prediksi terhadap suatu kelas (AC) dengan rumus:
AC =
TN + TP TN + TP + FN + FP
Akurasi merupakan akumulasi tingkat ketepatan vonis positif dan negatif pada keseluruhan vonis terhadap sample. Selain akurasi, kita juga dapat menghitung nilai True Positive dan True Negative dari ke-empat nilai di atas dengan rumus:
TPR =
TP dan TP + FN
FPR =
FP . FP + TN
True Positive Rate yang disebut juga sensitivity (Kohavi & Provost, 1998:271) menggambarkan tingkat kemampuan mesin inferensi untuk menggolongkan suatu nilai ke dalam kelas yang tepat. Semakin mendekati 100%, maka semakin baik tingkat inferensi suatu mesin. Sedangkan False Positive Rate menggambarkan tingkat kemampuan mesin untuk memisahkan suatu nilai yang tidak termasuk ke dalam suatu kelas tertentu. Semakin mendekati 0 (nol), maka semakin baiklah tingkat inferensi suatu mesin (Raval,
29
Ghahramani, dan Wild, 2002:792).