BAB 2
TINJAUAN PUSTAKA
2.1 Landasan Teori 2.1.1
Artificial Intelligence Menurut Winston (2002:2), AI adalah pembelajaran komputasi yang memungkinkan komputer dapat memahami, menjawab, dan beraksi. Dan menurut Russell dan Norvig (2010:1-5), dalam perkembangannya, Artificial Intelligence memiliki 4 kelompok definisi sebagai berikut :
2.1.1.1 Acting Humanly Pada tahun 1950, Alan Turing merancang “The Turing Test” untuk menyediakan definisi kecerdasan yang berjalan lancar. Komputer berhasil melalui uji coba apabila manusia penguji tidak mengetahui tulisan respon dibuat oleh manusia atau komputer. Kini, komputer yang digunakan untuk melalui uji coba diharuskan memiliki kemampuan sebagai berikut : a.) Natural Language Processing Kemampuan untuk dapat berkomunikasi dengan Bahasa Inggris. b.) Knowledge Representation Kemampuan untuk menyimpan hal yang diketahui atau didengar. c.) Automated Reasoning Kemampuan
untuk
menyimpan
informasi
untuk
menjawab
pertanyaan dan mengambil kesimpulan. d.) Machine Learning Kemampuan untuk beradaptasi dengan kondisi baru dan untuk mendeteksi dan mengekstrapolasi pola. e.) Computer Vision Kemampuan untuk mengenali objek. f.) Robotics Kemampuan untuk memanipulasi objek dan bergerak.
7
8 2.1.1.2 Thinking Humanly Untuk dapat membangun program yang berpikir seperti manusia, dibutuhkan metode untuk menentukan bagaimana manusia berpikir. Terdapat 3 metode untuk menentukan bagaimana manusia berpikir : a.) Introspeksi Mencoba mensimulasikan pikiran manusia dalam melakukan sesuatu. b.) Eksperimen Psikologi Mengamati perilaku manusia. c.) Pencitraan otak Mengamati kegiatan dalam otak. Ketika berhasil memahami bagaimana manusia berpikir, maka program komputer dapat dibuat berpikir seperti manusia. 2.1.1.3 Thinking Rationally Seorang filsafat Yunani, Aristoteles adalah manusia pertama yang mencoba untuk merancang cara berpikir yang benar. Silogisme yang dibuat oleh Aristoteles memunculkan studi yang dinamakan logika. Pada tahun 1965, program komputer berhasil diciptakan untuk menyelesaikan masalah yang dideskripsikan dengan notasi logika, apabila tidak menghasilkan solusi, maka program tersebut akan mengulangi proses komputasi selamanya. 2.1.1.4 Acting Rationally Program komputer dibuat untuk melakukan sesuatu, dan agen komputer diharapkan untuk melakukan lebih dari yang dilakukan program komputer, seperti beroperasi secara mandiri, melihat lingkungan, bertahan dalam jangka waktu yang panjang, beradaptasi, membuat dan mengejar tujuan. Agen yang rational bertindak untuk meraih hasil terbaik di dalam kondisi yang tidak tentu sekalipun.
9 2.1.2 Natural Language Processing Menurut Pustejovsky dan Stubbs (2013:4), Natural Language Processing (NLP) merupakan salah satu bidang ilmu komputer yang berkembang dengan mengkombinasikan studi bahasa dan komputasi linguistik dengan studi Artificial Intelligence.Pengembangan NLP bertujuan untuk merancang dan membangun aplikasi yang dapat memfasilitasi interaksi manusia dengan mesin melalui natural language. Penerapan NLP meliputi : 2.1.2.1 Question Answering System (QAS) Question Answering System adalah contoh penerapan NLP yang digunakan untuk menjawab pertanyaan yang diajukan manusia dengan bahasa sehari-hari (natural language). Contoh penerapan QAS adalah aplikasi SIRI yang dapat digunakan pada produk Apple Inc., iPhone. 2.1.2.2 Summarization Summarization adalah contoh penerapan NLP yang berkemampuan untuk mengolah sekumpulan dokumen atau email, dan menciptakan rangkuman yang koheren dengan kontennya. 2.1.2.3 Machine Translation Machine Translation merupakan cabang ilmu NLP yang pertama kali diteliti. Contoh program Machine Translation yaitu Google Translate, yang digunakan untuk menerjemahkan berbagai bahasa ke bahasa lainnya. 2.1.2.4 Speech Recognition Speech Recognition merupakan penerapan NLP yang paling rumit. Hingga kini, Speech Recognition terus dikembangkan dan dapat digunakan pada ponsel atau komputer untuk mengenali bahasa yang diucapkan baik berupa pertanyaan, dan perintah. 2.1.2.5 Document Classification Document Classification merupakan cabang ilmu NLP yang paling sukses. Document Classification bertujuan kategori suatu dokumen.
untuk mengidentifikasi
Contoh penerapannya seperti penyaringan
spam, klasifikasi artikel, ulasan film, dan lain sebagainya.
10 2.1.3 Automated Essay Scoring Automated Essay Scoring (AES) merupakan salah satu cabang dari bidang document classification. AES merupakan teknologi yang sedang berkembang, yang digunakan untuk menilai esai secara otomatis. Akurasi dan keandalan sistem AES juga telah terbukti tinggi. Sampai saat ini, peningkatan mutu mesin penilai esai masih berlanjut dan berbagai studi dilangsungkan untuk meningkatkan tingkat efektifitas sistem AES karena AES berguna untuk mengatasi masalah waktu, biaya, dan generalisasi isu pada esai (Dikli, 2006:1). Hingga saat ini, terdapat empat tipe AES, yang secara luas digunakan oleh perusahaan pengujian, universitas, dan sekolah-sekolah umum, diantaranya adalah Project Essay Grader (PEG) yang merupakan sistem pertama yang diciptakan untuk menilai esai, Intelligent Essay Assessor (IEA) yang merupakan sistem penilai esai yang menggunakan metode Latent Semantic Analysis, E-rater yang digunakan Educational Testing Service untuk menilai esai pada Graduate Management Admissions Test, dan IntelliMetric, AES yang dikembangkan oleh Vantage Learning dan digunakan oleh College Board.
2.1.4 Latent Semantic Analysis Latent Semantic Analysis (LSA) merupakan metode yang menggunakan model statistik matematis yang digunakan untuk menganalisa struktur semantik suatu teks. LSA digunakan untuk menilai esai dengan mengkonversi esai menjadi matriks-matriks yang diberi nilai pada masingmasing term untuk dicari kesamaan dengan term referensi (Wild, Stahl, Stermsek, dan Neumann, 2005). Langkah-langkah LSA dalam menilai esai adalah sebagai berikut : 2.1.4.1
Text Preprocessing
2.1.4.1.1 Stopwords Removal Pada stopwords removal, kata yang tergolong kata depan, kata penghubung, dan sejenisnya dihilangkan dari kalimat. Contoh modifikasi hasil proses stopwords removal :
11 a
Membuang kata “am, is, are, and, in, etc.” dan singkatan.
b
Mengubah kata yang diawali dengan huruf besar menjadi huruf kecil.
Contoh : “Latent Semantic Analysis (henceforth LSA) is a linguistic theory and method. It has been used in natural language processing to determine semantic relationships in large bodies of corpora.” Menjadi : “latent semantic analysis linguistic theory method used natural language processing determine semantic relationships large bodies corpora” 2.1.4.1.2 Stemming Langkah berikutnya adalah stemming, pada proses ini kata akan direduksi menjadi kata dasar. Berikut contoh hasil stemming dari teks yang telah melalui stopword removal : Contoh : “latent semantic analysis linguistic theory method used natural language processing determine semantic relationships large bodies corpora” Menjadi : “latent semantic analysis linguistic theory method use nature language process determine relationship large body corpo” 2.1.4.1.3 Term Document Matrix Setelah dirubah menjadi kata dasar, kemudian sistem matriks dibuat dengan menempatkan kata hasil proses stemming (term) ke dalam baris. Matriks ini disebut term-document matrix. Setiap baris mewakili sebuah kata yang unik, dan setiap kolom mewakili konteks dari mana kata-kata tersebut diambil. Konteks yang
12 dimaksud bisa berupa kalimat, paragraf, atau seluruh bagian. Berikut contoh term-document matrix: Tabel 2.1 Contoh Term-document Matrix
:
Document 1
Document 2
Document 3
Document n
Term 1
1
2
0
N
Term 2
1
0
3
N
Term 3
1
1
0
N
Term 4
1
0
0
N
Term 5
0
0
4
N
Term 6
1
1
0
N
Term 7
1
0
0
N
Term 8
0
2
1
N
Term 9
1
1
0
N
Term n
n
n
n
N
Pada Tabel 2.1. baris pertama mewakili stemmed term (term 1, term 2, dst), dan bagian kolom mewakili konteks, yaitu teks. Nilainilai yang ada pada Tabel 2.1 menunjukkan berapa kali suatu term muncul dalam sebuah dokumen. contohnya, term 1 muncul 1 kali pada dokumen 1, dan muncul 2 kali pada dokumen 2, tapi tidak muncul pada dokumen 3, dan seterusnya.
2.1.4.2 Singular Value Decomposition Singular Value Decomposition (SVD) merupakan teorema aljabar linear yang mengatakan bahwa persegi panjang matriks A dapat dipecah menjadi tiga matriks, yaitu : a.) Matriks orthogonal U b.) Diagonal matriks S c.) Transpose dari matriks V orthogonal. Yang dirumuskan dengan :
13
Amn
=
matriks awal
Umm
=
matriks orthogonal U
Smn
=
diagonal matriks S
VTnn
=
transpose matriks V orthogonal
Hasil dari proses SVD adalah vektor yang akan digunakan untuk menghitung similaritasnya dengan cosine similarity.
2.1.5
Cosine Similarity
Menurut Aji, Baizal, dan Firdaus (2011:2), Cosine Similarity digunakan untuk menghitung nilai kosinus sudut antar vektor dokumen dengan vektor query, semakin kecil sudut yang dihasilkan, maka tingkat kemiripan esai semakin tinggi. Vektor merupakan besaran yang memiliki nilai dan arah. Cosine Similarity dirumuskan sebagai berikut:
Keterangan : A
= vektor dokumen
B
= vektor query •B
= perkalian dot vektor A dan vektor B
|A|
= panjang vektor A
| |
= panjang vektor B
| ||B|
= cross product antara |A| dan |B|
α
= sudut yang terbentuk antar vektor A dan B
Dari hasil cosine similarity¸ akan didapatkan nilai yang akan dibandingkan dengan penilaian manusia untuk diuji selisih nilainya.
14 2.1.6 Algoritma Menurut Cormen, Leiserson, Rivest, dan Stein (2009:6), algoritma adalah prosedur komputasi yang terdefinisi dengan baik yang menggunakan suatu data atau sekumpulan data sebagai input, dan menghasilkan data atau sekumpulan data sebagai output. Secara sederhana, algoritma adalah urutan langkah komputasi yang mentransformasikan input menjadi output. Algoritma digunakan sebagai alat untuk menyelesaikan masalah komputasi. Masalah komputasi didefinisikan input dan output yang diinginkan. Tugas algoritma adalah mendeskripsikan prosedur komputasi yang spesifik untuk mencapai input dan output yang ingin dicapai pada suatu permasalahan komputasi.
2.1.7 Structured Programming Menurut McCalla (1985:15), pada tahun 1985, ilmuwan komputer telah mengembangkan teknik yang dinamakan structured programming, yang dapat menghasilkan program komputer yang lebih mudah dibaca, di-debug, dan ditulis. Structured programming juga mudah untuk didokumentasikan karena
tiap
modul fungsional
dapat
dideskripsikan
dengan
baik.
Berdasarkan prinsip structured programming, prosedur dapat diprogram dengan menggunakan satu atau lebih dari 3 tipe struktur logika. Struktur logika hanya memiliki 1 entry point dan 1 exit point, karakteristik tersebut yang menyebabkan structured programming menghasilkan program komputer yang lebih mudah ditulis dan dibaca. Struktur logika tersebut dibagi menjadi 3 struktur, yaitu: a.) Struktur Sequence Struktur Sequence menunjukkan instruksi komputer dalam urutan topdown atau berurutan. Struktur Sequence digambarkan sebagai berikut :
15
Gambar 2.1 Struktur Sequence b.) Struktur Selection Struktur Selection memerika kondisi, jika kondisinya benar, maka instruksi yang dijalankan adalah cabang keputusan yang kondisinya benar, namun jika kondisinya salah, maka yang dijalankan adalah cabang keputusan lainnya, yang kondisinya tidak benar. Struktur Selection digambarkan sebagai berikut :
16
Gambar 2.2 Struktur Selection
c.) Struktur Iteration Struktur Iteration atau Repetition memeriksa suatu kondisi, jika kondisinya salah atau belum terpenuhi, maka instruksi akan terus dijalankan hingga kondisinya benar atau sudah terpenuhi. Namun jika kondisinya benar atau sudah terpenuhi, maka program akan keluar dari struktur. Struktur Iteration digambarkan sebagai berikut :
17
Gambar 2.3 Struktur Iteration 2.1.7 Bahasa Inggris Bahasa Inggris adalah bahasa yang paling banyak digunakan di dunia (sebagai bahasa pertama atau kedua dunia) yang digunakan sebagai bahasa nasional oleh beberapa negara, seperti United States, sebagian besar Kanada, British Isles, Australia, dan New Zealand. Dalam beberapa tahun, Bahasa Inggris merupakan bahasa resmi negara kolonial seperti Britain, mencakup India, Nigeria, Ghana, Kenya, dan negara anglophone di Afrika. Bahasa Inggris memiliki dialek yang berbeda-beda di tiap negara (Fromkin, Rodman, dan Hyams, 2014:284).
2.1.8 N-gram Menurut Russell dan Norvig (2010), n-gram didefinisikan sebagai urutan panjang simbol yang tertulis dengan sebutan unigram untuk 1-gram, bigram untuk 2-gram, trigram untuk 3-gram, dan seterusnya. Pemodelan n-gram adalah pemodelan yang memetakan distribusi probabilitas dari urutan huruf-n. Pemodelan N-gram didefinisikan sebagai urutan rantai Markov. Contoh n-gram : a.) Unigram : “best”, “great”, “friend”
18 b.) Bigram : “best friend”, “great friend”
2.1.9 Python Python adalah bahasa pemrograman berorientasi objek yang sering kali diinterpretasikan sebagai scripting language. Pada mulanya, Python didesain oleh Guido van Rossum di Stichting Mathematisch Centrum di Netherlands pada awal tahun 1990. Selanjutnya Python dikembangkan oleh Python Software Foundation. Python biasa digunakan untuk aplikasi sistem administrasi, dan tugas komputer lainnya yang berskala relatif kecil. Python bersifat open-source dan tersedia di platform umum komputer (Sebesta, 2010: 119). Pada penelitian ini juga digunakan library NLTK untuk mendukung proses pada suatu NLP. Berikut contoh code untuk mencetak deret fibonacci pada Python : >>> def fib(n): >>>
a, b = 0, 1
>>>
while a < n:
>>>
print(a, end=' ')
>>>
a, b = b, a+b
>>>
print()
>>> fib(1000)
2.1.10 PHP PHP Hypertext Processor (PHP) adalah scripting language di sisi server yang didesain khusus untuk web. PHP dapat ditanamkan dengan halaman HyperText Markup Language (HTML) yang akan dieksekusi pada saat halaman tersebut dikunjungi. PHP merupakan software yang bersifat opensource, yang berarti kita dapat menggunakan, mengganti, dan berbagi tentang source code PHP tanpa biaya (Welling dan Thomson, 2001:3). Berikut adalah contoh code PHP untuk mengkoneksikan PHP dengan MySQL :
19 die('Could not connect: ' . mysql_error()); } echo 'Connected successfully'; mysql_close($link); ?>
2.1.11 MySQL MySQL adalah sistem database relasional. MySQL lebih cepat, lebih dapat diandalkan, dan lebih murah dibandingkan sistem database lain (termasuk sistem komersil seperti Oracle dan DB2). MySQL menggunakan bahasa database, yakni Structured Query Language (SQL). SQL adalah bahasa terstandarisasi untuk melakukan query dan memperbaharui data dan untuk administrasi database (Kofler, 2005:5-6). Berikut adalah contoh query MySQL : SELECT * FROM daftar_dosen WHERE nama_dosen LIKE '%i' OR alamat LIKE 'm%';
Query tersebut digunakan untuk mencari kolom nama dosen yang diakhiri dengan huruf í’ atau kolom alamat yang diawali dengan huruf ‘m’.
2.1.12 jQuery jQuery adalah library yang kuat dan kompleks yang dirilis pertama kali pada bulan Agustus 2006. jQuery merupakan pendukung JavaScript yang lebih memudahkan para developer dalam membangun suatu web (Franklin, 2013:1). Berikut adalah contoh code jQuery yang berfungsi untuk menghilangkan teks ketika teks diklik oleh user : <script> $(document).ready(function(){ $("p").click(function(){ $(this).hide(); }); });
20 2.1.13 State Transition Diagram Menurut O’Brien dan Marakas (2006), State Transition Diagram merupakan diagram yang bertujuan untuk menggambarkan perpindahan state, dari suatu kondisi ke kondisi lainnya. State Transition Diagram dinotasikan sebagai berikut : 2.1.13.1 State Pada State Transition Diagram, terdapat 2 jenis state, yaitu : a.) Initial State Initial state adalah state/keadaan awal suatu proses pada sistem. Sebuah sistem hanya diperbolehkan memiliki 1 initial state. b.) Final State
Final state adalah state/keadaan akhir suatu proses pada sistem. Sebuah sistem diperbolehkan memiliki lebih dari 1 final state. Notasi state dapat dilihat pada Gambar 2.4.
Gambar 2.4 Notasi State (Sumber : O’Brien dan Marakas, 2006) 2.1.13.2
Perpindahan State Perpindahan state dinotasikan dengan panah. Perpindahan state ditandai dengan adanya kondisi dan aksi yang menghubungkan suatu state dengan state yang lain. Notasi perpindahan state dapat dilihat pada Gambar 2.5.
Gambar 2.5 Notasi Perpindahan State (Sumber : O’Brien dan Marakas, 2006)
21 2.2
Penelitian Terkait Penilai esai otomatis sudah banyak diteliti sejak tahun 1966, mulai dari Page, Landauer, dan peneliti lain yang meneliti bidang penilai esai otomatis. Dari penelitian tersebut, didapat peningkatan kualitas sistem penilai esai otomatis, dari yang semula hanya menilai esai dari jumlah kata, tanda baca, hingga sistem penilai esai otomatis yang menilai tentang hubungan antar kata secara semantik. Berikut adalah beberapa penelitian penilai esai otomatis yang telah dilakukan para peneliti :
2.2.1
Project Essay Grading Pada tahun 1966, atas permintaan College Board, Ellis Page mengembangkan sistem komputer untuk mengolah penilaian esai dalam skala besar yang dapat berjalan lebih praktis dan efektif. PEG menggunakan pengukuran proxes untuk memprediksi kualitas intrinsik suatu esai (trins). Proxes lebih merujuk pada gaya penulisan seperti total kata rata-rata, panjang esai, jumlah titik koma atau koma, dan lain-lain. PEG memiliki beberapa keunggulan, yaitu nilai prediksinya dapat dibandingkan dengan penilaian manusia, dan komputasinya dapat dilacak untuk mencari kesalahan penulisan. Namun, karena PEG hanya menilai gaya penulisan, maka sangat memungkinkan para pembuat esai membuat esai dengan gaya standar penulisan yang akan mendapat nilai tinggi (Dikli, 2006). Dikli (2006) juga menambahkan bahwa dalam sistem PEG, terdapat 2 tahapan, yaitu training dan scoring. Jumlah esai yang diperlukan PEG dalam tahapan training sebanyak 100-400 esai. Pada tahapan training, variabel proxes ditentukan untuk tiap esai dan tiap variabel memasuki ke persamaan prediksi. Pada akhir proses, nilai esai diberikan dengan koefisien bobot awal komputasi yang didapat dari tahapan training. Penghitungan trins pada esai yang belum dinilai dapat diprediksikan dengan persamaan regresi standar. Akurasi yang dihasilkan oleh PEG sebesar 0,87 dibandingkan dengan penilaian manusia.
22 2.2.2
Intelligent Essay Assessor Intelligent Essay Assessor (IEA) adalah salah satu penilai esai otomatis yang dikembangkan oleh Pearson Knowledge Analysis Technologies yang menganalisa dan menilai esai menggunakan metode analisa teks semantik yang dinamakan Latent Semantic Analysis (LSA). IEA berfokus pada keterkaitan konten dibandingkan organisasi bahasa pada konten. IEA menggunakan 3 sumber untuk menganalisa esai, yaitu esai murid yang belum dinilai, esai ekspertis, dan perbandingan internal esai yang belum dinilai. Pertama, IEA membandingkan kemiripan konten antara esai mahasiswa dan esai lain dengan topik yang sama yang dinilai oleh manusia agar dapat ditentukan jarak kemiripan konten antar esai. Berikutnya, IEA akan memprediksi nilai esai dengan menambahkan “gaya penulisan statistik korpus” dan mekanik (Dikli, 2006:8-9). Menurut Valenti, Neri, dan Cucchiarelli (2003:3), IEA sangat tepat untuk menganalisa dan menilai esai ekspositori dengan topik seperti ilmu alam, studi sosial, sejarah, medis atau bisnis. Dalam uji coba yang dilakukan, IEA berhasil meraih kemiripan dengan nilai manusia sebesar 85 % - 91 %.
2.2.3 E-Rater E-Rater dikembangkan oleh Burstein dan rekan-rekannya menggunakan MsNLP
untuk
melakukan
parsing
kalimat
pada
esai.
E-Rater
menggunakan kombinasi statistik dan teknik NLP untuk mengekstrak fitur lingual dari esai untuk dinilai. Esai yang dievaluasi diukur dengan esai yang dinilai manusia. E-Rater memiliki fitur untuk menganalisa struktur wacana, struktur sintaktis, dan penggunaan kata. Kini, E-Rater dibenamkan pada Criterion. Criterion merupakan sistem AES versi realtime berbasis web yang dikembangkan oleh ETS Technologies. E-Rater merupakan AES yang kompleks dan membutuhkan banyak training dibandingkan AES lainnya. Pada uji coba yang dilakukan, dengan menguji lebih dari 750000 esai GMAT yang telah dinilai, diperoleh kemiripan sebesar 87 % - 94 % (Valenti, Neri, dan Cucchiarelli, 2003:3).
23 2.2.4
Generalized Latent Semantic Analysis Berdasarkan penelitian yang dilakukan oleh Islam dan Hoque (2012), GLSA membuat n-gram berdasarkan dokumen matriks, bukan dengan kata dengan dokumen matriks dari LSA. Sebuah n-gram adalah bagian item n dari urutan tertentu. Item bisa fonem, suku kata, huruf, kata atau pasangan dasar sesuai dengan aplikasi. Sebuah n-gram ukuran 1 disebut sebagai "unigram", ukuran 2 adalah "bigram" (atau, kurang umum, sebuah "digram"), ukuran 3 adalah "trigram", dan ukuran 4 atau lebih hanya disebut "n-gram" Menurut GLSA, vektor bigram untuk "carbon dioxide " adalah kata atomik, berbeda dengan kata "carbon" dan "dioxide". Dari contoh tersebut menunjukkan GLSA memperhatikan urutan kata. Arsitektur sistem secara keseluruhan telah dipartisi menjadi dua bagian utama: training essay set generation dan evaluasi esai hasil training.
2.2.4.1
Training Essay Set Generation
Gambar 2.6 Training Essay Set Generation (Sumber : Islam dan Hoque, 2012:619)
Gambar 2.6 menunjukkan gambaran proses yang dilakukan dengan metode GLSA. Langkah-langkah yang digunakan untuk membangun suatu GLSA, di antaranya : a.) Preprocessing the training essays
24 Preprocessing dilakukan dalam tiga langkah: penghapusan stopword, stemming kata-kata ke kata dasar dan memilih term indeks n-gram. 1. Penghapusan stopword Pada langkah penghapusan stopword, kata yang paling sering dihapus adalah "a", "an", "the", "on", dll. 2. Word stemming Setelah menghapus stopword, dilakukan stemming untuk mengubah kata-kata ke kata dasar. Menggunakan algoritma stemming M.F. Porter. 3. Memilih term indeks n-gram Term indeks n-gram dipilih untuk membuat n-gram dengan dokumen matriks. Materi kuliah dan jumlah esai yang belum dinilai yang memadai ini dipilih untuk membuat term indeks. Script Jawaban yang belum dinilai kemudian digunakan sebagai training set esai. N-gram yang muncul di lebih dari satu esai pelatihan dipilih sebagai term indeks.
b.) Perhitungan SVD SVD pada GLSA dihitung dari n-gram dengan dokumen matriks. SVD bertujuan untuk mengurangi dimensi. Tujuan dari pengurangan dimensi adalah untuk mengurangi noise agar terlihat rincian penting dalam data sehingga struktur semantik yang mendasar dapat digunakan untuk membandingkan isi esai. Operasi
pengurangan
dimensi
dapat
dilakukan
dengan
menghapus satu atau lebih nilai singular terkecil dari singular matriks S dan juga akan dihapus jumlah yang sama kolom dan baris masing-masing dari U dan V. 2.2.4.2
Evaluasi Esai Hasil Training Setelah hasil training diperoleh, query matriks dapat terbentuk dengan membuat n-gram by document matrix, dan query vektor dapat diperoleh dari esai, query vektor dirumuskan dengan :
25
= transpose query matriks = perpotongan matriks orthogonal kiri = perpotongan matriks singular SVD
Kemudian dilakukan perhitungan cosine similarity sebagai berikut :
=
bobot query vektor
=
bobot vektor esai training
Nilai similaritas terbesar antara query vektor dengan vektor esai training digunakan untuk menilai esai. Dari penelitian ini, didapatkan hasil akurasi nilai GLSA dengan nilai manusia sebesar 0,89 – 0,95.
2.2.5 Conceptual Rater Conceptual Rater (C-Rater) merupakan prototipe AES yang berbasis NLP yang berfokus menilai jawaban singkat terkait pertanyaan berbasis konten. CRater mengadaptasi beberapa alat pemrosesan natural language dan teknik yang dikembangkan untuk E-Rater. C-Rater dan E-Rater memiliki perbedaan tujuan penilaian. E-Rater menilai kemampuan menulis esai dibandingkan spesifikasi konten, sementara C-Rater menilai respon tergolong benar atau tidak. Penilaian respon dapat dilakukan dengan mengevaluasi keterkaitan kandungan informasi dengan konsep area yang spesifik. C-Rater tidak membutuhkan kumpulan esai yang besar untuk proses training.
Tingkat
akurasi C-Rater sebesar 80% dengan penilaian instuktur (Valenti, Neri, dan Cucchiarelli, 2003:3).
Berdasarkan penelitian - penelitian terkait yang telah dipaparkan, dapat diambil kesimpulan :
26
Tabel 2.2 Penelitian Terkait Judul
Tujuan
Metode
Hasil
Automated
Membantu
Menggunakan
PEG
Essay
manusia
Grading
menilai
(Dikli, 2006)
yang disebabkan untuk
terhadap
banyaknya
namun
yang
Akurasi berhasil 0,87
untuk prinsip Trin dan mendekati Trin penilaian manusia
esai Proxes.
esai mengkomputasi
dinilai hasil
variabel PEG
dapat membuat intrinsik, manusia
Proxes
esai, karena hanya
dan menitikberatkan untuk pada
kesulitan dalam menghitung
gaya
penulisan, seperti
mempertahankan hasil dari non- banyaknya konsistensi
variabel
penilaian esai.
intrinsik. lebih
jumlah
titik,
PEG membuat banyak pihak
menitikberatkan menyalahgunakan pada
gaya PEG
dan
penulisan
mengakali
dibanding
dengan membuat
konten.
esai yang pasti mendapat
PEG
nilai
tinggi ketika diuji dengan sistem.
27
Judul An of
Tujuan
Overview Menguji Automated metode
Scoring
Metode
Hasil
Akurasi
Memberikan
Pearson
0,85 – 0,91
LSA prediksi skala mengklaim
of untuk menilai nilai
Essays
hubungan
(Dikli, 2006)
semantik pada dan konten esai.
yang IEA
hanya
tengah dinilai, membutuhkan dengan 100 data set
metode IEA
LSA, untuk dinilai melakukan
layak
training, lebih
digunakan
sedikit
dalam penilai dibanding esai
otomatis penilai
esai
karena tingkat otomatisnya. korelasinya
Hal
tersebut
mendekati
dipercaya
penilaian dari disebabkan manusia.
karena
IEA
dapat memprediksi skala
nilai
pada suatu esai secara otomatis
28 Judul
Tujuan
Metode
Hasil
Akurasi
An Overview
Menguji
Menggunakan
Metode
0,87 – 0,94
of Current
penilaian
NLP
Research on
berdasarkan
mengidentifikasi ini
Automated
pengukuran
fitur
untuk besutan
fakultas dengan menilai
(Valenti,
koleksi
Neri,
and kompleksitas
dinilai
penilaian cukup berhasil
Essay Grading pemilihan kata,
ETS
sampel Graduate
dan menyimpan Management
Cucchiarelli,
leksikal,
dengan bobot ke Admission
2003)
proporsi
dalam database.
Test (GMAT)
kesalahan tata
Analytical
bahasa,
Writing
proporsi
Assessment
kesalahan
(AWA)
penggunaan
memberikan
bahasa,
penilaian yang
lain-lain.
dan
dan
memiliki korelasi yang baik
dengan
human raters
29 Judul
Tujuan
Metode
Hasil
Automated
Menguji
Menggunakan
Hasil penilaian 0,89 – 0,95.
Essay Scoring penilaian esai n-gram
Akurasi
untuk dengan GLSA
with
berdasarkan
membuat
memberikan
Generalized
kombinasi
dokumen
korelasi
nilai
Latent
LSA
serta dengan
nilai
Semantic
memperhatikan mereduksi
manusia yang
Analysis
urutan kata.
SVD
sangat
menggunakan
yaitu 0,89 –
truncated
0,95.
(Islam
and
Hoque, 2012)
dengan matriks,
SVD,
serta
memperhatikan urutan dalam penelitian.
kata
baik
30 Judul
Metode
Hasil
An overview of Menjawab
Menggunakan
C-Rater tidak 0,80
Current
teknik Natural memerlukan
Research
Tujuan
jawaban on singkat
Automated
berkaitan
Essay Grading
dengan
yang Language Processing
Akurasi
banyak
data
training, Rater
Chanya
(Valenti, Neri, pertanyaan
membutuhkan
and
berbasis
jawaban kunci
Cucchiarelli,
konteks
yang
2003:5)
disediakan instruktur.