TESIS
PENENTUAN MAKNA KATA DARI FRASE DALAM KALIMAT BAHASA INGGRIS Jeany Harmoejanto (5109201011)
Pembimbing: Daniel O. Siahaan S.Kom, M.Sc, P.D.Eng Ahmad Saikhu, S.Si., M.T
OUTLINE Tujuan | Penelitian Sebelumnya & Kontribusi | Permasalahan Æ Input dan Output Æ Proses Penentuan Makna | Hasil Uji Coba | Kesimpulan | Saran |
TUJUAN PENELITIAN |
|
Input: please take your hat off when you go inside the building Penentuan Frase Output: Penentuan Makna Frase Daftar Frase: take off (6) Daftar Kata: please(1), hat(1), go(4), building(1) Kata take off pada wordnet y y y y y y y y y
(1) leave (2) take away or remove (3) depart from the ground (4) take time off from work (5) mimic or imitate in an amusing or satirical manner (6) remove clothes (7) get started or set in motion, used figuratively (8) prove fatal (9) make a subtraction
BATASAN MASALAH Frase yang akan ditangani adalah: 1. Frase yang dapat menyebabkan pembentukan makna baru contoh: take Æ take off 2. Frase yang menyebabkan perubahan jenis kata contoh: handle (Verb) Æ door’s handle (Noun) 3. Frase yang bukan suatu idiom contoh: false alarm Proses pengerjaan penelitian akan menggunakan bantuan library Stanford PoS Tagger dan RitaWN
PENELITIAN SEBELUMNYA & KONTRIBUSI
PROSES Penentuan Frase
Penentuan Makna
PROSES PENENTUAN FRASE
KOMBINASI INSERTION
KOMBINASI BUBBLE
UJI COBA (1) Data = 65 Kalimat Æ 65 Frase | Pengukuran Hasil Uji Coba |
A= Frase ada di kuisioner dan ada di uji coba B= Frase ada di kuisioner tetapi tidak ada diuji coba C= Frase tidak ada di kuisioner, tetapi ada diuji coba D= Frase tidak ada di kuisioner dan tidak ada diuji coba Precision = A / (A+C) Recall = A / (A+B) Akurasi = (A+D) / (A+B+C+D)
HASIL UJI COBA (1)
PENENTUAN MAKNA FRASE
ALGORITMA PAGERANK
HASIL UJI COBA (2) Data = 65 Kalimat Æ 64 Frase & 196 Kata | Pengukuran Hasil Uji Coba |
Akurasi = Makna yang Benar / Total Kata x 100%
A= Gloss yang diubah ke bentuk dasar B= Gloss yang tidak diubah ke bentuk dasar
KESIMPULAN (1) |
|
|
Akurasi pada proses penentuan frase mencapai 82.89% sedangkan proses penentuan makna mencapai 60,94% Precision dan Recall pada proses kombinasi mencapai 84.15% dan 96.92%, di mana kombinasi Bubble mempunyai prosentase lebih tinggi dari Insertion Proses Tagging pada tahap awal penentuan frase, mempengaruhi tingkat akurasi dari penentuan makna frase. Tagging yang tidak tepat, makna yang dihasilkan pasti tidak sesuai.
KESIMPULAN (2) |
|
Kesediaan data dalam Wordnet (RitaWN) mempengaruhi proses penentuan frase pada kalimat dan dapat menghasilkan frase yang tidak termasuk dalam kategori frase yang menimbulkan pengertian baru, contohnya at home, this morning. Semakin banyak jumlah potongan frase dan kata dalam sebuah kalimat, semakin besar kemungkinan ditemukan makna yang sesuai
SARAN |
|
|
Variasi kombinasi kata dengan mendahulukan kata yang berkategori verb, dicari terlebih dahulu semua kemungkinan, karena mayoritas frase dengan makna baru adalah frase verbal. Pada penentuan makna frase, dapat dilakukan dengan menelusuri sinonim dari kata-kata yang ada dalam gloss, berdasarkan referensi (Navigli, 2010) Penentuan jumlah makna tidak harus menghasilkan hanya 1 makna, karena pada kenyataannya ada >1 makna yang jika divalidasi juga menghasilkan makna yang sesuai, hanya saja berapa makna yang perlu ditentukan sebagai maksimal output yang harus dihasilkan harus diteliti lebih lanjut.
FRASE Kata Æ She bought an expensive lamp | Frase Æ The lamp on the table is expensive * Frase preposisi, frase noun, frase gerund * Frase verbal | Klausa Æ The lamp which is standing on the table is expensive |
ALGORITMA LESK
UJI COBA (1) Jarak
Precision
Recall
Akurasi
1
2
3
4
5
Bubble
78.26%
82.54%
84.29%
85.14%
84.00%
Insertion
78.26%
80.95%
82.86%
82.43%
81.33%
Bubble
55.38%
80.00%
90.77%
96.92%
96.92%
Insertion
55.38%
78.46%
89.23%
93.85%
93.85%
Bubble
48.00%
68.42%
77.63%
82.89%
81.82%
Insertion
48.00%
66.23%
75.32%
78.21%
77.22%
CONTOH GLOSS The noun takeoff has 4 senses (first 1 from tagged texts) |
1. (1) takeoff -- (a departure; especially of airplanes)
|
2. takeoff -- (the initial ascent of an airplane as it becomes airborne)
|
3. parody, lampoon, spoof, sendup, mockery, takeoff, burlesque, travesty, charade, pasquinade, put-on -- (a composition that imitates or misrepresents somebody's style, usually in a humorous way)
|
4. parody, mockery, takeoff -- (humorous or satirical mimicry)
The verb take off has 9 senses (first 6 from tagged texts) |
1. (15) depart, part, start, start out, set forth, set off, set out, take off -- (leave; "The family took off for Florida")
|
2. (6) take off -- (take away or remove; "Take that weight off me!")
|
3. (4) take off, lift off -- (depart from the ground; "The plane took off two hours late")
|
4. (2) take off, take time off -- (take time off from work; stop working temporarily)
|
5. (1) take off -- (mimic or imitate in an amusing or satirical manner; "This song takes off from a famous aria")
|
6. (1) take off -- (remove clothes; "take off your shirt--it's very hot in here")
|
7. get off the ground, take off -- (get started or set in motion, used figuratively; "the project took a long time to get off the ground“)
SYNSET DAN RELASI SYNSET
Relasi Synset
Synset
NAVIGLI, 2010