ANALISIS PEMBENTUKAN WORD GRAPH KATA SIFAT MENGGUNAKAN METODE KNOWLEDGE GRAPH
USEP RAHMAT
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa tesis Analisis Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph adalah karya saya sendiri dengan arahan pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis lain disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, September 2009
Usep Rahmat NIM. G551070521
ABSTRACT USEP RAHMAT. The Analysis of Word Graph Formation of Adjective Using Knowledge Graph Methods. Under Supervision of SRI NURDIATI and FARIDA HANUM. Knowledge graph theory is a new way to describe natural language, which focuses on semantic aspect. In the theory, there are 9 binary and 4 frame relationships. A word is a basic unit in a natural language processing. In the theory of knowledge graph, every word is represented by a word graph, expressing the meaning of the word. This research mainly focuses on how to construct a word graph of adjective in Indonesian language. Adjective is a word which explains a noun. In this thesis, every adjective will be analyzed using Indonesian grammar. The result is systematic patterns of adjective word graphs. Keywords: knowledge graph, word graph, adjective, natural language processing.
RINGKASAN USEP RAHMAT. Analisis Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph. Dibimbing oleh SRI NURDIATI dan FARIDA HANUM. Bahasa alami adalah bahasa yang biasa digunakan oleh manusia yaitu suatu bentuk representasi dari suatu pesan yang ingin dikomunikasikan antarmanusia. Teknologi Natural Language Processing (NLP) adalah teknologi yang memungkinkan untuk melakukan berbagai macam pemrosesan bahasa alami yang biasa digunakan oleh manusia. Knowledge Graph (KG) adalah suatu metode baru dalam NLP yang digunakan untuk memahami bahasa manusia yang mengkaji secara luas pada tataran jaringan semantik berupa teks yang bersifat subjektif dan disajikan dalam bentuk graf. Metode KG sudah dipergunakan untuk dokumen berbahasa Inggris. Struktur bahasa Inggris tidak persis sama dengan bahasa Indonesia, untuk itu perlu dilakukan analisis terhadap struktur bahasa Indonesia, sehingga metode KG dapat digunakan untuk menganalisis dokumen berbahasa Indonesia. Penelitian penerapan teori KG pada bahasa Indonesia dalam jangka panjang bertujuan merancang sebuah software yang dapat membaca sembarang teks bahasa Indonesia serta menghasilkan informasi dalam bentuk graf. Teks graf yang dihasilkan diharapkan berupa intisari dari teks yang dipelajari. Salah satu tahapan yang dapat dilakukan untuk membangun software tersebut adalah membuat aturan pembentukan word graph untuk seluruh kata dalam bahasa Indonesia yang secara otomatis menganalisis teks berbahasa Indonesia. Saat ini aturan pembentukan word graph bahasa Indonesia dari berbagai jenis kata seperti kata benda, kata kerja, kata sifat dan lain-lain belum ada, maka penulis akan membangun aturan pembentukan word graph dengan membatasi ruang lingkupnya yaitu hanya pada kata sifat. Penelitian ini bertujuan menganalisis struktur kata sifat dan membuat aturan pembentukan word graph kata sifat. Manfaat penelitian ini adalah menunjukkan bahwa metode KG mampu memberikan pengetahuan sebagai informasi penting yang dapat digunakan dalam menganalisis teks berbahasa Indonesia. Dalam teori KG setiap kata berhubungan dengan sebuah word graph yang menyatakan arti dari kata dan disebut dengan semantic word graph. Word graph merupakan graf dari kata dan dapat dinyatakan sebagai graf yang diberi label. KG adalah suatu metode yang digunakan untuk menganalisis teks dan merepresentasikan teks tersebut ke dalam bentuk graf. KG adalah suatu instrumen yang merepresentasikan struktur terkonsep yang sudah tertentu. Pada prinsipnya komposisi dari KG terdiri atas concept (token, name dan type) dan relationships. Concept merupakan sesuatu yang penting dalam membentuk suatu pengertian dari khusus ke umum atau sebaliknya. Concept dapat direpresentasikan menggunakan token, type, dan name. Token merupakan concept yang dipahami oleh seseorang menurut cara pandangnya masing-masing sehingga token bersifat subjektif. Token adalah suatu node yang diindikasikan oleh “ “, oleh karena itu pada teori KG segala sesuatu akan dihubungkan dengan token. Type adalah concept yang berupa informasi umum dan bersifat objektif karena merupakan kesepakatan yang dibuat sebelumnya. Name adalah sesuatu yang bersifat unique individual. Ontologi adalah gambaran beberapa concept dan relasi antarconcept yang bertujuan untuk
mendefinisikan beberapa ide yang merepresentasikan concept, relasi dan logikanya. Ontologi word graph terdiri atas 9 type binary relationships dan 4 frame relationships. Sembilan type binary relationships tersebut antara lain: ALI, CAU, EQU, SUB, DIS, ORD, PAR, SKO, dan ontologi F. Empat frame relationships yang dimaksud adalah FPAR, NEGPAR, POSPAR, dan NECPAR. Relasi ALI digunakan untuk menghubungkan sebuah type dengan token. Relasi CAU digunakan untuk menghubungkan dua token yang memiliki hubungan sebab akibat dimana sesuatu mempengaruhi sesuatu yang lain. Relasi EQU digunakan untuk menghubungkan sebuah name dengan token. Relasi SUB digunakan untuk menyatakan bahwa sesuatu merupakan bagian dari sesuatu yang lain. Relasi DIS digunakan untuk menyatakan sesuatu yang berbeda. Relasi ORD digunakan untuk menyatakan sesuatu yang berurutan. Relasi PAR digunakan untuk menjelaskan bahwa satu elemen berkaitan dan memiliki sifat elemen lainnya. Relasi SKO digunakan untuk menyatakan informasi bergantung. Ontologi F digunakan untuk menunjukkan fokus dari suatu graph. Relasi FPAR digunakan untuk menghubungkan sebuah konsep dengan struktur di dalamnya, relasi NEGPAR digunakan untuk menyatakan negasi dari sesuatu, relasi POSPAR menyatakan kemungkinan sesuatu, dan relasi NECPAR untuk menyatakan suatu kebutuhan. Metode penelitian yang akan dilaksanakan terdiri atas tiga tahap yaitu tahap pertama analisis struktur kata sifat, tahap kedua pembuatan aturan word graph kata sifat bahasa Indonesia dan tahap ketiga pengujian aturan word graph kata sifat bahasa Indonesia. Dari hasil studi literature teks berhubungan dengan pertanian, penulis memilih kata sifat untuk dianalisis dari tiga majalah Trubus yang dipilih secara acak, kemudian mengelompokkan kata sifat berdasarkan pembentukan kata sifat yang menekankan kepada proses afiksasi. Selanjutnya penulis mempelajari jenisjenis relasi dasar dalam KG yang akan diterapkan pada pembentukan word graph kata sifat. Setelah relasi diperoleh maka dibuat aturan pembentukan word graph kata sifat bahasa Indonesia, kemudian hasil aturan tersebut diuji, jika telah memenuhi aturan rancangan word graph kata sifat maka ditetapkan aturan pembentukan word graph kata sifat bahasa Indonesia. Hasil penelitian ini berupa pembentukan word graph kata sifat bahasa Indonesia dari berbagai bentuk afiksasi. Hasil ini mengindikasikan adanya satu aturan yang dapat dibuat secara umum untuk setiap kata sifat yang ada meskipun tidak menutup kemungkinan beberapa aturan belum tertampung.
Kata kunci : knowledge graph, word graph, kata sifat, natural language processing.
©Hak Cipta milik Institut Pertanian Bogor, tahun 2009 Hak Cipta dilindungi undang-undang 1.
2.
Dilarang mengutip sebagian atau seluruh hasil karya tulis ini tanpa mencantumkan atau menyebutkan sumber. a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah b. Pengutipan tidak merugikan kepentingan yang wajar Institut Pertanian Bogor. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa izin Institut Pertanian Bogor.
ANALISIS PEMBENTUKAN WORD GRAPH KATA SIFAT MENGGUNAKAN METODE KNOWLEDGE GRAPH
USEP RAHMAT
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Matematika Terapan
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009
Penguji Luar Komisi pada Ujian Tesis: Drs. Prapto Tri Supriyo, M.Kom.
Judul Tesis Nama NIM
: Analisis Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph : Usep Rahmat : G551070521
Disetujui Komisi Pembimbing
Dr. Ir. Sri Nurdiati, M.Sc. Ketua
Dra. Farida Hanum, M.Si. Anggota
Diketahui
Ketua Program Studi Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S.
Tanggal Ujian : 2 September 2009
Dekan Sekolah Pascasarjana
Prof. Dr. Ir. Khairil A. Notodiputro, M.S.
Tanggal Lulus :
PRAKATA Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karuniaNya sehingga karya ilmiah ini dapat diselesaikan. Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan
Februari 2009 ini adalah Analisis
Pembentukan Word Graph Kata Sifat Menggunakan Metode Knowledge Graph. Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Sri Nurdiati, M.Sc. dan Ibu Dra. Farida Hanum, M.Si. selaku pembimbing serta Bapak Drs. Prapto Tri Supriyo, M.Kom. selaku penguji yang telah banyak memberikan saran. Di samping itu, ungkapan terima kasih juga penulis sampaikan kepada Departemen Agama Republik Indonesia yang telah membiayai penelitian ini, kepada rekanrekan mahasiswa atas diskusinya, serta pihak lain yang tidak bisa disebutkan satu per satu. Semoga atas semua kebaikan dapat bernilai ibadah dan dibalas oleh Allah SWT dengan kebaikan yang berlipat. Ucapan terima kasih yang tiada hingga
kepada Ibunda, yang tercinta Istri dan keempat putra/i, dan seluruh
keluarga yang memberikan motivasi, do’a dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat.
Bogor, September 2009
Usep Rahmat