NATT]RAL LANGUAGE PROCESSING (NLP)
.
Oleh: Bagus F&tkhurrozi
Fakultas Teknik Univercitas Tidar Magelang
ABSTRACT Nolural Language Prccessinq NLP) is an area of research ond applicalion that etplota hotr .onpt ters can be used to understand and naripulate naturcl la,tguoge tatt or speech to do utqtl things. NLP researche$ ain lo Eather howledge on how hunan behrgs
uderstanrl and vse languqge so that qpoqiate tools and technique: con be dereloped ro nake anp er qtste, s underctdnd ond nanipulate nalwal languages to petform the desircd tasls. Applicatiotts of NLP hclude a wnbu offrelds of sfudies, such at ntachine lronslalio\ naltal language tal yoce:sing aid snnnatizatio4 ser i$etfaces, nultilingual and toss language infornation retrieval (CLIR), tpeech rccognitio\ artwial intelligence and
ape
Vstens.
Kelhlotat: nalatul language ptucesshg
A..
PENDAHULUAN.
Artificial Int€lligerce atau kecerdasan buatan itu s€suatu yang diciptakan oteh manusi4 untuk meoggantik n manusia. Jadi bisa jadi kecerdasan buatan itu merupakan surtu ancaman. Walau puu menyadari bahwa kecerdasan buatan bisa jadi adalah suatu ancaman rmtuk manusi4 tapl manusia masih saja mengembangkan apa yang disebut d€ngan k€c€rdasan buatan. 28
vot
32
Nd 2, 15 -lsEtu 2N9 : 2814
Manusia masih saja mencoba mengunbangkan/mendapatkan sesuatu (teknologi) yang baru, yang dapat bqpikir seperti manusia.
Hal ini t€dadi karena adanya kaidakpuasau dalarn diri manusia, rnanusia ingin nendapa*an sesuatu dengan cara yang lebih mudah. .
Lagipula memang ada k€terbalasan-keterbatasal dalam diri manusi4 sepeci otak manusia yang hanya mampu berpikir dengan ftekuensi kira-kira 100 Hz dan karena manusia mempunyai rasa capai. Bandingkan . deng&n komputer s€kalang yang rnampu mengolah data dengan fiekuensi 4 GHz. Komputer juga tidak mempunyai iasa capai t'alau pun harus mengolah data yang sama berulang-ulang, setelah sistem pakar adalah Penggunaan aplikasi pengolahan bahasa alani atatJ ndtwal language processizg (NLP). Bahasa alami adalah bahasa ibu. Program pengolahan bahasa alami meng$makan tekdk Al agar komputer mengeni dan bisa membuat bahasa alami.
AI
B. 1.
PEMBAHASAN
Apakah NLP? l*rlah Nalural Language Prccessing G'ILP) atau Pengolahan Bahasa Alami (PBA) biasanya digunakm untuk Eenjelaskan fiDgsi komponen perangkat hmak atau perangkat keras dalam
rbuah
sistem komputer yang menganalisis atau mensintesis bahasa
yang diucapkan atau dihrlis. Julukan 'alami' dimakzudkan untuk membedakan rnaousia berbicara dan menulis dari behasa yang formal, seperti matematika atau notasi logika. atau bahasa Nqtwal komputer, seperti Jav4 LISP, dan C+r. Lebih (Jnderstandtng' yang (NLU) lebih terkait dengan tujuan Language ambisius dari sisteln komputer yang sebenarnya utuk meoahami bahasa alami sepsti manusia"
la\i*'
29
Naaral lawuge
.
P@Birc
@Lp) (Bags Fa1HtoE@t)
Adalah jelas bahwa kompute. dapat dip.ogram utrtuk memabami'.kode misalnya, dalam arti bahna seorang _Javqiy:yetet lap6i. dinrlisi yang akan menyebabkan qptet wt]' dijalanken 46gao 6.n- di vindow browser. Mrrr$tjuga untuk program komputer utuk iremecahkan banyak teta_tetilofuk Aan serta membuktikan leorEm4 diur brhk n sanpai dengan penaksiran baru Tapi analisis kompute. tshadap Frkataan dan teks tetap penuh dengan masala[ walaupun tetap menarik
(lihatSidebarl.l).'
Sideb$ 1.1 KemeDduur dalsm NLP Kemetrduaan linguistik kadang-kadang nenjadi sunber lelucor! tapi banyak kata-kata umum dan kalirnat ada beberapa int€tpr€tasi yang tak ketahuan, Misalnya, kara benda ba;k, memiliki banyak arti. Dapat mOrujuk kepads sebuah lembaga keuangar! atau batas sungai, atau dengan sikap pertanrhao atiu betgaDtung pada sesuatu. Manusia jarang merancuhn arti ini, karcna pe6edaan kontcl(s dalam simbol dari kal8 ini tedadi, dan karena dunia pengefahual yang nyata Setiap orang yang membaca surat taber tahi bahwa 'di Tepi Balat dad yordania, tidak nerujuk kepgda sebuah lembaga keuangan, 'Baok' a.lalah sebuah c$!oh dari kenenduaan leksikal. Te.aoi
seluruh kalimat dapat eemiliki dwimakna dengan respek ie 5trtiktur dan mekn"nya Berila$ adalah b€benpa contoh populer: Klmjlmg'n bibi bisa meneganggu' yang bisa berarti-taik 'lni nrerupakan gangguao jika nengmjungi salah satu dari bibi" dau 'Ini merupakan gangguan jika salan- sanr dari bibi mengunjungi' tcrganturg b€rhubutrg dengan analisis sintaksis. Manifestasi umum dari kensrduaa! sintaksis "aahh lampiran frase prcposisioral. Pertimbangkan contoh berikut:
YoL 32
Nd 2,
15
taatut
2ut9 : 28-11
'John melih* orang di taman dengan teleskop.' U*uk siapa teleskop yang dimiliki? John? Tarnan? Orang di
taman? Setiap akan menyarankan interpetasi yaag berMa, berdasa*an lampiran yang berbeda dari Fase preposisional 'dengan teleskop.' Pemberian motivasi ini, ada banyak cara yang salah satu clapat nendekati studi alas NLPNLU. Banyak teks dimulai dengan beberapa latar belakang dari tinguistik, meneruskan langsung ke sintaks (aDalisis shuktu tatabahasa), terus dengan ilmu semantik (analisis makna), dan diakhiri dengan pedakuan dari pragmatiks (masalah kontcks atau penggunaan bahasa). Seperti sebuah pengorganisasian terhadap b6han yang baik untuk belajar akadenilq ietapi tidak akan terlayani pada buku yang terfokus pada aplikasi dan ieknik yang terkait. Bagian ioi menyajikan gambaran singkat mengenai NLP yang memtrtier peninggalan dari linguistik modem, perigenalan pola dan kecerdasan buaran melalui serangkaian kekuatiran yang munctll dari berbagai aplit
. .
'Bacaimana s€buah. sistem
yang memenuhi
kebuhhan
.peDgguna informasi? atau
.Apa yang membuatringkasur dokumen', keduanya teorais dan
menarik secara praldis. .
Sintaks nama (tnisalnya seuktur intemal dad kompo& seperti nana pertamatuma pasangan t€rakhfu) adalah s€dikit perbetiaan masalah dari pgnerltuan struktu kalimat yang khas Ilggris (alau Perancis atau Jennan). Demikian pula, Dasalah 31
Ndtunt Loa"4se
p@Bi,c@u,) (Bass
FaN,@tM)
pen€ntuan penunjukan dad mma te$€but dalam berbagai cara Frbeq d:nCan arti dari sebuah kalimat. peratr toot"ti nar.na aan disryuiguasi oamu iuga agat tlusis tekoik tujuan umum untuk tetidakmeqduaaD .d*g-3?3olg@ Kaum.l seperu seperti yary l,ercantuJn di Sidebar I . I .
aiil
Gil
l9fl$ql
2.
NLP drn iingutstik
definisi singkat konsep linguistik .B:bop..-u jika banya dntuk memberika! p-"g"ra""tadisional $perlulan, literatur- di- NLP. Bagian bedkd akan nrerop"*ioaf._ U"t"o.l
..
!:gitt"l".Sr
bidang ini.
dan konsep yang umurir dalam ttrata
"a"jfr ;,"t dtrk*ii;
2.1. Sintaks dan semantik ... Dalam beb€rapa bukq Noam Chomslsy memHakan afiara kaliinat ying s€i)ara sintaks tidalcnormal, seperti 'Gagssan tidur dengan rnarah tidak berwama hijau ,. . dan l@limat y8llg baik secara gramatikal sernantii tetspi tidak normal, s€p€rti Tidak berwama hijau gagasan tidur dengan marah,. Kenyataaa bahwa titr a"p"ti bahasa kedua acak "t*an-"ti.* sebagaidibukti DerD€oa. cara.yang s€dng ditambabkal un-tuk penguraian dari sintaks dan semantik pada asutu Danwa satu dapat menganalisis struktur sintatsis kalimat yaog pertama (tanpa rherujuk kepada m,kn,) a_ mengatursrs struitur senantik unruk aplikasi bshasa alami.
.
b"h*"-y-C; d"i; *t"frtlt"
2.2. Pragrnatiks dan konteks
bhcanya ditetapkan sebagai pemuran vanc oenguae peoggunaatr oahasa-.Dengan demikiaa jilo saya berkata'Anda b€xlrutang saya lima dolad nungkin ini lebih banyak permintaan utuk membaya dibauding
voL 32 No. 2, 15 Aet
dB 2009
:
284
pqtryafaatr yang sebemmya, tlnpa menganggap bagaiaana trase yang sehamya" Maka keutamaan sering disesuaikan ke dalam analisis modem terhadap makna Misalny4 jika saya kaik kata ' nat wal I angus ge Ijrc c e s s in g' permintaan dalaur kotak mesin pencari, apa yang sebenamya saya cari?'Definisi? Referensi ke literatur? Ahli clalam NLP? Kusus di NLP? Mesin pencari yang 'cerdas' mungkin dapat mempunyai
gambaran keluaiarinya, dcngan melihat permiaiaan saya sebelurnnya. Setiap kadidat pemintaan terdahulu yang tercantum pada titik mesin pencari mungkin di direksi yang berbeda: ' apak€h
nalursl languqge proce ss ing'
AI'
'bul-u 'univeNitas Rochester,' Penggunaan dan konteks adalah saling terkait. Beb€rapa konteks yang radikal mempengaruhi maksud di balik sebirah ucapao. Delgatr demikian saya dapat mencuplik perkataan Adolf Hitler tanpa mendukung sentimen yang dinyatakan, atau menanamkan kalimat dalam bahasa konteks yang'mempengaruhi interFetasinya, misalnya, 'Saya ragu bahwa Pemerintah akan membubarkan Microsoft '.
2.3. Dua maknaNl-P
Salah satu p€ndekqtan NLP adalah berakar pada jenis analisis
lin€uistik diraqkum pada bagian sebelunnya. Hal ini kadangkadang dicirikan sebagai 'simbolis', karena sebagian besar terdid dari peraturan untuk manipulasi simbol, misalnya" p€Bturan tata babasa yang mengatakan apakah suatu kalimat yang dibentuk dengan baik atau tidak. Pemberian kepercayaan lang erat dari kec.erdasan buatao tradisional termasuk komputasi simbolis, itu juga nemiliki karakteristik-informal sebagai 'Mode Al tua yaug baik'. 33
Nahnd laauaEe
Pt@W OD) (Bdqct Fdu@tdi)
Pendekaan kedu4 yang didapatkan dari alaf pembayaran yaog lebih luas pada tahun 1990-arL yang berakar dalarn anatisis statistik teftadap bahasa Hal ini kadang-kadang dicirikan sebagai 'empiris', tarena melibatkan penurunan data bahase dari korpra teks r€latif besar, sepelti sumber berita dan web pages. Pemilihan istilah lebih baik memiliki penanbahan bonus dari p€masuka! rasioialisme ke peoenlangatr gambara& tujuao yang didapatka! basifat memgikan beberapa konotasi di arena beasiswa abad keduaputuh. Salah satu cara unhtk melihat perbedaan adalah metodologi muid. Simbolis NLP cenderung bekeds totrdor! dengan membebani pola tata bahasa yang dikenal dan arti asosiasi atas teks. Empiris NLP cenderung bekeda bottom-up dad teks itu sendii, merc€d pola dan asosiasi untuk mod€l, pencarian uatuk pola dan asosiasi ke model, beberapa rnungkin tidak sesuai dengan sintaksis mumi atau hubungan ser@ntik. Cara lain untuk memahami perbedaa! ini adalah utuk melihat bagaimana dua sekolah meoangani kerumitan bahasa pengolaha4 terutima masalah ketidakpastia!, pencontohan oleh fenomena seperti ambiguitas. Jelas bahwa pendekalan simbolis mumi oleh ketidakpsstian trrs€but harus mengojukan aturan tambahaD, atau faldor kontekstual, maka harus dij'dik n fomal
ini
d.l'm
Ini merupakan rretodologi tasis tarem ia- bergantung pada manusia ahli rmtuk
beb€raps mode.
pengetahuan',
mengidentifikasi dan menjelaskan kereguleran dalam donairt. Pend€katal empiris lebih kuantitatif, kareaa akan cendenrng akan menghubrmgkan dengan kemungkinan alternatif dari analisis data tekstual, d& memulrlskan penggunaan metode statistik Bobagai alat-alal ceggih tErsedia mtuk pencampurm dan pemaduao model nathematika dal"m servis dari usaha ini. 2.4, Tasks dan supedasks
Aplikasi utana dari bahasa penrosesau 34
di
web
a
Yol. 32
Na
2,
l5 llsata
2009 : 2E44
perclehan kembali dokumen: penemuan dokumetr yang dianggap rclevan untuk petrgguoa satu snaian. Satu dapd melakukan pencarian dokumen tanpa melakukan signifikan NLP, dan banyak . mesin pencari melakukannya, nanun tren di tahun 1990-an telah terhadap peningkatru kecanggihan
tentmg
35
Natutul Lae@pe
Pte$hE@LP) (BasLt Fa&@@i)
TWas ini dapat dipadukan dalan cam uahrk menarik formula 'supenasks', misalnya, seorang program dapat memilih dokumel dari sumber berdasukan konten, mergr.Eutkatr mereka ke dalam . kategori, kemudian mengekstraksi beberapa informasi relevan dari s€tiap dokumen yang meriarik. Tergantung pada lingkat akwasi yang dip€dukaq beberapa manual intervensi mungkin diperl*an, tetapi'kita akan melihat contoh Dyata yang menunjukkan bahrra program pengolahan sumber teks bisa menjadi asisten yaag efektif ke sistem editorial. Seperti supertasks scdang dipertimbangkan di bawah dari rubrik ?ets ,ni.rir8ldengan penganalogion dergon 'data zinr'rg', dima&sudkan ultuk mewakili berbagai cara yang menggunakan metddatq depat diturunkan dari penyimpar teks ortine.
3. Penlahn lirguistik Lirguistik analisis teks biasanya berlangsung di sebuah layar mode. Dokumeu yang rusak ke dalam paragnf, paraSraf menjadi kalimat, dan kalimat dalam s€tiap kata. Kata-kata dalam kalimat tenebut kernudian dilabelkan oleh bagian p€mbicarasn dall Iiturfitur lainnya" s€belum kalimat yang drpecah (subjek analisis granarikal). Dengan demikian parsers biasanya menjadikan kalipat pembatas, penand4 pemblokir, dao pelabel pM of speech (POS). T€tapi tidak semua aplikasi memerlukan ruang yang lengkap seperti peralat-an. Misalny4 semua mesin pencari melalerkan langkah penyimbolan, namun tidak semua bagian melalo*atr pelabelan p€rnbicaraan. 3,1. Kalimat pembalas dan penanda
Uatuk pemisahan kalimal dari s€buah dokume!, kita perlu metrentrkan lingkup dari kalimat dan mengidentifikasi konstituennya"
36
t'ol.
i2
No.
2, 15 18ur16 2N9 : 2&14
3.1.1. Kalimat
pembalas Mendeteksi batas akuat kalimat adalah tidsk mudab, karena tanda baca tada-tanda yang meoandai akhn kalimat sering memiliki dwimaknb. Misalny4 periode dapat menunjukkan titik ctesimal, sebuah si4katan, akhir kalimat, singkatatr aiau di skhir kalimat Demikian pula, kalimat dimulai dengan huruf kapital, t€iapi tidak semua kata kapital memulai katimat' bahkan jika mereka mengikuti periode. Sebagai contoh dari sebuah
pengecualian, pertimbangkan: - Periode diikuti oleh spasi dan kemudian dengan huruf besar' namun sebelumnya judirl tidak membahsi kalimat. Contoh judul mungkin tennasuk 'Bapak', 'Ibu', 'Dt', 'Pres'', W CTO ',' HMS ', U.S.S.', dan sebagainYa. "' Unnrk ketidakmenduaan tanda baca' kalimat P€mbatas serinskali bereantung pada elspresi reguler atau aturan penglcualian. S.got.nturi lain mengandalkan peralatan ternik auo dilatih di manual pensegmenan bagian pokqk P,ada oenamtshan D€ratunm dan pengecualian, dan untr* pelatihan pe*ahaan, seSlnenters mungkin menggunakan informasi tambahan seperti bagi.an dad fr€kuensi kata
-
i*iiti.,
3.1.2.
'
Peqanda
Kalirndl p€mbatas kadang-kadang membutr.rhkan bantuan dari p€mnda ke k;tidakmenduaan karakter baca. Penanda (uga dikenal sobagai kara atau peng!'nalisa leksikal segmen) aliran segmen dari pemaknaan disebut penanda' Pada tand'a pertama, ku*kt". tada daDat diambil sebagai urutan karakter dipisahkan oleh spasi putih. Pendekatan sederhana seperti ini mungkin cocok untuk Leberapa aplikasi, tetapi. dapat mengfibalkan ketidakakuntan' S"Uagai contot, ia tidak memperhatikan tanda-tada bac4 seperti tirik, koma dan tanda hubung. Adalah dalabose "rtr,tdiJl dari alau dua taqda? Jelas, rcmer '1005,98' sehanrsnya matadi
*it
"aiu
Natutzl
satu
Ltguase P@sj,E (NLP) (B4sB FqtEaoei)
dengan '$ 1,005.98? Jika '$' taoda mesjadi 'ndn, atau diidentifikasi sebagai tantla sendid yang
tada" Bagaimana
bagian
dari
benar? . 3.2. Pemblokir dan pelabel
Porsing lidak dapat melanjutkarl karera ketiadaan analisa leksikal, dan yalg dipedukan terlebih dahulu meugidentifikasi bennrk akar dari kata datl menenhtkan bagian dari bagian pelkataadrya
3.2.1. Pemblokir Dalam bahasa biasa, pemlokir benar-benar
penganalisa
morfologikal yang mengaitkan varian yang sama dengan istilah bentuk akar. et<ar rtapat dikemukakan sebagai rujud yang biasarya ditemukan sebagai masukan dalam kamus. Utrtuk contoh, 'go', lgoes', 'going', 'gone' dan 'went' akan diksitkan dengsr aksr tel,tuf'go'. Ada dua jenis penganalisa morfologikal: ialleksional dan derivasional, inlteksional morfologi menyatakan hubungan siltsksis antar kata dari bagihn pembicaraan yang sama (misaltrya: 'itlate' d^ 'Wates), sedangkan derivasional morfologi menyatakan hubungan leksikal altara kata-kata yang dapat befteda dari bagian pembicaraan (misa!ll.y4 'itlate' dar. 'idlslion)' Serare irtusus, infleksional morfologi mernpelajari variasi kata dalam bentuk yang diperlulan untuk menyaakan fitur tatabahas4 seperti tunggavjsmak arau masa ialu/masa kini. Morfologi derivasional mengekspresikanpenciptaan kata-kata baru dari orang larna, dan meDcoba untuk menghubugkan perHaan kata ke bentuk akar. Derivasional biasanya netibattan dalam perutahan kategori tstababasa dari k t4 datr munglin juga melibatkan perubehaa ke artinya- Oleh kareda itu 'rn,b'al'dibentuk dai'&zd', namunmemiliki arti berlawaun.
.
.
38
VoL 32 No. 2, 15
/8'lj'a 2n9 : 284
Bagian dari pelabelan pembicaraan Bagian dari pelabelan pembicataan berdasarkan penanda dan kalimal pembatas, seperti label adri setiap kata dalam kalimat sesuai dengan tanda. Kard memutuskan apakah kata yang diberikan adatah kata b€nda, kata kerie" kata sifat, dan sebagainya. Berikut ini adalah dua kemungkinan penandaan kalimat berkaitan dengan kemenduaan teotang kalimat mengunjuagi bibi. 'funjungan/adj bitriN-Pl dapaVAux akan/V-Inf a/DET-
3.2.2.
Indef gangguan N-Sg'.
'Kunjungar,iV-Prog
bibiN-Pl dapat/Aux
akanry-Inf
a/DET-lndef gargguan/ N-S g' Dalam kalimat p€rtama, 'melgunjungi' adalah kata sifat yang memodifikssi subjek bibi'. Dalam kalimat yang kedu4 ia adalah seonng yang mengambil 'bibi' sebagai obyek fika tata yang diberikan satu label POS, dan tidak ada kata kata yang tidak diketahui oleh pelabel, pelabelan POS akan
menjadi tugas sederhana. Namun, seperti contoh
di
atas
mengganrback\.kata $Nngkin ditugoskan beberapa labet POS' dan peranan pelabel adalah unnrk memilih salah satu yang benar. Pada contoh bibl, itu tidak cukup infomasi dalam kalimat untuk memutuskan sntara dua label. Anda memerlukan beberapa jenis konteks, sepanjang batas dari: 'Saya harus mengundang di4 tapi kunjuogan bibi bisa mengganggu' . atau 'Saya harus mengunjungi di4 tapi kunjungan bibi bisa mengganggu'.
!.hkaa [emudian, program akan perlu mengambil beberapa inferensi untuk memilih label yang benar. Mengikuti dua pemakDaan NLP, ada dua,.pendekatan untuk pelabelan POS; bedasa*an aturatr dan stokastik.
Pelabel berdasa*an sturan akan mencoba unirk menerapkaa 39
Ndtddl Lane@se
P@si'E
NI-P)
(Bat' Fddar,@t)
beberapa pengetahuan linguistik untuk menyingkfukan rangkaian dari label yang secara sintaks tidak berar. Ini bisa clalam bentuk kontekshlal atuan scD€rti: Jiks tak diketahui istilah yang diawali oleh sebuah penentu dan diikuti de.ngan kata beniia, label kenudiao menjadi adjectiveBeberapa pelabel juga mengandalkan informasi morfologikal untuk m€Nnbantu ketidakmenduaan pros€s- Sebagai contob, Jika dwinalm/ketidaktahuan katr b€rakhir '-ing' dan diawali dengan kata kerja, maka label a verb. 3,3. Frase noun dao pengenal nama
Kita s€ring membutuhkan untuk mclihat bagian sebuang pelabelan dari pembicaraan Sebagai aontob, mari kita asumsikan bahwa kita ingin menbangun sist€m yang mengekstrak bisnis kabar. yang memrik . dati sutnb€r dokmen, d8n harus mengidentifikasi orang dan nana pcrusaluan dan hubungan bahwa kata yang merek& Mugtin b€rguna diberikan adalah kata benda nama diri ftata 'C€orye), ietapi pelabelan POS sendiri tidak membantu kita untuk mengenali no'na p€rtartta dan tenkhir dalatrt kalitnat (kats 'George Bush). Parsers noun &ase dapat metnbutu kita melakukan suatu tugqs. bissaoya sebagisn (atau dangk U) porsers, dadpada pars€rs lengkap (at8u dalam) yang kitajumpei di awal bagian ini. i potsing tqs}o, Sebagian alamal pars€rs qdalah ve$i sedeAana iliman' tujuan utama adatah unnrk nengi
untuk
[d
d
Itol.
i2 Nd
2, 15
As.xB
2009 :
28-g
Misalny4 banyak ftasa kata benda yang dimulai dengan penentu ( 'The', 'a', 'ini',) dan berakhir sebelum kata kerja yang umum ( 'is', 'are', has', 'have'). 3.4. Parsers du lzJababzsa Parsirg dilakukan sehubungan dengan suatu tata bahasa, pada dasamya sebuah set aturan yang berkata dengan kombinasi bagiair pembicaraan yang rnenghasilkan bentuk frase baik dan struktur kalimat. Dengan dcmikian: ' Tidak berwama hijau gagasan tidur dengan marah' mungkin secara sintaks dinitai bai( hingga Adjective + Adjective - norm pengenalan frase noun valid adalah Verb + adverb adalah pengenalan ftase verb valid, dan noun frase + verb frase bentuk kalimat yang valid. Dengair konhas, ' Gagasan tidur dengan marah tidak berwarna hijau '. akan dihakimi tidak grammatikal, karena tidak ada pola gramatikal adverb + ierb + noun + adjectivef adjective adverb + verb +.noun + noul + adjective adverb + noun + noun + adjectivel adjective advetb + noun + noun + noun + adjective adaiah disanksikan oleh atuan Bahasa Inggris. Analisis SEMANT.IK metibatkan irlentifikasi berbagai jenis kata atau frase, misaloy4 mengenal kata stau fras€ sebagai nam4 dan juga mengidentifikasi peran yang mereka mainkan dslatn kalimat, misalnya, baik subjek atau objek. Perbedaan jenis semantik memiliki fitur yurg berbed4 misahy4 kala atau frase kata benda dapat merujuk sesuatu unhrk aimasi atau inanimasi, untuk sebuah perusahaan, organisasi, tempat, yary tanggal, atau peran jumlah uang. Psran sematrtik nungkin berbeda
dari
siotaktic, misalnya, dalam dua kalirnat, 41
N.ttatal L@wuaee
P@$dIENLP)
(Bde1B
Fdkka@i)
'Pengadilan Federal menghakini Microsoft '. dan
4.
'Microsoft telah dibakimi oleh Peagadilan Federal'.
AplikasiNLP
Beberapa di antard berbagai kategori aplikasi NLP adslah sebagai bedkut:
4.1. Notnal langusge Ttsnsletor, yaittt transbtor dari satu bahasa alami ke
bahasa alami lainnya, misalnya tanslatot bahasa Inggris ke bahasa Indonesia" Bahasa lndonesia ke Bahasa Jawa dan sebagaiirya Translator bahasa alani bukan hanya kamus yang menerjemahkan kata pe! kat4 tetapi harus juga mentranstasikan sintaks dari bahasa asal ke ballasa tujuaDnya.
4,2.
Translator balvrsa dlami ke bahasa buatarq yutJ trdnslslor yang mengubah perintah-perinah dalam bahasa alami menjadi bahasa bwtln yang dapat dieksekusi oleh mesin atau komputer. Sebagai @tj',ot\ trqnslator yartg memungkinkan kita mgmberikan pedntah bahasa alami kepada
koEputer. Dengan sistem seperti ini, pengguna sistem dapat memberikan perintah dengm bahasa sehari-hari, misalny4 unnrk menlhapus semua file, pengguna cukup memberikan perintah 'tomputer, tolong hapus semua file!" Trqnslator akm meltranslasika! pcrintah'bahasa alami tersebut neqjadi pedntah bahasa formal yatrg dipahami oleh komputer, yaitu "dir r.+ ".
4.3.
Text Summatizatioa, yaihr suatu sisten yang dapat "membuat ringkasan" hal-hal yang peoting dari suatu wacana yang diberikan.
42
YoL 32 No- 2, I5 Agt s16 2009 :
C.
2614
I(ESIMPTJLAN
Natural Lsnguage Prccessing (NLP) atau Pemlos€san Alani @BA) merupakan salah satu tujuan jangka panja4 datl Attifciat Intelegence (kecerdasan buatan), )qitu p€mbuatan program yaog memiliki kemampuan untuk memahami bahasa Bahasa
manusia- Dalam dunia kecerdasan buatan pengolahan bahasa alami
merupakar aplikasi terbegar setelah sistem pakar. Inti dari perffosesan bahasa ilami adalah penguraian kalimat atau sering disebut dengan parser. Parser berfirngsi untuk membaca kalimat, kata demi kata dan menentukan jenis kata apa saja yang boleh mengikuti kata tersebut. Dalsm p€mahaman suatu bahasa ada bebenpa bidang yang harus disertakan yaitu morfologi, sintaksis, semantik, pragmatik, fonologi, dan pengeahuan te ang dunia sekitar. .
DAFTAR PUSTAKA
Chowdhury Gobinda
G. Natural Langudgs Processing
www.cis.strath.ac'.uk
Jaclcon Peter, Isabelle Moulinier. 1984' Naturql Ianguage Processing lor Online Applications: Text Retrieval, Extrqction and Cqlegorizstion John Benjamirs Publishing
'
Co. Amsterdam ' The Netherlands
Maming Clnistopher D. 1999. Foundations of Statisncal Naturql languoge Processing. The MIT Prcss Carnbridge, Massachusetts Londo!, England
Nirenburg Sergei, Victor Rasl{a' Ontologicql Semantics.
43
lhhatl
Rindnesch Thonas
C.
lans@Ee P,@sts9 @LP) (B4eB
Nqrural L@tgwge
Fdr@tdt
Prccessin&
http://slq-oln.nih.qov
. Slomeger Keanclb" 1995. Fonnal Prcgr@nning lenguqges. A
Plllish ing Conp y
44
$nrlc atd &nantics ol