PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KONSEP DAN IMPLEMENTASI PARSING DENGAN MENGGUNAKAN METODE BRUTE FORCE
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Sains (S.Si) Program Studi Matematika
Oleh: Vinsentia Asri Budiarti NIM : 003114035
PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SANATA DHARMA YOGYAKARTA 2006
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
HALAMAN PERSEMBAHAN
Kebanggaan terbesar adalah bukan tidak pernah gagal, tetapi bangkit kembali setiap kali kita jatuh. Kebanyakan dari kita tidak menyukai apa yang sudah kita miliki, tetapi kita selalu menyesali apa yang belum kita capai. Seorang pesimis melihat kesulitan dalam setiap kesempatan, seorang optimis melihat kesempatan dalam setiap kesulitan.
Kupersembahkan Karyaku ini Kepada: Yesus Kristus Sang Juru Slamatku, Kedua orangtuaku tercinta JB Tukidjo, Kakaku tersayang mas Bowo, Kekasihku dr Aloysius Sulistyanto, M.D.,
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, Juli 2006 Penulis
Vinsentia Asri Budiarti
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRAK Parsing dengan metode Brute Force adalah parsing yang memilih aturan produksi mulai dari paling kiri, dan melakukan expand semua non terminal pada aturan produksi sampai yang tertinggal adalah simbol terminal. Kemungkinan pertama string masukan sukses di-parsing, bisa juga bila terjadi expansi yang salah untuk suatu simbol variabel maka akan dilakukan backtrack. Algoritma ini membangun pohon parsing yang top down, yaitu mencoba segala kemungkinan untuk setiap simbol non terminal.
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRACT
The Brute Force Parsing method is a method which choosing left most symbol on a production rule and expanding all of non terminal symbol on it until only a terminal symbol left. The first possibility is input string parsed successfully, otherwise it will perform backtracking when expansion have an error. This algorithm create a top-down parse tree which will trying all possibilities for each non terminal symbol.
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KATA PENGANTAR
Allah mencipatakan manusia diberi akal dan pikiran. Dengan tidak meninggalkanNya kita mampu melewati segala rintangan dan kesulitan yang kita hadapi. Akan tetapi kita sering lupa bahwa kasih dan cintaNya senantiasa menyertai kita sepanjang hidup. Dan dengan campur tangan Allah semua dapat terselesaikan dengan mudah. Bunda Maria perawan suci yang telah mengajarkan kepada kita untuk tidak pernah berhenti memohon dalam kesulitan apapun yang kita hadapi, dengan perantaraanNya maka akan dikabulkanNya. Puji syukur penulis panjatkan kepadaMu Bapa di surga yang telah mengabulkan doa-doaku dengan perantaraan Bunda Maria, Ibu sejati dan Ratu surgawi. KepadaMu semua pengharapanku yang besar kucurahkan sehingga dapat menyelesaikan tugas dan tanggungjawabku selama ini dengan baik. Dalam menyusun skripsi ini penulis memperoleh banyak bantuan, petunjuk serta bimbingan yang sangat berharga dari berbagai pihak.. Oleh karena itu dengan ketulusan hati ijinkan penulis secara pribadi menyampaikan ucapan terima kasih sebesar-besarnya kepada: 1. Bpk Ir. Ig. Aris Dwiatmoko, M.Sc. selaku Dekan FMIPA Universitas Sanata Dharma, terima kasih atas saran dan motivasi yang diberikan kepada penulis. 2. Bpk Y.G. Hartono, S.Si., M.Sc. selaku Ketua Program Studi Matematika, terima kasih atas semangat yang diberikan kepada penulis hingga penulis dapat menyelesaikan skripsi ini. 3. Ibu M.V. Any Herawati, S.Si., M.Si. selaku Dosen Pembimbing Akademik, terima kasih atas saran dan motivasinya.
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4. Bpk Iwan Binanto, S.Si. selaku dosen pembimbing skripsi, terima kasih buanyak atas kesabaran, perhatian, motivasi dan kepercayaan yang diberikan kepada penulis hingga selesainya penulisan skripsi ini. Penulis tidak akan pernah melupakan semua bantuan, kesabaran, saran serta kebaikan bapak. 5. Terima kepada semua dosen pengajar serta staff FMIPA atas kerjasamanya selama ini kepada penulis. 6. Bapak dan ibu tercinta JB. Tukidjo, serta kakakku tersayang Mas Bowo, terima kasih atas kasih sayang, perhatian, semangat, kesabaran dan kebaikan yang diberikan kepada penulis. 7. Tak lupa ucapan terima kasih kepada calon suamiku, dr. Aloysius Sulistyanto, M.D., Akp, terima kasih buanyak atas kesabaran, kesetian, cinta, kasih sayang, motivasi, pengertian, ketulusannya hingga saat ini. Sekali lagi terima kasih telah membangkitkan semangat hidupku. 8. Sahabatku Tatik, terima kasih atas semangat yang diberikan, terima kasih juga atas pinjaman kamusnya. 9. Teman-teman kampus angkatan 2000: Tatik, Ayu, Bunga, Pras, Felix, Willy, Tony, Niza, Eros, Tildy, Sinta, Megi, Eros, Tika, Elin, Sunarto, Deny, Wiwid ndut, Dewi, Susi, Wiwid, Andy, Lia, Nety, Heri, Jeng-jeng, polo, Mira, Ferry, Wahyu, Heru. Terima aksih atas persahabatnnya selama ini. 10. Teman kostku Ana, terima kasih atas persahabatannya ini. 11. Mas Koko, terima kasih atas bantuannya.
ix
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12. Semua pihak yang secara langsung maupun tidak langsung yang turut membantu dalam penulisan skripsi ini, maaf tidak dapat disebutkan satu persatu.
Penulis menyadari bahwa skripsi ini masih jauh dari kata sempurna, oleh karena itu segala kritik dan saran yang bersifat membangun dari semua pihak akan penulis terima dengan senang hati. Akhir kata penulis mohon maaf atas segala kekurangan dan penulis berharap smoga skripsi ini dapat bermanfaat bagi kita semua.
Yogyakarta,
Juli 2006
Penulis
Vinsentia Asri Budiarti
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR ISI
HALAMAN JUDUL.............................................................................................. i HALAMAN PERSETUJUAN PEMBIMBING.................................................... ii HALAMAN PENGESAHAN............................................................................... iii HALAMAN PERSEMBAHAN............................................................................ iv PERNYATAAN KEASLIAN KARYA................................................................ v ABSTRAK............................................................................................................. vi ABSTRACT...........................................................................................................vii KATA PENGANTAR..........................................................................................viii DAFTAR ISI......................................................................................................... .xi BAB I PENDAHULUAN……..…………………………………………………1 A. Latar Belakang…………………………………………………………….1 B. Perumusan Masalah……………………………………………………….3 C. Pembatasan Masalah……………………………………………............... 3 D. Tujuan Penulisan………………………………………..…………………4 E. Manfaat Penulisan…………………………………………………………4 F. Metode Penulisan………………………………………………………….4 G. Sistematika Penulisan....…………………………………………..............4 BAB II DASAR TEORI…………………………………………………………...6 A. Finite State Automata……………………………………………………..6 A.1. Penerapan Finite State Automata…………………………………….6 A.2. Deterministic Finite State Automata………………………………....9
xi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
A.3. Non Deterministic Finite State Automata……………………..........12 B. Bahasa – bahasa Reguler………………………………………………...15 B.1. Bahasa-bahasa Reguler dan Ekspresi-ekspresi Reguler……………15 B.2. Aturan Produksi Bahasa Reguler…………………………………...18 C. Tata Bahasa Bebas Konteks……………………………………………..21 C.1. Bahasa – bahasa Bebas Konteks……………………………………21 C.2. Penyederhanaan Tata Bahasa Bebas Konteks……………………....24 D. Parsing…………………………………………………………………...33 D.1. Parsing Dengan Brute Force………………………………………..38 D.2. Ambiguitas………………………………………………………….39 E. Pointer Di Pascal…………………………………………………………43 E.1. Deklarasi Variabel Pointer………………………………………….45 E.2. Proses Variabel Pointer……………………………………………..49 BAB III PERANCANGAN DAN DIAGRAM ALUR PROGRAM PARSING..52 A. Perancangan Struktur Data……………………………………………….52 B. Diagram Alur Program Parsing…………………………………………..53 BAB IV PENUTUP………………………………………………………………63 A. Kesimpulan……………………………………………………………….63 B. Saran……………………………………………………………………...63 DAFTAR PUSTAKA ……………………………………………………………64 LAMPIRAN……………………………………………………………………...65
xii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I KONSEP DAN IMPLEMENTASI PARSING DENGAN MENGGUNAKAN METODE BRUTE FORCE
A. Latar Belakang Masalah Dalam bidang komputer dikenal sebuah bahasa yaitu bahasa otomata berhinggan (finite automata). Sebuah otomata berhingga menguraikan sebuah bahasa sebagai himpunan semua untai yang menggerakkan untai dari state awal ke salah satu state yang diterimanya (himpunan state akhir). Dalam skripsi ini digunakan tata bahasa reguler dan tata bahasa bebas konteks sebagai dasarnya. Bila pada tata bahasa reguler terdapat pembatasan pada ruas kanan atau hasil produksi maka pada tata bahasa bebas konteks tidak terdapat pambatasan hasil produksinya. Sebuah tata bahasa bebas konteks adalah suatu cara yang menunjukkan bagaimana menghasilkan untai-untai dalam sebuah bahasa. Tata bahasa bebas konteks telah banyak memberikan bantuan pada pemrograman dan perancangan parsing. Tata bahasa bebas konteks menjadi dasar dalam pembentukan suatui proses parsing. Penyederhanaan tata bahasa bebas konteks bertujuan untuk melakukan pembatasan posisi munculnya terminal-terminal dan variabel-variabel sehingga tidak menghasilkan pohon penurunan yang memiliki kerumitan yang tidak perlu atau aturan produksi yang tidak berarti. Dengan diturunkannya sebuah untai dari tata bahasa bebas konteks, simbol awal diganti oleh suatu untai. Setiap nonterminal dalam untai ini, secara bergantian digantikan oleh untai yang lain, dan seterusnya sampai tinggal tersisa
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 2
untai yang hanya terdiri dari simbol-simbol terminal. Selanjutnya tidak ada lagi penggantian karena tidak ada lagi nonterminal untuk digantikan. Kadang-kadang sangat berguna untuk menggambarkan penurunan itu, yaitu yang menunjukkan kontribusi dari masing-masing non terminal pada untai akhir dari terminalterminal. Gambar seperti ini dinamakan pohon penurunan atau pohon penguraian (derivation tree atau pharse tree). Metode parsing ada dua, pertama Top Down dan yang kedua Bottom Up. Top Down sendiri meliputi Backtrack: Brute Force dan No Backtrack: Recursive Descent Parser. Dalam skripsi ini penulis hanya membahas parsing dengan menggunakan metode Top Down Brute Force. Metode ini akan memilih aturan produksi mulai dari paling kiri dan melakukan expand semua non terminal pada aturan produksi sampai yang tertinggal adalah simbol terminal. Skripsi ini hanya membahas parsing dengan menggunakan metode Brute Force karena penulis merasa bahwa dasar teori untuk membahas parsing dengan metode Brute Force pernah penulis terima selama kuliah. Sedangkan parsing dengan metode Recursive Desent Parser dasar teori untuk membahasnya belum pernah penulis terima karena ini tentang compiler (dasar teorinya misal membahas analisis leksikal dan analisis semantik). Sehingga penulis memutuskan untuk menulis skripsi tentang parsing yang menggunakan metode Brute Force. Penulis juga membahas pointer di pascal. Karena pointer di pascal akan mendasari penulis dalam membuat program parsing-nya. Program parsing yang penulis buat menggunakan bahasa pemrograman turbo pascal. Pointer adalah alamat untuk item data. Pascal memungkinkan untuk membuat variabel yang akan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 3
menunjuk ke data dengan tipe khusus. Variabel pointer mengandung alamat dari data dalam memori
B. Perumusan Masalah Pokok permasalahan yang akan dibahas dalam tulisan ini dapat dirumuskan sebagai berikut: 1. Apa yang dimaksud dengan parsing dengan menggunakan metodeBrute Force itu? 2. Bagaimana mengimplementasikan parsing dengan menggunakan metode Brute Force?
C. Pembatasan Masalah Dalam pembahasan tentang parsing dalam konsep dan implementasinya penulis membatasi masalah hanya pada proses parsing dengan menggunakan metode Brute Force dengan aturan produksi tata bahasa sebagai berikut: S → Ba | Ab A → Sa | AAb | a B → Sb | BBa | b yang akan menurunkan untai-untai. Misal untai yang diturunkan: ‘bbaaaabb’, untai ‘ ab’, untai ‘ba’, untai ‘abba’ dan sebagainya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 4
D. Tujuan Penulisan Tujuan yang ingin dicapai adalah ingin lebih memahami dan mendalami tentang konsep parsing dengan metode Brute Force yang di implementasikan dalam bahasa pemrograman Turbo Pascal.
E. Manfaat Penulisan Manfaat yang diperoleh dari mempelajari topik ini adalah supaya semakin memahami dan mengerti tentang konsep parsing dengan metode Brute Force dan implementasinya dengan menggunakan bahasa pemrograman Turbo Pascal.
F. Metode Penulisan Metode yang digunakan penulis adalah studi pustaka yaitu dengan membaca dan mempelajari buku-buku yang berkaitan dengan bahan yang telah dipilih.
G.Sistematika Penulisan Pada bab I penulis pembahas tentang latar belakang masalah, rumusan masalah, pembatasan masalah, tujuan penulisan, manfaat penulisan, metode penulisan, sistematika penulisan. Pada bab II tentang dasar teori yang isinya membahas Finite State Automata meliputi penerapan finite state automata, deterministic finite state automata, non deterministic finite state automata, Bahasa-bahasa regular yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 5
meliputi bahasa-bahasa regular dan ekspresi-ekspresi regular, aturan produksi bahasa regular, Tata bahasa bebas kontrks yang meliputi bahasa-bahasa bebas konteks, penyederhanaan tata bahasa bebas konteks, Parsing meliputi parsing dengan metode brute force, ambiguitas, Pointer meliputi deklarasi variable pointer, proses variable pointer. Pada Bab III membahas tentang perancangan dan diagram alur program parsing yang berisi tentang perancangan dengan menggunakan struktur data, diagram alur program parsing. Pada Bab IV penutup yang berisi kesimpulan dan saran.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB II DASAR TEORI
A. Finite State Automata A.1 Penerapan Finite State Automata Finite State Automata / otomata berhingga state, selanjutnya disingkat dengan FSA, bukanlah mesin fisik tetapi suatu model matematika dari suatu sistem yang menerima input dan output diskrit. Finite State Automata merupakan mesin otomata dari bahasa reguler. Suatu finite state automata memiliki state yang banyaknya berhingga, dan dapat berpindah-pindah dari suatu state ke state yang lain. Perubahan state ini dinyatakan oleh fungsi transisi. Jenis otomata ini tidak memiliki tempat penyimpanan, sehingga kemampuan mengingatnya terbatas. Teori mengenai finite state automata adalah suatu tool yang berguna untuk merancang sistem. Contoh, pada pemeriksa pariti ganjil pengirim akan menambahkan bit paritas sehingga jumlah bit 1 adalah ganjil. Misal terdapat data: 0110 maka pengirim akan menambahkan bit 1, sehingga penerima akan memperoleh 01101 bila data: 0111 maka pengirim akan menambahkan bit 0, sehingga penerima akan memperoleh 01110 6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
bila suatu saat penerima memperoleh jumlah bit 1 yang genap, misal 10010 maka penerima akan memutuskan bahwa telah terjadi kesalahan dalam pengiriman. Bisa dibuat sebuah otomata yang akan memeriksa apakah suatu barisan input memiliki bit 1 dalam jumlah ganjil atau genap. Mesin ini akan mempunyai dua state, sebut saja sebagai state EVEN (genap) dan state ODD (ganjil). 0 EVEN
0 1
ODD
1 gambar 1.1 mesin otomata untuk pemeriksa pariti ganjil Pada finite state automata, arti dari bentuk-bentuk seperti yang ada pada gambar diatas adalah: •
Lingkaran menyatakan state/kedudukan
•
Label pada lingkaran adalah nama state tersebut
•
Bususr menyatakan transisi yaitu perpindahan kefudukan/state
•
Label pada bususr adalah simbol input
•
Lingkaran didahului sebuah bususr tanpa label menyatakan state awal
•
Lingkaran ganda menyatakan state akhir/final Gambar seperti diatas biasa disebut sebagai graph transisi atau diagram
keadaan (state). Pada gambar diatas state awalnya adalah EVEN. Karena mesin ini merupakan pemeriksa pariti ganjil, maka himpunan state akhir yang menyatakan input diterima adalah ODD. Simbol input yang ada {0,1}. Jika mesin mendapatkan input:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
1101 urutan state yang terjadi EVEN 1 ODD 1 EVEN 0 EVEN 1 ODD Berakhir dengan state ODD sehingga “1101” diterima oleh mesin Bila mesin mendapatkan input: 101 urutan state yang terjadi EVEN 1 ODD 0 ODD 1 EVEN Berakhir dengan state EVEN maka “101” ditolak oleh mesin. Meskipun pada contoh diatas state akhirnya hanya satu, pada umumnya bisa terdapat sejumlah state akhir. Istilah state akhir tidak berarti komputasi (disini berupa perpindahan/transisi) berhenti (halt) begitu state akhir tercapai. State akhir hanya menyatakan kedudukan-kedudukan tertentu sebagai kedudukan-kedudukan yang diterima. Secara formal finite state automata dinyatakan oleh 5 tupel atau M=(Q,Σ,δ,S,F), dimana: Q = himpunan state/kedudukan Σ = himpunan simbol input/masukan/abjad δ = fungsi transisi S = state awal/kesusukan awal, S ∈Q F = himpunan state akhir F adalah jumlah state akhir, jadi jumlah state akhir pada suatu finite state automata bisa lebih dari satu.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
Maka contoh diatas bisa dinyatakan sebagai berikut: Q = {ODD,EVEN} Σ = {0,1} S = EVEN F = {ODD} Finite state automata berdasarkan pada pendefinisian kemampuan berubah state-statenya bisa dikelompokkan ke dalam deterministik maupun non deterministik,. A.2 Deterministic Finite State Automata Pada otomata berhingga deterministik/ Deterministic Finite Automata, selanjutnya disebut dengan DFA, dari suatu state ada tepat satu state berikutnya untuk setiap simbol masukan yang diterima. Sebagai contoh, misal ada otomata seperti pada gambar berikut ini: a q0
a b
q1
b b
q2
a gambar 2.1 mesin DFA Konfigurasi Deterministic Finite State Automata di atas secara formal dinyatakan sebagai berikut: Q = {q0,q1,q2} Σ = {a,b} S = q0 F = {q2}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Fungsi transisi yang ada sebagai berikut: δ(q0,a) = q0 δ(q0,b) = q1 δ(q1,a) = q1 δ(q1,b) = q2 δ(q2,a) = q1 δ(q2,b) = q2 Biasanya fungsi-fungsi transisi ini disajikan dalam sebuah tabel transisi. Tabel transisi tersebut menunjukkan state-state berikutnya untuk kombinasi statestate dan input. Tabel transisi dari fungsi transisi diatas sebagai berikut:
δ
a
b
q0
q0
q1
q1
q1
q2
q2
q1
q2
Tabel 1.1 Pada tabel transisi Deterministic Finite Automata diatas, nampak bahwa sebuah state berikutnya yang unik untuk setiap pasangan state-input. Jadi untuk sebuah state dan input yang berlaku, bisa ditentukan tepat satu state berikutnya. Pada Deterministic Finite Automata, δ merupakan sebuah fungsi yang harus terdefinisi untuk semua pasangan state-input yang ada dalam Q X Σ. Sehingga apapun state saat itu atau inputnya, selalu terdapat satu dan hanya satu state
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
berikutnya. State berikutnya itu ditentukan oleh informasi yang ada di dalam pasangan state-input. Suatu string x dinyatakan diterima bila δ(S,x) berada pada state akhir. Biasanya secara formal dikatakan bila M adalah sebuah finite state automata, M=(Q, Σ, δ, S, F), menerima bahasa yang disebut L(M), yang merupakan himpunan {x ⏐δ(S,x) didalam F}. Misal pada contoh gambar 2.1 diberi input string ‘abb’ pada mesin tersebut. Maka : δ(q0,abb)= δ(q0,bb)= δ(q1,b)= q2 karena q2 termasuk state akhir, maka ‘abb’ berada dalam L(M) misal pada ontoh gambar 2.1 di beri input string ‘baba’ pada mesin tersebut, maka: δ(q0,baba)= δ(q1,aba) = δ(q1,ba)= δ(q1,a) = q1 karena q1 tidak termasuk state akhir, maka ‘baba’ tidak berada dalam L(M). Contoh lain, misal terdapat gambar mesin DFA sebagai berikut: a,b
q0
a q1
b
tabel transisi dari gambar 2.2 adalah : δ
a
b
q0
q1
q1
q1
q1
q0
Tabel 1.2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
Jadi dari suatu gambar/ diagram transisi dapat dibuat tabel transisinya. Sebaliknya dapat pula digambar diagram transisi suatu Deterministic Finite Automata bila diketahuai tabel transisinya. Contoh terdapat tabel transisi: δ
a
b
q0
q0
q1
q1
q0
q0
Tabel 1.3 Dengan S = q0 F = {q1} Maka diagram transisinya dapat dilihat pada gambar 2.3 berikut ini: a q0
b
q1
a,b gambar 2.3 A.3 Non Deterministic Finite State Automata Pada Non-deterministic Finite Automata (NFA) dari suatu state bisa terdapat 0,1, atau lebih busur keluar (transisi) berlabel simbol input yang sama. Non-deterministic Finite Automata didefinisikan pula dengan lima tupel M = (Q, Σ, δ, S, F), dengan arti yang serupa pada Deterministic Finite Automata. Perbedaannya terletak pada fungsi transisinya, dimana untuk setiap pasangan state-input, bisa memiliki nol atau lebih pilihan untuk state berikutnya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Contoh: a,b a,b
q0
q1
a gambar 2.4 mesin otomata NFA Dari gambar 2.4, dari state q0 terdapat dua busur keluar yang berlabel input ‘a’. Dari state q0 bila mendapat input ‘a’ bisa berpindah ke state q0 atau q1, yang secara formal dinyatakan: δ(q0,a)= {q0,q1} maka otomata ini disebut non-deterministik (tidak pasti arahnya). Tabel transisinya sebagai berikut: δ
a
b
q0
{q0,q1}
{q1}
q1
{q1}
{q1}
Tabel 2.1 Perlu diperhatikan bahwa cara penulisan state hasil transisi pada tabel transisi untuk Non-deterministic Finite State Automata digunakan kurung kurawal ‘{‘ dan ‘}’, karena hasil transisinya merupakan suatu himpunan state. Suatu string diterima oleh Non-Deterministic Finite Automata bila terdapat suatu urutan sehubungan dengan input string tersebut dari state awal menuju state akhir. Misalkan saja L(M) adalah bahasa yang diterima oleh Non-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
Deterministic Finite Automata pada gambar 2.4. Tentukan apakah string ‘ab’ termasuk dalam L(M)? Untuk Non-Deterministic Finite Automata harus mencoba semua kemungkinan yang ada sampai terdapat satu yang mencapai state akhir. Dalam contoh diatas, urutan transisi yang mencapai state akhir: δ(q0,ab) = δ(q1,b) = q1 Jadi untuk membuktikan suatu string diterima oleh Non-Deterministic Finite Automata tersebut dibuktikan dulu suatu urutan transisi yang menuju state akhir . Contoh lain, misal terdapat gambar 3.2 mesin NFA:
q0
b
a
q1 a
gambar 3.2 Terlihat tidak ada busur keluar dari state q1 untuk simbol input ‘b’ atau secara formal dinyatakan: δ(q1,b) = φ
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
tabel transisinya sebagai berikut: Tabel 2.2
δ
a
q0
{q1} {q0}
q1
{q0} φ
b
B. Tata Bahasa Reguler B.1. Bahasa-Bahasa Reguler dan Ekspresi-Ekspresi Reguler Sebuah bahasa dinyatakan regular jika terdapat finite state automata yang dapat menerima bahasa-bahasa. Finite state automata sendiri merupakan model matematika dari suatu sistem yang menerima input dan output diskrit dan juga merupakan mesin otomata dari bahasa reguler. Bahasa-bahasa yang diterima oleh suatu finite state automata bisa dinyatakan secara sederhana dengan ekspresi regular (Regular Ekspression). Ekspresi regular selanjutnya disebut sebagai ER, yang memberikan cara untuk mendefinisikan bahasa-bahasa. Ekspresi regular memberikan suatu pola untuk untai dari suatu bahasa. Semua untai yang cocok dengan sebuah pola tertentu, dan hanya untai-untai itu, yang menyusun bahasa regular tertentu. Demikian pula sebuah otomata berhingga mendefinisikan sebuah bahasa sebagai himpunan semua untai yang menggerakkan untai dari kedudukan awal ke salah satu dari kedudukan-kedudukan yang diterima Untuk sebuah abjad ∑ tertentu, bahasa-bahasa regular atas ∑ menarik dari segi teoritis karena membentuk koleksi terkecil dari bahasa-bahasa atas ∑ yang tertutup di bawah operasi-operasi perangkaian, penutup bintang dan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
gabungan bahasa dan memuat bahasa kosong Ø dan bahasa-bahasa singleton { a } untuk a Є ∑. Definisi 2.2.1 (Kelly, Dean. h 36) Misalkan ∑ merupakan sebuah abjad. Koleksi dari bahasa-bahasa regular atas ∑ didefinisikan sebagai berikut: a. Ø adalah sebuah bahasa regular. b. { ε } adalah sebuah bahasa regular. c. Untuk setiap a ∉ ∑, { a } adalah sebuah bahasa regular. d. Jika A dan B adalah bahasa-bahasa regular maka A ∪ B, A . B, dan A* adalah bahasa-bahasa regular. e. Tidak ada bahasa-bahasa lain atas ∑ yang regular. Artinya koleksi dari bahasa-bahasa regular atas ∑ terdiri dari bahasa kosong, semua bahasa singleton, termasuk { ε }, dan semua bahasa yang dibentuk oleh operasi-operasi bahasa perangkaian, gabungan, dan penutup bintang. Contoh: Misalkan ∑ = {a, b} maka yang berikut ini benar: Ø dan { ε } adalah bahasa-bahasa regular. { a } dan { b } adalah bahasa-bahasa regular. { a, b} adalah regular, yang merupakan gabungan dari { a } dan { b }. { ab } adalah reguler. { a, ab, b } adalah regular. { ai | i ≥ 0 } adalah regular. { ai bj | i ≥ 0 dan j ≥ 0} adalah regular.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
{ (ab)i | i ≥ 0 }adalah regular. Notasi dari ekspresi regular yaitu sebagai berikut: ‘*’, ‘+’, ‘+’, ‘∪’, ‘.’ •
* yaitu karakter asterisk, berarti bisa tidak muncul, bisa juga muncul berhingga kali (0-n)
•
+
•
+ atau ∪ berarti union
•
. (titik) berarti konkatenasi, biasanya titik bisa dihilangkan, misal: ab
( pada posisi superscript / di atas) berarti minimal muncul satu kali (1-n)
bermakna sama seperti a.b Telah disepakati bahwa urutan untuk operator-operator *, ∪ dan . adalah * pertama, . berikutnya dan ∪ yang terakhir. Contoh ekspresi regular ( selanjutnya disingkat sebagai ER): ER: ab*cc Contoh string yang dibangkitkan: abcc, abbcc, abbbcc, abbbbcc, acc ( b bisa tidak muncul atau muncul sejumlah berhingga kali ) ER: 010* Contoh string yang dibangkitkan: 01, 010, 0100, 01000 ( jumlah 0 di ujung bisa tidak muncul, bisa muncul berhingga kali ) ER: a + d Contoh string yang dibangkitkan: ad, aad, aaad ( a minimal muncul sekali ) ER: a * ∪ b * Contoh string yang dibangkitkan: a, b, aa, bb, aaa, bbb, aaaaa, bbbb
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
ER: ( a ∪ b ) Contoh string yang dibangkitkan: a, b ER: ( a ∪ b )* Contoh string yang dibangkitkan: a, b, ab, ba, abb, bba, aaaa, bbbb ( untai yang memuat a atau b) ER: 01 * 0 Contoh string yang dibangkitkan: 0, 01, 011, 0111, 01111 ( string yang berawalan dengan 0, dan selanjutnya boleh diikuti deretan1) B.2. Aturan Produksi Bahasa Reguler Sebuah otomata berhingga mendefinisikan sebuah bahasa sebagai himpunan semua untai yang menggerakkan dari state awal ke salah satu state yang diterima ( himpunan state akhir). Sebagai contoh, pandang otomata berhingga yang diterima oleh transisi dalam gambar dibawah ini. Q2
a
ε Q0
a
b
Q1 ε ε
b Q3
Q4 Q4 qq b
Otomata berhingga diatas menerima bahasa regular a(a* ∪ b*)b. Bilamana sebuah lintasan diambil dari kedudukan awal ke yang lain, “keluaran” simbol itu aa2b dengan menggerakkan dari kedudukan Q0 ke Q1 ke Q2 ke Q2 ke Q2 ke Q4.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
Untai yang dipakai dalam bahasa regular a(a* ∪ b*)b terdiri dari sebuah a yang diikuti oleh suatu “bagian akhir”. Misal E dianggap bagian akhir, secara simbolis observasi ini menyajikan S → aE. Anak panah (→) bisa dibaca seperti “dapat ” atau “terdiri dari”. Bagian akhir dari sebuah untai demikian terdiri dari satu dari dua susunan para a dan para b. Jadi bisa ditulis E → A dan E → B untuk menunjukkan kemungkinan ganda untuk E. Dua susunan dari para a dan para b bisa dinyatakan sebagai A → aA bersama dengan A → b untuk menunjukkan sebuah untai dari para a diikuti oleh sebuah b atau sebagai B → bB bersama dengan B → b, yang menunjukkan sebuah untai para b diikuti oleh b yang lain. Ekspresi-ekspresi tersebut dapat diringkas sebagai berikut: S → aE E→A E→B A→b A → aA B→b B → bB Ekspresi-ekspresi tersebut dapat dipandang sebagai aturan-aturan pengganti sewaktu membangkitkan untai-untai. Simbol di sebelah kiri anak panah bisa diganti oleh untai di sebelah kanan. Sebagai contoh, untai aab bisa dihasilkan melalui permulaan S, mengganti S dengan aE, mengganti E dengan aA, dan akhirnya A dengan b. Diperkenalkan simbol | yang di baca “atau”. Dengan menggunakan simbol ini, dua aturan E → A dan E → B dapat dikombinasikan sebagai E → A | B, demikiani
juga
aturan
yang
lain.
Koleksi
aturan
sebelumnya
untuk
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
membangkitkan untai-untai tadi kemungkinan bisa ditulis kembali sebagai berikut: 1. S → aE 2. E → A | B 3. A → aA | b 4. B → bB | b Untai a3b bisa dibangkitkan dari S dengan pertama kali menerapkan aturan 1 untuk mandapatkan aE, kemudian aturan 2 untuk mendapatkan aA, dan kemudian aturan 3 untuk mendapatkan aaA dan aaaA; akhirnya bagian kedua dari aturan 3 dapat diterapkan untuk mendapatkan aaab. Uraian dari proses pembangkitan ini dapat ditulis seperti berikut: S => aE => aA => aaA => aaaA => aaab Untuk anak panah ganda =>Dibaca sebagai “menurunkan”, “menghasilkan”, atau “membangkitkan”. Definisi (Kelly, Dean. h 81) Sebuah tata bahasa regular G didefinisikan dengan 4-tupel G = ( ∑, N, S, P), dimana: ∑ = sebuah abjad N = sebuah koleksi simbol nonterminal S = suatu nonterminal tertentu yang dinamakan simbol awal (start simbol) P = sebuah koleksi aturan-aturan pengganti, dinamakan produksiproduksi, yang berbentuk A → w, untuk A Є N dan w adalah suatu untai atas ∑ ∪ N yang memenuhi:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
1. w memuat paling banyak satu nonterminal 2. jika w memuat sebuah nonterminal, maka ia muncul sebagai simbol terkanan dari w. Bahasa yang dihasilkan oleh tata bahasa regular G dinotasikan L (G). Contoh: Sebuah tata bahasa regular G = ( ∑, N, S, P), untuk ∑ = { a, b } N = { S, A } P : S → bA A → aaA| b | ε L (G) memuat semua untai yang berbentuk ba2nb dan ba2n. yaitu L (G) = b (a2)*(b ∪ ε). C. Tata Bahasa Bebas Konteks C.1. Bahasa-Bahasa Bebas Konteks Definisi 3.3.1 ( Kelly, Dean. Otomata Dan Bahasa-Bahasa Formal. h.86) Sebuah tata bahasa bebas konteks atau Context-Free Grammer (CFG) adalah sebuah 4-tupel, G = ( N, ∑, S, P ) Untuk: N adalah sebuah koleksi berhingga dari nonterminal-nonterminal ∑ adalah sebuah abjad ( juga dikenal sebagai sebuah himpunan dari terminal-terminal ) S adalah sebuah nonterminal spesifik yang dinamakan simbol permulaan P adalah sebuah himpunan dari produksi-produksi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Bahasa yang dihasilkan oleh CFG G dinotasikan L ( G ) dan dinamakan bahasa bebas konteks ( Context-Free Language ) disingkat CFL. Karena suatu tata bahasa regular adalah sebuah CFG, didapatkan juga bahwa suatu tata bahasa regular adalah sebuah CFL. Seperti sebuah tata bahasa regular, sebuah CFG adalah sebuah cara yang menunjukkan bagaimana menghasilkan untai-untai dalam sebuah bahasa. Di CFG juga menggunakan notasi => untuk menunjukkan aksi dari generasi itu sebagai lawan pada →, yang merupakan bagian dari sebuah aturan produksi. Ketika menurunkan sebuah untai, nonterminal-nonterminal itu masih mewakili bagianbagian tak terturunkan dari untai itu. Dalam hal tata bahasa-tata bahasa regular, bagian tak terturunkan itu selalu terjadi pada salah satu ujung. Dalam CFG yang tidak merupakan tata bahasa-tata bahasa regular bisa terdapat lebih banyak dari satu bagian tak terturunkan dan bisa terjadi dimana saja dalam untai itu. Ketika penurunan itu telah lengkap, semua bagian tak terturunkan telah diganti oleh untai-untai ( mungkin kosong ) dari simbol-simbol terminal. Misal CFG yang ditentukan oleh: S → aSb | ε Terdapat bahasa-bahasa bebas konteks yang bukan bahasa-bahasa regular. Artinya koleksi bahasa-bahasa bebas konteks sepatutnya memuat koleksi bahasa-bahasa regular. Dalam generalisasi ke tata bahasa-tata bahasa bebas konteks, semua pembatasan pada ruas kanan dari aturan-aturan produksi dihapus, dengan mengizinkan ruas kanan dari produksi itu dibentuk dari suatu untai atas N ∪ ∑.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
Satu-satunya tempat yang tersisa untuk generalisasi pada ruas kiri dari aturanaturan produksi itu. Tata bahasa frasa-tersruktur ( phrase-structured grammer ) adalah salah satu tata bahasa yang ruas kiri aturan-aturan produksinya itu bisa dibentuk dari suatu untai tak kosong atas N ∪ ∑, yang memuat suatu nonterminal. Jadi untuk sebuah tata bahasa frasa-terstruktur, koleksi dari aturan-aturan produksi P memenuhi: P ⊆ ( N ∪ ∑ )* N ( N ∪ ∑ )* × ( N ∪ ∑ )* Tata bahasa-tata bahasa frasa tersruktur juga dikenal sebagai tata bahasatata bahasa tipe 0 atau tak dibatasi. Istilah bebas konteks, apabila diterapkan pada tata bahasa-tata bahasa mengingatkan akan adanya tata bahasa-tata bahasa yang terhadapnya konteks bersifat sensitif. Tata bahasa-tata bahasa konteks sensitif ( context-sensitive grammer ) adalah tata bahasa-tata bahasa frasa terstruktur yang disini dibatasi oleh produksi-produksi α → β sedemikian sehingga | α | → | β |. Terdapat sebuah bentuk normal untuk tata bahasa-tata bahasa ini yang setiap produksinya berbentuk α1Aα2 → α1βα2 dengan β ≠ ε. Produksi-produksi demikian mengizinkan penggantian nonterminal A dengan untai β hanya bila A terjadi dalam “konteks” dari α1 dan α2. Tata bahasa-tata bahasa konteks sensitif tidak dapat menurunkan bahasa yang sama banyak dengan tata bahasa-tata bahasa frasa terstruktur, tetapi tata bahasa-tata bahasa konteks sensitif mengizinkan terjadinya penurunan-penurunan didalam cara yang dapat diduga. Walaupun demikian, perhatikan bahwa karena | S | = 1 dan karena | ε | = 0, tidaklah mungkin untuk menurunkan untai kosong
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
dalam sebuah tata bahasa konteks sensitif yang benar. Bahasa-bahasa pemrograman sering kali dirancang agar konteks sensitif sebagai sebuah cara untuk menyederhanakan proses kompilasi. Contoh : Untuk tata bahasa bebas konteks yang ditentukan oleh S → AA A → AAA | a | bA | Ab Tata bahasa bebas konteks diatas dapat menurunkan untai b2aba2ba sebagai berikut: S => AA => AAAA => bAAAA => bbAAAA => bbaAAA => bbabAAA => bbabaAA => bbabaAbA => bbabaabA => bbabaaba => b2aba2ba. C.2. Penyederhanaan Tata Bahasa Bebas Konteks Penyederhanaan tata bahasa bebas konteks bertujuan untuk melakukan pembatasan sehingga tidak menghasilkan pohon penurunan yang memiliki kerumitan yang tidak perlu atau aturan produksi yang tidak berarti. Misalkan terdapat tata bahasa bebas konteks ( dengan simbol awal S ): S →
A
A →
B
B →
C
C →
D
D →
a|A
Tata bahasa bebas konteks tersebut memiliki kelemahan terlalu panjang jalannya padahal berujung pada S → a, produksi D → A juga menyebabkan kerumitan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
Suatu tata bahasa bebas konteks dapat disederhanakan dengan tiga cara sebagai berikut: 1. Penghilangan produksi useless ( tidak berguna ) 2. Penghilangan produksi unit 3. Penghilangan produksi ε. Selanjutnya akan dibahas satu persatu cara penyederhanaan tata bahasa bebas konteks tersebut. 1. Penghilangan Produksi Useless Produksi useless adalah: •
Produksi yang memuat simbol variabel yang tidak memiliki penurunan yang akan menghasilkan terminal-terminal seluruhnya ( maksudnya menuju terminal ), produksi ini tidak berguna karena bila diturunkan tidak akan pernah selesai ( masih ada simbol variabel yang tersisa ).
•
Produksi yang tidak akan pernah dicapai dengan penurunan apapun dari simbol awal, sehingga produksi itu redundan (berlebihan).
Contoh : 1. Terdapat tata bahasa bebas konteks: S →
aAb |
cEB
A →
dBE |
eeC
B →
ff
C →
ae
D →
h
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Dari tata bahasa bebas konteks diatas dapat diterangkan bahwa: 1). Aturan produksi S → cEB, A → dBE, E tidak memiliki penurunan 2). Aturan produksi B → ff , D → h, redundan maka dari tata bahasa bebas konteks diatas, produksi yang useless: S → cEB A → dBE B → ff D → h Jadi tata bahasa bebas konteks setelah disederhanakan menjadi: S →
aAb
A →
eeC
C →
ae
2. Terdapat tata bahasa bebas konteks: S → aBD B → cD | Ab D → ef A → Ed F → dc Dari tata bahasa bebas konteks diatas dapat diterangkan sebagai berikut: 1). Aturan produksi A → Ed, E tidak memiliki penurunan 2). Aturan produksi F → dc, redundan 3). Aturan produksi B → Ab, A tidak memiliki penurunan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
maka dari tata bahasa bebas konteks tersebut yang useless yaitu: B → Ab A → Ed F → dc Jadi aturan produksi untuk tata bahasa bebas konteks tersebut setelah disederhanakan menjadi: S → aBD B → cD D → ef Pada prinsipnya setiap kali melakukan penyederhanaan harus diperiksa lagi aturan produksi yang tersisa, apakah semua produksi yang useless sudah dihilangkan. 2. Penghilangan Produksi Unit Produksi unit adalah produksi dimana ruas kiri dan ruas kanan aturan produksinya hanya berupa satu simbol variabel, misalkan A → B, C → D. Keberadaan produksi unit membuat tata bahasa bebas konteks memiliki kerumitan yang tidak perlu atau menambah panjang penurunan. Penyederhanaan ini dilakukan dengan melakukan penggantian aturan produksi unit. Contoh: 1. Tata bahasa bebas konteks: S →
Cba | D
A →
bbC
B →
Sc | ddd
C →
eA | f | C
D →
E | SABC
E →
gh
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
Penggantian yang dilakukan dari tata bahasa bebas konteks diatas adalah: D →E menjadi D → gh C → C dihapus S → D menjadi S → gh | SABC Sehingga aturan produksi setelah penyederhanaan menjadi: S → Cba | gh | SABC A → bbC B → Sc | ddd C → eA | f D → gh | SABC E → gh 2. Tata bahasa bebas konteks: S →
A
S →
Aa
A →
B
B →
C
B → b C →
D
C →
ab
D →
b
Penggantian yang dilakukan dari tata bahasa bebas konteks diatas adalah: 1). C → D menjadi C →
b
2). B → C menjadi B → b | ab, karena B → b sudah ada maka cukup dituliskan B → ab 3). A → B menjadi A → ab | b 4). S → A menjadi S → ab | b sehingga aturan produksi setelah penyederhanaan menjadi:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
S → ab | b S →Aa A → ab | b B → ab B → b C →b C → ab D → b 3. Penghilangan Produksi ε. Produksi ε adalah produksi dalam bentuk α → ε atau bisa dianggap sebagai produksi kosong ( empty ). Penghilangan produksi ε dilakukan dengan melakukan penggantian produksi yang memuat variabel yang bisa menuju produksi ε, atau biasa disebut nullable. Prinsip penggantiannya bisa dilihat kasus berikut: S → bcAd A → ε Pada kasus diatas A nullable, serta A → ε satu-satunya produksi dari A, maka variabel A bisa ditiadakan. Hasil penyederhanaan tata bahasa bebas konteks menjadi: S → bcd Tetapi bila kasusnya: S → bcAd A → bd | ε Pada kasus diatas A nullable, tapi A → ε bukan satu-satunya produksi dari A, maka hasil penyederhanaannya menjadi:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
S → bcAd | bcd A → bd Contoh: 1. Terdapat tata bahasa bebas konteks: S → AB A → abB | aCa | ε B → bA | BB | ε C → ε Variabel yang nullable adalah A, B, C. Dari S → AB maka S juga nullable, maka dilakukan penggantian: A → aCa menjadi A → aa B → bA
menjadi B → bA | b
B → BB
menjadi B → BB | B
A → abB
menjadi A → abB | ab
S → AB
menjadi S → AB | A | B | ε
C → ε, B → ε, A → ε dihapus Perlu diperhatikan bahwa untuk penggantian S → AB disini tetap mempertahankan produksi S → ε, karena S merupakan simbol awal. Ini satusatunya perkecualian produksi ε yang dihasilkan oleh simbol awal. Jadi hasil akhir penyederhanaannya menjadi: S → AB | A | B | ε A → abB | ab | aa B → bA | b | BB | B 2. Tata bahasa bebas konteks: S → dA | Bd A →
bc
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
A →
ε
B →
c
Variabel yang nullable adalah A. A → ε bukan penurunan satu-satunya dari A (terdapat A → bc), maka S → dA diganti menjadi S → dA | d. A → ε dihapus. Tata bahasa bebas konteks setelah penyederhanaan menjadi: S → dA | d Bd A →
bc
B →
c
Pada prinsipnya ketiga penyederhanaan penghilangan useless, unit dan ε dilakukan bersama pada suatu tata bahasa bebas konteks, yang nantinya menyiapkan tata bahasa bebas konteks tersebut untuk diubah ke dalam suatu Bentuk Normal Chomsky . Bentuk Normal Chomsky tidak penulis bahas. Hal yang memerlukan perhatian dari tata bahasa bebas konteks adalah penghilangan suatu tipe produksi bisa menghasilkan produksi tipe yang lain, hal ini didasari kenyataan bahwa penghilangan produksi ε bisa menghasilkan produksi unit. Perhatikan juga bahwa penghilangan produksi unit tidak menghasilkan produksi ε, dan penghilangan produksi useless tidak menghasilkan produksi unit maupun ε. Maka semua produksi yang tidak diinginkan bisa dihapuskan dengan melakukan urutan sebagai berikut: •
Menghilangkan produksi ε
•
Menghilangkan produksi unit
•
Menghilangkan produksi useless
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
Hasil yang diperoleh nanti adalah tata bahasa yang sudah bebas dari ketiga jenis produksi tersebut. Contoh: 1. Tata bahasa bebas konteks:
•
S →
AA | C | bd
A→
Bb | ε
B→
AB | d
C→
de
Pertama-tama dilakukan penghilangan produksi ε, sehingga aturan produksinya menjadi :
•
S →
A | AA | C | bd
A→
Bb
B→
B | AB | d
C→
de
Selanjutnya penghilangan produksi unit, sehingga aturan produksinya menjadi:
•
S →
Bb | AA | de | bd
A→
Bb
B→
AB | d
C→
de
Penghilangan produksi useless, maka hasilnya menjadi: S →
Bb | AA | de | bd
A→
Bb
B→
AB | de
Jadi hasil akhir aturan produksi tidak lagi memiliki produksi ε, produksi unit maupun produksi useless.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
D. Parsing Dengan diturunkannya sebuah untai dari tata bahasa bebas konteks, simbol awal diganti oleh suatu untai. Setiap nonterminal dalam untai ini, secara bergantian digantikan oleh untai yang lain, dan seterusnya sampai tinggal tersisa untai yang hanya terdiri dari simbol-simbol terminal. Selanjutnya tidak ada lagi penggantian karena tidak ada lagi nonterminal untuk digantikan. Kadang-kadang sangat berguna untuk menggambarkan penurunan itu, yaitu yang menunjukkan kontribusi dari masing-masing nonterminal pada untai akhir dari terminalterminal. Gambar seperti ini dinamakan pohon penurunan atau pohon penguraian (derivation tree atau pharse tree). Sebuah pohon (tree) adalah suatu graph terhubung tidak sirkuler, yang memiliki satu simpul (node)/vertex disebut akar (root) dan dari situ memiliki lintasan ke setiap simpul. Pohon penurunan (derivation tree/pharse tree) berguna untuk menggambarkan bagaimana memperoleh suatu string (untai) dengan cara menurunkan simbol-simbol variabel menjadi simbol-simbol terminal. Setiap simbol variabel akan diturunkan menjadi terminal, sampai tidak ada simbol variabel yang belum tergantikan. Misal terdapat tata bahasa bebas konteks dengan aturan produksi (simbol awal S, selanjutnya didalam bahasan ini S digunakan sebagai simbol awal untuk tata bahasa bebas konteks): S → AA A → AAA | a | bA | Ab
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
Dari aturan produksi tata bahasa bebas konteks tersebut akan digambarkan pohon penurunan untuk memperoleh untai ‘bbabaaba’. Pada pohon tersebut simbol awal akan menjadi akar (root). Setiap kali penurunan dipilih aturan produksi yang menuju ke solusi. Simbol-simbol variabel akan menjadi simpul-simpul yang mempunyai anak. Simpul-simpul yang tidak mempunyai anak akan menjadi simbol terminal. Jadi gambar dari aturan produksi tersebut adalah: S A b
A A
b
A A
b
a
A A
a b
a
A A a
Proses penurunan atau parsing bisa dilakukan dengan cara : 1. Penurunan terkiri (leftmost derivation) : simbol variabel terkiri yang diperluas terlebih dulu. 2. Penurunan terkanan (rightmost derivation) : simbol variabel terkanan yang diperluas terlebih dulu. Misal terdapat tata bahasa bebas konteks: S → aAS | a A → SbA | ba Untuk memperoleh untai ‘aabbaa’ dari tata bahasa bebas konteks diatas (‘=>’ bisa dibaca ‘menurunkan’) :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
1. Dengan penurunan terkiri : S => aAS => aSbAS => aabAS => aabbaS => aabbaa 2. Dengan penurunan terkanan : S => aAS => aAa => aSbAa => aSbbaa => aabbaa Meskipun proses penurunannya berbeda akan tetapi memiliki pohon penurunan yang sama, yaitu sebagai berikut: S a
A
S
b
a
S A b
a a
Biasanya persoalan yang diberikan berkaitan dengan pohon penurunan adalah untuk mencari penurunan yang hasilnya menuju kepada suatu untai yang ditentukan. Dalam hal ini, perlu untuk melakukan percobaan pemililihan aturan produksi yang bisa menuju ke solusi. Misalkan sebuah tata bahasa bebas konteks memiliki aturan produksi sebagai berikut: S → aAd | aB A→b|c B → ccd | ddc Pohon penurunan dari tata bahasa bebas konteks diatas untuk memperoleh untai ‘accd’ bisa dilihat pada gambar berikut ini: S a
B c c d
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
Contoh: 1. Untuk tata bahasa bebas konteks berikut: S → Ba | Ab A → Sa | AAb | a B → Sb | BBa | b Dari tata bahasa bebas konteks tersebut diperoleh penurunan untai ‘bbaaaabb’ sebagai berikut:
S =>Ab => AAbb => SaAbb => BaaAbb =>BBaaaAbb => bBaaaAbb => bbaaaAbb => bbaaaabb Pohon penurunannya sebagai berikut:
S A A S B
b
A a
b a
a
B
B
b
b
a
2. Sebuah tata bahasa bebas konteks memiliki aturan produksi: S → aB | bA A → a | aS | bAA B → b | bS | aBB
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Pohon penurunan untuk memperoleh untai ‘aaabbabbba’ bisa dilihat pada gambar dibawah ini: S a
B a
B a
B
B b
B b
S
S
b
b a
B
A a
b Metode Parsing Di dalam mengimplementasikan sebuah metode parsing ke dalam program perlu diperhatikan tiga hal: 1. Rentang waktu eksekusi 2. Penanganan kesalahan 3. Penanganan kode Metode parsing bisa digolongkan sebagai berikut: 1. Top Down Kalau dilihat dari terminologi pohon penurunan, metode ini melakukan penelusuran dari root/puncak menuju ke leaf/daun (simbol awal sampai simbol terminal). Metode top down sendiri meliputi: 1.Backtrack/backup : Brute Force 2.No backtrack : Recursive Descent Parser
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
2. Bottom Up Metode ini melakukan penelusuran dari leaf/daun menuju ke root/puncak. Pada skripsi ini hanya dibahas parsing dengan metode Top Down Brute Force. D.1. Parsing Dengan Brute Force Metode ini memilih aturan produksi mulai dari paling kiri, dan melakukan expand semua non terminal pada aturan produksi sampai yang tertinggal adalah simbol terminal. Kemungkinan pertama string masukan sukses di-parsing, bisa juga bila terjadi expansi yang salah untuk suatu simbol variabel maka akan dilakukan backtrack. Algoritma ini membangun pohon parsing yang top down, yaitu mencoba segala kemungkinan untuk setiap simbol non terminal. Contoh suatu bahasa dengan aturan produksi sebagai berikut: S → aAd | aB A → b|c B → ccd | ddc
Misal ingin dilakukan parsing untuk string: ‘accd’. Tahapan yang terjadi bisa dilihat pada gambar berikut:
i)
S
ii)
S a
A
iii) d
S a
A b
d
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
iv)
S a
A
v) d
S a
vi) B
c
S a
B c
c
d
Terlihat pada penurunan iii) A → b, terjadi kegagalan, maka dilakukan backtrack dan penurunan iv) yang dilakukan adalah expansi A → c. karena terjadi kegagalan maka backtrack lagi, dan ‘naik’ ke atas sampai terjadi penurunan v) S → aB. Penurunan vi) B → ccd memberikan hasil akhir bahwa ‘accd’ diterima oleh bahasa tersebut. D.2. Ambiguitas Ambiguitas/mendua arti terjadi bila terdapat lebih dari satu pohon penurunan yang berbeda untuk memperoleh suatu untai. Keduaartian dapat menjadi sebuah masalah untuk bahasa-bahasa tertentu jika artinya bergantung dalam bagian pada struktur, seperti halnya dengan bahasa-bahasa asli dan pemrograman. Jika sebuah struktur bahasa mempunyai lebih dari satu dekomposisi dan jika kontruksi sebagian menentukan arti, maka arti itu adalah mendua arti. Sebagai contoh dari hal mendua arti yang mengaburkan arti yaitu pandang tata bahasa-tata bahasa untuk pernyataan-pernyataan penugasan sederhana berikut ini: A →
I := E
I →
a | b | c
E →
E+E | E*E(E) | I
Dalam tata bahasa diatas simbol-simbol terminal itu telah digaris bawahi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
Untai a := b + c * a adalah sebuah untai dalam bahasa dari pernyataanpernyataan penugasan ini. Ada dua pohon penurunan yang berbeda untuk tata bahasa tersebut, yaitu:
A I
A
:=
a
E
I
E +
E
:=
a
E E *
E
E
E
+ E
I
I
I
I
I
a
c
a
b
c
I
E
b
*
Jika dicoba untuk menentukan berapa nilai pada sebelah kanan dari operator penugasan itu (simbol :=) dihitung, akan terdapat dua hasil yang mungkin yaitu b + ( c * a ) atau ( b + c ) * a. Pada umumnya hasil-hasil ini tidaklah sama. Contoh: Terdapat tata bahasa bebas konteks: S →
SbS | ScS | a
Terdapat dua cara membangkitkan sebuah untai yaitu penurunan terkiri dan penurunan terkanan. Dalam sebuah penurunan terkiri (leftmost derivations) nonterminal terkiri yang selalu diperluas. Begitu juga dalam sebuah penurunan terkanan (rightmost derivations) nonterminal terkanan yang selalu diperluas. Jadi untuk tata bahasa bebas konteks diatas, penurunan terkiri untuk untai ‘abaca’ yaitu”
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
S => ScS => SbScS => abScS =>abacS => abaca Penurunan terkanan untuk untai ‘abaca’ sebagai berikut: S => ScS => Sca => SbSca => Sbaca => abaca Diketahui dua penurunan ini mempunyai pohon penurunan yang sama. S S S a
b
c S
S a
a
Dalam tata bahasa berikut ini yang juga menurunkan untai ‘abaca’ : S => SbS => abS => abScS => abacS => abaca dan S => SbS => SbScS => SbSca => Sbaca => abaca
Penurunan terkiri berbeda dari penurunan sebelumnya begitu juga dengan penurunan terkanan juga berbeda dengan penurunan sebelumnya. Kehadiran dari dua penurunan terkiri dan terkanan yang berbeda ada hubungannya dengan keberadaan dua pohon penurunan yang berbeda. Jadi sebuah tata bahasa yang mendua arti dapat dicirikan sebagai salah satu tata bahasa yang mempunyai dua atau lebih penurunan terkiri dan terkanan yang berbeda untuk untai yang sama.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Pohon penurunan yang satunya sebagai berikut: S S b
S
a
c
S
S
a
a
Contoh lain dari tata bahasa bebas konteks yang ambigu adalah: S →
aB | bA
A →
a | aS | bAA
B →
b | bS | aBB
Tata bahasa bebas konteks diatas dapat menurunkan untai ‘aabbaabb’, penurunannya sebagai berikut: S => aB => aaBB => aabB => aabbS => aabbaB => aabbaaBB => aabbaabB => aabbaabb S => aB => aaBB => aabSB => aabbAB => aabbaB => aabbaaBB =>aabbaabB => aabbaabb Pohon penurunannya: S a
S B
a
a
B B
B a
b b S
B b
a
B a
B S a B B
b A B
B
b
b
a
b b
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
Jadi untuk menunjukkan bahwa suatu tata bahasa bebas konteks ambigu, bias dilakukan dengan menemukan untai yang memungkinkan pembentukan lebih dari satu pohon penurunan. Ambiguitas dapat menimbulkan masalah pada bahasabahasa tertentu, baik bahasa alami maupun pada bahasa pemrograman. Bila suatu struktur bahasa memiliki lebih dari suatu dekomposisi (penurunan), dan susunannya akan menentukan arti, maka artinya menjadi ambigu.
E. Pointer Di Pascal Nama perubah, yang digunakan untuk mewakili suatu nilai data, sebenarnya merupakan atau menunjukkan suatu lokasi tertentu dalam pengingat komputer dimana data yang diwakili oleh nama perubah tersebut disimpan. Pada saat sebuah program dikompilasi, kompiler akan melihat pada bagian deklarasi perubah (var) untuk mengetahui nama-nama perubah apa saja yang akan digunakan, sekaligus mengalokasikan atau menyediakan tempat dalam pengingat untuk menyimpan nilai data tersebut. Perubah-perubah yang demikian ini dinamakan dengan perubah satatis. Dari pengertian diatas, bahwa sesudah suatu lokasi pengingat ditentukan untuk suatu nama perubah, maka dalam program tersebut perubah yang dimaksud akan tetap menempati lokasi yang telah ditentukan dan tidak mungkin diubah. Dengan melihat pada sifat-sifat perubah statis maka banyaknya data yang bias diolah adalah terbatas. Sebagai contoh, missal diketahui perubah dengan deklarasi sebagai berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
Var tabel : array [1..100,1..50] of integer;
Perubah tabel diatas hanya mampu untuk menyimpan data sebanyak 100X50 = 5000 buah data. Jika tetap nekat untuk menambah data pada perubah tersebut, eksekusi program akan terhenti karena deklarasi lariknya kurang. Jika ingin mengolah data yang banyaknya tidak bias dipastikan sebelumnya, maka pascal menyediakan satu fasilitas yang memungkinkan menggunakan suatu perubah yang disebut dengan perubah dinamis. Perubah dinamis adalah suatu perubah yang akan dialokasikan hanya pada saat diperlukan, yaitu setelah program dieksekusi. Dengan kata lain, pada saat program dikompilasi, lokasi untuk perubah tersebut belum ditentukan. Kompiler hanya akan mencatat bahwa suatu perubah akan diperlakukan sebagai perubah dinamis. Hal ini membawa keberuntungan pula, bahwa perubah-perubah dinamis tersebut bias dihapus pada saat program dieksekusi, sehingga ukuran pengingat akan selalu berubah. Hal inilah yang menyebabkan perubah dinamakan sebagai perubah dinamis. Karena alasan inilah perubah dinamis lebih dikenal dengan sebuatan pointer yang artinya menunjuk ke sesuatu. Dalam perubah dinamis, nilai data yang ditunjuk suatu pointer biasanya disebut sebagai simpul/node.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
E.1. Deklarasi Variabel Pointer Bentuk umum: Var
: <^TipeData>
Contoh: Var P : ^integer;
Pendeklarasian variabel pointer tidak jauh berbeda dengan pendeklarasian biasa, hanya perlu ditambahkan simbol topi (^) sebelum tipe datanya. Simbol topi tersebut menandakan bahwa variabel tersebut menunjuk ke lokasi tertentu pada memori. Dapat digambarkan variable P seperti ditunjukkan pada diagram berikut:
P Variabel pointer dapat pula dibuat yang tipe record. Pendeklarasiannya adalah seperti berikut: Bentuk Umum: Type = <^NamaRecord>; = Record : <TipeData1>; : <TipeData2>; ….. : <TipeDataN>; End; Var : ;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
Contoh: Type Str30 = String[30]; Point = ^Data; Data = record Nama : string[24]; Alm : string[30]; Pekerjaan: string[30]; End; Var P1,P2 : point; A,B,C : string[30];
Pada contoh diatas, P1 dan P2 masing-masing bertipe pointer, sedang A,B,C perubah statis bertipe string. Pada saat program dikompilasi, perubah P1 dan P2 akan menempati lokasi tertentu dalam pengingat. Kedua perubah ini masing-masing belum menunjuk ke suatu simpul. Pointer yang belum menunjuk ke suatu simpul nilainya dinyatakan dengan nil. Untuk mengalokasikan simpul dalam pengingat, statemen yang digunakan adalah statemen new, yang mempunyai bentuk umum: New (perubah);
Dengan perubah adalah nama perubah yang bertipe pointer. Sebagai contoh, dengan deklarasi perubah seperti diatas dan statemen: New(P1); New(P2);
Maka sekarang dipunyai dua buah simpul yang ditunjuk oleh P1 dan P2. P1 P2 Program ini kemudian menyerahkan nilai ke dua item data tersebut dalam sembarang cara dengan menggunakan referensi P1^ dan P2^. Sebagai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
contoh, pernyataan berikut akan menyerahkan nilai 2.0 ke item yang ditunjuk dengan P1 dan menambah 1 ke nilai tersebut, menyimpan hasilnya ke dalam item data yang ditunjuk dengan P2: P1^ := 2.0; P2^ := P1^ + 1.0;
Isi memori dapat digambarkan sebagai berikut: P1
2.0
P2
3.0
Variabel pointer dapatr digunakan sebagai argumen ke prosedur new. Variable pointer dapat dapat digunakan dalam pernyataan penugasan, disediakan dua variable yang mempunyai tipe sama. Asumsikan P1 dan P2 menunjuk ke item data, seperti ditunjukkan dalam contoh sebelumnya. Pernyataan tersebut: P2 := P1;
Akan menyebabkan P1 dan P2 menunjuk ke item data yang sama, seperti ditunjukkan: P1
2.0
P2
3.0
Maka isi dari P2 (yang berupa alamat) telah diganti dengan nilai (yang berupa alamat) yang dikandung dari P1. yang terjadi adalah item data yang sebelumnya ditunjuk dengan P2 masih ada, tetapi tidak ada cara untuk mengakses isi tersebut. Salah satu keistimewaan yang sangat berguna pada tipe data pointer adalah kemampuan untuk melekatkan pointer ke dalam record. Keistimewan ini akan sangat penting dalam menerapkan struktur data abstrak. Sebagai contoh,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
andaikata akan membuat dua record dengan cara seperti itu bahwa satu record menunjuk ke record berikutnya, seperti ditunjukkan dalam diagram berikut ini: pertama Salah satu cara untuk membuat nilai awal (inisialisasi) elemen dengan menggunakan: New(Pertama); Pertama^.Nama:= ’Ina’;
Pada saat ini keadaan bagian memori sebagai berikut: Pertama
Ina
?
Isi pada pertama^.nama sudah didefinisikan, tetapi isi pada pertama^.Berikut (bagian pointer pada record) belum didefinisikan pada tahap ini. Sekarang dapat membuat record lain untuk data berikut dengan menggunakan variable Temp: New(Temp); Temp^.Nama:=’Ira’;
Bagian memori sekarang menjadi Pertama
Ina
?
Ira
?
Temp Sekarang adalah melengkapi record yang mengandung ‘Ina’ dan record yang mengandung ‘Ira’. Isi dari pertama^berikut memerlukan penunjuk ke data yang ditunjuk dengan Temp. Dapat dibuat hubungan tersebut dengan sangat sederhana sebagai berikut: Pertama^.Berikut := temp;
Susunan memori tersebut sekarang menjadi : Pertama Temp
Ina
Ira
?
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
Sekarang dapat melengkapi struktur tersebut dengan menempatkan nil ke dalam bagian pointer (berikut) pada lemen terakhir; Temp^.berikut := nil;
Bagian memori tersebut pada saat ini ditunjukkan struktur yang telah komplit: Ina
Pertama
Ira
E.2. Proses Variabel Pointer Pada pembahasan diatas telah diterangkan bagaimana mendeklarasikan variabel
pointer
dan
bagaimana
menginisialisasikan
variabel
pointer
menggunakan prosedur new. Cara lain untuk menginisialisasikan variabel pointer adalah dengan menggunakan konstanta pointer yaitu nil. Jika variabel pointer diserahi nilai nil, ini berarti bahwa tidak menunjuk dimanapun juga, artinya pointer tidak menunjuk ke item data. Jika P merupakan variabel pointer, pernyataan P := nil;
Menyebabkan nilai P diset ke nil. Nilai nil untuk variabel pointer disimbolkan dalam memori dengan diagram sebagai berikut: P Hal yang penting untuk mengerti perbedaan antara variable pointer yang belum didefinisikan dan variabel pointer yang mempunyai nilai, isi dari variabel yang belum didefinisikan (sama dengan dideklarasikan tapi tidak ada nilainya sebelum diserahi suatu nilai ke variabel tersebut) tidak diketahui. Prosedur new membuat item data dan menetapkan nilai pada variabel pointer. Penyerahan nilai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
nil ke variabel pointer juga menetapkan nilai variabel pointer tersebut, tetapi tidak demikian jika tanpa mengalokasikan hubungan ke item data. Sebelumnya dikatakan bahwa memungkinkan untuk menggunakan memori kembali dalam head yang tidak diperlukan, ini dilakukan dengan menggunakan prosedur Dispose, yang membebaskan penunjuk item data dengan parameternya dan mengeset parameter ke nil. Bentuk prosedur Dispose: Dispose(variable_pointer);
Sebagai contoh, andaikan PtrP1 dan PtrP2 menunjuk item data real, seperti ditunjukkan: P1
2.0
P2
3.0
Setelah eksekusi pada prosedur dispose untuk PtrP1, seperti” Dispose (PtrP1);
Nilai PtrP1 akan mnjadi nil, dan ruangan yang telah dialokasikan untuk variable tersebut akan dikembalikan ke kelompoknya pada ruangan yang dapat digunakan dan dialokasikan kembali jika diperlukan. Pada penunjuk ini diagram memorinya sebagai berikut: P1 P2
3.0
Andaikata ingin mempunyai PtrP1 menunjuk ke item data yang sama dengan PtrP2 dan membebaskan penunjuk data dengan PtrP1. Hal pertama harus menggunakan prosedur dispose, seperti ditunjukkan segmen program berikut: Dispose (PtrP1); PtrP1 := PtrP2;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Setelah eksekusi prosedur dispose ini, memori akan kelihatan sebagai berikut: P1 P2
3.0
Kemudian, setelah eksekusi pada pernyataan penugasan tersebut memori akan tampak sebagai berikut: P1 P2
3.0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III PERANCANGAN DAN DIAGRAM ALUR PROGRAM PARSING
A. Perancangan Struktur Data Program parsing yang akan penulis buat menggunakan senarai berantai (linked list). Senarai berantai adalah kumpulan komponen yang disusun secara berurutan dengan bantuan pointer. Masing-masing komponen dinamakan dengan simpul (node). Dengan demikian setiap simpul dalam suatu senarai berantai terbagi menjadi dua bagian. Bagian pertama disebut medan informasi, yang berisi informasi yang akan disimpan dan diolah. Bagian kedua disebut medan penghubung (link field), yang berisi alamat simpul berikutnya. Penghubung dalam elemen terakhir selalu mempunyai nilai nil. Ini berguna sebab pada elemen tersebut tidak ada data yang melewati elemen ini, sehingga penghubung ini tidak menunjuk kemanapun. Gambar 3. 1 di bawah ini menunjukkan diagram skematis dari senarai berantai dengan 8 simpul. Setiap simpul digambar dalam dua bagian. Bagian kiri adalah medan informasi dan bagian kanan adalah medan penyambung, sehingga dalam diagram digambarkan sebagai anak panah. Medan penyambung sebenarnya adalah suatu pointer yang menunjuk ke simpul berikutnya, sehingga nilai dari medan adalah alamat suatu lokasi tertentu dalam pengingat. Dari gambar 3.1., pointer awal, yang bukan merupakan bagian dari senarai menunjuk ke simpul pertama dari senarai tersebut. Medan penyambung
52
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 53
(pointer) dari suatu simpul yang tidak menunjuk simpul lain disebut dengan pointer kosong, yang nilainya dinyatakan sebagai nil. Awal b
b
a
a
a
a
b
b
Medan penyambung dari simpul kedua Medan informasi dari simpul kedua Gambar 3. 1. Contoh senarai berantai dengan 8 simpul Nilai awal pada Temp adalah isi pada kepala. Pada saat nilai pada Temp tidak sama dengan nil, dapat menggunakan bagian data pada bagian ini (menggunakan Temp^.Data) dan kemudian diproses ke elemen berikutnya dengan mengganti Temp dengan nilai pada Temp^.berikut yaitu isi pada bagian penghubung pada elemen sekarang (elemen yang ditunjuk oleh pointer Temp). Teknik untuk menyimpan daftar dari data adalah menggunakan array. B. Diagram Alur Program Parsing Suatu program adalah sederetan perintah yang mengatur apa-apa yang harus dikerjakan komputer, untuk mendapatkan suatu hasil/keluaran yang di harapkan. Sebelum suatu program dibuat, alangkah baiknya kalau dibuat logika/ urut-urutan perintah program dalam suatu diagram yang disebut diagram alur. Suatu program komputer pada umumnya berisi 3 hal, yaitu: 1. Pembacaan/pemasukan data ke dalam komputer 2. Melakukan komputasi/perhitungan terhadap data tersebut 3. Mengeluarkan/mencetak hasil
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 54
Diagram alur untuk program parsing yang penulis buat adalah sebagai berikut: Ket: Nleft = simpul ekspresi terkiri SP = string yang dibentuk dari pohon SU = string yang diuji
Start
Inisialisasi aturan produksi dan ekspresi
Masukkan string
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 55
2
Buat simpul awal untuk ekspresi S Buat Nleft
SP = SU
ya
tidak ya
SP < SU tidak
Hapus simpul anak dari Nleft terakhir yang diexpand tidak
ya
Adakah aturan produksi untuk Nleft yang belum diuji
tidak Tidak valid
Selesai
Valid
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 56
Catatan : n = banyaknya string Simbol untuk menyatakan START ataupun BERHENTI KOTAK MASUKAN, untuk membaca data yang kemudian diberikan sebagai harga suatu variabel KOTAK PENUGASAN, untuk memberi harga kepada suatu variabel, atau untuk melakukan perhitungan matematika yang hasilnya di berikan sebagai harga suatu variabel KOTAK KEPUTUSAN, untuk memutuskan arah atau percabangan yang diambil sesuai dengan kondisi yang saat itu terjadi, BENAR atau SALAH
Simpul penghubung, untuk penghubung bila diagram alur terputus disebabkan oleh pergantian halaman (tidak cukup digambar satu halaman). Sebelum membuat program parsing yang lengkap, maka perlu dibuat algoritmanya terlebih dahulu. Algoritma cek ekspresi {digunakan untuk mengecek ekpresi apakah string yang dimasukkan sebuah ekspresi apa tidak } langkah 0 (Inisialisasi ekspresi dari aturan produksi) langkah 1 Tentukan: Isekspresi = false langkah 2 Test, apakah Iseksprei = nil ? jika ya, selesai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 57
langkah 3 Test, apakah token = ekspresi [i] ? jika ya, tentukan isekspresi = true dan selesai jika tidak, tent i = 0 ke intExpresicount – 1 do, kembali ke langkah 1 Algoritma diatas diimplimentasikan dalam fungsi IsExpression Algoritma cek node {digunakan untuk mendapatkan ekspresi node yang paling kiri} langkah 0 (Inisialisasi ekspresi node dari simbol non terminal) langkah 1 Tentukan: GetMostLeftExpressionNode = mostLeftNode langkah 2 Test, MostLeftNode = nil ? jika ya, MostleftNode = Node, selesai jika tidak, temp = Node^.Child langkah 3 Test, apakah MostLeftNode=GetMostLeftExpNode(Temp^.Node)? jika ya, selesai jika tidak, temp = temp^.next, kembali ke langkah 2 Algoritma diatas diimplimentasikan pada fungsi GetMostLeftExpressionNode Algoritma membuat ekspansi pohon Langkah 0 memberi nil pada ChildTree untuk i = panjang anak turun 1 dikerjakan Langkah 1 Menambah nama pertama ke node daftar Langkah 2 Membuat ruangan untuk node Langkah 3 Menambah nama untuk daftar Langkah 4 menyesuaikan pointer ke elemen terakhir pada daftar Program
membuat
ekspansi
pohon
disajikan
dalam
Procedure
ExpandTree, menambahkan nama pertama kali, harus membuat elemen,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 58
menempatkan nama dalam elemen tersebut dan memberi nilai awal pada bagian penghubung di elemen tersebut dengan nil. Sejak itu elemen tersebut merupakan elemen terakhir dalam Daftar. Prosedur yang diperlukan adalah: new(Node); Node^.token := Child[i]; Node^.child := nil;
Prosedur untuk menambah nama pada Daftar dibagi menjadi 3 bagian. Pertama ruangan dibuat untuk nama, yang meliputi menyimpan Node dalam lokasi dan memberi nilai ChildTree pada penghubung. Pointer Temp digunakan untuk membuat elemen tersebut seperti ditunjukkan berikut ini: new(Temp); Temp^.Node := Node; Temp^.Next := ChildTree;
Kemudian elemen baru ini ditambahkan ke Daftar dengan menyesuaikan pada elemen terakhir dalam Daftar: ChildTree := Temp;
Akhirnya pointer Root^.Child sehingga menunjuk pointer akhir menunjuk elemen baru. Root^.Child := ChildTree;
Algoritma untuk menelusuri linked list pada fungsi GetSentence: 1. Temp = Root^.child 2. while Temp <> nil do 3. Menggunakan data pada elemen yang ditunjuk dengan Temp 4. Temp = nilai pada penghuhung pada lemen sekarang 5. End while
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 59
Marilah menelusuri prosedur tersebut dengan Daftar ini. Diasumsikan Daftarnya sebagai berikut: A
B
C
Root^.child Awalnya, nilai pada Root^.child ditempatkan pada Temp, hasilnya sebagai berikut: A
B
C
Root^.child Temp Nilai pada temp tidak nil, sehingga isi elemen sekarang ini (yang ditunjuk Temp yaitu A). A
B
C
Root^.child Temp Sampai disini nilai awal Temp masih tidak nil, maka menggunakan isi elemen ini dan menyatakan nilai pada Temp untuk menunjuk ke elemen berikutnya: A
B
C
Root^.child Temp Lagi nilai Temp masih belum nil, sehingga data dalam elemen ini digunakan dan bagian penghubung pada elemen ini menjadi nilai baru pada Temp.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 60
A
B
C
Root^.child Temp Sekarang nilai pada Temp sudah nil, sehingga Daftar telah lengkap ditelusuri dan proses berhenti. Untuk membuat linked list pada program ini, pertama akan memasukkan nama dan diakhiri dengan ‘End’. Program akan membuat struktur linked list yang mengandung nama-nama yang dimasukkan tadi. Ketika semua program telah dimasukkan, program akan menulis/mencetak daftar tersebut dalam urutan sesuai dengan yang dimasukkan. Pada program ini akan memerlukan record yang mengandung Node dan penghubung (penunjuk) ke elemen berikutnya dalam daftar. Diperlukan juga record yang mengandung token dan child serta record yang mengandung input dan result. Dalam program ini memerlukan variabel pointer untuk ptrParseTree, variabel intExprCount, int RuleCount yang masing-masing bertipe integer, variabel strSentence yang bertipe string, variabel Expresion yang berupa larik (array) yang komponennya bertipe char dan banyaknya 255 buah dan variabel prRules yang berupa larik (array) yang bertipe ^TproductionRule dan banyaknya 255 buah (merupakan variabel yang digunakan untuk pengujian sentence). Tipe dan variabel yang diperlukan sebagai berikut:
Type TPtrList = ^TList; TPtrNode = ^TNode;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 61
TList = record Node : TPtrNode; Next : TPtrList; end;
TNode = record Token : string; Child : TPtrList; end; TProductionRule = record Input : string; Result : string; end; Var {variabel untuk menyimpan data grammar } intExprCount : Integer; Expression : array[0..255] of char; intRuleCount : Integer; prRules : array[0..255] of ^TProductionRule; {variabel yang digunakan untuk pengujian sentence } strSentence : string; ptrParserTree : TPtrNode;
Berikut ini adalah program untuk membuat program parsing yang menggunakan linked list yang dirutkan berdasarkan nama yang dimasukkan. Program berakhir ketika dimasukkan ‘End’. Program ini akan mencetak isi pada daftar setelah semua data telah dimasukkan. Algoritma dari program parsing yang dibuat penulis adalah sebagai berikut: 1. Melakukan expand ekspresi terkiri berdasarkan aturan produksi 2. Mengecek apakah string dari tree sama dengan string yang diuji 3. Kalau string dari tree lebih panjang dari string yang diuji, maka lakukan backtrack 4. Kalau string dari tree sama dengan string yang diuji, maka string yang diuji valid.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 62
5. Jika string dari tree kurang dari string yang diuji,maka kembali ke langkah 1 Banyak operasi yang diterapkan sebagai fungsi atau prosedur dalam program parsing ini. Program parsing secara lengkap dapat dilihat dalam listing program. Contoh kasus: Misal string yang akan diuji adalah string yang menurunkan untai ‘abba’, maka pertama kali yang dilakukan adalah melakukan expand ekspresi terkiri. S B
a
S S
b b
B
a
String yang dibentuk dari pohon untainya tidak sama dengan untai dari string yang diuji dan jumlah string dari pohon lebih besar dari string yang diuji maka dilakukan backtrack ke string S. S B S A
a b
b
a Jadi string yang dibentuk sama dengan string yang diuji maka valid.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 63
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB IV PENUTUP
A. Kesimpulan Parsing dengan metode Brute Force merupakan parsing yang memilih aturan produksi mulai dari yang paling kiri dan akan melakukan expand semua variabel pada aturan produksi sampai yang tertinggal adalah simbol terminal. Metode Brute Force ini, bila terjadi expand yang salah untuk suatu simbol variabel maka akan dilakukan backtrack, sehingga metode ini mempunyai kelemahan. Kelemahan dari metode Brute Force adalah: 1. Mencoba untuk semua aturan produksi yang ada sehingga menjadi lambat 2. Memakan banyak memori karena perlu mencatat lokasi backtrack Awalnya penulis merasa kesulitan dalam membuat program parsing ini. Setelah penulis membaca dan belajar lagi maka penulis merasa lebih memahami dan mendalaminya sehingga penulis dapat membuat program parsing dengan metode Brute Force yang diimplementasikan dengan bahasa pemrograman turbo pascal. B. Saran Dalam program parsing yang penulis buat ini, masih banyak mengalami kekurangan, karena penulis hanya membuat program parsing dengan satu aturan produksi saja. Maka penulis menyarankan kepada para pembaca agar dapat menyempurnakan program parsing ini dengan membuat program parsing yang dapat memasukkan beberapa aturan produksi, tidak hanya satu.
63
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR PUSTAKA
H.S., Suryadi dan Sumin, Agus. (1997) Pengantar Algoritma Dan Pemrograman Teknik Diagram Alur Dan Bahasa Basic Dasar. Jakarta: Gunadarma. Hasbi,M. (2003). Struktur Data dan Algoritma Dalam pemrograman Turbo Pascal. Yogyakarta: Gava Media Kelly,Dean. (1995). Automata and Formal Languages .Englewood Cliffs,NJ: Plentice-Hall. Kelly,Dean. (1999). Prenhallindo.
Otomata
dan
bahasa-Bahasa
Formal.
Jakarta:
Utdirartatmo,Firrar. (2001). Teori Bahasa dan Otomata. Yogyakarta: J&J Learning. Utdirartatmo,Firrar. (2001). Teknik Kompilasi. Yogyakarta: J&J Learning. Sanjaya, Dwi. (2001). Bertualang dengan Struktur Data di Planet Pascal. Yogyakarta: J&J Learning Santoso,P. Insap. (2004). Struktur Data Menggunakan Turbo Pascal 6.0. Yogyakarta: Andi Offset.
64
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN Listing Program
Program Parsing; type TPtrList = ^TList; TPtrNode = ^TNode; TList = record Node : TPtrNode; Next : TPtrList; end; TNode = record Token : string; Child : TPtrList; end; TProductionRule = record Expression : string; Result : string; end; var {variabel untuk intExprCount : Expression : intRuleCount : prRules :
menyimpan data grammar } Integer; array[0..255] of char; Integer; array[0..255] of ^TProductionRule;
procedure Initialize; {inisialisasi expresi dan aturan produksi yang ada } var i
: Integer;
begin intExprCount := 3; Expression[0] := 'S';{anggap sentence sebagai sebuah} Expression[1] := 'A';{expresi juga } Expression[2] := 'B'; intRuleCount := 8; for i := 0 to intRuleCount - 1 do new(prRules[i]); prRules[0]^.Expression := 'S'; prRules[0]^.Result := 'Ba'; prRules[1]^.Expression := 'S';
65
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 66
prRules[1]^.Result := 'Ab'; prRules[2]^.Expression := 'A'; prRules[2]^.Result := 'Sa'; prRules[3]^.Expression := 'A'; prRules[3]^.Result := 'AAb'; prRules[4]^.Expression := 'A'; prRules[4]^.Result := 'a'; prRules[5]^.Expression := 'B'; prRules[5]^.Result := 'Sb'; prRules[6]^.Expression := 'B'; prRules[6]^.Result := 'BBa'; prRules[7]^.Expression := 'B'; prRules[7]^.Result := 'b'; end;
procedure CleanUp; {Prosedur untuk menghapus aturan produksi dari memori} var i
: Integer;
begin for i := 0 to intRuleCount - 1 do Dispose(prRules[i]); end;
function IsExpression(Token : string) : boolean; {Fungsi untuk mengecek ekspresi apakah string yang dimasukkan sebuah ekspresi apa bukan} var i : Integer; begin IsExpression := false; for i := 0 to intExprCount - 1 do if Token = Expression[i] then begin IsExpression := true; Break; end; end;
function GetMostLeftExpressionNode(Node:TPtrNode): TPtrNode; {Fungsi untuk mendapatkan ekspresipling kiri} var Temp MostLeftNode
: TPtrList; : TPtrNode;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 67
begin MostLeftNode := nil; if IsExpression(Node^.Token) then begin if (Node^.Child = nil) then begin MostLeftNode := Node; end else begin Temp := Node^.Child; while (Temp <> nil) do begin MostLeftNode := GetMostLeftExpressionNode(Temp^.Node); if MostLeftNode <> nil then Break; Temp := Temp^.Next; end; end; end; GetMostLeftExpressionNode := MostLeftNode; end;
procedure ExpandTree(var Root : TPtrNode; Child : string); {Prosedur untuk membuat ekspansi pohon } var ChildTree Temp Node i
: : : :
TPtrList; TPtrList; TPtrNode; Integer;
begin ChildTree := nil; {gunakan downto biar tree yang terbentuk urut sesuai dengan sentence} for i := Length(Child) downto 1 do begin new(Node); Node^.token := Child[i]; Node^.child := nil; new(Temp); Temp^.Node := Node; Temp^.Next := ChildTree; ChildTree := Temp; end; Root^.Child := ChildTree; end; procedure DeleteChild(var Node : TPtrNode); {Prosedur untuk menghapus anak dari sebuah node yang dikirimkan sebagai parameter} var Child, Temp
: TPtrList;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 68
begin Child := Node^.Child; while Child <> nil do begin Temp := Child; if Temp^.Node <> nil then begin if Temp^.Node^.Child <> nil then DeleteChild(Temp^.Node); Dispose(Temp^.Node); end; Child := Child^.Next; end; Node^.Child := nil; end;
procedure DeleteNode(var Node : TPtrNode); {Prosedur untuk menghapus node dari simbol} begin if Node^.Child <> nil then DeleteChild(Node); Dispose(Node); end;
function GetSentence(Root : TPtrNode) : string; {Fungsi untukmengecek sentence} var Temp : TPtrList; Buffer : string; begin if Root = nil then begin GetSentence := ''; end else if Root^.Child = nil then begin GetSentence := Root^.Token; end else begin Buffer := ''; Temp := Root^.child; while (Temp <> nil) do begin if (Temp^.Node^.Child <> nil) then Buffer := Buffer + GetSentence(Temp^.Node) else Buffer := Buffer + Temp^.Node^.Token; Temp := Temp^.Next; end; GetSentence := Buffer; end; end;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 69
function DoValidate(Root:TPtrNode;Sentence:string): boolean; {Fungsi untuk mengecek bahwa string masukkan adalah valid} var strTemp i MostLeftExpr blnResult
: : : :
string; Integer; TPtrNode; boolean;
begin { jika sudah tidak ada expresi lagi test} blnResult := false; MostLeftExpr := GetMostLeftExpressionNode(Root); strTemp := GetSentence(Root); if MostLeftExpr = nil then begin if (Sentence = strTemp) then blnResult := true; end else begin for i := 0 to intRuleCount - 1 do begin if (prRules[i]^.Expression = MostLeftExpr^.Token) then begin ExpandTree(MostLeftExpr, prRules[i]^.Result); strTemp := GetSentence(Root); if (Length(strTemp) > Length(Sentence)) then DeleteChild(MostLeftExpr) else blnResult := DoValidate(Root, Sentence); end; if blnResult = true then break; end; end; DoValidate := blnResult; end;
function Validate(Sentence : string) : boolean; {Fungsi untuk memulai validasi} var Root i MostLeft
: TPtrNode; : Integer; : TPtrNode;
begin new(Root); Root^.Token := 'S'; Root^.Child := nil; Validate := DoValidate(Root, Sentence); DeleteNode(Root); {bebaskan memori yang dipakai oleh pohon penelusuran } end;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 70
var strSentence
: string;
begin { inisialisasi aturan produksi } Initialize; write('Masukkan string ?'); readln(strSentence); if Validate(strSentence) then begin writeln('String yang dimasukkan Valid ..'); end else begin writeln('String yang dimasukkan Tidak valid ..'); end; { dealokasikan aturan produksi } CleanUp; readln; end.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 71
Output Program
Masukkan string ?bbaaaabb String yang dimasukkan Valid .. Masukkan string ?ba String yang dimasukkan Valid .. Masukkan string ?bbaba String yang dimasukkan Tidak valid .. Masukkan string ?abba String yang dimasukkan Valid .. Masukkan string ?bbaaba String yang dimasukkan Valid .. Masukkan string ?abbaa String yang dimasukkan Tidak valid .. Masukkan string ?abbbaa String yang dimasukkan Valid .. Masukkan string ?babbabaa String yang dimasukkan Valid .. Masukkan string ?abab String yang dimasukkan Valid .. Masukkan string ?aabb String yang dimasukkan Valid .. Masukkan string ?ab String yang dimasukkan Valid .. Masukkan string ?bbaaab String yang dimasukkan Valid .. Masukkan string ?baaabb String yang dimasukkan Valid .. Masukkan string ?bbaaaaba String yang dimasukkan Tidak valid ..
Masukkan string ?baaababb String yang dimasukkan Valid .. Masukkan string ?bbaaaabb
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 72
String yang dimasukkan Valid .. Masukkan string ?baaaababb String yang dimasukkan Tidak valid .. Masukkan string ?baabbb String yang dimasukkan Tidak valid .. Masukkan string ?baaaaabb String yang dimasukkan Tidak valid .. Masukkan string ?bbbaaaab String yang dimasukkan Tidak valid .. Masukkan string ?aabbbbaa String yang dimasukkan Valid ..
Masukkan string : bbbaaabb String yang dimasukkan Tidak valid .. Masukkan string : bbaaaaab String yang dimasukkan Tidak valid .. Masukkan string : bbbbaabb String yang dimasukkan Tidak valid .. Masukkan string : bbaaabbb String yang dimasukkan Tidak valid .. Masukkan string : bbbbaabb String yang dimasukkan Tidak valid ..