PEMODELAN PEMROGRAMAN DINAMIS PADA MULTIPLE SEQUENCE ALIGNMENT UNTUK PERANCANGAN PRIMER SELULASE
M. BAHRUL ULUM
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2013
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul pemodelan pemrograman dinamis pada multiple sequence alignment untuk perancangan primer selulase adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2013
M.Bahrul Ulum NIM G651110111
*
Pelimpahan hak cipta atas karya tulis dari penelitian kerja sama dengan pihak luar IPB harus didasarkan pada perjanjian kerja sama yang terkait.
RINGKASAN M. BAHRUL ULUM. Pemodelan Pemrograman Dinamis Pada Multiple Sequence Alignment Untuk Perancangan Primer Selulase. Dibimbing oleh WISNU ANANTA KUSUMA dan JONI PRASETYO. Selulase mempunyai peranan utama dalam pemanfaatan limbah biomassa yang mengandung lignin, hemicellulose dan cellulose (lignocellulose). Limbah biomassa ini sangat banyak terdapat dilingkungan dan sampai saat ini masih belum dimanfaatkan secara maksimal. Selulase berperan menguraikan cellulose atau hemicellulose menjadi gula. Beberapa mikroorganisme mempunyai kemampuan untuk memproduksi selulase, terutama extracellular enzim selulase. Tetapi kebanyakan mikroorganisme dari alam memproduksi enzim selulase dengan jumlah terbatas (aktifitasnya rendah). Dalam rangka meningkatkan produktivitas mikroorganisme dalam menghasilkan selulase, salah satu metode yang bisa diterapkan adalah memasukan sekuens gen penghasil selulase ke dalam mikroorganisme tersebut. Data untuk menyusun sekuens gen tersebut bisa dilakukan dengan merangkum sekuens gen dari mikroorganisme penghasil selulase. Langkah pertama untuk memprediksi sekuens gen penyandi selulase tersebut adalah merancang primer sekuens gen penyandi selulase yang dirangkum dari beberapa mikroorganisme penghasil selulase. Tujuan penelitian ini adalah merancang potensial primer selulase dari sekuen DNA penyandi selulase yang akan dilakukan penyejajaran dengan teknik multiple sequence alignment menggunakan metode progresif. Metode penelitian ini terdiri atas beberapa tahapan proses yaitu pengambilan data, multiple sequence alignment dengan metode progresif dan perancangan primer. Data yang digunakan berupa gen penyandi selulase yang diambil dari GenBank NCBI (National Center for Biotechnology Information) Penelitian ini, kami melakukan pendekatan untuk mencari potensial primer yang berpotensi untuk meningkatkan produktivitas enzim selulase. Dalam perancangannya, digunakan metode multiple sequence alignment (MSA) yang menggunakan algoritme progressive alignment. Pada tahap penyejajaran, dari 5 sekuens penyandi selulase didapatkan adanya 3 daerah konservatif (conserved regions). Sedangkan template yang digunakan untuk merancang potensial primer yaitu sekuens Solanum lycopersicum NM-001247953 dari daerah yang memiliki similaritas yang tinggi (conserved region). Diperoleh 46 pasang primer dari 3 conserved region. Masing-masing dari conserved region ke-1 sebanyak 28 pasang primer, conserved region ke-2 sebanyak 13 pasang primer dan conserved region ke-3 sebanyak 5 pasang primer. Kata kunci: bioinformatika, selulase, multiple sequence alignment, perancangan primer
SUMMARY M. BAHRUL ULUM. Modeling of the Dynamic Programming Multiple Sequence Alignment for Design Primer Cellulase. Supervised by WISNU ANANTA KUSUMA and JONI PRASETYO. The role of cellulase is absolutely very important to degrade cellulose which is abundant in environment like biomass waste. Many microorganisms have capability to produce cellulase. In order to improve the cellulase production by the microorganism, one of methods can be done by inserting the sequence gene of cellulase. The information of the sequence gene can be extracted from microorganisms of cellulase producer. The first step to predict the sequence gene of cellulase, we should design the primer of the sequence gene by summarizing the information from many microorganism which are cellulase producer. The purpose of this study is the potential cellulase primers design from DNA sequence encoding cellulase alignment to be performed by multiple sequence alignment techniques using progressive methods. The procedure of this research in general divided into 3 parts, which are data preparation, multiple sequence alignment with progressive methods and primer design. The data used in the form of genes encoding cellulase retrieved from NCBI GenBank (National Center for Biotechnology Information). This study, our approach to search for potential primer to increase the productivity of cellulase enzymes. In its design, the method used multiple sequence alignment (MSA), which uses progressive alignment algorithm. In the alignment phase, from 5 obtained a cellulase coding sequences conserved region 3 (conserved regions). While the template that is used to design the primer sequences potentially Solanum lycopersicum NM-001247953 from areas that have a high similarity (conserved region). Retrieved 46 primer pairs from conserved region 3. Each of the conserved region-1 to as many as 28 pairs of primers, conserved region-2 to as many as 13 pairs of primers and the conserved region of the 3 by 5 primer pairs.
Keywords: bioinformatics, cellulase, multiple sequence alignment, primer design
© Hak Cipta Milik IPB, Tahun 2013 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB
PEMODELAN PEMROGRAMAN DINAMIS PADA MULTIPLE SEQUENCE ALIGNMENT UNTUK PERANCANGAN PRIMER SELULASE
M.BAHRUL ULUM
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Komputer pada Program Studi Ilmu Komputer
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2013
Penguji Luar Komisi pada Ujian Tesis : Dr Ir Agus Buono, MSi, MKom
Judul Tesis Nama NIM
: Pemode1an Pemrograman Dinamis pad a Multiple Sequence Alignment untuk Perancangan Primer Selulase : M.Bahrul Ulum : 0651110111
Disetujui oleh
Komisi Pembirnbing
Dr En
Dr Eng Joni Prasetyo, ST, MT Anggota
Diketahui oleh
Ketua Program Studi Ilrnu Komputer
Tanggal Ujian : 22 Agustus 2013
Dekan Sekolah Pascasarjana
Tanggal Lulus: j
0 SEP 2013
Judul Tesis Nama NIM
: Pemodelan Pemrograman Dinamis pada Multiple Sequence Alignment untuk Perancangan Primer Selulase : M.Bahrul Ulum : G651110111
Disetujui oleh Komisi Pembimbing
Dr Eng Wisnu Ananta Kusuma, ST, MT Ketua
Dr Eng Joni Prasetyo, ST, MT Anggota
Diketahui oleh
Ketua Program Studi Ilmu Komputer
Dekan Sekolah Pascasarjana
Dr Yani Nurhadryani, SSi, MT
Dr Ir Dahrul Syah, MSc. Agr
Tanggal Ujian : 22 Agustus 2013
Tanggal Lulus :
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2012 ini ialah bioinformatika, dengan judul Pemodelan Pemrograman Dinamis pada Multiple Sequence Alignment untuk Perancangan Primer Selulase. Terima kasih penulis ucapkan kepada Bapak Dr Eng. Wisnu Ananta Kusuma dan Bapak Dr Eng. Joni Prasetyo selaku pembimbing yang telah banyak memberikan saran dan dukungan. Kepada Bapak Dr Ir Agus Buono, MSi, MKom selaku penguji. Selain itu, penghargaan penulis sampaikan kepada semua dosen dan staf Departemen Ilmu Komputer IPB, dosen dan staf ISTA yang telah membantu selama proses penelitian. Kepada ayah, ibu, bungsu, serta seluruh keluarga atas segala doa dan kasih sayangnya. Ungkapan terima kasih juga disampaikan kepada guru-guru PP.Darut Tafsir atas segala doa dan dukungannya serta teman-teman seperjuangan Ilkom 13 khususnya Nona, Mba Dian, Kang Asril (Tim Bioinformatik) yang telah membantu selama proses penelitian. Semoga karya ilmiah ini bermanfaat.
Bogor, Agustus 2013
M. Bahrul Ulum
DAFTAR ISI
DAFTAR TABEL
iv
DAFTAR GAMBAR
iv
DAFTAR LAMPIRAN
iv
1 PENDAHULUAN Latar Belakang Rumusan Masalah Tujuan Penelitian Manfaat Penelitian Ruang Lingkup Penelitian
1 1 2 2 2 2
2 TINJAUAN PUSTAKA Deoxyribonucleic Acid (DNA) Sequence Alignment Multiple Sequence Alignment Selulase GenBank
3 3 3 4 5 5
3 METODE PENELITIAN
7
4 HASIL DAN PEMBAHASAN
12
5 SIMPULAN
22
DAFTAR PUSTAKA
23
LAMPIRAN
25
RIWAYAT HIDUP
49
DAFTAR TABEL 1 2 3 4 5 6 7
Matriks jarak Sekuens gen penyandi selulase Similarity scores Sekuens Conserved Region Primer dari region ke-1 Primer dari region ke-2 Primer dari region ke-3
9 12 13 18 21 21 19
DAFTAR GAMBAR 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Deoxyribonucleic Acid (DNA) Sequence alignment (a) Global alignment dan (b) Local alignment Multiple sequence alignment Website NCBI Prosedur penelitian Diagram alir algoritme progressive alignment Guide tree / Phylogenetic tree Hasil penyejajaran dengan metode progresif Proses algoritme progressive alignment (a) forward primer (b) reverse primer Tiga tahap progressive sequence alignment Pseudo-code algoritme Needleman-Wunsch Pseudo-code metode Neighbor-Joining Proses pembangunan sebuah pohon filogenetik (phylogenetic tree) menggunakan metode Neighbor-Joining Phylogenetic tree dari 5 gen penyandi selulase Pseudo-code progressive alignment Hasil multiple sequence alignment dari 5 gen penyandi selulase Waktu yang dibutuhkan oleh algoritme progressive alignment Hasil perancangan potensial primer dari sekuens conserved region ke-1 Hasil perancangan potensial primer dari sekuens conserved region ke-2 Hasil perancangan potensial primer dari sekuens conserved region ke-3
3 4 4 5 6 7 8 9 9 10 10 12 13 14 15 15 16 17 17 19 19 20
DAFTAR LAMPIRAN 1 2
Gen penyandi selulase Hasil multiple sequence alignment
25 29
1
1 PENDAHULUAN Latar Belakang Pemanfaatan selulase di Indonesia semakin meningkat, karena saat ini selulase digunakan untuk biokonversi bahan lignoselulosa menjadi sumber energi dari bahan baku yang terbarukan (Anindyawati 2009; Joshi et al. 2011). Selain itu selulase juga sangat berperan dalam berbagai industri, di antaranya industri dengan penggunaan selulase yang cukup besar seperti industri tekstil, pulp dan kertas, deterjen, farmasi, pertanian dan makanan (Kuhad et al. 2011; Mojsov 2012). Berbagai aplikasi dari selulase menjadikannya sangat potensial untuk diproduksi terutama di Indonesia. Umumnya selulase yang digunakan saat ini berasal impor. Selulase dapat diproduksi oleh kelompok bakteri, kapang maupun khamir. Mikroba yang umum digunakan adalah Trichoderma reesei (Sukumaran et al. 2005; Lee dan Koo 2001; Sim dan Oh 1993). Beberapa mikroorganisme mempunyai kemampuan untuk memproduksi selulase, terutama extracellular selulase. Tetapi kebanyakan mikroorganisme dari alam memproduksi enzim selulase dengan jumlah terbatas (aktifitasnya rendah). Dalam rangka meningkatkan produktivitas mikroorganisme dalam menghasilkan selulase, salah satu metode yang bisa diterapkan adalah memasukan sekuen gen penghasil selulase ke dalam mikroorganisme tersebut. Data untuk menyusun sekuen gen tersebut bisa dilakukan dengan merangkum sekuen gen dari mikroorganisme penghasil selulase. Langkah pertama untuk memprediksi sekuen gen penyandi selulase tersebut adalah merancang primer sekuen gen penyandi selulase yang dirangkum dari beberapa mikroorganisme penghasil selulase. Primer merupakan untai asam nukleat yang berfungsi sebagai titik awal untuk mensintesis DNA, yang diperlukan untuk mereplikasi DNA karena enzim-enzim yang mengkatalisis proses ini, yaitu DNA polimerase, hanya dapat menambahkan nukleotida yang baru ke rantai DNA yang ada. Perancangan primer dapat dilakukan berdasarkan sekuen DNA yang telah diketahui ataupun dari sekuen protein yang dituju. Apabila sekuen DNA maupun sekuen protein yang dituju belum diketahui maka perancangan primer dapat didasarkan pada hasil analisis homologi dari sekuen DNA atau protein yang telah diketahui mempunyai hubungan kekerabatan yang terdekat, salah satunya yaitu dengan menggunakan teknik multiple sequence alignment (Lakshmi et al. 2008). Penyejajaran sekuen nukleotida atau protein adalah proses dasar dalam biologi molekuler. biomolekul, seperti deoxyribonucleic acid (DNA), asam ribonukleat (RNA), dan sekuen protein. Multiple sequence alignment merupakan salah satu masalah yang paling mendasar pada bidang bioinformatika karena merupakan langkah awal untuk menganalisis sekuen biologis, pohon filogenetik, merancang aplikasi dalam pemodelan struktural, dan sekuen pencarian database (Kampke et al. 2001; Lakshmi et al. 2008 ). Penelitian terkait multiple sequence alignment masih terfokus pada sekuen protein (Edgar dan Batzoglou 2006). Multiple sequence alignment juga diterapkan pada studi in silico produksi hyaluronidase lintah (Hirudo medicinalis) secara rekayasa genetika (Djamil 2005) dan menggunakan multiple alignment dari sekuen DNA atau protein terkait untuk menemukan primer guna amplifikasi homolognya (Fredslund et al. 2005). Berbagai macam algoritme telah diteliti pada
2
penyejajaran beberapa sekuen (multiple sequence alignment). Algoritme ini secara umum diklasifikasikan ke dalam tiga kategori sesuai dengan properti mereka exact algorithms (Stoye 1997), progressive algorithms (Loytynoja dan Goldman 2005; Mount 2009) dan iterative algorithms (Lupyan et al. 2005). Salah satu dari ketiga algoritma penjajaran tersebut yang memiliki keunggulan besar dari segi kesederhanaan serta cukup sensitif adalah Progressive algorithms (Lakshmi et al. 2008). Progressive alignment algorithms merupakan algoritma pendekatan untuk menemukan sekuen secara global pada penjajaran beberapa sekuen (multiple sequence alignment). Pada penelitian ini, dilakukan penyejajaran sekuen DNA penyandi selulase dengan teknik multiple sequence alignment menggunakan metode progresif (progressive alignment algorithms) Selanjutnya, hasil dari penyejajaran tersebut akan dirancang untuk mendapatkan potensial primernya.
Perumusan Masalah Bagaimana melakukan penyejajaran sekuen DNA penyandi selulase dengan teknik multiple sequence alignment menggunakan metode progresif untuk merancang potensial primer selulase.
Tujuan Penelitian Tujuan penelitian ini adalah merancang potensial primer selulase dari sekuen DNA penyandi selulase yang akan dilakukan penyejajaran dengan teknik multiple sequence alignment menggunakan metode progresif.
Manfaat Penelitian Adapun manfaat dari penelitian yang dilakukan, yaitu untuk mendapatkan potensial primer selulase yang dapat meningkatkan produktifitas enzim selulase.
Ruang Lingkup Penelitian Ruang lingkup penelitian ini adalah merancang potensial primer selulase dari sekuen DNA yang akan dilakukan penyejajaran dengan teknik multiple sequence alignment. Metode yang digunakan adalah metode progresif (progressive alignment algorithms).
3
2 TINJAUAN PUSTAKA Deoxyribonucleic Acid (DNA) Asam deoksiribonukleat (deoxyribonucleic acid) atau biasa disebut DNA, adalah biomolekul yang berupa asam nukleat yang terdapat dalam inti sel atau nucleus, berfungsi untuk menyimpan informasi genetik pada suatu organisme (Jones dan Pevzner 2004). DNA berbentuk untai ganda (double helix) yang disatukan oleh ikatan hidrogen antara basa-basa di dalam kedua untai tersebut. Basa-basa tersebut adalah adenin (A), sitosin (C), guanin (G), dan timin (T). Adenin berikatan dengan timin, dan sitosin berikatan dengan guanin. DNA dapat melakukan replikasi DNA, di mana ketika replikasi DNA ini dilakukan, terbentuklah DNA baru yang memiliki informasi genetik yang serupa dengan induknya.
Sumber : IPA Educational Material Archive (http://www2.edu.ipa.go.jp/gz/)
Gambar 1 Deoxyribonucleic Acid (DNA) Sequence Alignment Sequence alignment adalah metode yang digunakan untuk mencari kesamaan dan perbedaan pada tingkat pasangan basa maupun asam amino dengan memperhitungkan hubungan evolusi, fungsi serta struktur gen (Baxevanis dan Ouellete 2001). Sequence alignment juga dapat dikatakan sebagai suatu metode penyusunan penataan kembali dua atau lebih sekuen DNA ataupun asam amino sehingga didapatkan daerah skuens yang sama sekuennya relatif antara satu dengan lainnya dengan menggunakan program algoritme tertentu dibantu dengan komputer. Metode ini digunakan untuk mencari similarity dan homology antar sekuen nukleotida atau asam amino. Similarity adalah tingkat kesamaan antara satu sekuen dengan sekuen yang lain, sedangkan homology adalah menunjukan hubungan evolusi antara dua sekuen atau lebih (Baxevanis dan Ouellete 2001).
4
Gambar 2 Sequence alignment Ada beberapa tipe alligment, berdasarkan pada posisi, yaitu local alignment dan global alignement. Sedangkan menurut banyaknya sekuen, dibbagi dalam pairwise alignment dan muultiple alignment. Global alignment dapat diiasumsikan bahwa pada sekuen baik pada p awal dan akhir sekuen terletak pada tem mpat yang sama, dengan relatif sedikkit perbedaan yang nyata. Local alignment merupakan m daerah lokal yang kecil darri sekuen spesifik dengan tingkat kesamaan yang y tinggi. Pairwise alignment adalahh membandingkan antara dua sekuen, dann multiple alignment adalah membanddingkan lebih dari dua sekuen (Baxevanis daan Ouellete 2001). (a)
(b)
Gambar 3 (a) Global alignment dan (b) Local alignment
M Multiple Sequence Alignment Multiple sequence allignment merupakan perluasan dari pairwise alignment yang menjajarkan beberapaa sekuen terkait untuk mendapatkan pencocokkan sekuen yang optimal. Ada khusus keuntungan dari Multiple sequence alignment karena
5
dapat menunjukkan informasi biologis lebih lanjut dari sepasang bijaksana keselarasan (pairwise alignment). Misalnya, memungkinkan identifikasi pola sekuen yang dijajarkan dan motif di seluruh keluarga sekuen. Multiple sequence alignment juga merupakan prasyarat untuk melaksanakan analisis filogenetik sekuen keluarga untuk mengetahui asal hubungan evolusioner yang ada, dapat diketahui juga adanya kesamaan homologi antar sekuen, dan mutasi yang dapat dilihat sebagai adanya perbedaan huruf pada satu kolom, dan adanya insertion atau deletion yang terlihat sebagai gap pada satu atau lebih sekuen pada penjajaran dan memprediksi protein sekunder dan struktur tersier. Multiple sequence alignment juga telah diaplikasikan dalam merancang degenerasi polymerase chain reaction (PCR) primer berdasarkan pada beberapa sekuen terkait (Lakshmi et al. 2008 ).
Gambar 4 Multiple sequence alignment
Selulase Selulase adalah enzim terinduksi yang disintesis oleh mikroorganisme selama ditumbuhkan dalam medium selulosa (Lee dan Koo 2001). Selulase juga dapat diartikan sebagai nama bagi semua enzim yang memutuskan ikatan glikosidik beta-1,4 di dalam selulosa, sedodekstrin, selobiosa, dan turunan selulosa lainnya. Enzim selulase terdiri dari tiga komponen yaitu endo-1,4-β-Dglukanase, ekso-1,4-β-D- glukanase dan 1,4-β-D-glukosidase yang dapat dihasilkan oleh berbagai macam mikroorganisme. Selulase tidak dimiliki oleh manusia, karena itu manusia tidak dapat menguraikan selulosa. Tetapi hal ini dapat dilakukan oleh beberapa hewan seperti kambing, sapi, dan insekta seperti rayap karena dalam sistem pencernaannya mengandung bakteri dan protozoa yang menghasilkan enzim selulase yang akan menghidrolisis (mengurai) ikatan glikosidik beta-1,4. Oleh karena reaksi yang ditimbulkan oleh selulase saat mengurai selulosa adalah hidrolisis, maka selulase diklasifikasikan ke dalam jenis enzim hidrolase. Ikatan glikosidik adalah ikatan kovalen yang terbentuk antara dua monosakarida melalui reaksi dehidrasi atau penghilangan gugus air. Ikatan antar glukosa ini dinamakan glikosidik beta-1,4 karena konfigurasi glukosa dalam selulosa semuanya berbentuk beta, yakni ketika glukosa membentuk cincin, gugus hidroksil yang terikat dengan karbon nomor 1 akan terkunci di bagian atas sumbu cincin, sedangkan angka “-1,4” diperoleh dari atom karbon yang menghubungkan antar unit glukosa monosakarida terletak pada atom karbon nomor 1 dan nomor 4. GenBank GenBank merupakan suatu institusi pencatat dan pengelola sekuen DNA dan ekspresi asam aminonya. Sekuen DNA dicatat dan dikumpulkan dari berbagai
6
penemuan yang dengan sukarela memberikan hasil temuannya baik belum atau telah dipublikasikan (Baxevanis dan Ouellete 2001). Terdapat tiga kelompok besar GenBank di dunia yang menjadi acuan dalam pencarian gen, yaitu National Center for Biotechnology Information (NCBI) (http://www.ncbi.nlm.nih.gov/) di Amerika serikat. DNA Data Bank of Japan (DDBJ) (http://www.ddbj.nig.ac.jp) di Jepang dan European Bioinformatics Institut (EBI) (http://www.ebi.ac.uk) di Inggris.
Gambar 5 Website NCBI
7
3 METODE PENELITIAN Metode penelitian terdiri dari beberapa tahapan, yaitu pengambilan data penelitian, multiple sequence alignment dengan metode progresif dan perancangan primer. Alur penelitian dapat dilihat pada gambar 6. mulai Pengambilan data Multiple sequence alignment dengan metode progresif Conserved Region Perancangan Primer Potensial Primer
selesai
Gambar 6 Prosedur penelitian
PENGAMBILAN DATA Data yang digunakan untuk penelitian ini adalah diambil dari GenBank NCBI (National Center for Biotechnology Information). MULTIPLE SEQUENCE ALIGNMENT Pada tahap ini dilakukan penyejajaran data DNA dengan metode progresif, tujuannya untuk mendapatkan organisme dan daerah yang memiliki tingkat similaritas yang tinggi (conserved region). Penyejajaran dengan metode progresif dilakukan dalam tiga tahap, yaitu pairwise alignment, pengelompokan sekuen dan progressive alignment. Metode ini merupakan algoritma pendekatan untuk menemukan sekuen secara global pada penyejajaran beberapa sekuen (Gusfield 1997; Sung 2009).
8
Gambar 7 Diagram alir algoritme progressive sequence alignment 1. Pairwise alignment Proses yang pertama pada penyejajaran progressive sequence alignment adalah membandingkan antara dua sekuen (Pairwise alignment) menggunakan algoritma Needleman-Wunsch. Algoritma needleman & wunsch merupakan metode untuk pencarian sekuen optimal secara global dari 2 sekuen. Algoritma ini terdiri dari memanipulasi matriks, bernama , . Matriks ini pertama kali dibangun dengan cara yang biasa, kolom 0 dan 0 baris, ini dipenuhi sebagai berikut (Gautham, 2006) : ,0 0,
,
1,
,
1,
(1)
Dengan m dan n adalah panjang dari dua sekuen masing-masing dengan kompleksitas waktu komputasi sebesar O (mn). Berikutnya mengatasi selsel lainnya dimulai dari pojok kiri atas dari matriks (yaitu sel ( 1, 1)) dan bergerak ke arah sudut kanan bawah (sel ( , ), mengisi kotak rekursif menurut aturan berikut: F i-1,j-1 + S(Xi , Yj ) F i,j =Max 1, , 1
(2)
dengan , adalah skor match / mismatch, w adalah gap penalty konstan ( 0), dan , adalah akumulasi nilai sampai , . Dalam contoh menghitung nilai Matrix (1,1). F (1,1) = Max{F (0,0) -1, F(0,1) -2, F(1,0) -2} = Max{-1,-4,-4} = -1
9
Demikian pula, untuk menghitung nilai seluruh matriks. Tabel 1 Matriks jarak ‐ ‐ 0 G ‐2 T ‐4 G ‐6 T ‐8 C ‐10
A ‐2 ‐1 ‐3 ‐5 ‐7 ‐9
T ‐4 ‐3 0 ‐2 ‐4 ‐6
G ‐6 ‐3 ‐2 1 ‐1 ‐3
T T C ‐8 ‐10 ‐12 ‐5 ‐7 ‐9 ‐2 ‐4 ‐6 ‐1 ‐3 ‐5 2 0 ‐2 0 1 1
2. Pengelompokan sekuen Proses berikutnya dalam algoritme progressive sequence alignment adalah mengelompokan sekuen berdasarkan similarity score yang dihasilkan dari proses pairwise aligment.
Gambar 8 Guide tree / Phylogenetic tree 3. Progressive alignment Langkah terakhir adalah secara progresif menyejajaran dua sekuen yang paling mirip terlebih dahulu, mengikuti sesuai dengan perintah yang diberikan oleh guide tree. SD,E = alignment (SD, SE) SA,B = alignment (SA, SB) SA,B,C = alignment ((SA, SB), SC) SA,B,C,D,E = alignment ((SD, SE) ,(SA, SB, SC))
Gambar 9 Hasil penyejajaran dengan metode progresif
10
Seq1 A G G A Seq2 A T G C G T Seq3 A T G C G A
Gambar 10 Prosees algoritme progressive sequence alignmentt Perancangan Primer Perancangan primerr merupakan faktor penting dalam keeberhasilan melakukan amplifikasi geen dengan memperhitungkan pemilihan yang y layak berdasarkan hasil alignmeent dari kedekatan sekuen yang diinginkaan dengan conserved region yang tinnggi (Abd-Elsalam 2003). Primer adalah untai u asam nukleat yang berfungsi sebbagai titik awal untuk sintesis DNA. Primer juga j dapat diartikan sebagai 'oligonucleotide' atau rangkaian pendek DNA atau RNA R yang digunakan untuk menginissiasi (memulai) duplikasi DNA (Djamil 20005). Primer yang digunakan dalam ampplifikasi umumnya terdiri dari dua jenis, yakkni forward dan reverse. Forward prim mer bergerak dengan arah 5′ –> 3′ untai DNA A template, sementara reverse primer bergerak dengan arah 3′ –> 5′ untai DNA A template (Abd-Elsalam 2003). (a)
(b)
Gambar 111 (a) Forward primer dan (b) Reverse primerr Dalam melakukan peerancangan primer harus dipenuhi parameter-parameter sebagai berikut: A. Panjang primer Umumnya panjang prim mer berkisar antara 18 – 30 basa. Primer dengaan panjang kurang dari 18 basa akkan menjadikan spesifisitas primer rendah. Sedangkan S untuk panjang primer leebih dari 30 basa tidak akan meningkatkan spesifisitas s primer secara bermakna.
11
B. Suhu leleh (Melting temperature / Tm) Suhu leleh (melting temperatur / Tm) adalah temperatur di mana 50 % untai ganda DNA terpisah. Suhu leleh yang optimal untuk primer di kisaran 5258oC, umumnya menghasilkan hasil yang lebih baik dibandingkan primer dengan suhu leleh yang lebih rendah (Dieffenbach et al. 1995). Secara teoritis Tm primer dapat dihitung dengan menggunakan rumus [2(A+T) + 4(C+G)] (Wallace et al. 1979). C. Kandungan GC Kandungan GC(%) merupakan karakteristik penting dari DNA dan memberikan informasi tentang kekuatan anil. Primer harus memiliki GC konten antara 45 dan 60% (Dieffenbach et al. 1995). D. Sekuen Akhir 3’ (3' GC Clamp) Sekuen nukleotida pada akhir 3’ sebaiknya G atau C. Nukleotida A atau T lebih toleran terhadap mismatch dari pada G atau C, dengan demikian akan dapat menurunkan spesifisitas primer (Dieffenbach et al. 1995). E. Hairpins Primer sebaiknya menghindari terbentuknya loop (Dieffenbach et al. 1995). F. Cross - Dimer Primer dapat berikatan dengan primer pasangannya (forward dan reverse) (Dieffenbach et al. 1995). G. Pengulangan Nukleotida Primer sebaiknya tidak memiliki urutan pengulangan dari 2 basa dan maksimum pengulangan 2 basa sebanyak 4 kali masih dapat ditoleransi, misalnya GCGCGCGC (Dieffenbach et al. 1995). Peralatan Penelitian Alat yang digunakan dalam penelitian ini dibagi dalam perangkat keras dan perangkat lunak, sebagai berikut : a. Perangkat keras : • Processor : Pentium(R) Dual-Core CPU T4500 @ 2.30 GHz 2.30 GHz • Memory : RAM 2 GB • Harddisk : 320 GB b. Perangkat lunak : • Sistem operasi Windows 7 Starter 32-bit operating system • Notepad Digunakan untuk melakukan proses pembuatan fasta file (.Fasta) • Matlab 7.11.0 (R2010b) Digunakan untuk melakukan proses penyejajaran sekuen DNA dan merancang potensial primer selulase.
12
4 HASIL DAN PEMBAHASAN Data yang digunakan untuk penelitian ini adalah berupa DNA penyandi selulase yang diambil dari GenBank NCBI (National Center for Biotechnology Information). Tabel 2 Sekuen gen penyandi selulase TIPE GEN
ORGANISME
NOMOR AKSESI
PANJANG GEN
Cellulase
Solanum Lycopersicum Triticum Aestivum Arabidopsis Thaliana Solanum Lycopersicum Solanum Lycopersicum
NM_001247953 AY091512 NM_124350 NM_001247933 NM_001247938
1895 bp 2196 bp 2360 bp 1717 bp 1780 bp
Sumber : NCBI (http://www.ncbi.nlm.nih.gov/gene/?term=cellulase)
MULTIPLE SEQUENCE ALIGNMENT Progressive Sequence Alignment Data yang digunakan diunduh pada basis data NCBI dan disimpan dalam format (.fasta) menggunakan Notepad. Kemudian data tersebut dijajarkan secara Progressive Sequence Alignment menggunakan Matlab, dengan tujuan untuk mengetahui tingkat similaritas dan homology antara sekuen DNA penyandi selulase. Progressive Sequence Alignment terdiri atas tiga tahap (Liu et al. 2009).
Gambar 12 Tiga tahap progressive sequence alignment : (1) pairwise alignment, (2) pengelompokan sekuen dan (3) progressive alignment (Liu et al. 2009) a. Pairwise Alignment Tahap pertama pada Progressive Sequence Alignment adalah membandingkan antara dua sekuen (pairwise alignment) gen penyandi selulase menggunakan algoritme Needleman-Wunsch. Algoritme Needleman-Wunsch merupakan metode untuk pencarian sekuen optimal secara global dari 2 sekuen. Pseudo-code dari algoritme Needleman-Wunsch ditampilkan pada gambar 13.
13
1. Input: Dua sekuen X dan Y 2. Output: Penyejajaran yang optimal (best alignment)dan skor α 3. Initialization: 4. Set F(i,0) := −i·w for all i = 0,1,2, . . . ,n 5. Set F(0,j) := −j·w for all j = 0,1,2, . . . ,m 6. For i = 1, 2, . . . , n do: 7. For j = 1, 2, . . . , m do: F i-1,j-1 + S(Xi , Yj ) 8. Set F i , j := Max F i 1, j w F i, j 1 w 9. Set backtrace T(i,j) to the maximizing pair (i′,j′) 10. The score is α := F(n,m) 11. Set (i,j):=(n,m) 12. repeat 13.
if T(i,j)=(i−1,j−1) print
14. else if T(i,j)=(i−1,j) print 15. Set (i,j):= T(i,j) 16. until (i,j)=(0,0).
else print
Y
Gambar 13 Pseudo-code algoritme Needleman-Wunsch Langkah pertama dalam algoritme ini (pseudo-code no 4 dan 5) adalah membuat matriks yang disebut similarity matrix F (i, j). Matriks dibangun dengan cara yang biasa, dengan kolom 0 dan baris 0, m dan n adalah panjang dari dua sekuen masing-masing dengan kompleksitas waktu komputasi sebesar O (mn). Langkah selanjutnya adalah mengatasi sel-sel lainnya dimulai dari pojok kiri atas dari matriks (yaitu sel ( 1, 1)) dan bergerak ke arah sudut kanan bawah (sel ( , ), mengisi kotak rekursif menurut aturan (pseudo-code no 6, 7, 8). , adalah skor match / mismatch, w adalah gap penalty konstan ( 0), dan , adalah akumulasi nilai sampai , . Langkah terakhir dari algoritme ini (pseudo-code no 9 s/d 16 ) adalah membangun jejak kembali (traceback), dimulai dari titik di bagian kiri atas dari matriks, dimana sel yang memberikan nilai yang sesuai dengan jalur terbaik yang mungkin akan hadir, yaitu sel dengan skor tertinggi. Prosedur traceback berfungsi untuk mengidentifikasi penyejajaran yang optimal (best alignment). Dari hasil penyejajaran dua sekuen (pairwise alignment) gen penyandi selulase menggunakan algoritme Needleman-Wunsch diperoleh similarity score (Tabel 3). Similarity score tersebut digunakan untuk tahap selanjutnya yaitu mengelompokan sekuen.
S1 S2 S3 S4 S5
Tabel 3 Similarity scores S1 S2 S3 S4 1 545 1 559 2 313 1 584 1 312 1 373 1 684 1 348 1 423 1 589
S5
-
14
S1 = Solanum Lycopersicum NM_001247953 S2 = Triticum Aestivum AY091512 S3 = Arabidopsis Thaliana NM_124350 S4 = Solanum Lycopersicum NM_001247933 S5 = Solanum Lycopersicum NM_001247938 b. Pengelompokan Sekuen Tahap kedua pada Progressive Sequence Alignment adalah mengelompokan sekuen gen penyandi selulase menggunakan metode Neighbor-Joining. Metode Neighbor-Joining (NJ) didasarkan pada jarak matriks dan secara luas digunakan oleh ahli bioteknologi dan biologi molekuler karena efisien. Metode NeighborJoining dimulai dengan pohon berbentuk bintang. Dalam setiap langkah, pasangan node yang paling dekat satu sama lain dipilih dan terhubung melalui simpul baru. Kemudian, jarak dari ini node baru ke seluruh node di pohon dihitung. Algoritma berakhir ketika hanya ada dua node yang tidak terhubung. Berikut adalah pseudocode dari metode Neighbor-Joining. 1. Variabel: 2. T => node daun 3. d => jarak matriks 4. D => normalisasi matrik jarak 5. r => Array divergensi 6. L => node tambahan 7. Inisialisasi: 8. L = S. 9. Iterasi: 10. Pilih sepasang node i , j yang jarak normalisasi Di j adalah minimum, dengan Di j = di j – (ri + rj), dan ri adalah perbedaan node i, dengan 11. 12. 13. 14. 15.
∑
Tentukan node k baru dan menetapkan dks = ½(dis + djs – dij), untuk semua s di L. Tambahkan k ke S dengan jarak sisi dik = ½ (dij + ri - rj), djk = dij – dik, menghubungkan k ke i dan j, masing-masing. Hapus i dan j dari L dan menambahkan k. Terminasi: Ketika L dibentuk oleh dua daun i dan j, tambahkan sisi yang tertunda antara i dan j dengan jarak dij
Gambar 14 Pseudo-code metode Neighbor-Joining Gambar 15 menunjukkan contoh proses pembangunan sebuah pohon filogenetik (phylogenetic tree) menggunakan metode Neighbor-Joining untuk matrik jarak 4x4.
15
Gambar 15 Proses pembangunan sebuah pohon filogenetik (phylogenetic tree) menggunakan metode Neighbor-Joining Dari hasil pengelompokan sekuen gen penyandi selulase menggunakan metode Neighbor-Joining diperoleh phylogenetic tree (Gambar 16). Phylogenetic tree memainkan peran penting dalam beberapa aplikasi yang relevan dalam bioinformatika, seperti multiple sequence alignment.
Gambar 16 Phylogenetic tree dari 5 gen penyandi selulase
c. Progressive Alignment Tahap terahir pada Progressive Sequence Alignment yaitu melakukan penyejajaran dua sekuen yang paling mirip terlebih dahulu yang didapat dari hasil
16
pengelompokan 5 sekuen gen penyandi selulase (phylogenetic tree). Berikut adalah pseudo-code dari progressive alignment. 1. Input: a set A={A1, . . . ,Ar} of sequences 2. var: 3. C = current set of alignments 4. begin 5. C= 6. For i = 1,2, . . . , r do 7. C:=C {{Ai}} 8. do 9. choose two sub-alignments A p , A 10. C = C−{A p,A q} 11. A s := align (A p , A q); 12. C = C {A s} 13. While |C| >1 14. end
q
from C;
Gambar 17 Pseudo-code progressive alignment S5 S4 S1
S2,3 = alignment (S2, S3) = alignment (S1, S5) S1,5 S1,4,5 = alignment ((S1, S5), S4) S1,2,3,4,5 = alignment ((S2, S3),(S1, S4, S5))
S3 S2
Dari tahap akhir ini didapat penyejajaran dari ke-5 sekuen gen penyandi selulase (Gambar 17).
17
Gambar 18 Hasil penyejajaran dari 5 gen penyandi selulase Dari hasil analisa penyejajaran sekuen gen penyandi selulase, algoritme Progressive Sequence Alignment dapat menghasilkan penyejajaran yang optimal, karena dijajarkan berdasarkan kemiripan dari dua sekuen tetapi dibutuhkan kompleksitas waktu komputasi yang tinggi, terutama pada tahap pairwise alignment (Gambar 19). Dapat diketahui bahwa spesies yang memiliki nilai atau kesamaan tertinggi adalah Solanum lycopersicum NM-001247953, dibandingkan spesies yang lain. Penyejajaran secara multiple sequence alignment menghasilkan daerah yang memiliki similaritas yang tinggi (conserved region), hal itu terlihat pada histogram (Gambar 18). Semakin tinggi histogram berarti semakin tinggi juga tingkat similaritasnya. Conserved region pada basa nukleotida yang mempunyai similaritas dan homologi tinggi, maka daerah tersebut dijadikan template untuk digunakan sebagai primer spesifik. Dalam penelitian ini, hasilnya didapatkan 3 conserved region ditampilkan pada Tabel 4.
Time (S)
Time (S)
25 250 20 200 15 150 10 100
Progressive Alignment
5 0
50
0
5
10
15
Jumlah Sekuens
Gambar 19 Waktu yang dibutuhkan oleh progressive sequence alignment
18
Tabel 4 Sekuen conserved region REGION
POSISI
SEKUEN
862-1175
GACCACTCTTGTTGGGAGAGACCTGAGGATATGGACACCCCAA GAAGTGTGTACAAAATTGACAAAAACACTCCTGGGACTGAAGT TGCTGCTGAAACTGCTGCTGCTCTCGCTGCTGCTTCCTTAGTCTT TAGGAAATGCAACCCATCTTACTCCAAGATACTAATCAAAAGG GCCATCAGGGTGTTTGCCTTTGCTGATAAGTATAGAGGTTCATA CAGCAATGGTCTGAGAAAAGTAGTGTGCCCATACTACTGCTCA GTTTCGGGATATGAGGATGAGCTGTTGTGGGGTGCTGCTTGGTT ACATAGAGC
2
1567-1765
TGTGGTGGAGTTGTTATTACACCAAAGAGGCTTCGAAATGTAG CCAAAAAACAGGTGGACTATTTGTTAGGAGACAATCCACTAA AAATGTCATACATGGTGGGATATGGAGCAAGGTATCCACAGA GGATTCATCACAGGGGATCCTCATTACCCTCAGTCGCGAACCA TCCAGCAAAGATACAATGCAGGGATGGTT
3
1790-1915
CACCAAACCCGAACGTACTAGTAGGGGCTGTGGTAGGTGGTC CTGATGAGCATGATCGTTTCCCAGACGAGCGTTCAGATTACGA GCAATCTGAACCTGCCACTTACATTAATGCTCCACTTGTTG
1
PERANCANGAN PRIMER SELULASE Dalam merancang potensial primer selulase digunakan sekuen Solanum lycopersicum NM-001247953 dari daerah yang memiliki similaritas yang tinggi (conserved region) sebagai template. Parameter untuk merancang potensial primer selulase yang digunakan dalam penelitian ini adalah sebagai berikut : 1. Panjang primer sebesar 20 bp (base pair) 2. Melting temperatur (Tm) sebesar min=50oC dan max=60oC 3. Kandungan GC sebesar min=45% dan max=55% 4. Tidak terbentuk hairpin 5. Tidak terbentuk self-dimer 6. Tidak terjadi pengulangan nukleotida 7. 3’ GC clamp Berdasarkan hasil perancangannya diperoleh sebanyak 46 pasang potensial primer selulase dari ketiga conserved region, ditampilkan pada Gambar 20, 21 dan 22.
19
Gambar 20 Hasil perancangan potensial primer dari sekuen conserved region ke-1
Berdasarkan Gambar 20 diketahui bahwa lokasi potensial primer yang bagus dari conserved region ke-1 setelah diseleksi adalah berada pada posisi antara 150 sampai 210 dari panjang sekuen sebesar 313 bp. Rentang amplifikasi pemilihan primer adalah 5′ –> 3′ = 0 – 169 dan 3′ –> 5′ = 170 – 313. Hasil perancangan dari conserved region 1 didapat sebanyak 28 pasang primer ditampilkan pada Tabel 5.
Gambar 21 Hasil perancangan potensial primer dari sekuen conserved region ke-2
20
Berdasarkan Gambar 21 diketahui bahwa lokasi potensial primer yang bagus dari conserved region ke-2 setelah diseleksi adalah berada pada posisi antara 50 sampai 130 dari panjang sekuen sebesar 198 bp. Rentang amplifikasi pemilihan primer adalah 5′ –> 3′ = 0 – 150 dan 3′ –> 5′ = 160 – 198. Hasil perancangan dari conserved region 2 didapat sebanyak 13 pasang primer ditampilkan pada Tabel 6.
Gambar 22 Hasil perancangan potensial primer dari sekuen conserved region ke-3
Berdasarkan Gambar 22 diketahui bahwa lokasi potensial primer yang bagus dari conserved region ke-3 setelah diseleksi adalah berada pada posisi antara 60 sampai 90 dari panjang sekuen sebesar 125 bp. Rentang amplifikasi pemilihan primer adalah 5′ –> 3′ = 0 – 120 dan 3′ –> 5′ = 80 – 125. Hasil perancangan dari conserved region 3 didapat sebanyak 5 pasang primer ditampilkan pada Tabel 7. Tabel 7 Primer dari region ke-3 FORWARD / REVERSE PRIMER
START
END
%GC
Tm
TACGAGCAATCTGAACCTGC AAGTGGCAGGTTCAGATTGC
81 105
100 86
50 50
55.99 57.06
TACGAGCAATCTGAACCTGC TAAGTGGCAGGTTCAGATTG
81 106
100 87
50 45
55.99 53.6
TTACGAGCAATCTGAACCTG AAGTGGCAGGTTCAGATTGC
80 105
99 86
45 50
53.44 57.06
TTACGAGCAATCTGAACCTG TAAGTGGCAGGTTCAGATTG
80 106
99 87
45 45
53.44 53.6
TACGAGCAATCTGAACCTGC AATGTAAGTGGCAGGTTCAG
81 110
100 91
50 45
55.99 53.9
21
Tabel 5 Primer dari region ke-1
Tabel 6 Primer dari region ke-2
FORWARD / REVERSE PRIMER
START
END
%GC
Tm
FORWARD / REVERSE PRIMER
START
END
%GC
Tm
GCAACCCATCTTACTCCAAG AAAGGCAAACACCCTGATGG
140 195
159 176
50 50
54.22 57.22
ACAGAGGATTCATCACAGGG ATCTTTGCTGGATGGTTCGC
123 182
142 163
50 50
55.18 57.05
GCAACCCATCTTACTCCAAG CAAAGGCAAACACCCTGATG
140 196
159 177
50 50
54.22 55.61
ACAGAGGATTCATCACAGGG TATCTTTGCTGGATGGTTCG
123 183
142 164
50 45
55.18 53.62
GCAACCCATCTTACTCCAAG ATCAGCAAAGGCAAACACCC
140 201
159 182
50 50
54.22 57.71
CACAGAGGATTCATCACAGG ATCTTTGCTGGATGGTTCGC
122 182
141 163
50 50
53.6 57.05
GCAACCCATCTTACTCCAAG TATCAGCAAAGGCAAACACC
140 202
159 183
50 45
54.22 54.77
ACAGAGGATTCATCACAGGG GTATCTTTGCTGGATGGTTC
123 184
142 165
50 45
55.18 51.97
GCAACCCATCTTACTCCAAG TCTCAGACCATTGCTGTATG
140 234
159 215
50 45
54.22 53.03
CACAGAGGATTCATCACAGG TATCTTTGCTGGATGGTTCG
122 183
141 164
50 45
53.6 53.62
CTGCTTCCTTAGTCTTTAGG ACCATTGCTGTATGAACCTC
116 228
135 209
45 45
50.7 53.69
CCACAGAGGATTCATCACAG ATCTTTGCTGGATGGTTCGC
121 182
140 163
50 50
53.6 57.05
GCTGCTTCCTTAGTCTTTAG ACCATTGCTGTATGAACCTC
115 228
134 209
45 45
51.26 53.69
CCACAGAGGATTCATCACAG TATCTTTGCTGGATGGTTCG
121 183
140 164
45 45
53.6 53.62
CTGCTTCCTTAGTCTTTAGG AGACCATTGCTGTATGAACC
116 230
135 211
45 45
50.7 53.69
GGTGGACTATTTGTTAGGAG ATCTTTGCTGGATGGTTCGC
54 182
73 163
45 50
50.75 57.05
GCTGCTTCCTTAGTCTTTAG AGACCATTGCTGTATGAACC
115 230
134 211
45 45
51.26 53.69
GGTGGACTATTTGTTAGGAG TATCTTTGCTGGATGGTTCG
54 183
73 164
45 45
50.75 53.62
ACTGAAGTTGCTGCTGAAAC AAAGGCAAACACCCTGATGG
79 195
98 176
45 50
54.81 57.22
GGTGGACTATTTGTTAGGAG GTATCTTTGCTGGATGGTTC
54 184
73 165
45 45
50.75 51.97
ACTGAAGTTGCTGCTGAAAC CAAAGGCAAACACCCTGATG
79 196
98 177
45 50
54.81 55.61
CAGGTGGACTATTTGTTAGG ATCTTTGCTGGATGGTTCGC
52 182
71 163
45 50
51.05 57.05
ACTGAAGTTGCTGCTGAAAC ATCAGCAAAGGCAAACACCC
79 201
98 182
45 50
54.81 57.71
CAGGTGGACTATTTGTTAGG TATCTTTGCTGGATGGTTCG
52 183
71 164
45 45
51.05 53.62
ACTGAAGTTGCTGCTGAAAC TATCAGCAAAGGCAAACACC
79 202
98 183
45 45
54.81 54.77
CAGGTGGACTATTTGTTAGG GTATCTTTGCTGGATGGTTC
52 184
71 165
45 45
51.05 51.97
ACTGAAGTTGCTGCTGAAAC ACCATTGCTGTATGAACCTC
79 228
98 209
45 45
54.81 53.69
ACTGAAGTTGCTGCTGAAAC ACCATTGCTGTATGAACCTC
79 230
98 211
45 45
54.81 53.69
ACTGAAGTTGCTGCTGAAAC CAGACCATTGCTGTATGAAC
79 231
98 212
45 45
54.81 52.16
ACTGAAGTTGCTGCTGAAAC TCTCAGACCATTGCTGTATG
79 234
98 215
45 45
54.81 53.03
AAACACTCCTGGGACTGAAG TATCAGCAAAGGCAAACACC
66 202
85 183
50 45
55.56 54.77
GCAACCCATCTTACTCCAAG TATGTAACCAAGCAGCACCC
140 310
159 291
50 50
54.22 56.25
GCAACCCATCTTACTCCAAG CTATGTAACCAAGCAGCACC
140 311
159 292
50 50
54.22 54.44
GCAACCCATCTTACTCCAAG TCTATGTAACCAAGCAGCAC
140 312
159 293
50 45
54.22 53.54
GCAACCCATCTTACTCCAAG GCTCTATGTAACCAAGCAGC
140 314
159 295
50 50
54.22 54.42
ACTGAAGTTGCTGCTGAAAC TATGTAACCAAGCAGCACCC
79 310
98 291
45 50
54.81 56.25
ACTGAAGTTGCTGCTGAAAC CTATGTAACCAAGCAGCACC
79 311
98 292
45 50
54.81 54.44
ACTGAAGTTGCTGCTGAAAC TCTATGTAACCAAGCAGCAC
79 312
98 293
45 50
54.81 53.54
ACTGAAGTTGCTGCTGAAAC GCTCTATGTAACCAAGCAGC
79 314
98 295
45 50
54.81 54.42
AAACACTCCTGGGACTGAAG GCTCTATGTAACCAAGCAGC
66 312
85 293
50 50
55.56 53.54
AAACACTCCTGGGACTGAAG GCTCTATGTAACCAAGCAGC
66 314
85 295
50 50
55.56 54.42
22
5 SIMPULAN 1.
2. 3. 4.
Algoritme progressive alignment dapat menghasilkan penyejajaran yang optimal, karena dijajarkan berdasarkan kemiripan dari dua sekuen tetapi membutuhkan kompleksitas waktu komputasi yang tinggi dan memori yang besar. Kompleksitas waktu komputasi yang dibutuhkan algoritme NeedlemanWunsch dalam melakukan pairwise alignment adalah O(mn). Multiple sequence alignment (MSA) menggunakan algoritme progressive alignment dapat menghasilkan conserved region dari gen penyandi selulase yang digunakan pada perancangan primer. Template yang digunakan yaitu sekuen Solanum lycopersicum NM001247953 dari daerah yang memiliki similaritas yang tinggi (conserved region). Diperoleh 3 conserved region yang menghasilkan 46 pasang primer. Masing-masing dari conserved region ke-1 sebanyak 28 pasang primer, conserved region ke-2 sebanyak 13 pasang primer dan conserved region ke-3 sebanyak 5 pasang primer.
23
DAFTAR PUSTAKA Abd-Elsalam KA. 2003. Bioinformatics tools and guideline for PCR primer design. Afrikan journal of biotechnology. 2 (5): 91-95. Anindyawati T. 2009. Prospek enzim dan limbah lignoselulosa untuk produksi bioetanol. BS. 44(1): 49-56. Baxevanis AD, Ouellette BFF. 2001. Bioinformatics A Practical Guide to the Analyses of gene and Proteins. A John Wiley & Sons, Inc., Publication. Dieffenbach CW, Lowe TMJ, Dveksler GS. 1995. General Concepts for PCR Primer Design. In: PCR Primer, A Laboratory Manual, Dieffenbach CW, Dveksler GS Ed. Cold Spring Harbor Laboratory Press. New York. 133155. Djamil. 2005. Studi in silico produksi Hyaluronidase lintah (Hirudo medicinalis) secara rekayasa genetika [Tesis]. Depok (ID): Universitas Indonesia. Edgar RC, Batzoglou S. 2006. Multiple sequence alignment. Science Direct. 16. Fredslund J, Schauser L, Madsen LH, Sandal N, Stougaard J. 2005. PriFi: using a multiple alignment of related sequences to find primers for amplification of homologs. Nucleic acids research. 33. doi:10.1093/nar/gki425. Gautham N. 2006. Bioinformatics Databases and Algorithms. Alpha science Internasional Ltd. Oxford, UK. Gusfield D. 1997. Algorithms on String, Trees, and Sequences. Computer Science and Computational Biology. New York: Cambridge University Press. Jones NC, Pevzner PA. 2004. An Introduction to Bioinformatics Algorithm. Series on Computational Molecular Biology. Massachusetts (US) : MIT Press. Joshi B, Bhatt RM, Sharma D, Joshi J, Malla R, Lakshmaiah, Sreerama. 2011. Lignocellulosic ethanol production: Current practices and recent developments. Biotechnology and Molecular Biology Review. 6(8):172-182 Kampke T, Kieninger M, Mecklenburg M. 2001. Efficient primer design algorithms. Bioinformatics. 17(3). Kuhad RC, Gupta R, Singh A. 2011. Microbial Cellulases and Their Industrial Applications. Enzyme Research. doi:10.4061/2011/280696. Lakshmi PV, Rao AA, Sridhar GR. 2008. An Efficient Progressive Alignment Algorithm for Multiple Sequence Alignment. International Journal of Computer Science and Network Security. 8(10). Lee SM, Koo YM. 2001. Pilot-scale production of cellulose using Trichoderma reesei Rut C-30 in fed-batch mode. Journal of Microbiology and Biotechnology.11: 229-233. Liu Y, Schmidt B, Maskell DL. 2009. Parallel Reconstruction of NeighborJoining Trees for Large Multiple Sequence Alignments using CUDA. IEEE Loytynoja A, Goldman N. 2005. An algorithm for progressive multiple alignment of sequences with insertions. Proceeding of the National Academy of Sciences. 102(30):10557–10562. doi:10.1073/pnas.0409137102. Lupyan D, Macias AL, Ortiz AR. 2005. A new progressive-iterative algorithm for multiple structure alignment. Bioinformatics. 21(15). Mojsov K. 2012. Microbial cellulases and their applications in textile processing. International Journal of Marketing and Technology. 2(11):12-29. Mount DW. 2009. Using Progressive Methods for Global Multiple Sequence Alignment. Cold Spring Harb Protoc. 4(7).
24
Sim TS, Oh JCS. 1993. Application of Trichoderma reesei Cellulases for Degradation of Lignocellulosic Compounds. Proceeding of Mie Bioforum. Genetic, Biochemistry and Ecology of Lignocellulose Degradation. Uni Publishers Co. Ltd. 477- 481. Stoye J, Moulton V, Dress AW. 1997. DCA: An efficient iplementation of the divide and conquer approach to simultaneous Multiple sequence Alignment. Computer Applications in the Biosciences. 13 (6). Sung WK. 2009. Algorithms in Bioinformatics : A Practical Introduction. Mathematical and Computational Biology Series. US: CRC Press. Sukumaran RK, Singhania RR, Pandey A. 2005. Microbial cellulases – Production, applications and challenges. Journal of Scientific & Industrial Research. 64:832-844. Wallace RB, Shaffer J, Murphy RF, Bonner J, Hirose T, Itakura K (1979). Hybridization of synthetic oligodeoxyribonucleotides to phi chi 174 DNA: the effect of single base pair mismatch. Nucleic Acids Res. 6: 3543-3557
25
Lampiran 1 Gen penyandi selulase >Arabidopsis_thaliana_NM_124350 ACATTTCTTCACTTCCACACACTTTTACTTCTTTCTCTCTTCTCTTCTCTTCTCCAGATCTG ATCCCAAACCTTTGATTCATTGTTGTTGTTCTCTGCTGCTTTATCAGAGAGCATCATCATGT ACGGAAGAGATCCATGGGGAGGTCCATTGGAGATAAACACTGCAGATTCCGCCACCGACGAT GATCGTAGTCGGAATTTAAACGATTTGGATCGTGCGGCTCTTTCACGTCCACTAGATGAGAC GCAGCAGAGTTGGTTACTTGGTCCAACGGAGCAGAAGAAGAAGAAGTACGTCGATCTCGGTT GTATTATCGTTAGCCGCAAGATCTTCGTCTGGACTGTTGGTACTCTTGTTGCCGCCGCGTTA CTCGCCGGATTCATTACCTTGATCGTTAAAACTGTGCCGCGTCATCATCCTAAGACTCCGCC GCCGGATAATTATACTATAGCTCTACACAAAGCTCTTAAGTTCTTCAATGCTCAGAAATCTG GGAAATTGCCAAAGCATAATAACGTGTCATGGAGAGGTAATTCTGGGCTTCAAGATGGGAAA GGTGAAACAGGAAGCTTCTATAAAGATTTGGTGGGAGGTTATTATGATGCTGGTGATGCTAT CAAGTTCAATTTCCCCATGGCTTATGCTATGACTATGTTGAGCTGGAGTGTTATTGAATATA GTGCTAAATACGAAGCTGCTGGTGAGCTCACTCATGTTAAGGAGCTTATCAAATGGGGAACT GATTACTTTCTCAAGACTTTCAATAGTACTGCTGATTCCATTGATGATCTTGTGTCACAGGT TGGATCAGGGAATACTGATGATGGAAATACAGATCCTAATGACCATTACTGTTGGATGCGAC CTGAGGATATGGACTATAAAAGGCCCGTGACTACTTGTAATGGTGGATGTTCGGATCTCGCT GCAGAGATGGCAGCTGCTCTGGCTTCAGCATCTATTGTATTCAAGGATAACAAGGAATATTC TAAAAAGCTTGTCCATGGTGCTAAGGTGGTGTATCAGTTTGGAAGGACGAGGAGAGGGAGAT ATAGTGCAGGCACTGCGGAATCTAGCAAGTTCTATAATTCAAGTATGTATTGGGATGAGTTC ATTTGGGGTGGTGCTTGGATGTATTATGCTACCGGAAATGTAACGTATCTCAATCTAATCAC CCAACCTACTATGGCCAAGCATGCTGGTGCCTTCTGGGGTGGCCCTTACTATGGTGTATTTA GCTGGGACAACAAGCTTGCTGGTGCTCAGTTGCTGTTGAGCCGGTTGAGGTTGTTTCTGAGT CCTGGATATCCATATGAAGAAATTCTAAGGACCTTCCACAATCAGACCAGCATAGTCATGTG CTCATACTTGCCTATTTTCAACAAATTTAACAGAACCAATGGAGGTTTAATAGAGTTGAATC ATGGAGCTCCACAGCCGCTGCAATATTCTGTAAATGCAGCTTTCTTAGCGACTCTATACAGT GATTATCTGGATGCTGCTGATACTCCTGGATGGTACTGTGGACCTAATTTCTATTCGACAAG TGTGCTACGTGACTTTGCTAGATCCCAGATTGATTATATACTGGGTAAAAACCCTCGGAAAA TGAGTTATGTCGTTGGTTTTGGCACAAAATACCCAAGACATGTGCATCACAGAGGAGCTTCG ATACCCAAGAACAAAGTCAAGTATAACTGCAAAGGAGGATGGAAATGGAGAGACAGCAAGAA ACCAAACCCAAACACGATTGAAGGAGCCATGGTTGCTGGTCCTGACAAGCGCGACGGGTACC GTGATGTCCGTATGAACTACAACTACACTGAACCGACTCTTGCAGGCAATGCTGGTCTAGTC GCAGCTCTTGTGGCATTATCGGGTGAAGAAGAAGCCACCGGTAAGATAGACAAAAACACTAT TTTCTCAGCTGTTCCTCCTTTGTTCCCTACTCCACCACCTCCACCAGCACCATGGAAACCTT GAGAAAGCTAGACTTGTGTGATTCTGTCGCTGCTGCCAAAAAAAATGAATGAGGTAAGAAGG ATTTGGGTGTGAGACCAGAAGATTAGAAGCTAAACACAAGTCAGCCATAACCAAACTACTAA GGATTTCATTTGGCTTTACTAGATACAAACACGGGGTGGGTTACTTTACCACAAGCATTGTC TTTCTTTTCTTTTTTTGGGTTGCTGTTTTGTTCTTGTGAGATATCATATATATCTATGCGTT TTACTCTGTATATGTTTGATACCAAACTTGTATTCTTTGATAAACAATTTAATGAACTGTAT TAAACTTTTAACTATGTTTTATTGTGCAAGTGTGAGATCAACCTGGAATAACAACTGTAGTC TACT >Solanum_lycopersicum_NM_001247938 AACTTGTGTGAGCTCTATTTTTTTTTCCCTCAGTTCACAACCAAATAATGGCGCCAAAATAT ACCTCCATCATTTTCCTCTTCCTTCTCTTCAACTCCTTTTCATGTTCATTCGGAGGGGGTCA TGATTATCATGACGCCCTCCGAAAAAGCATCCTGTTCTACGAAGGACAACGATCCGGAAAAT TACCGCCGGATCAACGTATCAAATGGCGTAGAGACTCCGCATTACACGACGGTGCTTCCGCC GGAGTTGATTTGACAGGAGGCTATTACGATGCGGAGATAATGTGAAATTTGTTTTTCCGATG GCGTTTACGACGACATTGTTATCGTGGAGTATAATTGATTTTAAAAGGAATATAGGGAATGA ATTGGGTAATGCAGTGAAGGCGGTGAAATGGGGAACTGATTTTCTGTTGAAAGCTACGGCGA GAGATGGAGTGATATATGTACAAGTTGGTGATGCGTTTTCAGATCACAGTTGTTGGGAGAGA CCAGAAGATATGGATACATTAAGAACTGTTTATAAAATTGATGCGAATAATCCCGGTTCCGA TGTCGCCGGTGAAATCGCTGCTGCATTAGCTGCTGCATCCATTGTTTTCCGTTCACTGGATT
26 CTTCCTACTCAAATCTACTGCTTGATCGCGCTGTTAAAGTTTTCGATTTTGCCAATAGACAT AGAGGTGCATACAGCTCCAGCCTACACTCTGCTGTTTGCCCTTTCTATTGTGACTTTAATGG TTATCAGGATGAATTGCTTTGGGGTGCAGCATGGTTACATAAAGCAACAAGAAGAAGGCAAT ATAGAGAGTACATAGTGAAAAATGAAGTAATTTTAAGAGCAGGAGATACAATTAATGAATTT GGTTGGGACAACAAACATGCTGGTATTAATGTCCTTATTTCCAAGGAAGTGTTAATGGGAAA AGCACCAGATCTAAAATCATTTCAAGTAAATGCAGATGCATTCATTTGTTCAATATTACCTG GAATTTCTCATCCCCAAGTCCAATATTCTCCAGGTGGACTCATTGTCAAACCTGGGGTTTGT AACATGCAGCATGTGACATCTTTGTCCTTCTTACTCTTAACTTATTCTAATTATCTTAGTCA TGCCAATCATGTTGTGCCATGTGGTTCCATGACAGCCACCCCTGCCCTCCTCAAACACATTG CCAAACGTCAGGTGGATTATATTCTGGGAGATAATCCTCAAAGAATGTCATATATGGTAGGG TATGGTCCACATTACCCACAAAGGATTCACCATAGGGGTAGCTCTGTGCCATCTGTGGCCAC ACATTCAGCACGTATTGGTTGCAAAGAGGGATCTCGATACTTTTTTTCACCAAACCCAAACC CAAATCGATTAATTGGTGCTGTTGTTGGAGGGCCAAATTTAACAGACTCGTTCCCAGACGCC AGACCCTATTTTCAAGAATCTGAGCCCACAACATATGTTAATGCACCATTAGTGGGCCTATT GGCTTACTTTGCAGCCCATTCTAATTGATATAAACATGTGTAAAGAGAGAATGTAGTGGTGT GCAAAGGCCACCCTCTCTATTATTGTGTTGTTGTTGTCTAATAGGACTAATGTTGTTGTTTT TTAATCCCACTATATATATATATATTATATTAATACAAAAAAAGAATATCTTATCCCATCTT TTGTCTAAGAAAAAGAAAGATATCTAATGAACAAGGGATTTGTACTTTTTGAAATTGTAGTG GAAGTTGTTTTTATCTTATTATACATGAAAATTGTTTTGAATA >Solanum_lycopersicum_NM_001247933 ATAAACATAATATTAAATAGTCATAAACCATATGTTAAATAATAATAATAATTAATTAATAA TAACAATATGGCTTGTTCAAAGAATATTTGGGTTATTGTTATATTCTTTTTGTGCATTTTGG CTGGTCCTATTATTGCTCAAGATTACAATGATTCACTTGGCAAAGCTATTTTATTCTTTGAA GGGCAACGTTCTGGAAAATTACCAGTTTCTCAAAGAGTCAAATGGAGAGGAGATTCCGCACT CATCGATGGCATAATTGAACATGTGAATTTGATTGGAGGCTACTATGATGCTGGTGACAATG TAAAATTTGGATGGCCCATGGCTTATTCTTTAACCTTGTTGAGTTGGGCTGCTATTGAATAT CAAACACAAATCTCTTCAACAAATCAACTTGTACACCTCCAAAATGCAATTCGTTGGGGCAC AAATTTCTTAATTCGAGCCCATACTTCAAGTACAACTCTCTATACTCAGGTTGGAGATGGAA ATGCAGATCACCAATGTTGGGAAAGACCAGAAGACATGGATACTCCTAGAACACTATATAAA ATAACATCAAATTCTCCAGGATCTGAGGTGGCAGCTGACGTGGCAGCTGCTTTTGCTGCTGC TTCAATAGTTTTCAAAAATATTGATTCCAACTATTCTACAAAGTTATTAAAAAGATCAAGAT CCTTATTTGCATTTGCGGATAAGTATAGAGGATCTTACCAAGCTTCTTGTCCATTCTATTGT TCCTACTCAGGTTATAAGGATGAATTGTTGTGGGCTGCTGCTTGGCTATATAAGGCAGGTGG AGGAAACAATTATTTAAATTATGCTTCAATCAACCAAGGTTGGAGTCAAGTTGCCTCTGAGT TTAGTTGGGATGACAAGTTTGCTGGAGCCCAAACTTTACTAGCTAAGGAATACCTTAATGGA AAGAGCAATTTGGAAAAATTCAAGAAAGATGCTGATTCATTTATTTGTGGATTAATGCCAGA AAGTAGCTCTATACAAATTAAGACAACCCCAGGTGGACTTTTGTATTATAGAGATAGTAGCA ATTTGCAATATGTGAATGGTGCCACTATGGTACTTTTTATGTACACTAAAGTCCTTGAGGCA GCTGGAATAGGAGGAGTTACATGTGGATCTGTTAATTTTTCCACATCCAAGATTAAAGCCTT TGCAAAATTACAGGTTGACTACATACTTGGAAACAATCCACTCAAAATGTCATACATGGTGG GATTTGGCAACAAATATCCAACAAAACTTCACCATAGAGCCTCATCACTCCCTTCAATTTAT AACCATCCAACTAGGGTGGGGTGCAACGATGGCTATAGTTCATGGTACAATTCTAACAATCC AAACCCTAACACACATGTCGGTGCGATCGTCGGTGGGCCTAATTCCGGGGACCAATTTATTG ATTCGCGATCAGATTACTCTCATTCTGAACCCACGACTTATATGAATGCAGCATTTATAGGG TCCGTGGCCGCTTTGATTGATCAAACCAAAGAAGGAGAACACTATGGGGAAATTAATTCACA ATTTAACAAAACAGGTTTTATGTGATAGATAAATTAGTAAAGAAGTGAATGTCATGCAATAT TGATAAATATATGTACATATAATGAATTATCATAAATGTATGAAGCTATAAATATTACATAA TAGAAATAAATAAATATCAAAAATGTATCTTTTTTTTTTTTTT >Triticum_aestivum_AY091512 ATGTTCGGGCGGGACCCGTGGGGCGGGACGCTGGAGATCTCGAACGCGGACTCGGCGACGGA CGACGACCGGAGCCGGGACCTGGACCGGGGCGCCATGATGCGGCACCAGCTGGACGAGACGC AGCAGAGCTGGCTGCTGGCCGGCCCGGGCGACCAGGCCGGGAAGAAGAAGAAGAAGTACGTG GACATCGGCTGCATGGTCATCGACCGCAAGATCTTCATGTGGACCGTCGGCCTCATCCTCGG CGTCGGCCTCTTCGTCGGCTTCGTCATGATGATCGTCAAGCTCGTCCCGCACAAGAAGCCCC
27 CGCCGCCGCCGCCGGACCAGTACACCCTCGCGCTGCACAAGGCGCTCATGTTCTTCAACGCC CAGCGATCTGGTCATCTGCCCAAGCACAACGGCGTGNGTGGGAGGGGCAACTCCGGCATGAA GGACGGCCTCTCGGACAGCACCGTCAAGAAGAGCTTGGTCGGAGGCTTCTACGACGCAGGCG ACGCCATCAAGTTCAACTACCCCATGGCCTGGTCCATGAACATGCTCAGCTGGACGGTGATC GAGTACAGGGCCAAGTACGAGGCCATCGGCGAGCTCGACCATGTCAAGGAGATCATCAAGTG GGGCACCGACTACATGCTCAAGACCTTCAACTCGTCCGCCGACACCATCGACCGGATTGTCG CCCAGGTCGGCGTGGGTGACACCTCTAAAGGCCCCATGCCGAACGACCACTACTGCTGGATG AGGCCAGAGGACATTGATTACAAGAGGCCTGTCATCGAGTGCCACTCTTGCTCGGATCTTGC CGCTGGGATGGCCGCCGCTCTCGCTGCGGCTTCCATAGTGTTCAAGGACAGCAAGGCGTACT CTGACAAGCTCGTCCATGGTGCCAAGGCGCTGTACAAGTTCGGTAGGCTGCAGCGCGGCCGA TACAGCCCCAATGGCTCTGATCAGTCGCTGTTCTGCAATTCCACCAGCTACTGGGATGAGTT TGTGTGGGGTGGTGCGTGGATGTACTTCGCCACGGGAAACACATCGTACCTGACGATCGCCA CAGCTCCAGGGATGGCAAAGCATGCAGGCGCGTTCTGGATTGGCAGCCCAAACTATGGAGTG TTTACCTGGGATGACAAGCTTCCAGGATCTCAGGTTCTTCTCAGCAGGTTGCGGCTCTTCCT AAGTCCAGGGTATCCTTATGAAGAAATATTAAGGACATTCCACAACCAAACTGACAATGTCA TGTGCTCATATTTACCAGTATTCAATTCATTCAACTTCACTAAAGGAGGATTGATACAACTC AACCATGGAGGGCCTCAACCACTTCAGTACGTCGTCAATGCAGCTTTCCTTGCCTCTTTGTA TGCTGATTATCTGGACACCGCAGATACACCAAGGTGGTATTGTAGACCTAATTTCTATACCA CAGATGTCCTCCGTAAGTTTGCAAAGTCACAGCTTGATTACATCCTAGGCAAGAACCCACAA AAGATGAGCTACGTCGTGGGTTTTGGAAAGAAGTACCCGAAGCGTGTTCATCACAGAGGGGC ATCAATCCCTCATAACGGTGTCAAGTACGGATGCAAAGGAGGTTTTAAATGGAGAGAGTTTA AGAAAGCAAACCCTAATATCCTCGTCGGAGCAATGGTTGCTGGCCCTGACAAGCATGATGGC TTCAAAGATATCCGCACAAATTACAATTACACAGAACCTACCCTTGCAGCAAATGCTGGCTT GGTTGCAGCATTGATTTCTCTAGCTGACATCGATACCGGCAGATATTCAATTGATAAGAACA CCATCTTCTCAGCAGTTCCCCCAATGTTCCCGACACCCCACCACTCCTCAGCTTGGAAACCA TGAAGAGTCAGATCCCTGAACATTTCATAAGCATCAAATGGAGGGAGCAACAGATGGTTGTT TGGTATATACAGCGAAGGCCACGAACAGAAAGCAGACAACATAAGCTTACAGAGTTTCTACT TCTGTATCGGTATGACGGATCAGTATAAATCATCTGTCAACCATGGACTGGAAGTTGTGTGC AATTTGTGAAACTAATTTTTGGGGTCCTTGTTGTTATCCATATTCCGAGTTCATGTGTGAAG TTCTTTTTGTAGAAATGGTACCTTTGTAAGTCATTTTGTTTTATAGGAGTGANTTATTCGTC CCAGTAAAAAAAAAAAAAAAAAAAAA
>Solanum_lycopersicum_NM_001247953 CGTATTACTTTTCAGGTGGGTAGTTTCCAAAATGGCTTCTTGTTCTTCTTCAACAGCAGCTA TGGCTATGGCTATAACCATTTTTCTGTTTTTGTTGAGCTTTGTTACACCTGTGTTTCTTGCT AAACCTGTACATCATGCTCACCATCCTCGTTTTGCTTCTCATAACTATAGAGATGCTCTTGC AAAATCCATTATTTATTTTGAGGGTCAGAGGTCAGGGAAGCTCCCTTCTAGCCAGAGGATTA CTTGGCGTAAAGATTCTGGTCTATCAGATGGCAAAGCTATGGGGGTTGATTTGGTTGGTGGA TATTATGACGCTGGAGACAACGTGAAGTTCGGTTTCCCAATGGCATTCACCACCACAATGCT ATCATGGAGTGTGATTGAGTTTGGTGGGTTGATGAAAGGAGAGCTACTGAATGCAAAACAAG CCATTGGTTGGGCTACTGAATATCTTCTCAAGGCCACAGCCCATCCAGACACCATTTACGTT CAGGTTGGAGATGCAGGAAGTGACCACTCTTGTTGGGAGAGACCTGAGGATATGGACACCCC AAGAAGTGTGTACAAAATTGACAAAAACACTCCTGGGACTGAAGTTGCTGCTGAAACTGCTG CTGCTCTCGCTGCTGCTTCCTTAGTCTTTAGGAAATGCAACCCATCTTACTCCAAGATACTA ATCAAAAGGGCCATCAGGGTGTTTGCCTTTGCTGATAAGTATAGAGGTTCATACAGCAATGG TCTGAGAAAAGTAGTGTGCCCATACTACTGCTCAGTTTCGGGATATGAGGATGAGCTGTTGT GGGGTGCTGCTTGGTTACATAGAGCCACAAAGAACCCAACTTATCTCAATTATATCCAAAGG AACGGGCAAACTCTTGGGGCCGCGGAGACTGATAACACATTCGGGTGGGACAATAAGCATGT TGGAGCAAGGATTCTTCTTTCCAAGTCATTTCTTGTTCAAAAGCTTCAAACTCTCCATGATT ACAAGAGCCACGCAGACAACTACATTTGCTCCCTAATTCCAGGCACACCGGCTTCTCAAGCG CAATATACACCAGGAGGGCTACTCTTCAAGATGGATGATAGCAACATGCAGTATGTTACCTC CACTTCTTTCCTGCTAGTCACCTATGCCAAGTACTTAACTTCTGCTCGCATGGTTGTTAAAT GTGGTGGAGTTGTTATTACACCAAAGAGGCTTCGAAATGTAGCCAAAAAACAGGTGGACTAT TTGTTAGGAGACAATCCACTAAAAATGTCATACATGGTGGGATATGGAGCAAGGTATCCACA GAGGATTCATCACAGGGGATCCTCATTACCCTCAGTCGCGAACCATCCAGCAAAGATACAAT
28 GCAGGGATGGTTTCAGTGTGATGAACTCACAATCACCAAACCCGAACGTACTAGTAGGGGCT GTGGTAGGTGGTCCTGATGAGCATGATCGTTTCCCAGACGAGCGTTCAGATTACGAGCAATC TGAACCTGCCACTTACATTAATGCTCCACTTGTTGGAACACTCACTTACCTTGCTCACTCAT TTGGCCAACTCTAAAGTCAAGTGTGTAGTAGAATCAAGAATGAAGCCATGTTGGTCTTTGTT TTTACTTTTTCTAATTGCCTTGTTGATCACTAGTAGTAATATAATATATAGTCTAATCTAAA TGGGATGTGCTGGTGTGTGGTGTATTGGCTGAGACCTAAAAAGAGGCTCCAGCCCCCAACCA ACCCCCCCTCCTATGCACACAGGCCAAATGCTGTTTCATTGTTAGCAGCATATTTGCCTTGT TGGAGCATATGTTGTTACTAGTATTATTAATATTTTCTATAGTGGAAGCTTTCTTGTTTTAA CTTTCATGTTATCCGCTTTTACATGTTGGTTAACG
Lampiran 2 Hasil Multiple Sequence Alignment
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
RIWAYAT HIDUP M.Bahrul Ulum dilahirkan di Tangerang, 6 April 1988. Penulis merupakan anak keenam dari tujuh bersaudara, dari pasangan H. Syukur Dani dan Hj. Suamah. Tahun 2009, penulis lulus sarjana pada program studi Teknik Informatika Institut Sains dan Teknologi Al-Kamal Jakarta. Penulis melanjutkan jenjang magister pada tahun 2011 di program studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor (IPB). Penulis bekerja sebagai staf pengajar di Institut Sains dan Teknologi Al-Kamal Jakarta dari tahun 2011 sampai sekarang.