LAPORAN PRAKTIKUM REKAYASA GENETIKA
LAPORAN VI (BIOINFORMATIKA)
KHAIRUL ANAM P051090031/BTK BIOTEKNOLOGI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR 2010 0
BIOINFORMATIKA TUJUAN Tujuan praktikum ini adalah untuk : 1. Menentukan jenis fragmen DNA atau gen berdasarkan urut‐urutan nukleotida hasil sekuensing. 2. Membuat analisis situs restriksi, kesamaan, kemiripan dan filogenetik berdasarkan urut‐ urutan nukleotida. 3. Menentukan ORF dan CDS (coding sequence) suatu fragmen DNA. 4. Membuat deduksi asam amino dan membuat analisis kesamaan, kemiripan dan filogenetik tree berdasakan pada deduksi asam amino. 5. Menentukan domain deduksi asam amino dan menginterpretasikan peran metabolismenya. 6. Menentukan jenis protein/enzim berdasarkan pada nilai hidrofobisitasnya. TINJAUAN PUSTAKA Bioinformatika, sesuai dengan asal katanya yaitu "bio" dan "informatika", adalah gabungan antara ilmu biologi dan ilmu teknik informasi (TI). Pada umumnya, Bioinformatika didefenisikan sebagai aplikasi dari alat komputasi dan analisa untuk menangkap dan menginterpretasikan data‐ data biologi. Ilmu ini merupakan ilmu baru yang yang merangkup berbagai disiplin ilmu termasuk ilmu komputer, matematika dan fisika, biologi, dan ilmu kedokteran, dimana kesemuanya saling menunjang dan saling bermanfaat satu sama lainnya. Ilmu bioinformatika lahir atas insiatif para ahli ilmu komputer berdasarkan artificial intelligence. Mereka berpikir bahwa semua gejala yang ada di alam ini bisa dibuat secara artificial melalui simulasi dari gejala‐gejala tersebut. Untuk mewujudkan hal ini diperlukan data‐data yang yang menjadi kunci penentu tindak‐tanduk gejala alam tersebut, yaitu gen yang meliputi DNA atau RNA. Bioinformatika ini penting untuk manajemen data‐data dari dunia biologi dan kedokteran modern. Perangkat utama Bioinformatika adalah program software dan didukung oleh kesediaan internet (Utama, 2002). Bioinformatika adalah organisasi dan analisis komplek data yang dihasilkan dari analisa molekuler dan teknik biokimia. Disamping itu bioinformatika merupakan teknologi untuk koleksi, peyimpanan analisis, interprestasi, pelepasan dan aplikasi untuk informasi biologi. Analisi dilakukan dengan cara membandingkan data yang masuk dengan ribuan data lain yang tersedia di dalam pangkalan data (Nuswantara, 2000). Seiring dengan perkembangan bioinformatika yang amat pesat, informasi‐informasi baru dalam bidang ini terus bermunculan. Pangkalan data urutan DNA, RNA dan protein sangat berperan untuk mendukung berbagai kegiatan penelitian bioteknologi termasuk menggali berbagai potensi biologis di tengah beraneka ragamnya organisme (Nuswantara, 2000). Secara rutin para peneliti mengirimkan urutan‐urutan DNA, RNA atau asam amino kepada bank data dan diolah menurut kebutuhan. Hasil yang diperoleh umumnya berupa analisis kesamaan dan 1
beberapa jenis statistik dari urutan basanya yang dilakukan secara cepat oleh komputer dengan membandingkan data yang di input dengan data yang disimpan oleh bank data (Nuswantara, 2000). Pada suatu proyek penelitian biology molekuler khususnya yang berkaitan dengan analisis urutan DNA, RNA atau asam amino, esensi keberadaan bank data DNA sangat besar sehingga keberhasilan eksperiman sangat bergantung pada tersedianya pangkalan‐pangkalan data ini. Tanpa pangkalan data urutan‐urutan DNA tidak dapat disimpulkan (Lewitter, 1987). Selain analisa kesamaan, bank data biasanya menyediakan pula fasilitas perangkat lunak yang dapat mengolah DNA, RNA atau protein menjadi bentuk dua dimensi hingga struktur tiga dimensi yang dapat diputar dan dilihat dari berbagai sudut (Lewitter, 1987). Analisis keragaman untuk asam nukleat dan protein dalam bentuk dendogram merupakan salah satu fasilitas lain dari bank data. Perangkat analisis lainnya adalah untuk pembuatan harr plot, peta restriksi, analisis hidrofobisitas suatu protein dan masih banyak fasilitas lain yang dapat mempermudah kerja seorang peneliti (Nuswantara, 2000). Sekuen sebagian digunakan untuk menemukan potensi homolog yang akan digunakan untuk menduga fungsi dari query sekuen yang merupakan target sekuen yang dibutuhkan untuk menganalisis atau untuk membantu dalam permodelan pada struktur 3 dimensi (Rashidi and Lukas, 2000). Setelah informasi terkumpul dalam database, langkah berikutnya adalah menganalisa data. Pencarian database umumnya berdasar hasil alignment/pensejajaran sekuen, baik sekuen DNA maupun protein. Metode ini digunakan berdasar kenyataan bahwa sekuen DNA/protein bisa berbeda sedikit tetapi memiliki fungsi yang sama. Misalnya protein hemoglobin dari manusia hanya sedikit berbeda dengan yang berasal dari ikan paus. Kegunaan dari pencarian ini adalah ketika mendapatkan suatu sekuen DNA/protein yang belum diketahui fungsinya maka dengan membandingkannya dengan yang ada dalam database bisa diperkirakan fungsi daripadanya. Algoritma untuk pattern recognition seperti Neural Network, Genetic Algorithm dll telah dipakai dengan sukses untuk pencarian database ini. Salah satu perangkat lunak pencari database yang paling berhasil dan bisa dikatakan menjadi standar sekarang adalah BLAST (Basic Local Alignment Search Tool). Perangkat lunak ini telah diadaptasi untuk melakukan alignment terhadap berbagai sekuen seperti DNA (blastn), protein (blastp), dsb. Baru‐baru versi yang fleksibel untuk dapat beradaptasi dengan database yang lebih variatif telah dikembangkan dan disebut Gapped BLAST serta PSI (Position Specific Iterated)‐BLAST. Sementara itu perangkat lunak yang digunakan untuk melakukan alignment terhadap sekuen terbatas di antaranya yang lazim digunakan adalah CLUSTAL dan CLUSTAL W (Witarto, 2002).
2
BAHAN DAN METODE KERJA Bahan Urut‐urutan DNA hasil sekuens, data urutan DNA dan protein di GenBank, perangkat lunak di GenBank dan beberapa website, BioEdit versi 7.0.0 dan Treecon. Metode Penyiapan Data Format FastA 1. Notepad dibuka melalui ”Start” Æ “All Program” Æ “Accessories” Æ “Notepad” 2. Data urutan DNA hasil sekuensing dipindahkan ke program “Notepad” tersebut dengan cara mengkopi dan paste. 3. Data diatur dalam format fastA sebagai berikut : > nama urutan DNA
ATGC...dst (urutan hasil sekuensing DNA)
4. File disimpan dan diberi nama. Penyejajaran DNA dengan data DNA di GenBank 1. Ketik
http://www.ebi.ac.uk
http://www.ncbi.nlm.nih.gov
untuk untuk
website
GenBank
UniEropa
(EMBL),
website
GenBank
Amerika
Serikat,
http://www.ddbj.nig.ac.jp untuk website GenBank Jepang (DDBJ). 2. Pada website EMBL, diklik ”tools” Æ klik ”similarity and homology” Æ klik Blast2‐NCBI 3. Pada opsi ”DATABASE” diubah dari ”protein” menjadi ”nucleic acid”. 4. Urutan DNA hasil sekuensing dimasukkan ke form dalam program tersebut dengan cara memblok data sekuens (dalam format fastA) dan dicopy paste pada form yang tersedia, atau dengan meng‐upload file sekuens DNA (dalam notepad file) dengan mengklik “choose”. 5. Setelah data berhasil diupload, klik “RUN Blast” dan ditunggu hasilnya. 6. Hasil menunjukkan kesejajaran DNA hasil sekuens kita dengan jenis atau gen pada GenBank. 7. Identitas hasil kesejajaran dicatat sebagai kata kunci (keyword) pada tahap analisis kekerabatan urutan DNA maupun pembuatan pohon filogenetik. Analisis Kekerabatan Urutan DNA dan Pembuatan Pohon Filogenetik 1. Ketik http://www.ebi.ac.uk/srs enter. 2. Klik ”library page” dan pada window library page ini dipilih database yang diperlukan, contoh EMBL (coding sequence) ditandai (√) pada menu ”nucleotida sequence” 3. Klik ”Query Form” dan tunggu. 3
4. Pada kolom yang disediakan dimasukkan kata kunci hasil blast dan kata kunci lain seperti nama tingkatan taksonomi yang akan dibandingkan dengan hasil sekuens kita. Klik ”search”. 5. Ditampilkan data urutan‐urutan DNA sesuai dengan kata kunci yang kita masukkan. Jumlah tampilan yang sesuai dengan sekuens DNA kita ditunjukkan dengan angka yang terlihat pada bagian atas hasil. Jumlah tampilan yang dapat dilihat dalam satu tampilan dapat dirubah dengan mengubah jumlah angka ”show” pada ”Display Option” 6. Dipilih beberapa aksesi sesuai dengan tujuan analisis. Pada DNA yang dipilih ditandai dengan (√). 7. Untuk menampilkan format FastA pada hasil, pada opsi ”Display Option” diganti dari ”EMBLCDSSeqSimpleView” menjadi ”FastaSeqs” kemudian klik ”Apply Display Option”. 8. Semua aksesi yang muncul diblock, dicopi dan dipaste di bawah urutan DNA kita. 9. Format fastA DNA kita dan sekuens‐sekuens DNA yang berkerabat dengannya diatur agar rapi, komunikatif dan dapat dibaca oleh program filogenetik tree. Pembuatan Pohon Filogenetik dengan MAFFT version 6.0 1. Diketik website : http://align.bmr.kyushu‐u.ac.jp/mafft/online/server/ 2. Data aksesi urutan DNA kita dan kerabatnya dimasukkan ke dalam form yang tersedia dalam format fasta. 3. Diklik “submit” dan ditunggu. 4. Diklik “phylogenetic tree” 5. Diklik “GO” 6. Ditandai (√) pada ”NJ Åconserved sites (61 nuc)” 7. Diklik (√) ON pada ”Bootstrap” dan diklik ”GO” 8. Filogenetic Tree tampil jika pada PC atau laptop telah diinstal “java”. Analisis Urutan DNA dan Enzim Restriksi yang berperan 1. Diketik website : http://tools.neb.com/NEBcutter2/index.php 2. Dimasukkan data hasil sekuens DNA kita dengan namanya. 3. Diklik “submit” dan ditunggu. 4. Ditampilkan peta situs enzim restriksi yang dapat digunakan untuk memotong urutan DNA kita. Analisis Deduksi Protein dari urutan DNA 1. Diketik website : http://www.expasy.org/tools/ 4
2. Pada opsi “DNA Æ Protein” diklik “Translate” 3. Urutan DNA dalam format fastA dimasukkan ke dalam form dengan cara copi dan paste atau upload. 4. Diklik ”Translate” 5. Dimasukkan urutan DNA hasil sekuens kita (tanpa nomor dan nama urutan DNA) dan klik ”Translate Sequence” 6. Terdapat beberapa frame hasil translasi (urutan asam amino). Dipilih hasil translasi yang mempunyai kesejajaran yang tinggi dengan database protein, biasanya yang mempunyai urutan asam amino panjang diawali dengan ”Met” dan diakhiri dengan ”Stop”. 7. Dilakukan analisis kekerabatan dan pembuatan pohon filogenetik pada urutan asam amino seperti pada asam nukleat. Analisis Domain Protein pada Program Prosite 1. Diketik website : http://www.expasy.org/tools/ 2. Diklik “PROSITE” pada bagian atas website. 3. Dimasukkan urutan asam amino yang diperoleh dari hasil translate urutan sekuens DNA kita dengan cara copi dan paste ke form yang tersedia, dimulai dari “Met” dan diakhiri dengan “Stop”. 4. Unklik (√) “Exclude” sehingga tanda (√) hilang. 5. Diklik “Scan” dan ditunggu hasilnya. 6. Diperoleh hasil yang siap untuk dianalisis. Analisis Hidrofobisitas Protein Menggunakan Metode Kyte‐Doolittle 1. Diketik website : http://gcat.davidson.edu/rakarnik/KD.html (Kyte Doolittle Homepage) 2. Diklik ”perform a Kyte‐Doolittle for hydropathy plot on your sequence”. 3. Dimasukkan urutan asam amino yang kita miliki ke dalam form yang telah disediakan. 4. Diklik “Submit” dan ditunggu hasilnya. 5. Diperoleh hasil yang siap untuk dianalisis.
5
HASIL DAN PEMBAHASAN Hasil Dari hasil praktikum yang telah diacarkan maka kami diberikan tugas untuk mencari salah satu jenis sekuen dan membuat primernya. Berdasarkan hal tersebut diatas maka pada laporan ini saya menggunakan sekuen dari enzim hydrogenase yang diambil dari Eschercia coli sejumlah 1740 bp dan membandingkannya dengan 3 jenis enzim hydrogenase pada E. coli dengan strain yang berbeda yang data sekuennya terdapat di bankdata dengan maksud untuk tujuan tersebut diatas. Dengan memasukkan kata kunci hydrogenase pada http://www.ebi.ac.uk maka akan didapatkan 14.435 sekuen yang berkenaan dengan hydrogenase. Kemudian dipilih salah satu untuk diakses sekuensnya. Pada praktikum ini dipilih M28369: E. coli. sebagai ‘unknown sequence’, tampilan http://www.ebi.ac.uk dapat dilihat pada gambar 1. >ENA|M28369|M28369 Escherichia coli hydHG operon regulating labile hydrogenase activity. : Location:1..1000 ggtaagtcaggatgcaaacagccgggagatccagttacgctttaccgccaacgacacatt accggaaattcaggccgacccggacaggctgactcaggtcgtgttgaatctctatctcaa tgctattcaggcgattggtcagcatggcgtgattagcgtgacggccacgaaagccggcgg ggtaaaaatcagcgttaccgacagcggtaagggaattgcggcagatcagcttgatgccat cttcactccgtacttcaccactaaagccgaaggcaccggattggggctggcggtcgtgca taatattgttgaacaacacggtggtacaattcaggtcgcaagccaggagggaaaaggctc aacgttcaccctctggcttccggtcaatattacgcgtaaggacccacaaggatgacgcac gataatatcgatattctggtggtggatgatgacattagccactgcactattttgcaggct ttactgcgcggctggggctataacgtcgcgctggcgaacagcgggcgacaggcgttggag caggtgcgggaacaggtttttgatcttgtgctttgcgatgtgcgaatggcggagatggac ggcatcgccacgctgaaagagatcaaagcgttaaacccggcaattccggtgctgattatg actgcgtactccagcgtcgagacggcggtagaggcactgaaaactggggcgctggattat ctcatcaagccgctggatttcgataacctacaggcgacgtggaaaaagcgctcgcatacg cacagtattgatgctgaaacacctgcggtgactgccagccagttcggtatggtcggtaaa agcccggcgatgcaacacctgctcagtgaaatcgccctcgtcgcgccatgcgaagccacg gtactgatccacggcgattcggcacgtaaagagctggtcgccaggggacttcacgccagt agcgcacgtagcgaaaaaccgctggtaacgctcaactgtg Gambar 1. Sekuens dari dipilih M28369 sebagai ‘unknown sequence’ yang akan dibandingkan Kemudian sekuen ini dikopi dari http://www.ebi.ac.uk ke notepad. Lalu dicari sekuen lainnya dengan memanfaatkan NCBI blast. Dari situs tersebut diperoleh kode‐kode sekuen yang memiliki kemiripan dengan M28369 yang juga berasal dari E. coli. Maka dipilihlah tiga kode yang sama‐sama berasal dari E. coli. 6
Dari kode‐kode tersebut, dimasukkan ke dalam sistem pencari di http://www.ebi.ac.uk maka diperoleh sekuen‐sekuen yang dibutuhkan. Sekuen‐sekuen tersebut dikopi lalu dipasta di notepad. Dengan program bioedit maka diperoleh bahwa data tersebut tidaklah conserve terhadap sesamanya. Oleh karena itu perlu dilakukan desain primer dengan memperhatikan hal‐hal berikut: ‐ Tm‐nya ‐ %GC lebih baik kalo sekitar 50%, karena kalau terlalu banyak AT maka Tm akan turun/rendah ‐ Dimer, antara primer F dan R tidak boleh komplemen, bisa saling menempel, sehingga primer tidak efektif. Selain itu, di dalam primernya sendiri tidak boleh ada dimer ‐ Komplemen antar primer dan intra primer Apabila dipilih sekuen berikut sebagai primer Forward yaitu GCWATTSCGGTGCTGAYTAT, sekuen yang berasal dari daerah bp 600‐an, maka dari sekuen tersebut akan dihasilkan mRNA.sedangkan untuk sekuen reversenya merupakan komplemen dari mRNA, sehingga dibuat komplemennya agar diperoleh sekuen sebagai mRNA. Maka urutanya dari urutan (daerah bp 800‐ an) TTTCACTGAGCAGGTGTTGC diperoleh primer reversenya adalah AAWGTGACTSGTCCACWACG. Primer‐primer ini didesain karena daerah dalam gen antara organism yang satu dengan yang lain tidak conserve. Pembahasan Maka untuk mengisolasi gen hydrogenase dari E. Oli dapat digunakan primer sebagai berikut, dimana primer F adalah GCWATTSCGGTGCTGAYTAT dan primer R adalah AAWGTGACTSGTCCACWACG. Apabila dianalisa %GCnya maka akan diperoleh Tm = 2 (A+T) + 4 (G+C) = 2 (4+7) + 4 (5+4) = 22 + 36 = 58 sedangkan untuk reversenya diperoleh Tm = 2 (7+3) + 4 (4+6) = 20 + 40 = 60. Maka diperoleh suhu annealing dari primer‐primer tersebut adalah antara 58‐60°C. Ketika akan melakukan isolasi gen hydrogenase yang berasal dari E. coli, maka bahan dan kondisi PCR nya dapat dilakukan sebagai berikut: Komposisi PCR terdiri dari 1 ul dNTP, 0,5 ul taq polymerase, 1 ul buffer mix, 0,4 ul DMSO, 1,5 ul cDNA, 0,5 ul primer hyd F GCWATTSCGGTGCTGAYTAT, 0,5 ul primer hyd R AAWGTGACTSGTCCACWACG dan ddH2O hingga volume 10 ul. PCR dilakukan pada kondisi Pra PCR (predenaturasi) pada suhu 94oC selama 5 menit, denaturasi pada suhu 94oC selama 30 detik, annealing (penempelan) pada suhu 58oC selama 30 detik, pemanjangan 72oC selama 1 menit, pasca PCR 72oC selama 5 menit, pendinginan pada suhu 15oC selama 15 menit. Semua proses di atas dilakukan sebanyak 30 siklus. 7
SIMPULAN 1. Dengan memahami bagaimana mendesain primer maka dapat diketahui bagaimana cara untuk mengisolasi sebuah gen dari suatu organisme yang sekuennya belum kita ketahui dengan memanfaatkan bank data yang sudah ada di internet. 2. Setelah mengetahui primer yang dibutuhkan, maka dicari pula suhu annealing yang tepat untuk proses penempelan primer pada gen target. 3. Untuk sekuen yang informasinya masih kurang pada suatu organism, maka untuk mengisolasinya perlu menggunakan primer yang tidak terlalu spesifik. DAFTAR ACUAN Lewitter F1 1987 Online use of the GenBank Genetik Seguence Data Bank. Development in Industrial Microbiology. Vol. 27 Journal of Industrial Microbiology Suppl. No. 1
Nuswantara S. 2000. Internet untuk biologi molekuler. Warta Biotek Vol.14 No 2 Juni 2000.
Rashidi, H.H. & L.K. Buehler. 2000. Bioinformatics Basics. Applications in Biological Science and Medicine. CRC Press. London. pp 173.
Utama, A. 2003. Peran Bioinformatika dalam Dunia Kedokteran. Ilmu Komputer. Jakarta.
Witarto, AB. 2003. Bioinformatika Mengawinkan Teknologi Informasi dengan Bioteknologi. Ilmu Komputer, Jakarta.
8
LAMPIRAN
9
10
11
12
13
14
15