BAB 1 PENDAHULUAN
1.1 Latar Belakang Analis forensik komputer
merupakan pihak yang melakukan investigasi dan
pencarian barang bukti digital. Pada kasus tertentu, file yang dibutuhkan sebagai barang bukti digital untuk proses pengadilan telah terhapus. Pada saat proses restore, header file dari file tersebut bisa jadi hilang sehingga file tersebut tidak diketahui tipe file-nya dan mempersulit proses rekonstruksi file. Beberapa penelitian untuk mengidentifikasi file telah dilakukan sebelumnya, diantaranya adalah identifikasi file “fingerprints” (McDaniel & Heydari, 2003) dan identifikasi “fileprints” (Li, et al. 2005), penggunaan linear diskriminan the Fisher (Veenman, 2007) yang diaplikasikan kepada fileprint, entropy, dan pengukuran yang berbasiskan Kolmogorov complexity dan perbandingan dua metode yaitu metode linear discriminant dan longest common substring dan subsequences untuk membedakan 4 tipe file, yakni .pdf, .gif, .bmp, dan .jpg (Calhoun & Coles, 2008). Akan tetapi, penelitian yang dilakukan Calhoun dan Coles tersebut hanya sebatas pembuktian konsep. Identifikasi tipe file fragment merupakan hal yang rumit dikarenakan banyaknya tipe file yang berbeda-beda, mulai dari yang simple dan primitive seperti sebuah blok text ASCII maupun file JPEG sampai kepada file complex seperti file Adobe Acrobat (pdf). (Roussev & Garfinkel, 2009). Longest Common Subsequences merupakan metode klasik yang digunakan untuk menyelesaikan berbagai masalah seperti membandingkan dua file ataupun masalah bioinformatika. Algoritma LCS mempunyai kelebihan di bagian optimasi coding. LCS dapat mengurangi jumlah masalah yang ada karena pada umumnya header dan footer pada file jarang berubah, dan meskipun berubah, hampir pasti tidak berubah keduanya, sehingga dapat
2 mengurangi memory yang diperlukan untuk matrix perbandingan (Calhoun & Coles, 2008).
Metode ini dipakai untuk melakukan pencarian sequence terpanjang dari
beberapa sequence. Dalam pengujian ini, sequence yang digunakan adalah beberapa sequence dari hex number file utuh, kemudian hasil dari pengujian tersebut akan diuji kembali dengan sequence dari hex number file fragment, bila cocok, maka akan didapatkan tipe file dari file fragment tersebut. Setelah mengidentifikasikan file, program yang akan dirancang juga akan melakukan pembuktian akan hasil identifikasi file dengan metode penambahan header file sesuai hasil identifikasi. Misalkan suatu file fragment telah teridentifikasi sebagai file dengan ekstensi .pdf, maka akan dilakukan verifikasi dengan menambahkan header file .pdf sehingga dapat dibuka oleh aplikasi pembaca pdf dan isi daripada file tersebut dapat diperiksa dan dibaca. Berdasarkan latar belakang diatas, penulis mengajukan proposal penelitian dengan judul “Identifikasi tipe file dari file fragment menggunakan longest common subsequences (LCS)”.
1.2 Rumusan Masalah Penghapusan file untuk menghilangkan barang bukti membuat pihak analis forensik komputer kesulitan dalam merekonstruksi ulang file dari fragment yang tersisa. Untuk merekonstruksi file fragment tersebut, pihak forensik perlu mengetahui tipe file dari file fragment, oleh karena itu, diperlukan suatu metode untuk mengidentifikasi tipe file dari file fragment.
1.3 Tujuan Penelitian Mengidentifikasi tipe file dari file fragment dengan menggunakan Longest Common Subsequences
3 1.4 Batasan Masalah Untuk menghindari perluasan permasalahan yang ada, maka penulis membuat batasan masalah, yakni: 1. File yang akan diidentifikasi merupakan file dengan format .pdf, .doc, dan .rtf. 2. Hex number dari file fragment tidak dimanipulasi menggunakan hex editor atau aplikasi yang serupa. 3. Program yang dibangun hanya sebatas pengaplikasian metode LCS kepada file fragment, tidak sampai kepada tahap program yang dapat membedakan file utuh dengan file fragment.
1.5 Manfaat Penelitian Manfaat dari penelitian ini adalah: 1. Membantu mengidentifikasi tipe file dari file fragment. 2. Menjadi referensi untuk penelitian yang akan datang.
1.6 Metodologi Penelitian Tahapan-tahapan yang akan dilakukan pada pelaksanaan penelitian adalah sebagai berikut: 1. Studi Literatur Studi literatur dilakukan dalam rangka pengumpulan bahan referensi mengenai forensik digital, file, ekstraksi fitur, identifikasi file dan Longest Common Subsequences. 2. Analisis Permasalahan Pada tahap ini dilakukan analisis terhadap bahan referensi yang telah dikumpulkan pada tahap sebelumnya untuk mendapatkan pemahaman mengenai metode yang diterapkan yakni Longest Common Subsequences dalam menyelesaikan masalah identifikasi tipe file dari file fragment.
4 3. Pengumpulan Data Pada tahap ini dilakukan pengumpulan data serta pengujian data dalam training dataset berupa file utuh dan testing dataset berupa file fragment. 4. Implementasi Pada
tahap
ini
dilakukan
implementasi
metode
Longest
Common
Subsequences dalam penyelesaian masalah identifikasi tipe file dari file fragment. 5. Evaluasi dan Analisis Hasil Pada tahap ini dilakukan evaluasi serta analisis terhadap hasil yang didapatkan melalui implementasi metode Longest Common Subsequences dalam penyelesaian 6. Dokumentasi dan Pelaporan
1.7 Sistematika Penulisan Sistematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut:
Bab 1: Pendahuluan Bab ini berisi latar belakang dari penelitian yang dilakukan, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian, dan sistematika penulisan. Bab 2: Landasan Teori Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas pada penelitian ini. Pada bab ini akan dijelaskan teori-teori tentang forensic digital, file, file fragment, identifikasi file, serta Longest Common Subsequences (LCS). Bab 3: Analisis dan Perancangan Bab ini berisi tentang analisis, arsitektur umum dan penerapan metode Longest Common Subsequences (LCS) dalam fase training dan fase testing serta penjelasan tentang fase verifikasi.
5
Bab 4: Implementasi dan Pengujian Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan yang disusun pada bab 3. Selain itu, hasil penelitian akan didapatkan dari pengujian yang telah dilakukan, apakah hasil yang didapat sesuai dengan harapan atau tidak.
Bab 5: Kesimpulan Dan Saran Bab ini berisi kesimpulan dari rancangan dan penelitian yang telah dibahas pada bab 3, serta hasil penelitian pada bab 4 serta saran-saran yang diajukan untuk pengembangan penelitian selanjutnya.