BAB I PENDAHULUAN
I.1
Latar Belakang Masalah Tugas Akhir atau Skripsi adalah salah satu syarat dari masa akhir perkuliahan.
Tugas Akhir di beberapa prodi memiliki beberapa kategori, salah satunya di prodi Manajemen dan Bisnis S1 di Universitas Widyatama. Semakin lama dokumen Tugas Akhir pun semakin bertambah banyak, sehingga hal tersebut menyebabkan sulitnya melakukan pengkategorian dokumen Tugas Akhir. Penyusunan dokumen sesuai dengan kategori yang ada pun sangat diperlukan untuk menyesuaikan dengan kategori yang seharusnya, agar lebih terorganisir dan dapat mengklasifikasi dan pengkategorian dokumen secara otomatis. Permasalahan utama dari setiap dokumen yang ada adalah terdiri dari kumpulan kata- kata yang disatukan menjadi kalimat dengan penyusunan sesuai bahasa yang manusia kuasai. Sehingga ini menjadi permasalahan yang utama dari pengklasifikasian dokumen teks. Salah satu proses untuk menyelesaikan masalah tersebut adalah dengan proses Text mining. Text mining merupakan proses pengambilan data berupa teks dari sebuah sumber, yang dimana sumber tersebut berupa teks, dokumen, dll. Dengan melakukan proses Text mining dapat dicari kata kunci yang mewakili dari dokumen tersebut, yang nantinya dapat dilakukan analisa dan pencocokan antara dokumen dengan database kata kunci yang telah dibuat sehingga dapat diklasifikasikan sesuai kategori konsentrasinya. Salah satu metode yang dapat digunakan untuk pengklasifikasian dokumen adalah dengan pengelolaan dokumen menggunakan metode Text Mining dan pengkategorian dokumen menggunakan algoritma K-Nearest Neighbor dengan menggunakan Algoritma similarity
yaitu Euclidean Distance dan Minkowski
Distance .
I-1
I-2
Berdasarkan hal tersebut pada tugas akhir ini saya tertarik untuk mengangkat tema pengembangan perangkat lunak tentang pengkategorian dokumen dengan judul “KLASIFIKASI TEKS DENGAN MENGGUNAKAN
ALGORITMA K-
NEAREST NEIGHBOR PADA DOKUMEN TUGAS AKHIR”
I.2
Rumusan Masalah Adapun rumusan masalah pada penelitian ini adalah sebagai berikut : 1.
Bagaimana
mengimplementasikan
Euclidean Distance dan
Algoritma
K-NN
menggunakan
Minkowski Distance untuk pengklasifikasian
dokumen Tugas Akhir? 2. Bagaimana menganalisis penggunaan Algoritma K-NN menggunakan Euclidean Distance dan
Minkowski Distance pada pengklasifikasian
dokumen?
I.3
Tujuan Penelitian Adapun tujuan pada penelitian ini adalah sebagai berikut : 1. Mengimplementasikan Algoritma K-NN menggunakan Euclidean Distance dan Minkowski Distance kedalam sistem 2. Menganalisis penggunaan Algoritma K-NN menggunakan Euclidean Distance dan Minkowski Distance pada pengklasifikasian dokumen
I.4
Batasan Masalah Adapun batasan masalah pada penelitian ini adalah sebagai berikut : 1. Data yang digunakan adalah dokumen Tugas Akhir mahasiswa/i Prodi Manajemen dan Bisnis S1 Universitas Widyatama 2. Dokumen yang digunakan berupa teks hanya bagian abstrak pada Tugas Akhir mahasiswa/i Prodi Manajemen dan Bisnis S1 Universitas Widyatama dalam bahasa Indonesia
I-3
3. Dokumen yang digunakan hanya dokumen abstrak dalam Bahasa Indonesia 4. Format dokumen berupa PDF
I.5
Metode Penelitian Metodologi yang digunakan mengikuti tahapan-tahapan dalam metode pembangunan perangkat lunak waterfall yang terdiri dari tahapan-tahapan sebagai berikut : 1. Requirement analysis and definition, tahap ini dilakukan untuk memperoleh gambaran dari layanan dan batasan bagi sistem yang akan dibangun kemudian dianalisis dan didefinisikan kebutuhan yang harus dipenuhi oleh aplikasi yang akan dibangun. Berdasarkan hasil pengumpulan data dilakukan analisis kebutuhan. Tujuan analisis untuk menggali kebutuhan-kebutuhan yang harus dipenuhi aplikasi yang akan dibuat untuk memperoleh fungsi dan perilaku software. 2. System and software design, pada tahap ini difokuskan pada desain database, arsitektur perangkat lunak, dan interface. 3. Implementation and unit testing, pada tahap ini hasil desain program diimplementasikan ke dalam kode-kode dengan menggunakan bahasa pemrograman yang sudah ditentukan kemudian diuji secara keseluruhan. 4. Integration and system testing, tahap ini dilakukan pengujian untuk mengethaui kekurangan dari aplikasi yang dibuat. 5. Operation and maintenance, tahap ini dilakukan ketika sistem sudah melewati pengujian dan siap digunakan, juga dilakukan pemeliharaan agar sistem dapat menangani masalah dan membutuhkan peningkatan kualitas aplikasi setelah rilis.
I-4
Gambar 1.1 Waterfall Model [1]
I.6
Sistematika Penulisan Adapun sistematika pembahasan laporan ini terdiri dari enam bab, yaitu : Bab Satu pendahuluan, merupakan bagian kesatu dari laporan ini. Pada bagian
ini akan dibahas latar belakang maslah, rumusan masalah, tujuan dan manfaaat penelitian, batasan masalah, metodologi penelitian dan sistematika penulisan. Bab Dua landasan teori, merupakan bagian kedua dari laporan ini. Pada bagian ini akan dibahas landasan teori yang berkaitan dan digunakan dalam tugas akhir ini. Bab Tiga analisis sistem, merupakan bagian ketiga dari laporan ini. Pada bagian ini akan dibahas analisis sistem yang terdiri dari identifikasi masalah, hasil analisa dan model sistem. Bab Empat perancangan sistem , merupakan bagian keempat dari laporan ini. Pada bagian ini akan dibahas rancangan aplikasi
sistem yang akan dibangun,
termasuk didalamnya rancangan proses aplikasi pembuatan laporan antarmuka dan basis data.
I-5
Bab Lima implementasi dan pengujian sistem, merupakan bagian kelima dari laporan ini. Pada bagian ini akan dibahas implementasi rancangan aplikasi sistem mulai dari software, basis data, dan antarmuka yang siap digunakam. Bab Enam penutup, merupakan bagian keenam dari laporan ini. Pada bagian ini akan dibahas kesimpulan dan saran-saran terhadap kekurangan yang terdapar pada aplikasi yang telah dibangun.