Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2012)
ISBN 978‐602‐19837‐0‐6
Analisis Efektivitas Algoritma C4.5 dalam Menentukan Peserta Pemenang Tender Projek Jose Augusto Duarte Guterres, Paulus Mudjihartono, Ernawati 1
Magister Teknik Informatika Universitas Atma Jaya Yogyakarta 2,3 Universitas Atma Jaya Yogyakarta
[email protected] ,
[email protected],
[email protected]
Abstrak Pemilihan kontraktor yang tepat dalam menangani sebuah projek dapat pula mempengaruhi kualitas kerja. Keputusan Pemenang tender projek merupakan keputusan yang dilakukan oleh panitia penyelenggara tender projek yang bersifat transparan yang dapat memberikan nilai riil sesuai dengan ketentuan dalam menentukan pemenang tender projek. Saat ini dalam penentuan pemenang tender projek masih bersifat manual sehingga informasi-informasi yang merupakan kriteria penentuan pemenang tender projek terkadang terabaikan. Kriteria penilaian yang peneliti gunakan dalam menentukan pemenang tender projek meliputi evaluasi administasi, evaluasi teknis, evaluasi harga dan evaluasi kualifikasi. Empat kriteria tersebut, peneliti gunakan untuk mengklasifikasikan pemenang tender projek menggunakan algoritma C4.5 dengan mencari nilai Entropy dan Gain yang mana dapat membentuk pohon keputusan dalam menentukan pemenang tender projek. Penentuan pemenang tender projek ini setelah dianalisa dengan menggunakan algoritma C4.5 dapat memberikan informasi yang efektif dalam menentukan peserta pemenang tender projek. Kata Kunci : Algoritma C4.5, Entropy, Gain, Pemenang tender projek, Pohon Keputusan.
1. Pendahuluan Menurut [1] menyampaikan bahwa Pemilihan kontraktor yang tepat dalam menangani sebuah projek dapat pula mempengaruhi kualitas kerja dalam kemajuan pembangunan yang didasarkan pada evaluasi multi-atribut. Penilaian dalam berbagai atribut untuk dipertimbangkan dalam pemilihan kontraktor dapat membantu meningkatkan proses seleksi dalam mendapatkan
keputusan yang terbaik dalam memilih kontraktor [1]. Penentuan pemilihan terhadap kontraktor bertujuan untuk mengetahui kemampuan secara teknis oleh panitia penyelenggara tender projek akan pentingnya suatu perencanaan pembangunan untuk tahapan projek selanjutnya. Persaingan usaha yang semakin ketatpun melatarbelakangi perlunya sistem penilaian sebagai alat evaluasi kinerja konsultan perencana dalam menangani suatu projek perencanaan, sehingga tercipta suatu produk perencanaan yang optimal, sebagai acuan pelaksanaan pekerjaan konstruksi dan sebagai suatu keunggulan [3] dalam pendukung keputusan. Pembuatan sistem pendukung keputusan menurut [2] untuk prakualifikasi kontraktor yang dalam pembuatan model base-nya dilakukan dengan mengidentifikasi variabel-variabel pembeda terhadap kinerja kontraktor dari segi Evaluasi administrasi, evaluasi teknis, evaluasi harga, dan evaluasi Kualifikasi. Hal tersebut dapat dilihat dari validasi eksternal yang dilakukan terhadap data yang tidak dipergunakan dalam pembuatan model base yang memberikan keakuratan cukup tinggi [2]. Sistem pendukung keputusan digunakan dalam memadukan data dan pengetahuan untuk meningkatkan efektivitas dan efisiensi dalam proses pengambilan keputusan [4]. Dalam sistem pendukung keputusan terdapat informasi-informasi yang perlu ditelaah lebih dalam lagi sehingga informasi-informasi yang dibutuhkan dalam pemecahan sebuah masalah dapat diselesaikan dengan baik. Dalam sistem pendukung keputusan, terdapat pula sebuah teknik penggalian data atau yang dikenal dengan penambangan data (data mining) untuk menyelesaikan suatu masalah dalam memberikan informasi-informasi yang dibutuhkan, metode penggalian data tersebut biasa dikenal dengan teknik penambangan data. Penambangan data merupakan proses analisis data untuk menemukan suatu pola dari kumpulan data-data. Penambangan data mampu menganalisa data yang besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung keputusan.
Data Maning dan Database System
3-7
Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2012) Salah satu teknik yang ada pada penambangan data adalah klasifikasi. Beberapa kelompok klasifikasi, di antaranya adalah pohon keputusan, Bayesian dan jaringan saraf. Salah satu klasifikasi penambangan data dalam pohon keputusan adalah Algoritma C4.5. Dalam algoritma C4.5 pemilihan atribut dilakukan dengan menggunakan Gain Ratio dengan mencari nilai entropy. Algoritma C4.5 menggunakan pendekatan induksi dimana, dalam pendekatan ini, algoritma C4.5 membagi-bagi data berdasarkan kirteria yang di pilih untuk membuat sebuah pohon keputusan. Algoritma C4.5 ini juga menggunakan pendekatan secara top-down [5].
ISBN 978‐602‐19837‐0‐6
Di mana : S = Himpunan kasus A = Atribut i = Jumlah Partisi Atribut Si = Jumlah Kasus pada partisi ke i S = Jumlah Kasus dalam S
2. Metode Metode yang digunakan untuk analisis adalah metode Klasifikasi, menggunakan konsep penambangan data klasifikasi algoritma C4.5 yaitu dengan mencari nilai information gain dan entroopy sehingga dari metode ini dapat membentuk sebuah pohon keputusan dalam menangani peserta pemenang tender projek yang mana secara umum algoritma C4.5 dapat membangun pohon keputusan [10] adalah sebagai berikut: 1. Pilih atribut sebagai akar 2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang 4. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama.
3. Pembahasan Algoritma C4.5 adalah pengembangan dari algoritma ID3. Oleh karena pengembangan tersebut algoritma C4.5 mempunyai prinsip dasar kerja yang sama dengan algoritma ID3, hanya saja Algoritma C4.5 menggunakan pendekatan induksi dimana, dalam pendekatan ini, algoritma C4.5 membagibagi data berdasarkan kirteria yang di pilih untuk membuat sebuah pohon keputusan. Algoritma C4.5 ini juga menggunakan pendekatan secara top-down [5] dalam algoritma C4.5 ([7] [9] [8] [6] 2007) pemilihan atribut dilakukan dengan menggunakan Gain Ratio dengan rumus : Entropy(S ) =
........(1)
Atribut dengan nilai Gain Ratio tertinggi dipilih sebagai atribut test untuk simpul. Dengan gain adalah information gain dengan rumus : Gain(S,A) = Entropy(S) 3-8
.........(2)
Gambar 1. Pohon Keputusan Lengkap (Abidin., A. Z. Z., 2011) Gambar 1 menunjukan pohon keputusan dalam pemberian rekomendasi ajar [11]. Jumlah simbol lingkaran sebagai node menunjukkan jumlah atribut sebagai atribut sumber kognitif, minat dan nilai awal. Sedangkan atrinut tujuan berupa rekomendasi ajar yang bernilai induktif dan nondirektif.
4. Hasil dan Pembahasan Analisis efektivitas algoritma C4.5 dalam menentukan pemenang tender projek seperti pada tabel 1, data penetuan pemenang tender projek merupakan tahap pengambilan keputusan berdasarkan kriteria evaluasi administrasi, evaluasi teknis, evaluasi harga dan evaluasi kulaifikasi untuk dijadikan sebagai modal pengetahuan dalam membentuk sebuah pohon keputusan. Analisis dan perancangan sistem yang dapat membantu memberikan keputusan kepada panitia penyelenggara tender projek akan kemungkinan perserta tender projek yang akan menerima atau tidaknya sebuah projek diantaranya menentukan pohon keputusan, menentukan aturan, model data, fungsionalitas sistem dan perancangan struktur halaman. Implementasi sistem menggunakan bahasa pemrograman Visual studio dan MySQL sebagai database-nya. Sebagai langkah awal untuk melakukan perhitungan pencarian nilai gain dan entropy dapat dilihat pada kasus di bawah ini (Tabel 1). Misalkan ditampilkan 54 dataset pengujian untuk klasifikasi C4.5
Data Maning dan Database System
Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2012) Tabel 1. Tabel Dataset Uji Penentuan peserta pemenang tender projek Peserta Tender Trojek (P) P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14 P15 P16 P17 P18 P19 P20 P21 P22 P23 P24 P25 P26 P27 P28 P29 P30 P31 P32 P33 P34 P35 P36 P37 P38 P39 P40 P41 P42 P43 P44 P45 P46 P47 P48 P49 P50 P51 P52 P53 P54
Evaluasi Adminstrasi Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik Baik cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup cukup Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang Kurang
Evaluasi Teknis Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Sedang Sedang Sedang Sedang Sedang Sedang Rendah Rendah Rendah Rendah Rendah Rendah Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Sedang Sedang Sedang Sedang Sedang Sedang Rendah Rendah Rendah Rendah Rendah Rendah Tinggi Tinggi Tinggi Tinggi Tinggi Tinggi Sedang Sedang Sedang Sedang Sedang Sedang Rendah Rendah Rendah Rendah Rendah Rendah
Evaluasi Harga Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah Tinggi Tinggi Sedang Sedang Rendah Rendah
Evaluasi Kualifikasi Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap Lengkap Tidak Lengkap
Keputusan Penawaran (Diterima Atau Tidak) No No Yes No Yes No Yes No Yes No Yes No No No Yes No Yes No No No Yes No Yes No Yes No Yes No Yes No No No No No Yes No No No Yes No Yes No No No Yes No Yes No No No No No No No
Untuk bisa menentukan nilai-nila gain dan entropy dari masing-masing atribut di atas, maka terlebih kita konversi ke dalam bentuk tabel klasifikasi yang lebih detail sebagai berikut : Tabel 2. Tabel klasifikasi untuk perhitungan nilai gain dan entropy Node
Jumlah
No Yes
Entropy
GAIN
Kasus (S) (S1) (S2) 1
54
37
17 0,898653376
Baik
18
11
Cukup Kurang
18 18
12 14
7 0,964078765 6 0,918295834 4 0,764204507
Tinggi Sedang Rendah
18 18 18
12 10 15
6 0,918295834 8 0,99107606 3 0,650022422
Tinggi Sedang Rendah
18 18 18
16 11 10
2 0,503258335 7 0,964078765 8 0,99107606
Lengkap Tidak Lengkap
27 27
10 27
17 0,950956048 0 0
TOTAL Evaluasi Administrasi
Evaluasi Teknis
Evaluasi Harga
Evaluasi Kualifikasi
0,016460341
0,216674141
0,079182323
0,423175351
Setelah tabel 2 dibuat, maka langkah selanjutnya adalah melakukan perhitungan nilai entropy dengan menggunakan persamaan (2), untuk mencari nilai gain nya nanti. Langkah pertama mencari nilai entropy total, dilakukan sebagai berikut :
ISBN 978‐602‐19837‐0‐6
Baris Total Kolom Entropy pada Tabel 2 di hitung dengan Rumus Sebagai Berikut
Entropy(Total) = (-37/54 * Log2 (37/54)) + (17/54 * Log2(17/54) Entropy(Total) = ((-37/54) * 0,584962501) + ((17/54) * (-1,584962501) = 0,37372339 + 0,524929986 = 0,898653376 Perhitungan selanjutnya adalah menghitung nilai gain total untuk Evaluasi Administrasi dengan menggunakan persamaan (2) berdasarkan nilai entropy dari masing-masing atributnya sebagai berikut :
EntropyAdminstrasi (Baik) = (-11/18 * Log2(11/18) + (-7/18) * Log2(7/18) = 0,434190401 + 0,529888364 = 0,964078765 EntropyAdminstrasi (Cukup) = (-12/18 * Log2(12/18) + (-6/18) * Log2(6/18) = 0,389975 + 0,528320834 = 0,918295834 EntropyAdminstrasi (Kurang) = (-14/18 * Log2(14/18) + (-4/18) * Log2(4/18) = 0,281998951 + 0,482205556 = 0,764204507 Information Gain (Total,EVAdmin) = 0,898653376 - ((18/54 * 0,964078765 ) + (18/54 * 0,918295834 ) + (18/54 * 0,764204507)) = 0,898653376 - (0,882193035) = 0,036102799 Perhitungan nilai entropy dan gain diteruskan sampai atribut terakhir dan diperoleh nilai-nilai gain dan entropy tertentu. Hasil dari nilai gain kemudian dibandingkan dengan nilai gain lainnya untuk mencari nilai tertinggi yang akan dijadikan acuan untuk melakukan proses perhitungan kembali pada proses pembentukan struktur pohon [10]. pada perhitungan pada Tabel 2 diatas maka nilan Gain Tertinggi terdapat pada Atribut Evaluasi Kualifikasi Sehingga membentuk pohon Keputusannya seperti pada gambar 1.
Data Maning dan Database System
3-9
Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2012)
ISBN 978‐602‐19837‐0‐6
6.
Gambar 2. Pohon Keputusan Untuk Evaluasi Kualifikasi Tender Projek Menggunakan algoritma C4.5
Setelah melakukan perhitungan seperti langkah perhitungan dengan mencari nilai gain dan etropy maka proses selanjutnya adalah melakukan perhitungan kembali, yang mana atribut evaluasi kualifikasilah yang menjadi akar perhitungan sehingga bisa mendapatkan nilai entopy dan gain untuk proses selanjutnya. Setelah semua proses dihitung maka dapat membentuk pohon keputusan yang lengkap seperti pada gambar 3.
IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Sedang) AND (Evaluasi Teknis Sedang) THEN YES. 7. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Sedang) AND (Evaluasi Teknis Baik) THEN YES. 8. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Tinggi) AND (Evaluasi Teknis Baik) THEN NO. 9. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Tinggi) AND (Evaluasi Teknis Sedang) AND (Administrasi Baik) THEN YES. 10. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Tinggi) AND (Evaluasi Teknis Sedang) AND (Administrasi Cukup) THEN YES. 11. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Tinggi) AND (Evaluasi Teknis Sedang) AND (Administrasi Kurang) THEN YES. 12. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Tinggi) AND (Evaluasi Teknis Rendah) THEN NO.
4.2. Algoritma C4.5 dengan Metode Lain : a. Algoritma C4.5 Algoritma C4.5 dalam aplikasi weka dikenal juga dengan J48 maka hasil dari C4,5 adalah
b. Algoritma ID3 Gambar 3. Pohon Keputusan Lengkap Penentuan Peserta Pemenang Tender Projek
4.1. Aturann Klasifikasi Algoritma C4.5 Dari Hasil Analisi berdasarkan gambar 3 diatas maka algoritma dalam menentukan pemenang tender projek memiliki beberapa aturan: 1. 2. 3.
4.
5.
IF (Evaluasi Kulaifikasi Tidak Lengkap) THEN NO. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Rendah) THEN YES. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Sedang) AND (Evaluasi Teknis Rendah) AND (Evaluasi Administrasi Kurang) THEN NO. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Sedang) AND (Evaluasi Teknis Rendah) AND (Evaluasi Administrasi Cukup) THEN YES. IF(Evaluasi Kulaifikasi Lengkap) AND (Evaluasi Harga Sedang) AND (Evaluasi Teknis Rendah) AND (Evaluasi Administrasi Baik) THEN YES.
3-10
c. Aturan NNge
Data Maning dan Database System
Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2012)
5. Kesimpulan Dari Hasil Analisis data diatas dengan pembuktian-pembukitan algoritma C4.5 berdasarkan literatur yang digunakan maka dapat disimpulkan bahwa metode algoritma C4.5-pun dapat diterapkan dalam menentukan peserta pemenang tender projek dengan menggunakan kriteria kriteria evaluasi administrasi, evaluasi teknis, evaluasi harga dan evaluasi kualifikasi dan jika dibandingkan dengan metode lain seperti ID3 dan NNge maka algoritma C4.5 memiliki correctly classified yang lebih tinggi jika dibandingkan dengan metode yang lain (metode ID3 dan aturan NNge) dan root relative squere error Pada algoritma C4.5 lebih rendah jika dibandingkan dengan metode yang lain (metode ID3 dan aturan NNge) sehingga algoritma C4.5 dapat dikatakan sebagai metode yang efektif dalam menentukan peserta pemenang tender projek.
Referensi [1]
[2]
[3]
[4]
[5]
Turskis, Zenonas., 2008., Multi-Attribute Contractors Ranking Method By Applying Ordering Of Feasible Alternatives Of Solutions In Terms Of Preferability Technique, Baltic Journal On Sustainability, 14(2): 224–239. Demir, Hülya And Bostanci, Bülent., 2010., Decision-Support Analysis For Risk Management, African Journal Of Business Management, Vol. 4(8), Pp. 1586-1604,18 July, Issn 1993-8233 ©2010 Academic Journals. Diputra, I Gede Astawa., 2009, Sistem Penilaian Kinerja Konsultan Perencana Dalam Menangani Proyek Perencanaan Bangunan Gedung, Jurnal Ilmiah Teknik Sipil Vol. 13, No. 2, Juli. Suprapto, Heri., And Wulandari Sri., 2006, Decision Support System (Dss) Dalam Prakualifikasi Kontraktor, International Civil Engineering Conference "Towards Sustainable Civil Engineering Practice, Surabaya, August 25-26. Karaolis, Minas A., Member., Ieee., Moutiris, Joseph A., Hadjipanayi Demetra., And Pattichis, Constantinos S., Senior Member.,
ISBN 978‐602‐19837‐0‐6
Ieee., 2010, Assessment Of The Risk Factors Of Coronary Heart Events Based On Data Mining With Decision Trees, Ieee. [6] Al-Hegami, Ahmed Sultan., 2007, Classical And Incremental Classification In Data Mining Process, Ijcsns International Journal Of Computer Science And Network Security, Vol.7 No.12, December. [7] Chih-Chiang Wei., And Jiing-Yun You., 2011, C4.5 Classifier For Solving The Problem Of Water Resources Engineering, Proceeding Of The International Conference On Advanced Science, Engineering And Information Technology, Isbn 978-98342366-4-9, Juanuary. [8] Karegowda, Asha Gowda., Manjunath, A. S., And Jayaram, M.A., 2010, Comparative Study Of Attribute Selection Using Gain Ratio And Correlation Based Feature Selection, International Journal Of Information Technology And Knowledge Management, Volume 2, No. 2, Pp. 271-277, JulyDecember. [9] Minegishi, Tatsuya., Ise, Masayuki., Niimi, Ayahiko., Konishi, And Osamu., 2009, Extension Of Decision Tree Algorithm For Stream Data Mining Using Real Data, Fifth International Workshop On Computational Intelligence & Applications, Ieee Smc Hiroshima Chapter, Hiroshima University, Japan, November. [10] Kusrini, Luthfi, E. T., 2009, Algoritma Data Mining, Edisi 1, Andy Offset, Yogyakarta. [11] Abidin., A. Z. Z., 2011, Implementasi Algoritma C4.5 dalam menganalisa kemungkinan pembelian komputer sebagai media pembelajaran mahasiswa, Digital Information & Sistem conference, ISBN 978979; Bandung.
Data Maning dan Database System
3-11
Seminar Nasional Teknologi Informasi dan Komunikasi (SNASTIKOM 2012)
3-12
Data Maning dan Database System
ISBN 978‐602‐19837‐0‐6