Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
APLIKASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN SISWA JURUSAN IPA MAN 3 PADANG Eka Praja Wiyata Mandala, S.Kom, M.Kom, Rahmatino, S.Kom Teknik Informatika,Fakultas Ilmu Komputer Universitas Putra Indonesia “YPTK” Padang email:
[email protected], email:
[email protected] Abstract –This study aims to prediction the graduate of Student IPA in the MAN 3 Padang by using a decision tree method be represented using PHP dan MySQL programming. Theory used in this study is the theory associated with the data Mining. The steps are data collection techniques used to interview and students data on 2012/2013 years. On this analysis method describes the UML Unified Modelling Language (UML) is a "language" that has become standard in the industry to specify, visualize, design and document the artifacts of software systems, to model the business and non-software systems MySQL is an application or other system to manage the database or data management. PHP programming language is used, and also describes a method of decision tree by C4.5 algorithm. Keywords: Data Mining, UML, Decision tree, C4.5 Algorithm PENDAHULUAN Pemanfaatan data yang ada di dalam sistem informasi untuk menunjang kegiatan pengambilan keputusan, tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Sistem mengenai kelulusan yang diterapkan pemerintah saat ini menyebabkan ketidakpastian akan kelulusan siswa yang menyebabkan kegelisahan bagi para siswa maupun guru. Dengan adanya sistem baru yang diterapkan oleh pemerintah ini menyebabkan masyarakat khususnya pihak sekolah kesulitan dalam memprediksi kelulusan siswa/i mereka. Pada penelitian ini, dirumuskan beberapa permasalahan sebagai berikut : 1. Bagaimana merancang aplikasi data mining dapat memprediksi kelulusan siswa jurusan IPA di MAN 3 Padang ? 2. Bagaimana membuat sebuah aplikasi data mining yang dapat menyajikan data secara cepat? 3. Bagaimana aplikasi data mining dapat dijadikan sebagai penunjang keputusan yang akurat? 4. Bagaimana aplikasi data mining mampu menghasilkan pengetahuan-pengetahuan yang baru berupa informasi yang bermanfaat? Tujuan yang ingin dicapai dari pelaksanaan dan penulisan penelitian ini adalah Aplikasi Data Mining Untuk . . .
menghasilkan aplikasi untuk mendapatkan informasi yang berguna untuk memprediksi kelulusan siswa jurusan IPA di MAN 3 Padang dengan teknik data mining dan algoritma c.45.
LANDASAN TEORI Perangkat lunak (Software) adalah program komputer yang terasosiasi dengan dokumentasi perangakt lunak seperti dokumentasi kebutuhan, model design dan cara penggunaaan (user manual). Sebuah program komputer tanpa terasosiasi dengan dokumentasinya maka belum dapat dikatakan perangkat lunak (Softwawe). sebuah perangkat lunak juga disebut dengan sistem perangkat lunak. Sistem berarti kumpulan komponen yang saling terkait dan mempunyai satu tujuan yang ingin dicapai (Rosa dan Shalahuddin, 2011). Karakter perankat lunak dalah sebagai berikut (Rosa dan Shalahuddin, 2011): a. Perangkat lunak dibangun dengan rekayasa (software engineering) bukan diproduksi secara manufaktur atau pabrikan. b. Perangkat lunak tidak pernah usang ("wear over") karena kecacatan dalam perangkat lunak dapat diperbaiki. c. Barang produksi pabrikan biasanya komponen barunya akan terus diproduksi, sedangkan perangkat lunak biasanya terus diperbaiki seiring bertambahnya kebutuhan.
22
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
Model Software Development Life Cicle (SDLC) air terjun (waterfall) sering juga disebut model sekuensial linear(sequential linear) atau alur hidup klasik. model air terjun menyediakan pendekatan alur hidup perangkat lunak secara sekuensial atau berturut-turut dimuli dari analisis , desain, pengodean, pengujian, dan tahap pendukung (support) (Rosa dan Shalahuddin, 2011). Berikut adalah gambar model air terjun :
Sumber : Rosa dan Shalahuddin, 2011 Gambar 1 Ilustrasi Model Waterfall Unified Modelling Language(UML) merupakan bahasa visual untuk pemodelan dan komunikasi mengenai sebuah sistem dengan menggunakan diagram dan teks-teks pendukung. UML hanya berfungsi untuk melakukan pmodelan. Jadi penggunaan UML tidak terbatas pada metodologi tertentu, meskipun pada kenyataannya UML paling banyak digunakan pada metodologi berorientasi objek (Rosa dan Shalahuddin, 2011). Use case diagram atau diagram use case merupakan pemodelan untuk kelakuan (behavior) sistem informasi yang akan dibuat.Use case merupakan mendeskripsikan sebuah interaksi antara satu atau lebih actor dengan sistem informasi yang akan dibuat. Secara kasar, use case digunakan untuk mengetahui fungsi apa saja yang ada dalam sebuah sistem informasi dan siapa saja yang berhak menggunakan fungsi-fungsi itu (Rosa dan Shalahuddin, 2011). Diagram kelas atau class diagram menggambarkan struktur sistem dari segi pendefenisisan kelas-kelas yang akan dibuat untuk membangun sistem (Rosa dan Shalahuddin, 2011). State machine diagram atau dalam bahasa Indonesia disebut diagram status digunakan untuk menggambarkan prubahan status atau transisi status dari sebuah sistem atau mesin. Perubahan tersebut digambarkan dalam suatu graf berarah. State machine diagram merupakan pengembangan dari diagrm finite state automata dengan penambahan beberapa fitur dan konsep baru (Rosa dan Shalahuddin, 2011).
Aplikasi Data Mining Untuk . . .
ISSN :1412-5854
Activity diagram adalah teknik untuk mendiskripsikan logika procedural, proses bisnis dan aliran kerja dalam banyak kasus. Activity diagram mempunyai peran seperti halnya flowchart, akan tetapi perbedaannya dengan flowchart adalah activitas diagram bias mendukung perilk parallel sedangkan flowchart tidak bias (Munawar, 2005) Sequence diagram digunakan untuk menggambarkan perilaku pada sebuah scenario. Diagram ini menunjukkan sejumlah contoh objek dalam message (pesan) yang diletakkan diantara objek-objek ini didalam use case (Munawar, 2005). Collabrationdiagram adalah perluasan dari objek diagram. (Objek diagram menentukan objek-objek dan hubungnnya satu sama lain). Collaboration diagram menunjukkan message-message objek yang dikirimkan satu sama lain (Munawar, 2005) Deployement diagrammenunjukkan tata letak sebuah sistem secara fisik, menampakkan bagian-bagian software yang berjalan pada bagian-bagian hardware (Munawar, 2005). Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2006 / Kusrini dan Luthfi, 2009). Data mining sering juga disebut sebagai knowledge discovery in database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar (Santosa, 2007). Dalam klasifikasi, keluaran dari dari setiap data adalah bilangan bulat atau disktrit. Dalam contoh pengambilan keputusan untuk main bola atau tidak maka keuaran tersebut bias diubah ke bilangan bulat 1 atau -1. Dengan melihat keluaran yang berupa bilangan bulat kita bias menerapkan metod klasifikasi (Santosa, 2007). Dalam decision tree tidak menggunakan vector jarak untuk mengklasifikasikan obyek. Seringkali data observasi mempunyai atributatribut yang bernilai nominal. Seperti yang diilustrasikan, misalkan obyeknya adalah sekumpulan buah-buahan yang bisa dibedakan berdasarkan atribut bentuk, warna, ukuran dan 23
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
rasa. Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris dan tiap nilai tidak bisa dijumlahkan atau dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar, sedang dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat decision tree untuk menentukan suatu obyek termasuk jenis buah apa jika nilai tiap-tiap atribut diberikan (Santosa, 2007). Decision tree sesuai digunakan untuk kasus-kasus yang keluarannya bernilai diskrit. Walaupun banyak variasi model decision tree dengan tingkat kemampuan dan syarat yang berbeda, pada umumnya beberapa ciri yang cocok untuk diterapkannya decision tree adalah sebagai berikut(Santosa, 2007). Algoritma c4.5 merupakan algoritma yang dignakan untuk membentuk pohon keputusan (Kusrini dan Luthfi, 2009). Pohon keputusan merupakan metode klasifikasi dan metode prediksi yang sangat kuat dan terkenal. Metode pohon keputusan mengubah fakta yng sangat besar menjadi pohonkeputusanyng sangat dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat diekspreikan dalam bentuk bahasa basis data seperti structured query language untuk mencarirecord pada kategori tertentu (Kusrini dan Luthfi, 2009). Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut: 1. Pilih atribut sebagai akar 2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang 4. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. Untuk perhitungan nilai entrophy dapat dilihat pada persamaan sebagai berikut: Entropy(S)
𝑛 𝑖=1 −𝑝𝑖
ISSN :1412-5854
gain digunakan rumus seperti tertera dalam persamaan berikut: 𝑛
Gain(S,A)=Entropy(S)-
│𝑆𝑖│
𝑖=1 │𝑆│
∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖)
Keterangan : S : himpunan kasus A : atribut n : jumlah partisi atribut A |Si| : jumlah kasus pada partisi ke-i |S| : jumlah kasus dalam S Menurut permendikbud (2011), Siswa dinyatakan lulus dari Sekolah setelah: a. menyelesaikan seluruh program pembelajaran; b. memperoleh nilai minimal baik pada penilaian akhir untuk seluruh mata pelajaran yang terdiri atas kelompok mata pelajaran a) agama dan akhlak mulia; b) kelompok mata pelajaran kewarganegaraan dan kepribadian; c) kelompok mata pelajaran estetika, dan d) kelompok mata pelajaran jasmani, olah raga, dan kesehatan; c. lulus US/M untuk kelompok mata pelajaran ilmu pengetahuan dan teknologi; dan d. lulus UN. PHP adalah singkatan dari personal home page yang merupakan bahasa standaryang digunakandalamduniawebsite.PHPadalahbahas apemrogramanyang berbentuk script yang diletakkan didalam web server. Ada beberapa pengertian tentangPHP, akan tetapi PHP dapat diartikan sebagai hypertext preeprocessor. Ini merupakan bahasa yang hanya dapat berjalan pada server yang hasilnya dapat ditampilkan pada klien. Interpreter PHP dalam mengeksekusi kode PHP pada sisi server disebut serverside, berbeda dengan mesin maya java yang mengeksekusi program pada sisi klien(client-server).(Kasiman Peranginangin, 2009).
∗ 𝑙𝑜𝑔2 𝑝𝑖
Keterangan : S : himpunan kasus A : fitur n : jumlah partisi S pi : proporsi dari Si terhadap S Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk menghitung
Aplikasi Data Mining Untuk . . .
MySQL merupakan softwaresystem manajemen database Database ManagementSystem– DBMS)yangsangatpopulardikalanganpemrogra manweb, terutama di lingkunganLinux dengan menggunakan skrip dan ped. FungsiMySQLdapatdikatakansebagaiinterprete rquery,karenasetiapkita menggunakanquerySQL kitaharusmeletakkannyadidalamfungsiini.Deng ankata lain, SQL tidak dapat dijadikan tanpa 24
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
adanya fungsi MySQL. MySQL termasuk jenis relational database management system (RDBMS). Sehingga istilah seperti tabel, baris dan kolom tetap digunakan dalam MySQL. Pada MySQL sebuah database mengandung beberapa tabel, tabel terdiri dari sejumlah baris dan kolom. Gambar 2 Tampilan Login
HASILDANPEMBAHASAN Setelah dilakukan analisa seperti penjelaskan sebelumnya, maka sampailah pada langkah selanjutnya yaitu tahap implementasi. Implementasi ini merupakan tahap penerapan atau tahap daur hidup pengembangan sistem yang telah dibuat apakah sistem sudah berjalan dengan benar serta juga merupakan uji coba langsung cara menjalankan sistem bagi Waka Kurikulum. Dalam tahap ini, implementasi dilakukan untuk menentukan bagaimana cara menganalisa kepuasan Pengguna terhadap tingkat system yang telah dirancang. Setelah itu akan ditentukan rule-rule yang akan mendukung proses pengujian dari data yang akan diproses serta dengan uji coba langsung bagaimana cara menjalankan sistem bagi Waka Kurikulum. Dalam tahap ini berlangsung beberapa aktivitas secara berurutan yaitu mulai dari menerapkan rencana implementasi, melakukan kegiatan implementasi, dan tindak lanjut implementasi. Pengujian data akan dilakukan dengan menggunakan PHP dan MySql. Implementasi bisa diartikan pelaksanaan atau penerapan atau juga dapat disebut sebagai proses untuk melaksanakan ide, program atau seperangkat aktivitas baru dengan harapan orang lain dapat menerima atau melakukan perubahan. Maka dalam melakukan implementasi diperlukan tempat atau lingkungan implementasi. Tampilan program yaitu merupakan yang menjelaskan tentang proses dimulainya sampai program ini selesai di eksekusi, pointpoint pada sub bab ini akan menjelaskan tentang bagaimana sebuah form dijalankan dan apa saja fungsi yang terdapat pada form tersebut. 1.
Login LoginMerupakan halaman yang pertama kali ditampilkan ketika mengakses sistem. Pada halaman utama terdapat terdapat beberapa tombol, diantaranya adanya tombol login untuk akses masuk. Halaman utama dapat digambarkan sebagai berikut : Aplikasi Data Mining Untuk . . .
2.
Menu Utama Menu utamaMerupakan halaman yang pertama kali ditampilkan ketika Waka Kurikulum telah berhasil login. Pada halaman utama terdapat 6 menu, diantaranya adanya menu Home, Data Siswa, Proses Mining, Perhitungan Mining, Pohon Keputusan,dan Log Out. Halaman utama dapat digambarkan seperti gambar berikut :
Gambar 3 Tampilan Menu Utama 3.
Data Siswa Pada form ini, Waka Kurikulum dapat melihat data siswa yang telah ada, serta Waka Kurikulum Dapat melakukan Print Pohon Hapus semua data, Browse, data, Import Data, dan Input Data.
Gambar 4 Tampilan Data Siswa 4.
Input Data Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih input data siswa.
25
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
menu Decision perhitungan C4.5. Halaman ini digunakan untuk melihat proses data mining
Gambar 5 Input Data Form Browse Data Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih browse data.
Gambar9 Perhitungan C4.5
5.
Gambar 6 Browse Data Form Impor Data Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih import data.
9.
Form Pohon Keputusan Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih menu Decision Tree. Halaman ini digunakan untuk melakukan pengujian terhadap data yang telah di proses.
6.
Gambar 10 Pohon Keputusan 10. Form Print Data Siswa Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih print data siswa.
Gambar 7 Import Data 7.
Form Proses Mining Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih menu Proses Mining.
Gambar 11 Print Data Siswa 11. Form Print Pohon Keputusan Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih print pohon Keputusan.
Gambar 8 Proses Mining 8.
Form Perhitungan C4.5 Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum memilih
Aplikasi Data Mining Untuk . . .
Gambar 12 Print Pohon Keputusan
26
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
12. Form Laporan Data Siswa Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum melihat hasil dari print data siswa.
Keterbatasan Sistem Dari penjelasan sebelumnya terlihat bahwa aplikasi ini tidak sempurna. Pada aplikasi data mining untuk mencari keputusan dengan menggunakan metode algoritma C.45 ini memiliki beberapa keterbatasan sistem yang juga merupakan keterbatasan bagi penulis sebagai berikut:. 1.
Gambar 13 Laporan Data Siswa 13. Form Laporan Print Pohon Keputusan Halaman ini merupakan halaman yang akan muncul saat Waka Kurikulum melihat hasil print Pohon Keputusan.
ISSN :1412-5854
2.
3.
Aplikasi data mining untuk mencari keputusanmenggunakan metode algoritma C.45 ini hanya bisa digunakan untuk memprediksi jurusan IPA saja. Aplikasi data mining ini tidak bisa mevisualisasikan pohon keputusan ke dalam bentuk gambar. Aplikasi data mining ini tidak bisa mengambil data selain dalam format.xls
Saran Dari penelitian yang telah dilakukan dan sebagai akhir dari penulisan ini, dapat memberikan saran-saran dengan harapan akan berguna bagi pihak sekolah guna meningkatkan prestasi siswa. Saran-saran yang dikemukakan adalah sebagai berikut : Gambar 14 Laporan Pohon Keputusan KESIMPULAN Kesimpulan Dari uraian bab-bab sebelumnya maka dapat ditarik suatu kesimpulan mengenai perancangan dan implementasi aplikasi data mining untuk mencari keputusan menggunakan metode algoritma C.45 sebagai berikut : 1.
2.
3.
4.
Pihak sekolah dapat memprediksikan kelulusan seorang siswa dengan metode decision tree menggunakan algoritma C4.5 dengan atribut-atibut yang digunakan antara lain, nilai mid, nilai pra un, nilai afektif, nilai psikomotor.. Pihak sekolah dapat memprediksi kelulusan siswa dengan lebih cepat dan efisien karena data siswa telah tersistem. Membantu pihak sekolah menghindari kesalahan dalam pengisian data karena data dapat diambil dalam file yang berformat.xls. Menghasilkan pengetahuan-pengetahuan yang baru berupa informasi yang bermanfaat bagi pihak sekolah bahwa kelulusan seorang siswa dapat diprediksi melalui aplikasi data mining menggunakan metode decision tree serta algoritma C4.5.
Aplikasi Data Mining Untuk . . .
1. Diharapkan adanya penelitian lebih lanjut, karena ada beberapa bagian yang tidak dibahas karena batasan waktu dan batasan dari permasalahan yang telah diterapkan sebelumnya. 2. Diharapkan pada pengembangan selanjutnya aplikasi data mining ini dapat menampilkan visualisasi berupa graph pada pohon keputusan. 3. Diperlukan maintenance terhadap program aplikasi yang telah dibuat, supaya dapat di gunakan secara berkelanjutan selama kebutuhan terhadap informasi.
DAFTARREFERENSI [1] Haviluddin. 2011. Memahami Penggunaan UML (Unified Modelling Language). Samarinda. [2] Jalote, Pankaj. 2008. A Concise Introduction to Software Engineering. Springer. New Delhi [3] Kusnawi. 2007. Pengantar Solusi Data Mining.Yogyakarta [4] Kusrini dan Emha Taufiq Luthfi. 2009. Algoritma Data Mining. Penerbit Andi Offset, Yogyakarta. [5] Mulyanto, Aunur R. 2009. Rekayasa Perangkat Lunak Jilid I. Departemen Pendidikan Nasional, Jakarta. [6] Munawar. 2005. Pemodelan Visual dengan UML. Graha Ilmu, Yogyakarta. 27
Majalah Ilmiah UPI YPTK, Volume 20, No. 2, Oktober 2013
ISSN :1412-5854
[7] Pressman, Roger S. 2001. Software Engineering. McGraw-Hill. New York. [8] Rosa Ariani dan M. Shalahuddin. 2011. Modul Pembelajaran Rekayasa Perangkat lunak. Modula. Bandung [9] Santosa, Budi. 2007. Data Mining : Teknik Pemanfaatan Data untuk keperluan Bisnis. Graha Ilmu. Yogyakarta. [10] Sulistyorini, Prastuti. 2009.Pemodelan Visual dengan Menggunakan UML dan Rational Rose. Jurnal Teknologi Informasi XIV, 23 – 29.
Aplikasi Data Mining Untuk . . .
28