Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
MENENTUKAN KEMUNGKINAN MASUKNYA CALON MAHASISWA BARU PADA SEBUAH PERGURUAN TINGGI SWASTA MANGGUNAKAN TEKNIK KLASIFIKASI POHON KEPUTUSAN DENGAN APLIKASI RAPIDMINER 5.1 Petrus Dwi Ananto Pamungkas Program Studi Teknik Informatika, STMIK-Akademi Bina Insani-Bekasi Jl. Siliwangi No. 6, Bekasi, Jawa Barat - Indonesia 17113 Telp. (021) 88958130, (021) 82400924 e-mail :
[email protected] ABSTRACT Classification techniques with the formation of the decision tree is a data processing technique enormous able to present the data into information that is easily understood by almost everyone didandingkan in table form. Usually, the results of data collection is in table form. But not everyone is able to read the tables quickly and accurately as you wish manufacturer, especially if the data is very large. Data in this study hundreds of data presented in tabular form. All prospective students information collected in one table with a lot of items, ranging from personal data, parents to home school. The resulting table will be difficult to understand so that the absorption of information becomes old and inaccurate. Presentation of information in the form of a decision tree into a proper alternative for the data very much. By using an application RapidMiner 5.1, the making of a decision tree data from prospective students to more easily and quickly so that the university management can see and know what are the factors that make potential students to continue the registration process to become a student. Keywords: data, information, decision tree, RapidMiner 5.1 application.
ABSTRAK Teknik Klasifikasi dengan pembentukan pohon keputusan merupakan salah satu teknik pengolahan data yang sangat besar yang mampu mempresentasikan data menjadi informasi yang mudah untuk dipahami oleh hampir semua orang didandingkan dalam bentuk tabel. Biasanya, hasil pengumpulan data adalah dalam bentuk tabel. Tapi tidak semua orang mampu membaca tabel dengan cepat dan tepat sesuai keinginan pembuatnya, apalagi jika datanya sangat besar. Data dalam penelitian ini ada ratusan data yang disajikan dalam bentuk tabel. Semua informasi calon mahasiswa dikumpulkan dalam satu tabel dengan banyak item, mulai dari data pribadi, orang tua hingga asal sekolah. Tabel yang dihasilkan tersebut akan sulit dipahami sehingga penyerapan informasinya menjadi lama dan tidak akurat. Penyajian informasi dalam bentuk pohon keputusan menjadi alternatif tepat untuk data yang sangat banyak tersebut. Dengan menggunakan aplikasi RapidMiner 5.1 maka pembuatan pohon keputusan dari data calon mahasiswa menjadi lebih mudah dan cepat sehingga pihak manajemen perguruan tinggi dapat melihat dan mengetahui faktorfaktor apa saja yang membuat calon mahasiswa untuk tetap melanjutkan proses pendaftaran hingga menjadi mahasiswa. Kata kunci: data, informasi, pohon keputusan, aplikasi RapidMiner 5.1 Informatics and Business Institute Darmajaya
45
Petrus Dwi Ananto Pamungkas
1.
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
digunakan
PENDAHULUAN Berdasarkan data Dikti tahun 2014
bahwa
terdapat
lebih
dari
13.000
untuk
kegiatan
belajar-
mengajar. Semuanya butuh biaya yang harus
diperhitungkan
dengan
sebaik-
perguruan tinggi swasta di Indonesia yang
baiknya untuk keberlangsungan hidup
aktif
perguruan tinggi tersebut.
melakukan
kegiatan
belajar-
mengajar. Sebagai perguruan tinggi yang
Berdasarkan latar belakang masalah
melakukan pengelolaan dana sendiri maka
sebelumnya, maka penelitian difokuskan
perguruan
pada masalah bagaimana menghasilkan
tinggi
swasta
mencari
orang-orang
menjadi
mahasiswa.
harus
yang
aktif
berminat
Semakin
banyak
informasi
dengan
mudah
dan
mengenai faktor-faktor yang menyebabkan
calon mahasiswa yang menjadi mahasiswa
calon
maka semakin besar sumber dana yang
menjadi
dimiliki oleh perguruan tinggi swasta
perguruan tinggi swasta di Bekasi?
tersebut
sehingga
kegiatan
cepat
belajar-
mahasiswa
mendaftar
mahasiswa
Adapun
tujuan
hingga
pada
sebuah
penelitian
yang
mengajar dapat dilakukan secara optimal.
dilakukan adalah untuk menghasilkan
Untuk menarik minat calon mahasiswa
informasi
maka dibutuhkan biaya, waktu dan tenaga
mengenai faktor-faktor yang mungkin
yang lumayan besar. Jika memang sebuah
menjadi penentu para calon mahasiswa
perguruan
mampu
mendaftar hingga menjadi mahasiswa pada
menganalisis faktor-faktor apa saja yang
sebuah perguruan tinggi swasta di Bekasi
membuat orang melakukan pendaftaran
melalui penggunaan aplikasi RapidMiner
hingga menjadi mahasiswa maka dapat
5.1.
tinggi
swasta
dihemat biaya, waktu dan tenaga. Kegiatan
dengan
Menurut
mudah
Puspita
dan
dan
cepat
Wahyudi
pendaftaran mahasiswa baru merupakan
(2015) dalam penelitian “Algoritma C4.5
langkah
Berbasis Decision Tree untuk Prediksi
awal
dari
kegiatan
belajaroleh
Kelahiran Bayi Prematur” menjelaskan
mahasiswa pada sebuah perguruan tinggi.
bahwa dari hasil prediksi model algoritma
Bagi sebuah perguruan tinggi swasta,
C4.5 berbasis Decision Tree memberikan
kegiatan
mahasiswa
nilai akurasi yaitu 93.60%. Dengan nilai
mempunyai peranan yang sangat penting
akurasi yang sudah mencapai Excellent
untuk keberlangsungan kegiatan, mulai
classification hal ini menunjukan bahwa
dari penentuan jumlah kebutuhan dosen
Decision Tree merupakan model yang
hingga
cukup baik.
mengajar
yang
akan
dilakukan
penerimaan
jumlah
ruangan
yang
akan
Informatics and Business Institute Darmajaya
46
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
Menurut Pamungkas (2014) dalam
kandungan
data
yang
ditampilkan
penelitian “Algoritma Data Mining C4.5
memiliki kecenderungan pola yang dapat
untuk
menghasilkan data yang cukup informatif.
Mengetahui
Faktor
Penentu
Pengunduran Diri Calon Mahasiswa pada
Menurut
Gartner
Group
dalam
Suatu Perguruan Tinggi Swasta (Studi
Larose (2005) bahwa “Data mining is the
Kasus pada STMIK-Akademi Bina Insani,
process of discovering meaningful new
Bekasi)”
melalui
correlations, patterns and trends by sifting
Algoritma C4.5 dapat diketahui faktor
through large amounts of data stored in
utama mundurnya calon mahasiswa dalam
repositories, using pattern recognition
proses pendaftaran antara lain informasi
technologies as well as statistical and
yang diperoleh dari diri sendiri, orang tua,
mathematical
dan teman. Calon mahahasiswa jaman
Hand
sekarang dapat memperoleh informasi
mengatakan “Data mining is the analysis
dengan mudah dan cepat tentang tempat-
of (often large) observational data sets to
tempat kuliah melalui media internet
find unsuspected relationships and to
ditambah lagi dukungan dari orang tua dan
summarize the data in novel ways that are
teman.
both understandable and useful to the data
dijelaskan
bahwa
Sedangkan Syahril (2011) dalam penelitian
“Konversi
al
dalam
Sedangkan
Larose
(2005)
owner”. Hal ini juga diperkuat oleh
Training
Cabena et al dalam Larose (2005) bahwa
Menjadi
“Data mining is an interdisciplinary field
Bentuk Pohon Keputusan dengan Teknik
bringing togther techniques from machine
Klasifikasi
Tools
learning, pattern recognition, statistics,
RapidMiner 4.1” menjelaskan bahwa data
databases, and visualization to address the
yang ditampilkan dalam bentuk pohon
issue of information extraction from large
keputusan menjadi lebih mudah dan cepat
data bases”.
Tentang Penyakit
Data
et
techniques”.
Hipertensi
Menggunakan
untuk dipahami dibandingkan bila data disajikan
dalam
tabulasi.
terutama dalam mengelola data yang
RapidMiner 4.1 berperan cukup baik
sangat besar untuk memudahkan activity
dalam mengkonversi data training yang
recording suatu transaksi dan untuk proses
ada
data warehousing agar dapat memberikan
sehingga
bentuk
Data mining sangat perlu dilakukan
walaupun
data
yang
dikonversikan dalam bentuk sebuah pohon keputusan berasal dari data yang sangat besar
namun
pada
dasarnya
nilai
Informatics and Business Institute Darmajaya
informasi yang akurat bagi penggunanya. Alasan utama mengapa data mining sangat
menarik
perhatian
industri
47
Petrus Dwi Ananto Pamungkas
informasi
dalam
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
beberapa
tahun
dan model deskriptif. Model prediktif
belakangan ini adalah karena tersedianya
melakukan prediksi terhadap data dengan
data dalam jumlah yang besar dan semakin
menggunakan
besarnya kebutuhan untuk mengubah data
diketahui dari data yang berbeda. Model
tersebut
dan
ini dapat dibuat berdasarkan penggunaan
pengetahuan yang berguna, karena sesuai
data historis lain melalui teknik klasifikasi
fokus bidang ilmu ini yaitu melakukan
dan regresi. Untuk teknik klasifikasi dapat
kegiatan mengekstraksi atau menambang
digunakan
pengetahuan
yang
networks, decision trees, support vector
informasi
machines, dan instance based. Model
menjadi
informasi
dari
berukuran/berjumlah
data besar,
hasil-hasil
neural
yang
networks,
telah
bayesian
inilah yang nantinya sangat berguna untuk
deskriptif
pengembangan.
mengidentifikasi pola-pola atau hubungan
Ada banyak metode data mining yang
digunakan
untuk
tujuan
yang
digunakan
untuk
dalam data dan memberikan cara untuk mengeksplorasi
sifat-sifat
data
yang
berbeda. Menurut Maimon & Rokach
diselidiki. Teknik-teknik yang digunakan
(2010) bahwa ada dua kelompok besar
dalam metode ini antara lain clustering,
dalam
summarization, linguistic summary, dan
metode
data
mining,
yaitu
verification dan discovery (Gambar 1).
visualization. Pohon keputusan merupakan metode klasifikasi yang banyak digunakan untuk mengubah fakta yang sangat besar menjadi pohon keputusan yang mempresentasikan aturan yang mudah dipahami dengan bahasa alami dan juga dapat diekspresikan dalam bentuk bahasa database, seperti
Gambar 1. Taksonomi dari Metode Data
Structured Query Language (SQL), untuk
Mining Menurut Maimon & Rokach
mencari record pada kategori tertentu. Pohon keputusan juga dapat digunakan
Metode
verification
umumnya
meliputi teknik-teknik statistik seperti goodness of fit, hypothesis testing (Uji-T), dan analisis variansi. Sedangkan metode
untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan variabel target.
discovery dapat dibagi atas model prediktif Informatics and Business Institute Darmajaya
48
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
Menurut Berry & Linoff (2004) bahwa sebuah pohon keputusan adalah
algoritma C4.5 untuk membangun sebuah pohon keputusan adalah sebagai berikut:
sebuah struktur yang dapat digunakan
1. pilih atribut sebagai akar,
untuk membagi kumpulan data yang besar
2. buat cabang untuk tiap–tiap nilai,
menjadi himpunan-himpunan record yang
3. bagi kasus dalam cabang, dan
lebih
menerapkan
4. ulangi proses untuk setiap cabang
serangkaian aturan keputusan. Dengan
sampai semua kasus pada cabang
masing-masing
memiliki kelas yang sama.
kecil
dengan
rangkaian
pembagian
tersebut, anggota himpunan hasil menjadi
Untuk memilih atribut sebagai akar,
mirip satu dengan yang lainnya. Sebuah
didasarkan pada nilai gain tertinggi dari
pohon
atribut-atribut
keputusan
mungkin
dibangun
yang
ada.
Untuk
dengan cara seksama secara manual atau
menghitung gain digunakan rumus berikut:
dapat tumbuh secara otomatis dengan
Gain(S,A)=
menerapkan salah satu atau beberapa
Entrophy ( S )
algoritma
pohon
memodelkan
keputusan
himpunan
untuk
data
yang
terklasifikasi.
n
i 1
Si *Entrophy ( Si ) S
dimana: S
= Himpunan kasus
keputusan
i
= Atribut
biasanya dinyatakan dalam bentuk tabel
n
= Jumlah partisi atribut A
Data
dengan
dalam
atribut
pohon
dan
record.
Atribut
S i = Proporsi S i terhadap S
menyatakan suatu parameter yang dibuat sebagai
kriteria
dalam
pohon. Proses pada pohon keputusan adalah mengubah bentuk data dalam tabel menjadi model pohon dan mengubah bentuk
pohon
menjadi
S
pembentukan
aturan
= Jumlah kasus dalam S
Sedangkan penghitungan nilai entropy dapat dilihat dalam persamaan berikut: n
Entrophy ( S ) pi. log 2 pi i 1
dan dimana:
menyederhanakan aturan.
S
= Himpunan kasus
beberapa algoritma yang dapat digunakan
i
= Fitur
dalam pembentukan pohon keputusan,
n
= Jumlah partisi S
antara
p i = Proporsi S i terhadap S
Menurut Larose (2005) bahwa ada
lain
CART,
ID3,
dan
C4.5.
Algoritma C4.5 merupakan pengembangan dari
algoritma
ID3.
Secara
umum,
Informatics and Business Institute Darmajaya
49
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
sehingga perlu dilakukan data cleaning
2. METODE PENELITIAN Penelitian dilakukan terhadap data
berupa penghapusan data yang terduplikasi
calon mahasiswa yang masuk ke STMIK-
dan inkonsistensi. Dari hasil data cleaning
Akademi Bina Insani, Bekasi. Rentang
ini tersisa data sebanyak 513 orang untuk
data yang dimaksud adalah selama tahun
data tahun 2009, 730 orang untuk data
2009, 2010, dan 2011. Metode klasifikasi
tahun 2010, dan .sebanyak 730 orang
digunakan untuk mengambil keputusan
untuk data tahun 2011. Tahap selanjutnya
dengan
kasus
adalah dilakukan penyesuaian field dengan
sehingga perlu dibuatkan variabel target,
membatasi kategori yang ada seperti
yaitu
asal_info
memperkirakan
lulus
dan
suatu
gagal.
Data
calon
hanya
berasal
dari
teman,
mahasiswa yang mendaftar dibandingkan
orangtua, kakak, kerabat, dan diri sendiri
dengan
sudah
dengan datang langsung ke STMIK-
diterima menjadi mahasiswa STMIK-
Akademi Bina Insani, Bekasi. Untuk
Akademi Bina Insani, Bekasi. Adapun
asal_jurusan
variabel input yang digunakan antara lain
SMA,
gelombang,
Sedangkan untuk jurusan_sekolah hanya
data
mahasiswa
pekerjaan
yang
orangtua,
asal
sekolah, jurusan sekolah, pilihan kuliah, dan asal informasi.
hanya
SMK,
diberikan
Madrasah,
pilihan
dan
D1.
IPA, IPS, Bahasa, dan lainnya. Saat semua data sudah valid maka mulai dilakukan pengolahan data dengan menggunakan aplikasi RapidMiner 5.1.
3. HASIL DAN PEMBAHASAN 3.1. Penggunaan Aplikasi RapidMiner 5.1 Sebelum
menggunakan
a. Tampilan Awal Saat Menjalankan Aplikasi RapidMiner 5.1
aplikasi
RapidMiner 5.1, pastikan terlebih dahulu data yang akan diolah. Data yang dipilih adalah
data
mendaftar
di
calon
mahasiswa
yang
STMIK-Akademi
Bina
Insani, Bekasi pada tahun 2009, 2010, dan 2011 sebanyak 744 orang, 905 orang, dan 883 orang. Dari data yang sudah didapat ternyata masih banyak terdapat duplikasi data, inkonsistensi data berupa field yang
Gambar 2. Tampilan Awal Aplikasi RapidMiner 5.1
kosong dan kesalahan cetak (tipografi) Informatics and Business Institute Darmajaya
50
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
Setelah muncul tampilan logo dan
perintah yang terdapat dalam Import
informasi tentang aplikasi RapidMiner 5.1
Configuration Wizard. Terdapat empat
(Gambar
tahap
2)
maka
muncul
tampilan
yang
harus
dilakukan
dalam
pemilihan tempat penyimpanan file yang
penyesuaian data excel. Tahap pertama
nantinya
merupakan tahap pengambilan data excel
menggunakan
akan
diolah
RapidMiner
dengan 5.1,
bisa
(Gambar 5).
membuat folder baru atau membuka dari file yang ada (lihat Gambar 3).
Gambar 5. Tampilan Tahap Pertama Import Configuration Wizard Gambar 3. Tampilan Pemilihan Tempat Penyimpanan File
Setelah
tahap
pertama
selesai
dilakukan maka tahap berikutnya adalah b. Tampilan Pengambilan Data Excel Ketika sukses menentukan tempat penyimpanan file, selanjutnya mengambil data yang akan diolah dalam bentuk file excel (import data excel) (Gambar 4).
pengambilan item data excel yang akan diolah (Gambar 6). Seleksi item-item data apa saja yang akan diolah. Kemudian akan tampil item data yang telah diseleksi (Gambar 7).
Gambar 4. Tampilan Import Data Excel
c. Penyesuaian Data Excel Penyesuaian data excel yang akan diolah dapat dilakukan dengan mengikuti
Informatics and Business Institute Darmajaya
Gambar 6. Tampilan Tahap Kedua Import Configuration Wizard
51
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
Gambar 10. Koneksivitas antara Data dan Model Pohon Keputusan Gambar 7. Tampilan Tahap Ketiga Import Configuration Wizard
3.2. Interpretasi Data Pola informasi yang dihasilkan dari
Untuk tampilan terakhir dari Import
proses klasifikasi ini ditampilkan dalam
Configuration Wizard adalah menentukan
bentuk
tipe data untuk item KETERANGAN
tree)sehingga
menjadi bentuk LABEL (Gambar 8).
pihak yang berkepentingan.
pohon
keputusan
mudah
(decision
dimengerti
oleh
Gambar 10. Pohon Keputusan Tahun 2009 Gambar 8. Tampilan Tahap Keempat Dari gambar 10 di atas dapat dilihat
Import Configuration Wizard
bahwa ada beberapa faktor yang membuat d. Pemilihan Model Pengolahan Data Setelah tersedia
data
dalam
berikutnya
yang
akan
diolah
aplikasi
maka
tahap
adalah
memilih
model
calon mahasiswa tetap melanjutkan proses pendaftaran hingga menjadi mahasiswa antara lain: 1. Calon
mahasiswa
yang
pengolahan data. Dalam penelitian ini
mendapatkan
digunakan model Decision Tree (Pohon
berasal dari orangtua dan teman.
Keputusan) dan menghubungkan data
2. Calon
informasi
yang
mahasiswa
yang
yang telah disesuaikan dengan model
mendapatkan informasi berasal dari
pohon keputusan (Gambar 9).
kakak
Informatics and Business Institute Darmajaya
(saudara
kandung) 52
dan
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
memilih untuk kuliah pada pagi
kakak
hari dan berasal dari SMK dengan
memilih untuk kuliah pagi hari.
jurusan IPS. 3. Calon
(saudara
3. Calon mahasiswa
yang
kandung)
mahasiswa
mendapatkan
dan
yang
informasi
yang
mendapatkan informasi berasal dari
berasal dari kerabat (om, tante,
kakak
sepupu, maupun tetangga) dan
(saudara
kandung)
dan
memilih untuk kuliah pada pagi
mendaftar
hari serta berasal dari SMK dengan
ketiga.
jurusan selain IPS. 4. Calon
mahasiswa
4. Calon yang
sebelum
gelombang
mahasiswa
mendapatkan
yang
informasi
yang
mendapatkan informasi berasal dari
berasal dari kerabat (om, tante,
kerabat (om, tante, sepupu, maupun
sepupu, maupun tetangga) dan
tetangga) dan memilih jurusan
mendaftar
kuliah sekretari.
ketiga, memilih kuliah di malam
setelah
gelombang
hari, serta tinggal di wilayah DKI Jakarta.
Gambar 11. Pohon Keputusan Tahun 2010 Berdasarkan gambar 11 di atas dapat
Gambar 12. Pohon Keputusan Tahun 2011
dilihat bahwa ada beberapa faktor yang membuat
tetap
Berdasarkan gambar 12 di atas dapat
melanjutkan proses pendaftaran antara
dilihat bahwa ada beberapa faktor yang
lain:
membuat
1. Calon
calon
mahasiswa
mahasiswa
mendapatkan
informasi
mahasiswa
mahasiswa
tetap
yang
melanjutkan proses pendaftaran antara
yang
lain:
berasal dari orangtua dan teman. 2. Calon
calon
yang
mendapatkan informasi berasal dari
Informatics and Business Institute Darmajaya
1. Calon
mahasiswa
mendapatkan
informasi
yang yang
berasal dari orangtua dan teman.
53
Petrus Dwi Ananto Pamungkas
2. Calon
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
mahasiswa
mendapatkan
yang
informasi
7. Calon
yang
mahasiswa
yang
mendapatkan informasi berasal dari
berasal dari kerabat (om, tante,
kakak
sepupu, maupun tetangga) dan
mendaftar
berasal dari sekolah dengan jurusan
ketiga dan keempat serta memilih
selain IPA dan IPS.
kuliah program studi Manajemen
3. Calon
mahasiswa
mendapatkan
informasi
(saudara setelah
kandung), gelombang
yang
Administrasi, serta berasal dari
yang
sekolah manapun dengan jurusan
berasal dari kerabat (om, tante,
IPA.
sepupu, maupun tetangga) dan berasal dari sekolah dengan jurusan
4. SIMPULAN
selain IPA, serta tinggal di DKI
Sumber informasi yang diperoleh calon
Jakarta.
mahasiswa menjadi faktor utama lanjutnya
4. Calon
mahasiswa
yang
proses pendaftaran hingga sampai menjadi
mendapatkan informasi berasal dari
mahasiswa. Dengan kemajuan teknologi
kakak
dan
internet maka semua informasi tentang
sebelum
perguruan tinggi dan kegiatan-kegiatannya
(saudara
sudah
kandung)
mendaftar
gelombang ketiga dan keempat. 5. Calon
mahasiswa
dapat diketahui dengan cepat dan mudah.
yang
Ditambah dukungan dari orang tua dan
mendapatkan informasi berasal dari
teman maka semakin menguatkan niat
kakak
calon mahasiswa untuk terus menjalani
(saudara
mendaftar
kandung)
setelah
dan
gelombang
proses
pendaftaran
hingga
menjadi
ketiga dan keempat serta memilih
mahasiswa. Testimoni kakak (saudara
kuliah program studi Manajemen
kandung) dan tetangga yang pernah atau
Informatika.
sedang kuliah juga menjadi faktor yang
6. Calon
mahasiswa
yang
mendapatkan informasi berasal dari kakak mendaftar
(saudara setelah
harus diperhatikan oleh pihak manajemen sebuah perguruan tinggi.
kandung), gelombang
DAFTAR PUSTAKA
ketiga dan keempat serta memilih kuliah program studi Akuntansi
[1] Berry, Michael J. A. dan Gordon S.
maupun Sekretari, serta berasal
Linoff. 2005. Introduction to Data
dari SMK.
Mining and
Informatics and Business Institute Darmajaya
Knowledge Discovery.
54
Petrus Dwi Ananto Pamungkas
Jurnal Informatika, Vol.15, No.1, Bulan Juni 2015
Third Edition. Potomac: Two Crows
Decision Tree untuk Prediksi Kelahiran
Corporation.
Bayi Prematur. Prosiding Konferensi Nasional
[2] Bramer, Max. 2007. Principles of Data Mining. London: Springer-Verlag.
Ilmu
Pengetahuan
dan
Teknologi (KNIT) 2015. Hal. 107-112. ISBN 978-602-72850-0-2. 8 Agustus 2015. Bina Sarana Informatika: Bekasi.
[3] Kusrini dan Emha Taufiq Luthfi. 2009. Algoritma Data Mining. Yogyakarta: Andi Offset.
[8] Rapid-IvGmbH. 2010. RapidMiner 5: User Manual. www.rapid-i.com
[4] Larose, Daniel T. 2005. Discovering
[9] Syahril, Muhammad. 2011. Konversi
Knowledge in Data: An Introduction to
Data
Training
Tentang
Penyakit
Data Mining. New Jersey: John Willey
Hipertensi Menjadi Bentuk Pohon
& Sons, Inc.
Keputusan dengan Teknik Klasifikasi Menggunakan Tools RapidMiner 4.1.
[5] Maimon, Oded dan Lior Rokach. 2010. Data Mining and Knowledge Discovery
Jurnal SAINTIKOM. Vol. 10; No. 2; Mei 2011; Hal. 103-109.
Handbook. Second Edition. New York: Springer Science+Business Media.
[6] Pamungkas, Petrus Dwi Ananto. 2014. Algoritma Data Mining C4.5 untuk Mengetahui
Faktor
Penentu
Pengunduran Diri Calon Mahasiswa pada Suatu Perguruan Tinggi Swasta (Studi Kasus pada STMIK-Akademi Bina Insani, Bekasi). Bina Insani ICT Jurnal. Vol. 1; No. 2; Agustus 2014; Hal.
113-127.
ISSN
2355-3421.
STMIK Bina Insani: Bekasi.
[7] Puspita, Ari, dan Mochamad Wahyudi. 2015.
Algoritma
C4.5
Berbasis
Informatics and Business Institute Darmajaya
55