IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS
Romauli Manullang - 5108100501
Latar Belakang 2/18/2011
•
Pembuatan jadwal pada Jurusan Teknik lnformatika ITS harus dilakukan pada setiap pergantian semester.
• •
Pembuatan jadwal ini membutuhkan waktu, tenaga dan ketelitian. Adanya kesulitan untuk menentukan jumlah mahasiswa yang mengambil matakuliah tertentu pada tiap semester.
3
Perumusan Masalah 2/18/2011
–
Bagaimana melakukan prediksi jumlah mahasiswa, yang mengambil matakuliah tertentu menggunakan pendekatan metode klasifikasi dalam decision tree?
–
Bagaimana menentukan metode decision tree yang tepat berdasarkan karakteristik data?
–
Bagaimana membangun rule pengklasifikasian prediksi jumlah mahasiswa pengambil matakuliah?
–
Bagaimana mngimplementasikan metode klasifikasi decision tree?
–
Bagaimana melakukan uji coba decision tree tersebut ke dalam Matlab. 4
Tujuan 2/18/2011
Membuat implementasi decision tree untuk memprediksi jumlah mahasiswa pengambil matakuliah dengan menggunakan studi kasus di Jurusan Teknik Informatika ITS.
5
Batasan Masalah
2/18/2011
Data yang diambil dari Sistem Informasi Akademik ITS telah benar. Studi kasus yang digunakan adalah Jurusan Teknik Informatika ITS Surabaya. Membatasi nilai mahasiswa yang mengulang matakuliah yang memiliki nilai sebelumnya BC dan C. Metode decision tree yang digunakan adalah C4.5 Implementasi dibuat dengan menggunakan Matlab 7.1.
6
Algoritma C4.5 2/18/2011
Secara umum Algoritma C4.5 membangun pohon keputusan: a. Pilih atribut sebagai root. b. Buat cabang untuk masing-masing nilai. c. Bagi kasus dalam cabang. d. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama.
9
Information Gain Atribut A (Gain(a)) memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada.
Dengan: S : Himpunan Kasus A : Atribut n : Jumlah partisi atribut A | Si | : Jumlah Kasus pada partisi ke i | S| : Jumlah kasus dalam S
2/18/2011
Untuk
10
Entropy (Teori Informasi) Kebutuhan bit untuk menyatakan suatu kelas. Semakin kecil nilai Entropy maka semakin baik untuk digunakan dalam mengekstraksi suatu kelas.
2/18/2011
Dengan: S : Himpunan Kasus n : Jumlah partisi S p : Proporsi dari Si terhadap S 11
Algoritma Alpha Beta 2/18/2011
Alpha-beta pruning adalah algoritma pencarian yang mengurangi secara drastis jumlah simpul yang dibangkitkan untuk dievaluasi pada pohon pencarian yang dieksplorasi dalam algoritma Minimax. Simpul MIN akan dianggap sebagai simpul dengan urutan nilai dari rendah ke tinggi, dan simpul MAX dari tinggi ke rendah.
12
Perancangan 2/18/2011
Blok Diagram Sistem Informasi Akademik Pengambil Matakuliah
13
Diagram Alir Desain Sistem Secara Umum 2/18/2011
Mulai
Data Analisa Pengambil Matakuliah
Y
Decision Tree dengan Prioritas pengambil Matakuliah
Decision Tree dengan Pengambil Matakuliah
T
Decision Tree dengan Pengambil Matakuliah
Solusi Prediksi Pengambil Matakuliah
Selesai
14
Data Rule Decision Tree Nama Data
Keterangan
1.
Id
ID untuk tiap kondisi.
2.
Parent ID
ID yang mewarisi kondisi.
3.
Level
Level tiap kondisi dalam tree.
4.
Atribut
Atribut yang ditunjuk oleh level.
5.
Kondisi
Nilai atribut yang ditunjuk oleh atribut.
2/18/2011
No.
16
Implementasi
Membaca file xls (read file xls). Inisialisasi kolom file xls. Filter, digunakan untuk mengklasifikasi data maka sesuai dengan atribut. Get data entropy, menghitung nilai entropy dari data xls pada setiap kategori. Get total entropy, menghitung nilai entropy total setiap atribut. Calculate max gain, menghitung nilai gain dari setiap atribut berdasarkan nilai entropy dari kategori dan mencari nilai maksimal dari nilai gain. Get child node, sama tapi memanggil eliminate_category yang berfungsi membuang kategori parent (parent sebelumnya tidak anggap).
2/18/2011
18
Pruning 2.
3.
4.
5.
Memeriksa node tiap level, dimulai level terdalam. Pada tiap level mengelompokkan node sesuai parent nodenya. Pada setiap kelompok, diperiksa apakah memiliki value yg sama (mengulang/tidak mengulang) Bila sama maka parent kelompok tersebut diubah node nya menjadi value, lalu node kelompok tersebut dipotong (pruning) Bila berbeda maka dilanjut ke kelompok selanjutnya.
2/18/2011
1.
19
Uji Coba dan Evaluasi Data Uji Coba Data hasil analisa dari faktor-faktor yang mendukung mahasiswa pengambil matakuliah setiap semester yang diperoleh dari Sistem Informasi Akademik jurusan Teknik Informatika ITS Surabaya.
2/18/2011
20
UJI COBA SKENARIO 1 2/18/2011
Berdasarkan
pemilihan atribut Nilai, Jenis Kelamin, Angkatan, Tahun Lahir, Semester dan Umur dari mahasiswa pengambil matakuliah
23
ALJABAR LINEAR TAHUN 2007 Berdasarkan pemilihan atribut Nilai, Jenis Kelamin, Tahun Lahir, Angkatan, IPK, dan Semester .
Node
Parent 1 NULL 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 3 4 5 5 5 8 9 9 9 9 4 3 15 15 15 18 19 20 20 20 18 18 1
Label 'NILAI' 'TDK MENGULANG' 'KELAMIN' 'IPK' 'LAHIR' 'MENGULANG' 'MENGULANG' 'ANGKATAN' 'SEMESTER' 'TDK MENGULANG' 'MENGULANG' 'MENGULANG' 'MENGULANG' 'TDK MENGULANG' 'LAHIR' 'MENGULANG' 'MENGULANG' 'ANGKATAN' 'SEMESTER' 'IPK' 'MENGULANG' 'TDK MENGULANG' 'MENGULANG' 'MENGULANG' 'MENGULANG' 'MENGULANG'
Level
Type 0 1 1 2 3 4 4 4 5 6 6 5 5 3 2 3 3 3 4 5 6 6 5 4 4 1
1 0 1 1 1 0 0 1 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0 0 0 0
Atribut 'NULL' 'A-B' 'BC-C' 'L' '2-2.9' '1984-1985' '1986-1987' '1988-1989' '2007' 'Ganjil' 'Genap' '2008' '2009' '3-4' 'P' '1984-1985' '1986-1987' '1988-1989' '2007' 'Ganjil' '2-2.9' '3-4' 'Genap' '2008' '2009' 'D-E'
2/18/2011
24
Bentuk Tree Uji Aljabar Linear 2007 2/18/2011
25
Node
PENGENALAN POLA TAHUN 2007 1 2 2 4 5 6 6 6 9 9 5 4 2 1 15 15 15 18 18 20 21 21 23 23 23 20 1
Label 'ANGKATAN' 'NILAI' 'MENGULANG' 'IPK' 'KELAMIN' 'LAHIR' 'MENGULANG' 'MENGULANG' 'SEMESTER' 'MENGULANG' 'TDK MENGULANG' 'MENGULANG' 'TDK MENGULANG' 'MENGULANG' 'LAHIR' 'MENGULANG' 'MENGULANG' 'IPK' 'MENGULANG' 'KELAMIN' 'SEMESTER' 'MENGULANG' 'NILAI' 'TDK MENGULANG' 'TDK MENGULANG' 'MENGULANG' 'MENGULANG' 'MENGULANG'
Level
Type
0 1 2 2 3 4 5 5 5 6 6 4 3 2 1 2 2 2 3 3 4 5 5 6 6 6 4 1
1 1 0 1 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 1 1 0 1 0 0 0 0 0
Atribut 'NULL' '2007' 'A-B' 'BC-C' '2-2.9' 'L' '1984-1985' '1986-1987' '1988-1989' 'Ganjil' 'Genap' 'P' '3-4' 'D-E' '2008' '1984-1985' '1986-1987' '1988-1989' '2-2.9' '3-4' 'L' 'Ganjil' 'Genap' 'A-B' 'BC-C' 'D-E' 'P' '2009'
2/18/2011
Parent 1 NULL 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
26
Bentuk Tree Uji Pengenalan Pola 2007 2/18/2011
A n g k a ta n 2007
2009 2008
N i la i
A -B
B C -C
M
IP K
M
L a h ir
D -E
1 9 8 4 -1 9 8 5 1 9 8 6 -1 9 8 7 1 9 8 8 -1 9 8 9 M
M
M
IP K
3 -4 2 -2 .9
2 -2 .9
TM
K e la m in
L
M
P L
1 9 8 4 -1 9 8 5 1 9 8 8 -1 9 8 9 1 9 8 6 -1 9 8 7
G a n ji l
Sem e s te r G a n j il
M
A ngka ta n
Sem e s te r
TM
M
K e la m in
P
L a h ir
M
3 -4
G enap
M
N il a i
G enap
A -B
B C -C
D -E
TM
TM
TM
M
27
UJI COBA SKENARIO 2 2/18/2011
Berdasarkan pemilihan atribut Nilai, Angkatan, Selisih tahun Prediksi, Penghasilan orangtua, IPS dan Umur dari mahasiswa pengambil matakuliah
28
ALJABAR LINEAR TAHUN 2007 Parent
Label
Level
Type
Atribut
'NULL'
'NILAI'
0
1
'NULL'
2
1
'UMUR'
1
1
'BC'
3
2
'TDK MENGULANG'
2
0
'18-19'
4
2
'IPS'
2
1
'20-21'
5
4
'TDK MENGULANG'
3
0
'0-2.00'
6
4
'PENGHASILAN'
3
1
'2.01-3.0'
7
6
'MENGULANG'
4
0
'>= 5.000.000'
8
6
'ANGKATAN'
4
1
'1.000.000-5.000.000'
9
8
'TDK MENGULANG'
5
0
'2004'
10
8
'SELISIH'
5
1
'2005'
11
10
'MENGULANG'
6
0
'2007-2005'
12
10
'TDK MENGULANG'
6
0
'2007-2006'
13
8
'MENGULANG'
5
0
'2006'
14
8
'MENGULANG'
5
0
'2007'
15
6
'TDK MENGULANG'
4
0
'<= 1.000.000'
16
4
'SELISIH'
3
1
'3.01-4.0'
17
16
'PENGHASILAN'
4
1
'2007-2005'
18
17
'MENGULANG'
5
0
'>= 5.000.000'
19
17
'TDK MENGULANG'
5
0
'1.000.000-5.000.000'
20
17
'ANGKATAN'
5
1
'<= 1.000.000'
21
20
'TDK MENGULANG'
6
0
'2004'
22
20
'MENGULANG'
6
0
'2005'
23
20
'MENGULANG'
6
0
'2006'
24
20
'MENGULANG'
6
0
'2007'
25
16
'TDK MENGULANG'
4
0
'2007-2006'
26
2
'TDK MENGULANG'
2
0
'22-23'
27
1
'PENGHASILAN'
1
1
'C'
28
27
'UMUR'
2
1
'>= 5.000.000'
29
28
'MENGULANG'
3
0
'18-19'
30
28
'MENGULANG'
3
0
'20-21'
31
28
'TDK MENGULANG'
3
0
'22-23'
32
27
'UMUR'
2
1
'1.000.000-5.000.000'
33
32
'TDK MENGULANG'
3
0
'18-19'
34
32
'IPS'
3
1
'20-21'
35
34
'MENGULANG'
4
0
'0-2.00'
36
34
'TDK MENGULANG'
4
0
'2.01-3.0'
37
34
'ANGKATAN'
4
1
'3.01-4.0'
38
37
'TDK MENGULANG'
5
0
'2004'
39
37
'SELISIH'
5
1
'2005'
40
39
'MENGULANG'
6
0
'2007-2005'
41
39
'TDK MENGULANG'
6
0
'2007-2006'
42
37
'MENGULANG'
5
0
'2006'
43
37
'MENGULANG'
5
0
'2007'
44
32
'SELISIH'
3
1
'22-23'
45
44
'ANGKATAN'
4
1
'2007-2005'
46
45
'IPS'
5
1
'2004'
47
46
'MENGULANG'
6
0
'0-2.00'
48
46
'TDK MENGULANG'
6
0
'2.01-3.0'
49
46
'MENGULANG'
6
0
'3.01-4.0'
50
45
'MENGULANG'
5
0
'2005'
51
45
'MENGULANG'
5
0
'2006'
52
45
'MENGULANG'
5
0
'2007'
53
44
'TDK MENGULANG'
4
0
'2007-2006'
54
27
'TDK MENGULANG'
2
0
'<= 1.000.000'
2/18/2011
Node 1
29
Bentuk Tree Aljabar linier tahun 2007 2/18/2011
NILAI BC
C
Hasil
Umur
18-19
<=1jt
22-23
20-21
IPS
TM
TM
18-19
1jt-5jt
<=1jt
Angka tan
M
2004
1 TM
2005 2006
Angka tan
TM
2004 2005
>=1jt
M
TM
Angka tan
TM
M
2-3
M
>=5jt 1jt-5jt
2007
Selisih 3-4
0-2
Hasil
18-19 20-21 22-23
22-23
IPS
2
TM
Umur
20-21
TM
Selisih
Hasil
>=5jt
Umur
3-4
2-3
0-2
TM
TM
>=5jt
1jt-5jt
2004 2005
2006 2007
2007 2006 M
IPS TM
Selisih
M
M
M
TM
TM
Angk atan
Selisih
M
M
0-2 1 TM
2
2004
M
TM
2005 2006
M
2
2007
M
M
M
1
M
M
M
M
2-3 3-4
TM
M
30
Tree Sebelum Dipruning Pengenalan Pola tahun 2007
Nod Paren e t
Label
Level
Typ e
Atribut
1
'NULL' 'PENGHASILAN'
0
1
'NULL'
2
1
'UMUR'
1
1
'>= 5.000.000'
3
2
'MENGULANG'
2
0
'18-19'
4
2
'MENGULANG'
2
0
'20-21'
5
2
2
0
'22-23'
6
2
2
0
7
1
1
0
'24-25' '1.000.0005.000.000'
8
1
'MENGULANG' 'TDK MENGULANG' 'TDK MENGULANG' 'TDK MENGULANG'
1
0
'<= 1.000.000'
2/18/2011
31
Tree Setelah Dipruning 2/18/2011
Node
Parent
Label
Level
Type
Atribut
1
'NULL'
'PENGHASILAN'
0
1
'NULL'
2
1
'MENGULANG'
1
0
'>= 5.000.000'
7
1
'TDK MENGULANG'
1
0
'1.000.0005.000.000'
8
1
'TDK MENGULANG'
1
0
'<= 1.000.000'
32
Bentuk Tree Pada Uji Coba Skenario 3 Uji coba yang dilakukan pada skenario 3 ini adalah berdasarkan pemilihan atribut Nilai, Selisih tahun Prediksi, Angkatan, IPS dan Umur dari mahasiswa pengambil matakuliah.
2/18/2011
33
ALJABAR LINEAR TAHUN 2007 Node
Parent
Label
'NULL'
Level
Type
Atribut
'NILAI'
0
1
'NULL'
2
1
'UMUR'
1
1
'BC'
3
2
'TDK MENGULANG'
2
0
'18-19'
4
2
'IPS'
2
1
'20-21'
5
4
'TDK MENGULANG'
3
0
'0-2.00'
6
4
'ANGKATAN'
3
1
'2.01-3.0'
7
6
'TDK MENGULANG'
4
0
'2004'
8
6
'SELISIH'
4
1
'2005'
9
6
'MENGULANG'
4
0
'2006'
10
6
'MENGULANG'
4
0
'2007'
11
4
'SELISIH'
3
1
'3.01-4.0'
12
11
'ANGKATAN'
4
1
'2007-2005'
13
11
'TDK MENGULANG'
4
0
'2007-2006'
14
2
'TDK MENGULANG'
2
0
'22-23'
15
2
'MENGULANG'
2
0
'24-25'
16
1
'SELISIH'
1
1
'C'
17
16
'IPS'
2
1
'2007-2005'
18
17
'MENGULANG'
3
0
'0-2.00'
19
17
'UMUR'
3
1
'2.01-3.0'
20
19
'MENGULANG'
4
0
'18-19'
21
19
'ANGKATAN'
4
1
'20-21'
22
19
'ANGKATAN'
4
1
'22-23'
23
19
'MENGULANG'
4
0
'24-25'
24
17
'ANGKATAN'
3
1
'3.01-4.0'
25
24
'UMUR'
4
1
'2004'
26
24
'MENGULANG'
4
0
'2005'
27
24
'MENGULANG'
4
0
'2006'
28
24
'MENGULANG'
4
0
'2007'
29
16
'IPS'
2
1
'2007-2006'
30
29
'TDK MENGULANG'
3
0
'0-2.00'
31
29
'TDK MENGULANG'
3
0
'2.01-3.0'
32
29
'ANGKATAN'
3
1
'3.01-4.0'
33
32
'TDK MENGULANG'
4
0
'2004'
34
32
'UMUR'
4
1
'2005'
35
32
'MENGULANG'
4
0
'2006'
36
32
'MENGULANG'
4
0
'2007'
2/18/2011
1
34
Bentuk Tree Aljabar linier tahun 2007 2/18/2011
35
PENGENALAN POLA TAHUN 2007 Parent 1 'NULL'
Label 'IPS'
Level
Type
Atribut
0
1 'NULL'
2
1 'TDK MENGULANG'
1
0 '0-2.00'
3
1 'TDK MENGULANG'
1
0 '2.01-3.0'
4
1 'NILAI'
1
1 '3.01-4.0'
5
4 'TDK MENGULANG'
2
0 'BC'
6
4 'UMUR'
2
1 'C'
7
6 'MENGULANG'
3
0 '18-19'
8
6 'MENGULANG'
3
0 '20-21'
9
6 'ANGKATAN'
3
1 '22-23'
10
9 'MENGULANG'
4
0 '2004'
11
9 'MENGULANG'
4
0 '2005'
12
9 'SELISIH'
4
1 '2006'
13
9 'MENGULANG'
4
0 '2007'
14
6 'TDK MENGULANG'
3
0 '24-25'
2/18/2011
Node
36
Bentuk Tree Pengenalan Pola tahun 2007 2/18/2011
37
Uji Coba Skenario 1 Ringkasan untuk uji coba sebelum dan setelah tree dipruning berdasarkan pemilihan atribut. Beberapa atribut yang dipilih untuk uji coba yaitu Nilai, Jenis Kelamin, Lahir, IPK, Angkatan dan Semester. Matakuliah
Jumlah Data
Mengulang Sebenarnya
Prediksi Mengulang
Selisih
Error (e)
Aljabar Linear 2007
68
8
4
4
50%
Aljabar Linear 2008
68
9
21
12
133,3%
Pengenalan Pola 2007
26
2
2
0
0%
Pengenalan Pola 2008
26
2
1
1
50%
Rata-rata
2/18/2011
58,33%
38
Uji Coba Skenario 2 Ringkasan untuk uji coba sebelum tree dipruning berdasarkan pemilihan atribut. Beberapa atribut yang dipilih untuk uji coba yaitu Nilai, Selisih, Hasil, IPS, Angkatan dan Umur sebelum tree dipruning. Matakuliah
Mengulang Sebenarnya 8
Prediksi Mengulang 7
Selisih
Error (e)
Aljabar Linear 2007
Jumlah Data 68
1
12,5%
Aljabar Linear 2008
30
6
1
5
83,3%
Pengenalan Pola 2007
26
2
1
1
50%
Pengenalan Pola 2008
30
1
2
1
100%
Rata-rata
2/18/2011
61,45%
39
2/18/2011
Setelah tree dipruning
Matakuliah
Jumlah Data
Mengulang Sebenarnya
Prediksi Mengulang
Selisih
Error (e)
Aljabar Linear 2007
68
8
19
11
137,5%
Aljabar Linear 2008
30
6
2
4
66,6%
Pengenalan Pola 2007
26
2
1
1
50%
Pengenalan Pola 2008
30
2
2
0
0%
Rata-rata
63,5%
40
Uji Coba Skenario 3 Ringkasan untuk uji coba berdasarkan pemilihan atribut sebelum dan setelah tree dipruning. Beberapa atribut yang dipilih untuk uji coba yaitu Nilai, Selisih, Angkatan, IPS dan Umur. Hasil tree sebelum dipruning. Matakuliah
Jumlah Data
Mengulang Sebenarnya
Prediksi Mengulang
Selisih
2/18/2011
Error (e)
Aljabar Linear 2007
68
8
16
8
100%
Aljabar Linear 2008
30
4
10
6
150%
Pengenalan Pola 2007 Pengenalan Pola 2008 Rata-rata
26
2
2
0
0%
30
1
3
2
200% 112,5% 41
Kesimpulan 2/18/2011
Implementasi ini dapat digunakan untuk membangun Decision tree sesuai data training. Implementasi ini dapat digunakan untuk mengetahui jumlah mahasiswa pengambil matakuliah. Decision tree yang digunakan menggunakan metode C4.5, namun dalam implementasinya, pembuatan decision tree dilakukan semi-manual karena terdapat missing value.
42
Uji coba berdasarkan pemilihan atribut nilai, jenis kelamin, lahir, IPK, angkatan dan semester diperoleh nilai error sebelum dan setelah tree di pruning untuk matakuliah Aljabar Linear 2007 adalah 50%, Aljabar Linear 2008 adalah 133,3%, Pengenalan Pola 2007 adalah 0% dan Pengenalan Pola 2008 adalah 50%. Nilai rata-rata error sebelum dan setelah pruning untuk memprediksi jumlah mahasiswa pengambil matakuliah dengan pemilihan atribut Nilai, Jenis Kelamin, Lahir, IPK, Angkatan dan Semester sebelum dan setelah tree di pruning adalah 58,33% untuk 4 data uji coba yaitu matakuliah Aljabar Linear 2007, Aljabar Linear 2008, Pengenalan Pola 2007 dan Pengenalan Pola 2008.
2/18/2011
43
2/18/2011
Uji coba berdasarkan pemilihan atribut nilai, umur, penghaslan orangtua, selisih tahun prediksi dengan pengambilan, ips, dan angkatan diperoleh nilai error sebelum tree di pruning untuk matakuliah Aljabar Linear 2007 adalah 12,5%, Aljabar Linear 2008 adalah 83,3%, Pengenalan Pola 2007 adalah 50% dan Pengenalan Pola 2008 adalah 100% dan setelah tree di pruning untuk matakuliah Aljabar Linear 2007 adalah 137,5%, Aljabar Linear 2008 adalah 66,6%, Pengenalan Pola 2007 adalah 50% dan Pengenalan Pola 2008 adalah 0%.
Nilai rata-rata error untuk memprediksi jumlah mahasiswa pengambil matakuliah dengan pemilihan atribut nilai, umur, selisih tahun prediksi dengan pengambilan, penghasilan orangtua, ips, dan angkatan sebelum proses tree dipruning sebelum adalah 61,45% dan setelah tree dipruning adalah 63,5% untuk 4 data uji coba yaitu pada matakuliah Aljabar Linear 2007, Aljabar Linear 2008, Pengenalan Pola 2007 dan Pengenalan Pola 44 2008.
Uji coba berdasarkan pemilihan atribut nilai, umur, selisih tahun prediksi dengan pengambilan, ips, dan angkatan diperoleh nilai error sebelum dan setelah tree di pruning untuk matakuliah Aljabar Linear 2007 adalah 100%, Aljabar Linear 2008 adalah 150%, Pengenalan Pola 2007 adalah 0% dan Pengenalan Pola 2008 adalah 200%. Nilai rata-rata error untuk memprediksi jumlah mahasiswa pengambil matakuliah dengan pemilihan atribut nilai, umur, selisih tahun prediksi dengan pengambilan, ips, dan angkatan sebelum dan setelah proses tree di pruning adalah 112,5% untuk 4 data uji coba yaitu pada matakuliah Aljabar Linear 2007, Aljabar Linear 2008, Pengenalan Pola 2007 dan Pengenalan Pola 2008.
2/18/2011
45
Saran 2/18/2011
Hendaknya untuk pengembangan lebih lanjut, harap memperhatikan kelengkapan data faktor-faktor yang lain yang lebih baik agar hasil yang didapat semakin baik. Metode decision tree yang digunakan sebaiknya mampu mengatasi keberadaan missing value. Melakukan uji coba terbatas pada enam matakuliah saja dengan rentang tahun antara 2007 sampai 2008. Untuk pengembangan lebih lanjut diharapkan dapat melakukan uji coba pada semua matakuliah yang ada, sehingga hasilnya dapat digunakan untuk menentukan prediksi semua matakuliah yang ada
46
2/18/2011
Terima
kasih
47