Edisi Juli 2015 Volume IX No. 2 ISSN

Edisi Juli 2015 Volume IX No. 2

ISSN 1979-8911

ANALISA POLA ASOSIASI JALUR MASUK TERHADAP KELULUSAN MAHASISWA DENGAN MENGGUNAKAN METODE FOLD-GROWTH (STUDI KASUS FAKULTAS SAINS DAN TEKNOLOGI)

Mohamad Irfan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi Universitas Islam Negeri Sunan Gunung Djati Bandung [email protected]

Abstrak Teknologi komunikasi dan informasi telah berkembang seiring dengan tuntutan untuk mendapatkan informasi yang lebih spesifik dan terukur. Data yang diolah dijadikan pendukung untuk mengambil keputusan dengan memanfaatkan basisdata yang dimiliki untuk menentukan pola asosiasi jalur masuk calon mahasiswa terhadap kelulusan. Pola asosiasi antara data mahasiswa dan data kelulsan mahasiswa. Pola asosiasi antara dua jenis data tersebut dapat menunjukkan apakah ada keterkaitan antara variabel data mahasiswa yang terdiri dari jalur masuk dan Jurusan, dengan tingkat kelulusan mahasiswa yang bisa dilihat dari lama studi dan indeks prestasi kumulatif (IPK). Penelitian mencari pola asosiasi antara jalur masuk dengan kelulusan mahasiswa menggunakan metode FOLDGrowth. Dalam metode FOLD-Growth tahapan pertama yang dilakukan adalah mencari frequent itemset, pemangkasan item-item yang tidak frequent, pembangunan FP-Tree menggunakan transaksi yang telah dipangkas dan penggalian itemset frequent. Pencarian pola antara jalur masuk dengan kelulusan mahasiswa disertai nilai support dan nilai confident menghasilkan jalur masuk melalui tes tulis maka lama lulusnya lebih dari 4 tahun dengan IPK berada diantara 3.00 sampai 3.49 masuk dalam kategori B2 di jurusan Teknik Informatika, dengan nilai support 28,73. Jalur masuk tes PPA maka lulusnya lebih dari 4 tahun dengan IPK berada diantara 3,00 smapai 3,49 atau kategori B2 dengan niali support 12,80. Kata Kunci: Asosiasi Rule, Itemset, FOLD-Growth, Mahasiswa, Data Mining

1.

memakai sistem infor-masi untuk kegiatan

Pendahuluan

sehari-hari.

1.1 Latar Belakang Masalah

Sistem

informasi

dapat

digunakan untuk mendapatkan, mengolah Saat

ini,

sudah

banyak

instansi dan

menyebarkan

informasi

untuk

pemerintahan maupun swasta yang sudah menunjang

kegiatan,

memberikan 172


ISSN 1979-8911

informasi dan sebagai sarana pengambil

mining,

keputusan dengan memanfaatkan data-

diharapkan

base yang dimiliki. Database merupakan

pengetahuan-pengetahuan

sistem

memakai

lumnya tersimpan di dalam database

tersebut

sehingga menjadi informasi yang berharga.

penyimpanan

komputer

dimana

data

database

penggunaan

data

dapat

memberikan yang

sebe-

merupakan komponen utama dalam sistem

Ada

informasi, karena merupakan dasar dalam

menyelesaikan

menyediakan

diantaranya algoritma Fold-Growth, yang

informasi

[5].

Dimana

banyak berbagai bidang menggunakan

sejumlah

mining

algoritma

untuk

association

rule,

masuk dalam algortima asosiasi [4].

database. Bahkan saat ini hampir semua Penelitian ini dibuat dengan tujuan perusahaan,

perkantoran,

supermarket untuk

mendapatkan

informasi

yang

termasuk Perguruan Tinggi meng-gunakan berguna tentang hubungan antara tingkat database. kelulusan mahasiswa dengan jalur masuk Belum diketahuinya pola asosiasi

perguruan tinggi menggunakan teknik data

antara data mahasiswa dan data kelulusan

mining

mahasiswa di Universitas Islam Negeri

Growth. Informasi yang disajikan untuk

Sunan Gunung Djati Bandung.

mengukur

Pola

menggunakan

tingkat

metode

kelulusan

Fold-

dan

asosiasi antara dua jenis data tersebut

hubungannya

dapat menunjukkan apakah ada keterkaitan

mahasiswa. Informasi yang ditampilkan

antara variabel data mahasiswa yang

berupa nilai support (nilai penunjang)

terdiri dari jalur masuk dan program studi,

confident (nilai kepastian) dan hubungan

dengan tingkat kelulusan mahasiswa yang

antara tingkat kelulusan dengan proses

bisa dilihat dari lama studi dan IPK.

masuk mahasiswa.

dengan

jalur

masuk

Pencarian data dari pola tersebut sangat 1.2 Identifikasi Masalah erat kaitannya dengan penggunan data 173


ISSN 1979-8911

Berdasarkan latar belakang masalah diatas pokok permasalahan yang dicari solusinya adalah:

hubungan antara tingkat kelulusan dengan proses masuk mahasiswa. 2. Pembahasan dilakukan pada Program Sarjana (SI) di Fakultas Fakultas Sains

1. Bagaimana membuat aplikasi untuk dan

Teknologi

Universitas

Islam

menghasilkan informasi yang dapat Negeri Sunan Gunung Djati Bandung. digunakan untuk mengukur tingkat 3. Bahasa pemograman yang digunakan kelulusan dan hubungannya dengan yaitu bahasa Java. jalur masuk mahasiswa. 4. Data yang dijadikan penelitian ini 2. Informasi yang ditampilkan berupa adalah data mahasiswa Fakultas Sains nilai

support

(nilai

penunjang) dan

confident

(nilai

kepastian)

Teknologi

Universitas

Islam

dan Negeri Sunan Gunung Djati Bandung

hubungan antara tingkat kelulusan dari tahun 2006 sampai 2009 dan data dengan proses masuk mahasiswa. mahasiswa yang sudah menempuh pendidikan dari tahun 2006 sampai 1.3 Batasan Masalah 2009 di Fakultas Sains dan Teknologi. Adapun

batasan

masalah

dalam

aplikasi data mining untuk menganalisa hubungan antara jalur masuk dengan tingkat

kelulusan

mahasiswa

menggunakan metode Fold-Growth ini adalah:

5. Input dari aplikasi ini adalah memilih data

mahasiswa

sesuai

jurusan,

memilih nilai support dan memilih nilai Confidence. 6. Output dari aplikasi ini adalah hasil dari perhitungan menggunakan metode Fold-Growth

berupa

kombinasi

nilai support (nilai penunjang) dan

itemset,

support

dan

confident

confidence.

1. Informasi yang ditampilkan berupa

(nilai

kepastian)

dan

nilai

nilai

174


ISSN 1979-8911 beberapa kategori (atau class) yang telah

1.4 Tujuan Penelitian ini dibuat dengan tujuan, menghasilkan aplikasi untuk mendapatkan

didefinisikan sebelumnya. b.

informasi yang berguna tentang hubungan antara

tingkat

kelulusan

mahasiswa

Clustering [ Descriptive] Mempartisi data-set menjadi beberapa

sub-set atau kelompok sedemikian rupa

dengan jalur masuk menggunakan teknik

sehingga

data mining menggunakan metode Fold-

kelompok tertentu memiliki set property

Growth di Fakultas Sains dan teknologi.

yang dishare bersama, dengan tingkat

2.

elemen-elemen

similaritas

Dasar Teori

yang

tinggi

dari

dalam

suatu

satu

kelompok dan tingkat similaritas antar 2.1 Data Mining kelompok yang rendah. Disebut juga Data mining merupakan analisis dari peninjauan

kumpulan

data

dengan ‘unsupervised learning’

untuk

menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data.

c.

Assosiation

Rule

Discovery

[Descriptive] Mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-accur) dalam frekuensi yang sering, dengan membentuk sejumlah kaidah dari kumpulan-kumpulan

2.2 Teknik Data Mining Beberapa teknik dan sifat data mining adalah sebagai berikut: a.

Classification [Predictive] Klasifikasi adalah merupakan sebuah

tersebut. Contohnya: 90% orang yang belanja

di

suatu

supermarket

yang

membeli roti juga membeli selai, dan 60% dai semua orang yang berbelanja membeli keduanya.

record data baru ke salah satu dari

175

Edisi Juli 2015 Volume IX No. 2 d.

Sequential

Pattern

ISSN 1979-8911 Discovery

mengasumsikan

[Descriptive]

ketergantungan

Mencari sejumlah event yang secara

Teknik

ini

sebuah linier

banyak

atau

model nonlininer.

dipelajari

dalam

umum terjadi bersama-sama. Contohnya,

statistika, bidang jaringan saraf tiruan

dalam satu set urutan DNA, ACGTC

(neuron network).

diikuti oleh GTCA setelah suatu celah selebar 9 dengan probabilitas sebesar 30%. Jika diberikan sekumpulan obyek, dengan

masing-masing

obyek

2.3 Analisa Asosiasi a.

Frequent itemset Semua record dalam satu kelompok

mempunyai idtrans yang sama. Mereka

dihubungkan dengan waktu kejadiannya

bersama-sama

maka dapatkan pola yang memprediksi

transaksi

ketergantungan

sekuensial

pembelian satu item atau lebih. Suatu

dependencies)

yang

(sequential

kuat

diantara

kejadian-kejadian yang berbeda. (AB) (C)→(D

E)

dasarnya dibentuk dengan cara mencari semua kemungkinan pola yang ada. Nilaikejadian

dalam

pelanggan

terjadi

yang

pada

suatu

melibatkan

suatu

tanggal

tertentu dan nama dari tiap item yang

Pola-pola sekuensial pertama, pada

nilai

transaksi

menggambarkan

pola

diatur

dibeli dicatat bersama dengan jumlahnya. Pembuatan tabel ‘denormalized’ untuk mempermudah

data

mining

biasanya

dilakukan pada tahan data cleaning dari proses KDD. Lebar transaksi didefinisikan sebaga

berdasarkan urutan waktu kejadian.

jumlah item yang terdapat dalam sebuah e.

Regression [Predictive]

transaksi. Suatu transaksi

Memprediksi nilai dari suatu variable kontinyu yang diberikan berdasarkan nilai dari

variable

yang

lain,

dikatakan

berisi sebuah itemset X jika X merupakan subset

dari

.

Contohnya transaksi

dengan

176


ISSN 1979-8911

pertama pada tabel diatas berisi itemset

muncul dalam transaksi yang berisi X.

{Pena, Tinta} dan bukan {Pena, Air}.

secara formal dapat dinyatakan dengan

Support count(σ) merupakan jumlah transaksi yang berisi suatu itemset tertentu

persamaan berikut ini: s(X→Y)=

( ∪ )

atau dengan kata lain merupakan frekuensi c(X→Y)=

( ∪ ) ( )

kejadian dari suatu itemset. Support dari dimana s adalah support dan c adalah sutau itemset adalah perbandingan dari confidence. transasksi dalam basisdata yang berisi 2.4 Association Rule Mining

semua item dalam itemset. Biasanya jumlah himpunan item yang

Jika

terdapat

sebuah

himpunan

sering dibeli bersamaan relative kecil,

transaksi T, maka tujuan dari association

khususnya saat ukuran itemset meningkat.

rule mining adalah untuk menemukan

Semua itemset yang support-nya lebih

semua aturan yang mempunyai support

tinggi dari nilai minimum yang ditetapkan

≥minsup

user yang disebut dengan minsup; disebut

Pendekatan brute-force untuk association

frequentitemset.

rule mining menggunakann pendekatan

b.

Association Rule

dengan

Association rule merupakan sebuah

confidence dari semua kemungkinan rule.

ekspresi implikasi yang berbentuk X →Y,

Pendekatan Brute-frce terdiri dari langkah-

dimana X dan Y merupakan disjoint

langkah berikut:

itemset ( X∩Y) = ∅ . Contoh :{Pena,

a. Daftar

Tinta} ® {jus}. Dalam association rule, kita dapat confidence.

menghitung support adan Confidence

menyatakan

dan

confidence

menghitung

semua

≥minconf.

support

dan

kemungkinan

association rule b. Hitung support dan confidence untuk setiap rule

seberapa sering item-item-item dalam Y

177


ISSN 1979-8911

c. Pangkas rule yang tidak memenuhi minsup dan minconf thresholds.

(support Ordered-Trie Itemset) dalam penggalian

itemset

yang

frequent.

Secara umum, pendekatan ini sangat

SOTrielT adalah sebuah struktur data yang

mahal dalam waktu komputasinya. Jumlah

melakukan ekstraksi 1-itemset dan 2-

kemungkinan

itemset dari semua transaksi dalam basis

rule

dari sebuha

tabel

transaksi yang terdiri d item adalaha

data.

sebesar:

Dengan R =3 ͩ - 2 ͩ +1

menggunakan

basis

data

transaksi yang terdiri dari kode transaksi,

Misalkan digunakan data pada tabel

dan kode dari barang yang di beli,

pembelian diatas dengan jumlah itemd=5,

algoritma

maka jumlah kemungkinan rule adalah

menghasilkan

sebesar:

penelitian yang dilakukan oleh Woon et al.

R=3 - 2 + 1 = 243 – 64 +1 =180

ini

akan

diproses

untuk

pola

asosiasi.

pada

(2004), penggabungan dua buah algoritma yaitu FP-GROWTH dengan FOLDARM

Semua rule diatas merupakan partisi pada

metode

assosiasi

menghasilkan

biner dari itemset yang sama. Rules yang sebuah algoritma baru (FOLD-GROWTH) berasal dari itemset yang sama mempunyai yang memiliki kinerja yang lebih baik. support yang identik tetapi mempunyia Algoritma ini menggunakana struktur data confidence yang berbeda, sehingga kita SOTrielT, SOTrielT atau Sub Ordered Trie dapat

memasangkan

ulang

untuk Itemset

merupakan

suatu

Tree

yang

keperluan support dan confidence. digabungkan dengan yang utuh. Kinerja 2.5 Fold-Growth

dari

Fold-Growth merupakan salah satu metode

penggalian

menggunakan

struktur

pola

asosiasi

data

SOTrielT

algoritma

tersebut

menghasilkan

proses yang lebih fleksibel dan efisien jika dibandingkan dengan algoritma-algoritma

178


ISSN 1979-8911

aturan asosiasi lainnya seperti apriori dan

yang mengandung suatu pola dikatakan

FP-Growth.

sering muncul (frequent pattern) apabila support dari pola tersebut tidak kurang

2.6 FP-Tree

dari sutau konstanta ᶓ FP-Tree

merupakan

(batas ambang

struktur minimum support). Permasalahan mencari

penyimpanan data yang dimampatkan. FPpola

frequent

dengan

batas

ambang

Tree dibangun dengan memetkan setuap minimum support count ᶓ inilah yang data transaksi ke dalam setiap lintasan dicoba untuk dipecahkan oleh FOLDtertentu dalam FR-Tree. Karena dalam Growth dengan bantuan struktur FP-Tree. setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasanya memungkinkan

3.

Data Data

merupakan

untuk saling menimpa. Semakan banyak

keterangan

data transaksi yang memiliki item yang

dikumpulkan dari suatu populasi atau

sama, maka proses pemampatan dengan

bagian

struktur data FP-Tree semakin efektif.

karakte-ristik populasi tersebut [5].

Kelebihan dari FP-Tree adalah hanya

atau

keterangan-

populasi

fakta-fakta

untuk

yang

menjelaskan

3.1 Data induk Mahasiswa

memerlukan dua kali pemindaian data Data induk mahasiswa adalah data transaksi yang trebukti sangat efisien. mahasiswa yang di data ketika mahasiswa Missal

I={a1,

a2,

…….,an}

adalah pertama masuk ke Universitas Islam

kumpulan dari item. Dan basis data Negeri Sunan Gunung Djati Bandung transaksi DB= {T1, T2, …..Tn}, dimana setelah melakukan registrasi ulang. Data Ti (I € [1….n]) adalah sekumpulan yang dicatat adalah identitas pribadi transaksi yang mengandung item di l. mahasiswa dan identitas sekolah asal sedangkan support adalah perhitungan mahasiswa. Proses pendaftaran dilakukan (counter) frequensi kemunculan transaksi 179

Edisi Juli 2015 Volume IX No. 2 di tingkat Universitas, setelah di rekap lalu disebarkan ke Fakultas dan Jurusan. Atribut yang terdaftar pada data induk Mahasiswa. Tabel 1 Atribut Mahasiswa Atribut No_Daftar

Angkatan

NIM

Nama lulus Kota Lahir

Tanggal Lahir Alamat Atribut Desa RT

Kecamatan

Kota

Fakultas

Keterangan No daftar adalah, no pendaftar pada saat siswa tersebut daftar ke Universitas Islam Negeri Sunan Gunung Djati Bandung Angkat adalah keterangan untuk tahun pada saat mahasiswa pertama masuk NIM (Nomor Induk Mahasiswa) adalah nomor Identitas mahasiswa yang diberikan oleh pihak Universitas Nama mahasiswa yang lulus seleksi masuk Kota dimana tempat mahasiswa yang bersangkutan lahir Tanggal dimana mahasiswa yang bersangkutan lahir Alamat temapt mahasiswa tinggal Keterangan Desa dimana mahasiswa yang bersangkutan tinggal RT (Rukun Tetangga) tempat dimana mahasiswa yang bersangkutan bertempat tinggal Kecamatan tempat dimana mahasiswa yang bersangkutan tinggal Kota dimana Tempat mahasiswa yang bersangkutan lihar Fakultas tempat dimana mahasiswa tersebut diterima

ISSN 1979-8911 Kode Prodi

Nomor unik prodi dimana tempat mahasiswa bersanglutan diterima Prodi Prodi dimana tempat mahasiswa tersebut diterima Kelas Kelas tempat dimana mahasiswa tersebut diterima Jenis Jenis kelamin mahasiswa Kelamin yang bersangkutan Kode Pos Kode Pos tempat dimana mahasiswa bertempat tinggal No Telp No Telp mahasiswa yang bersangkutan Sekolah Sekolah asal tempat mahasiswa sebelum melanjutkan ke jenjang Universitas Nama Nama sekolah tempat Sekolah mahasiswa yang bersangkutan sekolah sebelum menlanjutkan ke jenjang Universitas Rumpun Asal jurusan mahasiswa tersebut pada saat di sekolah menengah atas Warga Kewarganagaraan Negara mahasiswa yang bersangkutan Agama Agama yang dianut oleh mahasiswa yang bersangkutan Penghasilan Penghasilan orang tua Orang Tua mahasiswa yang bersangkutan Atribut Keterangan Nama Nama orang tua mahasiswa Orang Tua yang bersangkutan Pekerjaan Pekerjaan orang tua Orang Tua mahasiswa yang bersangkutan Tes Jalur masuk tes mahasiswa yang bersangkutan pada saat pertama masuk ke Universitas. Pada Universitas Islam Negeri Sunan Gunung Djati Bandung terdapat beberapa jalur masuk diantaranya, PPA, Jalur Tulis, dan juga 180


Pendidikan Orang Tua Status 1

Propinsi

SNMPTN Pendidikan treakhir orang tua Mahasiswa yang bersangkutan Status sekolah terakhir mahasiswa yang bersangkutan Propinsi dimana mahasiswa yang bersangkutan tinggal

Tabel 2 Atribut Data Kelulusan Atribut Keterangan No pokok Nomor unik yang terdapat Ijazah di ijazah pada saat mahasiswa yang bersangkutan telah menyelesaikan pendidikannya di Universitas Tanggal Tanggap pada saat siding mahasiswa tersebut sidang tugas akhir dan dinyatakan lulus Nama Nama Mahasiswa yang Mahasiswa bersangkutan Tempat, tgl Tempat dan tanggal lahir Lahir mahasiswa yang bersangkutan Alamat Alamat tempat mahasiswa tinggal Yudicium Indeks prestasi yang di capai mahasiswa yang bersangkutan selama berkuliah di universitas Atribut Keterangan Judul Judul tugas dari Skripsi mahasiswa yang bersangkutan Pembimbing Orang/dosen yang membimbing tugas akhir mahasiswa yang bersangkutan Prodi Jurusan dari mahasiswa yang bersangkutan

ISSN 1979-8911 Data kelulusan adalah data mahasiswa yang telah dinyatakan lulus dan sudah menyelesaikan pendidikan di Fakultas Sains dan teknologi. Dalam data kelulusan terdapat

atribut

data mahasiswa dan

kelengkapan kelulusan diantaranya nomor pokok Ijazah, Tanggal sidang, Nama mahasiswa, Yudisium, judul skripsi, Program Studi, pembimbing, alamat serta tempat tanggal lahir. IPK dikategorikan berdasarkan prediksi kelulusan yang sudah ditetapkan dalam Universitas Islam Negeri Sunan Gunung Djati Bandung sebagai berikut [8]: Tabel 3 Indeks Prestasi Kumulatif No 1 2 3 4 5

Indek Prestasi 3.50-4.00 3.00-3.49 2.50-2.99 2.00-2.49 0.00-1.99

Predikat Kelulusan Cumlaude Amat Baik Baik Cukup Tidak Lulus

3.3 Proses Mining Data mining adalah proses yang memperkerjakan pembelajaran

satu

atau

lebih

komputer

teknik untuk

3.2 Data Kelulusan 181

Edisi Juli 2015 Volume IX No. 2 menganalisis

dan

ISSN 1979-8911

mengekstraksi

pengetahuan secara otomatis [2]. Data

( ) =

mining berisi pencarian trend atau pola

(2.1)

yang diinginkan dalam database besar ( . )=

untuk membantu pengam-bilan keputusan di waktu yang akan datang. Pola-pola ini

(2.2)

dikenal oleh perangkat tertentu yang dapat

memberikan suatu analisa data yang berguna dan berwawasan yang kemudian

( → )=

dapat dipelajari dengan lebih teliti, yang

mungkin saja meng-gunakan perangkat

(2.3)

pendukung keputusan yang lainnya. Algoritma FOLD-Growth 4.

Metode Algoritma FOLD-Growth merupakan

4.1 Assosiasi Rule hasil gabungan dari algoritma FOLDARM Association Rule merupakan sebuah ekspresi implikasi yang berbentuk X→Y , dimana X dan Y merupakan disjoint itemset. Dalam assosiasi rule kita dapat menghitung support dan confidence [1][3]. Confidence menyatakan seberapa sering item-item dalam Y muncul dalam transaksi yang berisi X. secara formal dapat dinyatakan dengan persamaan berikut ini:

dan

FP-Growth.

diharapkan

Pada

dapat

algoritma

ini

menggabungkan

keuntungan dan kebaikan dari 2 (dua) algoritma

antara

FP-Growth

dengan

FOLD-ARM. Algoritma FOLDARM yang memiliki kinerja cepat dalam pengukuran itemset

frequent

maksi-mum(

)

adalah kecil atau K ≤ 10, sedangkan algoritma FP-Growth memiliki kinerja yang cepat pada saat

>

10 [1]. Dalam

182


ISSN 1979-8911

algoritma ini terdapat pembagian tahap

itemset dan 2-itemset. Sehingga, untuk

pengerjaan sebanyak 4 (empat) tahapan

item-item yang tidak sesuai akan

utama [7].

dilakukan pemangkasan.

Tahapan Utama dalam algoritma FOLD-

c.

Membangun FP-Tree menggunakan transaksi –

Growth yaitu:

transaksi

yang

telah

dipangkas a.

Penggalian L1 (large 1 – itemset) dan

d.

Penggalian itemset frequent

5.

Pencarian Pola Asosiasi

L2 (large 2 – Itemset) dengan menggunakan SOTrielT. Pada tahapan ini, dilakukan pembacaan basis data Dalam penelitian ini, variabel yang sebanyak satu kali untuk membaca digunakan yaitu jalur masuk, program transaksi-transaksi yang ada dalam studi,

lama

studi

dan

IPK.

Dari

tersebut

akan

yang

bisa

basis data. Untuk setiap transaksi akan penggbabungan

data

dibangkitkan semua kemungkinan 1terbentuk

suatu

pola

itemset dan 2-itemsey yang kemudian memberikan informasi yang berkaitan dicatat dalam SOTrieIT. antara jalur masuk dengan kelulusan b.

Pemangkasan item-item yang tidak mahasiswa. Pada data yang ada, akan frequent. Dalam tahapan ini, akan ditransformasi

agar

mudah

dibaca.

dilakukan pemang-kasan pada setiap Transfor-masi data yang dilakukan pada transaksi yang ada dalam basis data penelitian ini adalah data tingkat kelulusan dengan menggunakan 1-itemset dan 2mahasiswa.

Dari

data

kelulu-san

itemset. Untuk setiap transaksi T, pada mahasiswa dapat dilihat dari lama studi itemset Lk

yang terdapat

dalam dengan IPK. Dari dua data tersebut dapat

transaksi tersebut dimana panjang k di kategorikan sesuai tingkat IPK yang lebih

dari

2,

akan

dilakukan sudah ditentukan oleh Universitas. Dari

pengecekan dengan menggunakan 1183


ISSN 1979-8911

data tersebut dapat dikategorikan menjadi 8 kategori, yaitu. Tabel 4 Kategori Tingkat kelulusan Mahasiswa Kategori

Keterangan Lama studi 4 tahun atau kurang A1 dari 4 tahun dan IPK 3,50 – 4,00 Lama studi 4 tahun atau kurang A2 dari 4 tahun dan IPK 3,00 – 3,49 Lama studi 4 tahun atau kurang A3 dari 4 tahun dan IPK 2.50 – 2,99 Lama studi 4 tahun atau kurang A4 dari 4 tahun dan IPK 2.00 – 2,49 Lama studi lebih dari 4 tahun B1 dan IPK 3,50 – 4,00 Kategori Keterangan Lama studi lebih dari 4 tahun B2 dan IPK 3,00 – 3,49 Lama studi lebih dari 4 tahun B3 dan IPK 2,50 – 2,99 Lama studi lebih dari 4 tahun B4 dan IPK 2,00 – 2,49

Gambar 1 Diagram alir prose FOLDGrowth Untuk melakukan analisa terhadap data

mahasiswa

dengan

kelulusan

mahasiswa. Perlu melakukan beberapa proses yang meliputi:

Dalam proses pencarian pola ini ada

a.

Sistem

menerima

inputan

beberapa langkah yang harus dijalani

minimum

secara

mendapatkan

support, data mahasiswa yang telah

informasi yang baru dari dalam database.

disimpan dalam database. Kemudian

Pada proses ini dimulai dengan pengum-

sistem

pulan data. Preprocessing, data mining,

association rule yang menghasilkan

proses FOLD-Growth

aturan asosiasi pada data inputan dan

bertahap

guna

confident,

berupa

akan

melakukan

minimum

proses

selanjutnya melakukan pengujian rule b.

Proses yang ada dalam algoritma foldgrowth ini terdiri dari 4 tahapan, yaitu penggalian

1-2

itemset

dengan 184


ISSN 1979-8911

menggunakan struktur data SOTrieIT,

berdasarkan nilai support dan nilai

pemangkasan

counfidence yang paling besar dan

item

yang

tidak

frequent, pembangunan FP Tree, dan penggalian itemset frequent. c.

f.

pembanguna

Growth adalah penggalian 1-2 itemset

menggunakan

dengan SOTrieIT yang dilakukan

dipangkas

dengan membaca database sebanyak

urutan

satu kali untuk membaca data-data

counfident.

setiap

dan

data

kelulusan. akan

Untuk

g.

dibangkitkan

kemungkinan 1 itemset dan 2 itemset

FP

Tree

item

yang

selanjutnya

nilai

support

dengan telah

berdasarkan dan

nilai

Tahap pada proses selanjutnya adalah tahap penggalian itemset frequent.

h.

Tahapan selanjutnya akan dilakukan

yang kemudian dicatat dalam struktur

conditional FP Tree, yaitu support

data SOTrieIT.

count dari setiap item dijumlahkan.

Proses

selanjutnya

adalah

Hanya item dengan nilai support lebih

pemangkasan item yang tidak frequent

besar

yaitu apabila nilai support dan nilai

minimum

count

dibangkitkan.

nya

minimum

e.

Kemudian tahapan selanjutnya adalah

Proses pertama pada algoritma FOLD-

mahasiswa

d.

yang telah dipangkas.

kurang support

dari yang

batasan sudah

i.

atau

sama support

dengan

nilai

yang

akan

Tahapan terakhir dalam sistem adalah

ditentukan. Jika minimum support dan

pengujian

terhadap

rule

yang

minimum confidence tidak sesuai

dihasilkan, yaitu pengujian lift ratio.

maka akan dipangkas.

Pada pengujian lift ratio dilakukan

Setelah dilakukan pemangkasan item

perbandingan antara confidence rule

yang tidak frequent, maka item-item

yang terbentuk dengan nilai beckmark

yang diproses tersebut akan diurutkan

confidence.

185

Edisi Juli 2015 Volume IX No. 2 j.

ISSN 1979-8911

Kemudian sistem akan menampilkan rule

yang

dihasilkan,

nilai

counfidence, nilai support, lift ratio yang telah dip roses diatas.

206700050 207429727 207429751 206700073 206700102 206700144 206700163

Tulis PPA Tulis SNMPTN SPMB SPMB Tulis

B3 B3 A2 A3 A1 B2 B2

Pada perhitungan manual, dilakukan dengan sample 30 data yang sudah melalui proses prepro-cessing dengan minimum support 20% dan minimum confident 50%. Sample data terdapat pada tabel 3.2 Tabel 5 Sample data mahasiswa NIM 206700110 206700072 206700076 206700103 206700105 206700112 206700180 206700026 206700034 206700044 206700046 206700071 206700091 206700094 206700098 206700109 206700141 206700142 206700143 206700146 206700169 206700181 206700194

Jalur PPA PPA Tulis SPMB SPMB SNMPTN Tulis Tulis PPA PPA SPMB SPMB Tulis SNMPTN PPA PPA SNMPTN SNMPTN SPMB SPMB PPA PPA Tulis

Kategori B2 B2 B1 A1 B1 B3 B3 A2 A2 B2 B2 B2 A1 A3 A3 B3 B3 B2 B2 B1 B1 B2 B2

Selanjutnya adalah tahap penggalian 1-2 itemset dengan menggunakan struktur data SOTrieIT. Proses pengalian 1-2 itemset dengan menggunakan struktur data SOTrieIT dapa dilihat pada gambar.

Gambar 2 Struktur data SOTrieIT penggalian 1-2 itemset Pada gambar 3.3. data yang sudah di SOTrieIT penggalian 1-2 itemset terdapat beberapa jalur masuk diantaranya PPA sebanyak 9 dengan kategori kelulusan yang berada di PPA ada A2 sebanyak 1, A3 sebanyak 1, B1 sebanyak 1, B2 sebanyak 4 dan B3 sebanyak 2. Tulis 186

Edisi Juli 2015 Volume IX No. 2 sebanyak 8 dengan kategori kelulusan

ISSN 1979-8911 B3

6

0.30

yang berada di Tulis yaitu B1 sebanyak 1, B3 sebanyak 2, B2 sebanyak 2, A2

Tabel 7 Perhitungan Support 2-itemset

sebanyak 2, A1 sebanyak 1. SNMPTN sebanyak 5 dengan kategori kelulusan yang berada di SNMPTN yaitu B3 sebanyak 2, A3 sebanyak 2, B2 sebanyak 1. Sedangkan SPMB sebanyak 8 dengan kategori kelulusan yang berada di jalur SPMB yaitu B2 sebanyak 4, B1 sebanyak 2, dan A1 sebanyak 2. Setelah membangun SOTrieIT yang utuh. Dilakukan penghitungan support

Itemset PPA,A2 PPA,B2 PPA,A3 PPA,B1 PPA,B3 TULIS,A1 TULIS,A2 TULIS,B1 TULIS,B2 TULIS,B3 SNMPTN,A3 SNMPTN,B2 SNMPTN,B3 SPMB,A1 SPMB,B1 SPMB,B2

Count 1 4 1 1 2 1 2 1 2 2 2 1 2 2 2 4

Support 0.05 0.2 0.05 0.05 0.1 0.05 0.1 0.05 0.1 0.1 0.1 0.05 0.1 0.1 0.1 0.2

count pada 1-itemset dan 2-itemset, pada tabel

3.13 untuk hasil penghitungan

support 1-itemset dan untuk tabel 3.4 perhitungan Support 2-itemset. Tabel 6 Perhitungan Support 1-itemset Itemset PPA TULIS SNMPTN SPMB A1 A2 A3 B1 B2

Count 9 8 5 8 3 3 3 4 11

Support 0.45 0.40 0.25 0.40 0.15 0.15 0.15 0.20 0.55

Pada tabel 3.4 terdapat penggabungan 2-itemset dan perhitungan nilai count dengan nilai support. Tahap pemangkasan

selanjutnya item-item

adalah yang

tidak

frequent. Minimum support yang telah ditentukan adalah 20% atau 0.2, jadi apabila nilai support countnya kurang dari batas

minimum

support

yang

telah

ditentukan maka dilakukan pemangkasan.

187


ISSN 1979-8911

Tabel 8 perhitungan support 2 itemset Itemset PPA,B2 SPMB,B2

Count 4 4

Support 0.2 0.2

Berdasarkan

minimum

confidence

yang telah ditentukan yaitu sebesar 50% maka apabila nilai confidence dari frequent

Tahapan membangun

adalah

itemset ≥ minimum confidence maka akan

menggunakan

dibangkitkan menjadi rule. Rule yang

selanjutnya FP-Tree

transaksi-transaksi data yang telah di

terbentuk dapat dilihat pada tabel 4.6

pangkas

Tabel 10 Rule yang dihasilkan Frequent Itemset SPMB →B2

Keterangan Jika Jalur Masuknya SPMB maka Kategori kelulusannya B2

Dari hasil perhitungan manual dengan sampel 30 data, dihasilkan SPMB→B2 dengan nilai confident 0,50. Gambar 3 FP-Tree 6.

Kesimpulan

Tahap selanjutnya adalah perhitungan nilai confidence pada frequent itemset. Pada tahapan ini, dicari nilai confidence pada frequent itemset yang telah terbentuk.

1. Jika jalur masuknya melalui tes TULIS maka lama lulusnya lebih dari 4 tahun dan IPK berada diantara 3.00 sampai 3.49 atau masuk dalam kategori B2

Tabel 9 Confidence Frequent itemset Frequent Itemset PPA →B2 SPMB →B2

Support Support Confidence (A,B) (A) 0,2 0,45 0.44 0,2

0,40

0.50

untuk jurusan Manajemen pendidikan Islam. 2. Jika jalur masuknya melalui tes PPA maka lama lulusnya lebih dari 4 tahun 188


ISSN 1979-8911

dengan IPK berada diantara 3.00

6. Jika

jalur

masuknya

melalui

tes

sampai 3.49 atau masuk dalam kategori

SNMPTN maka lama lulusnya lebih

B2 untuk jurusan pendidikan Agama

dari 4 tahun dan IPK berada diantara

Islam, pendidikan fisika,matematika,

3.00 sampai 3.49 atau masuk dalam

biologi, kimia, Agroteknologi.

kategori

3. Jika jalur masuknya melalui tes TULIS

B2

untuk

jurusan

matematika,Biologi, Teknik elektro.

maka lama lulusnya lebih dari 4 tahun

7. Jika jalur masuknya melalui tes SPMB

dan IPK berada diantara 3.00 sampai

maka lama lulusnya lebih dari 4 tahun

3.49 atau masuk dalam kategori B2


untuk jurusan Pendidikan Agama Islam,

3.49 atau masuk dalam kategori B2

matematika,

fisika,

kimia,

Teknik

untuk jurusan matematika, biologi.

Informatika,

Agroteknologi,

Teknik

8. Jika

Elektro.

jalur

masuknya

melalui

tes

SNMPTN maka lama lulusnya kurang

4. Jika jalur masuknya tes TULIS maka

dari atau pas 4 tahun dan IPK berada

lama lulusnya kurang dari atau pas 4

diantara 3.00 sampai 3.49 atau masuk

tahun dan IPK berada diantara 3.00

dalam kategori A2 untuk jurusan Fisika,

sampai 3.49 atau masuk kategori A2

kimia.

untuk jurusan Pendidikan Bahasa Arab, kimia.

DAFTAR PUSTAKA [1]

Hamnon, Marissa. 2012. Penerapan Metode

5. Jika jalur masuknya tes PPA maka lama

Association

Algoritma

lulusnya kurang dari atau pas 4 tahun

Rule

FP-Growth

Dengan

Pada

Data

Transaksi Penjualan Buku. Semarang:


Universitas Brawijaya.

3.49 atau masuk kategori A2 untuk jurusan

Pendidikan

Bahasa

[2]

Hermawati, A. F. 2009. Data Mining. Surabaya: Penerbit Andi.

Arab,Bahasa Inggris,

189

Edisi Juli 2015 Volume IX No. 2 [3]

Slimani,

Thabet.

2013.

ISSN 1979-8911 Efecient

Analysis of Pattem Association Rule Mining. LARODEC Lab.

[4]

Ma’ruf, Amrul, F .2013. Aplikasi Data Mining Untuk Mengetahui Hubungan Proses

Masuk

Dengan

Kelulusan Mahasiswa.

Tingkat

Yogyakarta:

AMIKOM.

[5]

Mata, T. Ramon, A. 2002. Dasardasar Database Relational. Jakarta: Penerbit Erlangga

[6]

Prasetyo, Eko. 2012. Data Mining Konsep dan Aplikasi Menggunakan MATLAB. Gresik: Penerbit Andi

[7]

Prastow, Deni. 2008. Penggunaan Struktur

Data

Pemangkasan

SoTrieIT Transaksi

untuk dengan

Algoritma Data Mining Fold-Growth. Institut Pertanian Bogor(IPB). Bogor.

[8]

UIN

Bandung.

2014.

Pedoman

Akademik UIN Sunan Gunung Djati Bandung. CV. Insan Mandiri.

190

Edisi Juli 2015 Volume IX No. 2 ISSN

Recommend Documents