PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN A M IUNTUK RUDD IN PENETAPAN POLA SERTFIKASI GURU
Program Pascasarjana urusan Teknik Elektro Program Studi Telematika Institut Teknologi Sepuluh November Surabaya 2010
LATAR BELAKANG n
n
Data Mining (Penggalian Data) didefinisikan sebagai sebuah proses untuk menemukan hubungan, pola dan trend baru yang bermakna dengan menyaring data yang sangat besar, yang tersimpan dalam penyimpanan, menggunakan teknik pengenalan pola seperti teknik statistik dan matematika [4] NUPTK adalah Nomor Unik Pendidik dan Tenaga Kependidikan yang merupakan Nomor Registrasi bagi Pendidik dan Tenaga Kependidikan pada jenjang Pendidikan Dasar dan Menengah baik Formal maupun Non Formal
Latar Belakang.... n
n
n
Data NUPTK yang dimiliki saat ini semakin lama semakin bertambah banyak Jika data NUPTK dibiarkan, maka data tersebut hanya akan menjadi sampah yang tidak berarti dan tujuan pembangunan database NUPTK menjadi tidak tercapai Diperlukan sebuah pendekatan atau metode pengolahan data yang mampu memilah dan memilih data yang besar secara cepat dan akurat
Latar Belakang.... n
n
Penerapan teknik-teknik data mining diharapkan mampu menjawab tantangan perkembangan data NUPTK yang semakin besar Pola asosiasi menjadi salah satu fungsionalitas yang paling menarik dalam penggalian data.
Tujuan Penelitian n
Untuk menemukan pola aturan asosiatif antara suatu kombinasi atribut sertifikasi yang dijadikan sebagai dasar pengajuan dan penetapan sertifikasi Guru,
Manfaat Penelitian n
n n
Mempermudah proses pengurusan sertifikasi bagi guru yang belum tersertifikasi Mempermudah proses penetapan sertifikasi Dapat menetapkan atribut sertifikasi yang harus dipenuhi oleh guru yang akan mengajukan sertifikasi
Association Rules v
v
v
Association Rules disebut juga Frequent Itemset Mining karena pola yang dihasilkan adalah pola item yang sering muncul bersamaan dalam sebuah data base Association Rule dinyatakan dalam bentuk X => Y, di mana X dan Y merupakan Itemset. Contohnya : {Milk, Diaper} => {Beer}.
Association Rules ... n
Support (s) dan Confidence (c) merupakan ukuran ketertarikan pada Association Rule. Support menunjukkan persentasi jumlah transaksi yang berisi X dan Y. Sedangkan Confidence menunjukkan persentasi banyaknya Y pada transaksi yang mengandung X
Association Rules ... n
n
n
n
Nilai Support digunakan untuk menentukan Frequent Itemset. Itemset yang nilai Support-nya memenuhi parameter threshold minimum support (min_sup) masuk dalam Frequent Itemset. Nilai Confidence digunakan untuk menentukan Strong Association Rule. Association Rule yang nilai Confidence-nya memenuhi parameter threshold minimum confidence (min_conf) termasuk dalam Strong Association Rule
Blok Diagram Sistem
Persiapan Data Pencarian Large itemset Large itemset Generate Strong Association Rule
Strong association Rules Interesting Association Rules
A. Persiapan data (1)
• •
Seleksi Data Atribut-atribut data NUPTK yang digunakan dalam penelitian ini adalah atribut yang yang bersumber dari dua variabel utama data NUPTK Pembersihan Data Proses pembersihan data dilakukan untuk membuang record yang keliru, menstandarkan attribut-attribut, dan mengendalikan data yang hilang
Algoritma Apriori
• Fast Algorithms for Mining •
Association Rules, Rakesh Agrawal & Ramakrishnan Srikant, IBM Almaden Research Center , Almaden, 1994. Berpengaruh besar dalam permasalahan generate frequent itemset pada association rule mining.
Contoh Hasil Pencarian Strong Association Rules Data NUPTK NO
ANTECEDENT -> CONSEQUENT
LIFT
1 {NUPTK=1 TingkatPend=1 MapelSertfikasi=1} -> {PLPG=1Sertifikasi=1} 1.9 2 {NUPTK=1 MapelSertfikasi=1 PLPG=1} -> {TingkatPend=1 Sertifikasi=1} 1.9 3 {TingkatPend=1 Sertifikasi=1} -> {NUPTK=1 MapelSertfikasi=1 PLPG=1} 1.9 4 {PLPG=1 Sertifikasi=1} -> {NUPTK=1 TingkatPend=1 MapelSertfikasi=1} 1.9 5 {TingkatPend=1 MapelSertfikasi=1} -> {PLPG=1 Sertifikasi=1} 1.86 50 {PLPG=1} -> {NUPTK=1 TingkatPend=1} 1.64 150 {NUPTK=1 TingkatPend=1 PLPG=1} -> {MapelSertfikasi=1} 1.4 181 {NUPTK=1} -> {32.0<=usia<50.0} 1.04, 182 {32.0<=usia<50.0} -> {NUPTK=1} 1.04 183 {NUPTK=1} -> {MsKerjaGuru<11 } 1.03 184 {MsKerjaGuru<11} -> {NUPTK=1} 1.03
• Lift = Confidence/Expected Confidence • Nilai lift yang berada di bawah 1 dianggap tidak ada ketergantungan yang kuat antara antecedent dengan consequent
KESIMPULAN
• •
Association rule mining menggunakan metode apriori berhasil diimplementasikan dan menemukan 184 rule penting yang tersembunyi dalam database NUPTK Pola data yang ditemukan pada data NUPTK yang memuat atribut sertfikasi dengan kategori lulus memiliki kecenderungan asosiasi yang kuat dengan atribut-atribut PLPG, NUPTK, Kualifikasi Pendidikan S1 dan Mata Pelajaran yang disertifikasi linear dengan Mata pelajaran yang diampu.
• Kecendurangan pola yang terbentuk dari
•
association rule mining data NUPTK dapat ditetapkan bahwa guru-guru yang Lulus sertfikasi adalah guru yang memenuhi atribut PLPG, NUPTK, Kualifikasi Pendidikan S1 dan Mata Pelajaran yang disertifikasi linear dengan Mata pelajaran yang diampu Usia Pendidik dan Tenaga Kependidikan 32-50 tahun dan masa kerja minimal 11 tahun menjadi dasar untuk penetapan mereka mendapatkan NUPTK