PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA ASOSIASI DAYA SERAP HASIL JIAN NASIONAL MATA PELAJARAN BAHASA INDONESIA SMA DI YOGYAKARTA
SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika
Disusun Oleh: Brigita Cynthia Dewi 125314016
PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2016
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
FP GROWTH ALGORITHM IMPLEMENTATION FOR ABSORTIVE CAPACITY ASSOCIATION RULE ANALYSIS ON INDONESIAN LANGUAGE SUBJECT AT SENIOR HIGH SCHOOL NATIONAL EXAMINATION IN YOGYAKARTA
A THESIS Presented as Partial Fulfillment of The Requirement To Obtain The Sarjana Komputer Degree In Informatics Engineering Study Program
By: Brigita Cynthia Dewi 125314016
INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2016 ii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ah.
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRAK Ujian nasional(UN) merupakan salah satu contoh sistem evaluasi standar pendidikan yang ada di Indonesia. UN ini dilaksanakan dengan tujuan untuk memetakan mutu pendidikan di Indonesia. Kegiatan evaluasi memang penting untuk dilakukan demi meningkatnya mutu pendidikan karena kegiatan ini evaluasi dapat memperlihatkan sampai sejauh mana siswa memahami materi yang diberikan. Setiap tahunnya Kementrian Pendidikan dan Kebudayaan (kemendikbud) selalu mengeluarkan nilai hasil UN dengan harapan dari data tesebut dapat ditemukan sebuah informasi yang bermanfaat untuk peningkatan mutu pendidikan di Indonesia. Salah satu bidang ilmu yang dapat digunakan untuk mendapatkan informasi dari kumpulan data tersebut adalah dengan data mining. Salah satu penerapan data mining pada tugas akhir ini menggunakan teknik association rule dengan algoritma FP-Growth. Teknik ini dapat digunakan untuk mencari frequent itemset dalam kumpulan data. Penelitian ini bertujuan untuk menerapkan algoritma FP-Growth pada data nilai daya serap UN SMA di Yogyakarta untuk mata pelajaran Bahasa Indonesia. Metodologi penelitian yang digunakan dalam penelitian ini adalah penelitian pustaka, KDD (Knowledge Discovery in Database) dan pembuatan laporan. Pada tahap awal KDD akan dilakukan pembersihan data dan integrasi data secara manual melalui Ms.Excel. Selanjutnya dilakukan seleksi data dan transformasi data di dalam perangkat lunak yang dibuat. Setelah itu dilakukanlah proses data mining dan terakhir adalah proses pattern evaluation dan knowledge presentation yang dikenakan pada hasil aturan asosiasi yang terbentuk. Pengujian terhadap sistem ini terdiri dari pengujian black box, pengujian validitas dan pengujian running time. Berdasarkan semua pengujian, disimpulkan bahwa algoritma FP-Growth dapat diterapkan dan dapat menemukan aturan asosiasi yang menarik dari data nilai daya serap. Sistem yang dibuat dengan melakukan penerapan metode FP-Growth ini menghasilkan 5 aturan asosiasi yang menarik berdasarkan nilai lift ratio tertinggi untuk tahun akademik 2012/2013-2013/2014 ada 3 aturan asosiasi dan untuk tahun 2014/2015 ada 2 aturan asosiasi. Secara subyektif kompetensi-kompetensi dalam aturan-aturan asosiasi tersebut memang saling berkaitan.
Kata Kunci : Association Rule, FP-Growth, data mining, nilai daya serap
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ABSTRACT The national examination (UN) is one example of a standard evaluation system of education in Indonesia. UN carried out in order to map the quality of education in Indonesia. Evaluation is the important things to do for improving the quality of education. this activity can reveal the extent to which students understand the material provided. Each year, Kementrian Pendidikan dan Kebudayaan (Kemendikbud) always display the results of the UN with the propose can be founded a useful information for improving the quality of education in Indonesia. One area of science that can be used to obtain information from the dataset is with data mining. This thesis using one technic of data mining association rule with FP-Growth algorithm. This technique can be used to find frequent itemset in the data set. This research aims to implement the algorithm FP-Growth in the value data absorption UN High School in Yogyakarta's for Indonesian subjects. The methodology for this research used in this study is a research library, KDD (Knowledge Discovery in Databases) and make a report. In the early stages of KDD will do data cleansing and data integration manually at Ms.Excel. Furthermore, the data selection and transformation of data will be do at the software that was created. After that perform the data mining process and the last is a process of pattern evaluation, and knowledge presentation imposed on the results of the association rules formed. Testing of the system consists of a black box testing, testing the validity and running time testing. Based on all the tests, it was concluded that FP-Growth algorithm can be applied and can find an interesting association rules from the data value of absorption. The system that was created with FP-Growth method produces 5 interesting association rules based on the value of the highest lift ratio for the academic year 2012 / 2013-2013 / 2014 there are three rules of the association and for the year 2014/2015 there are two rules of association. Subjectively competencies in the rules of the association are correlated. Keyword : Association Rule, FP-Growth, data mining, nilai daya serap, absorptive capacity
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa karena atas rahmat dan karunia-Nya, penulis dapat menyelesaikan Tugas Akhir yang berjudul “PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA ASOSIASI DAYA SERAP HASIL UJIAN NASIONAL MATA PELAJARAN BAHASA INDONESIA SMA DI YOGYAKARTA” ini dengan baik. Dalam proses penulisan tugas akhir ini penulis menyadari bahwa ada begitu banyak pihak yang turut membantu memberikan motivasi semangat dan juga bantuan dalam menyelesaikan tugas akhir ini. Oleh karena itu saya ingin mengucapkan terima kasih antara lain kepada : 1.
Bapak Sudi Mungkasi, S.Si., M.Math.Sc.,Ph.D. selaku Dekan Fakultas Sains dan Teknologi.
2.
Ibu Dr. Anastasia Rita Widiarti, selaku Kepla Prodi Teknik Informatika.
3.
Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T sebagai dosen pembimbing
akademik, yang telah memberikan bimbingan dan saran selama penulis menempuh studi. 4.
Ibu P.H Prima Rosa, S.Si., M.Sc selaku dosem pembimbing skripsi yang telah
memberikan kesabaran, waktu dan saran sehingga dapat diselesaikannya tugas akhir ini. 5.
Seluruh dosen yang telah mendidik dan memberikan pengetahuan dan
pengalaman berharga selama penulis belajar di Universitas Sanata Dharma Yogyakarta. 6.
Orang tua dan adik yang telah memberikan kasih sayang, perhatian, doa dan
dukungan sehingga penulis dapat menyelesaik tugas akhir. 7.
Teman-teman bimbingan bu Rosa yang selalu dapat memberikan motivasi dan
semangat.
ix
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR ISI
A THESIS.............................................................................................................................ii HALAMAN PERSETUJUAN ................................................. Error! Bookmark not defined. HALAMAN PENGESEHAN ............................................................................................... iv PERNYATAAN KEASLIAN KARYA .................................................................................v LEMBAR PERNYATAAN PERSETUJUAN ...................................................................... vi ABSTRAK ......................................................................................................................... vii ABSTRACT ...................................................................................................................... viii KATA PENGANTAR.......................................................................................................... ix DAFTAR ISI ....................................................................................................................... xi DAFTAR GAMBAR ......................................................................................................... xiii DAFTAR TABEL .............................................................................................................. xiv DAFTAR LAMPIRAN ....................................................................................................... xv BAB I .................................................................................................................................. 1 PENDAHULUAN ............................................................................................................... 1 1.1.
Latar Belakang...................................................................................................... 1
1.2.
Rumusan Masalah................................................................................................. 3
1.3.
Batasan Masalah ................................................................................................... 4
1.4.
Tujuan Penelitian .................................................................................................. 4
1.5.
Manfaat Penelitian ................................................................................................ 4
1.6
Metodologi Penelitian ........................................................................................... 5
1.7
Sistematika Penulisan ........................................................................................... 6
BAB II ................................................................................................................................. 7 LANDASAN TEORI ........................................................................................................... 7 2.1
Pengertian Penambangan Data .............................................................................. 7
2.2
Tujuan Penambangan Data.................................................................................... 7
2.3
Teknik Data Mining .............................................................................................. 8
2.4
Knowledge Discovery in Database (KDD) ............................................................ 9
2.5
Association Rules................................................................................................ 12 xi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III .............................................................................................................................. 20 METODE PENELITIAN ................................................................................................... 20 3.1
Sumber Data ....................................................................................................... 20
3.2
Spesifikasi Alat ................................................................................................... 24
3.3
Tahap – Tahap Penelitian .................................................................................... 24
BAB IV ............................................................................................................................. 28 PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK PENAMBANGAN DATA ................................................................................................. 28 4.1
Perancangan Awal Sumber Data ......................................................................... 28
4.2
Pengembangan Perangkat Lunak Penambangan Data .......................................... 29
BAB V............................................................................................................................... 49 IMPLEMENTASI PENAMBANGAN DATA.................................................................... 49 DAN EVALUASI HASIL .................................................................................................. 49 5.1
Implementasi Rancangan Perangkat Lunak Penambangan Data ........................... 49 5.2.1 Implementasi Kelas Model ...................................................................... 49 5.2.2 Implementasi Kelas View ........................................................................ 49 5.2.3 Implementasi Kelas Controller................................................................. 50
5.2
Evaluasi Hasil ..................................................................................................... 50 5.2.1 Uji Coba Perangkat Lunak (Black Box Testing)........................................ 50 5.2.2 Uji Validitas ............................................................................................ 58 5.2.3 Uji Coba Data Set .................................................................................... 61
BAB VI ............................................................................................................................. 78 PENUTUP ......................................................................................................................... 78 6.1
Kesimpulan......................................................................................................... 78
6.2
Saran .................................................................................................................. 79
DAFTAR PUSTAKA ........................................................................................................ 80
LAMPIRAN …………………………………………………………………………………………………………………….82
xii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR GAMBAR Gambar 2. 1 Diagram Model Klasifikasi ................................................................... 8 Gambar 2. 2 Penambangan data sebagai tahapan dalam proses KDD....................... 10 Gambar 2. 3 Tabel data transaksi ............................................................................ 13 Gambar 2. 4 Tabel daftar support count tiap item .................................................... 13 Gambar 2. 5 Pembuatan FP Tree ............................................................................. 14 Gambar 2. 6 Sub-database node I3 .......................................................................... 15 Gambar 4. 1 Diagram Konteks ................................................................................ 30 Gambar 4. 2 Diagram Usecase ................................................................................ 31 Gambar 4. 3 Ilustrasi FPTree .................................................................................. 34 Gambar 4. 4 Susunan arraylist untuk kode sekolah 01-010 ..................................... 35 Gambar 4. 5 Susunan arraylist untuk kode sekolah 01-019 ..................................... 35 Gambar 4. 6 Data arraylist dalam arraylist ............................................................. 35 Gambar 4. 7 Diagram Kelas Desain ....................................................................... 36 Gambar 4. 8 Halaman Awal .................................................................................... 43 Gambar 4. 9 Halaman About ................................................................................... 44 Gambar 4. 10 Halaman Help ................................................................................... 45 Gambar 4. 11 Halaman Preprocessing .................................................................... 46 Gambar 4. 12 Halaman Asosiasi ............................................................................. 47 Gambar 4. 13 Halaman Database ............................................................................ 48 Gambar 4. 14 Diagram Kelas Analisis .................................................................... 85 Gambar 5. 1 (a)Kotak Dialog “Pilih File” (b)Tabel Dataset .................................... 51 Gambar 5. 2 Kotak Dialog Salah Pilih File .............................................................. 51 Gambar 5. 3 Tampilan Setelah Menekan Tombol “Tandai Semua” ......................... 52 Gambar 5. 4 Tampilan Setelah Menekan Tombol “Hapus Atribut” ......................... 52 Gambar 5. 5 Tampilan Setelah Menekan Tombol “Batal” ....................................... 52 Gambar 5. 6 Hasil Pencarian Aturan asosiasi .......................................................... 55 Gambar 5. 7 Tampilan Ketika Min Support dan Minimum confidence Tidak Diisi .. 55 Gambar 5. 8 Kotak Dialog Simpan Hasil................................................................. 56 Gambar 5. 9 Kotak Dialog Jika Berhasil Menyimpan Data ...................................... 56 Gambar 5. 10 Dataset Supermarket.arff................................................................... 59 Gambar 5. 11 Dataset Setelah di Preprocessing ...................................................... 60 Gambar 5. 12 Uji Running Time Min Confidence=60% .......................................... 67 Gambar 5. 13 Uji Running Time Min Confidence=90% .......................................... 68 Gambar 5. 14 Uji Running Time Min Confidence=60% .......................................... 68 Gambar 5. 15 Uji Running Time Min Confidence=90% .......................................... 69
xiii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR TABEL Tabel 2. 1 Interval Daya Serap Siswa ...................................................................... 18 Tabel 3. 1 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2012/2013 & 2013/2014 ............................................................................................................... 20 Tabel 3. 2 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2014/2015 ............ 22 Tabel 4. 1 Daftar Kelas Untuk Tiap Usecase ........................................................... 32 Tabel 5. 1 Tabel Implementasi Kelas Model ........................................................... 49 Tabel 5. 2Tabel Implementasi Kelas View .............................................................. 49 Tabel 5. 3 Tabel Implementasi Kelas Controller ...................................................... 50 Tabel 5. 4 Tabel Hasil Uji Pada Halaman Preprocessing ......................................... 52 Tabel 5. 5 Tabel Pengujian Halaman Preprocessing ................................................ 54 Tabel 5. 6 Tabel Pengujian dengan Hitungan Manual .............................................. 57 Tabel 5. 7 Tabel Hasil Pengujian dengan WEKA .................................................... 60 Tabel 5. 8 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf=60% . 63 Tabel 5. 9 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf = 90% 63 Tabel 5. 10 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 60% .................. 65 Tabel 5. 11 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 90% .................. 66 Tabel 5. 12 Daftar aturan asosiasi data tahun 2012/2013-2013/2014........................ 71 Tabel 5. 13 Daftar aturan asosiasi data tahun 2014/2015 ......................................... 74
xiv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR LAMPIRAN
Lampiran 1 : Diagram Aktivitas .............................................................................. 82 Lampiran 2 : Diagram Kelas Analisis ...................................................................... 85 Lampiran 3 : Diagram Sequence ............................................................................. 86 Lampiran 4 : Diagram Kelas Desain ........................................................................ 89 Lampiran 5 : Penghitungan Manual......................................................................... 95 Lampiran 6 : Data…………………………………………………………………..106
xv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB I PENDAHULUAN
1.1.
Latar Belakang Setiap orang pasti memiliki kemampuan yang berbeda antara yang satu
dengan yang lainnya termasuk kemampuan seorang siswa dalam memahami suatu mata pelajaran. Setiap siswa memiliki tingkat pemahaman yang berbeda-beda dalam memahami setiap pelajaran yang diajarkan. Hal ini merupakan masalah yang sering dihadapi oleh para guru dalam upaya meningkatkan kualitas belajar siswa. Kemampuan seorang siswa dalam memahami materi bergantung juga pada kemampuan daya serapnya. Daya serap merupakan kemampuan siswa dalam menerima materi pembelajaran sesuai dengan batas yang ditentukan. Biasanya nilai ini didapatkan setelah seorang guru selesai melaksanakan evaluasi pembelajaran yang dilakukan setelah mengadakan tes. Dari hasil inilah seorang guru dapat memetakan perolehan nilai yang dicapai oleh siswa. Ujian nasional adalah salah satu sistem evaluasi standar pendidikan yang ada di Indonesia.Ujian Nasional merupakan salah satu upaya pemerintah dalam rangka memacu peningkatan mutu pendidikan. Ujian Nasional selain berfungsi untuk mengukur dan menilai
pencapaian
kompetensi lulusan dalam mata pelajaran tertentu, serta pemetaan mutu pendidikan pada tingkat pendidikan dasar dan menengah, juga berfungsi sebagai motivator bagi pihak-pihak terkait untuk bekerja lebih baik guna mencapai hasil ujian yang baik. Berbagai hasil penelitian menunjukkan bahwa dengan adanya Ujian Nasional, siswa terdorong untuk belajar lebih baik dan guru terdorong untuk mengajar lebih baik pula (Kemdikbud,2015). Salah satu cara yang dapat dilakukan untuk memajukan mutu pendidikan di Indonesia adalah dengan cara mengkaji secara mendalam hasil Ujian Nasional. Informasi hasil Ujian Nasional ini disediakan oleh Puspendik Balitbang Kemdikbud kedalam beberapa bentuk seperti bentuk statistik, grafik, 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
daftar dan juga daya serap. Dalam penelitian ini, bentuk informasi yang akan digunakan adalah informasi daya serap. Informasi daya serap ini berisi informasi laporan daya serap Ujian Nasional siswa SMA dari program IPA dengan mata pelajaran Bahasa Indonesia yang memiliki 21 kompetensi. Dari data tersebut diharapkan dapat digali informasi keterkaitan antara kompetensi yang satu dengan kompetensi lainnya dari sekolah-sekolah yang memiliki nilai daya serap yang memenuhi standar yang ditentukan. Informasi tersebut dapat dimanfaatkan oleh dinas pendidikan untuk membantu dinas pendidikan memberikan langkah-langkah perbaikan mengenai metode pembelajaran ada saat ini guna meningkatkan mutu pendidikan di Yogyakarta. Penelitian ini juga dapat dimanfaatkan oleh para peneliti di bidang pendidikan sebagai rekomendasi analisa agar dapat dikaji lebih mendalam lagi. Salah satu teknik yang dapat dipergunakan untuk menggali informasi tersebut adalah data mining. Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan didalam database. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar (Turban, dkk.2005). Data mining sendiri memiliki berbagai macam teknik, salah satunya adalah teknik asosiasi. Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item. Dalam kasus ini peneliti melakukan penelitian dari data nilai daya serap siswa SMA Yogyakarta untuk mencari tahu pola keterkaitan antara kompetensi yang satu dengan yang lainnya yang mempengaruhi keberhasilan siswa menggunakan algoritma FP-Growth. Algoritma FP-Growth merupakan salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data. Menurut Octaviani, (2010) algoritma FPGrowth memiliki waktu kerja yang lebih cepat dalam menemukan frequent itemset,
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
algoritma ini juga dapat menghasilkan aturan yang sama baiknya dengan algoritma Apriori setelah diujikan pada data transaksi penjulan untuk melakukan market base analysis. Pada penelitian tugas akhir ini nantinya akan dibuat sebuah sistem yang menerapkan algoritma FP-Growth pada data nilai daya serap siswa yang diharapkan dapat menemukan pola asosiasi antar kompetensi. Pada penelitian ini, peneliti hanya akan berfokus pada mata pelajaran Bahasa Indonesia. Mata pelajaran ini dipilih karena peneliti berpendapat bahwa Bahasa Indonesia itu merupakan salah satu identitas Bangsa Indonesia. Bahasa Indonesia mempunyai kedudukan yang sangat penting dalam kehidupan berbangsa dan bernegara maka Bahasa Indonesia juga merupakan salah satu mata pelajaran yang selalu diberikan semenjak siswa masih berada di tingkat Taman Kanak-Kanak. Tujuan pembelajaran dari mata pelajaran ini bukan hanya untuk sekedar siswa lulus dalam ujian melainkan mereka dapat menggunakan Bahasa Indonesia yang baik dan benar di kehidupan sehari-harinya. Karena kebutuhan itulah, penting bagi tenaga pendidik untuk mengetahui sejauh mana kemampuan berbahasa Indonesia anak didiknya. Hasil keluaran dari sistem diharapkan dapat digunakan untuk mengetahui kompetensi apa saja yang ternyata memiliki keterkaitan berdasarkan nilai lift ratio sebagai analisa secara obyektif dan juga berdasarkan pendapat dari seorang praktisi pendidikan di bidang Bahasa Indonesia sebagai analisa secara subyektif. Aturan asosiasi yang didapatkan tersebut dapat digunakan oleh dinas pendidikan untuk mengambil langkah-langkah perbaikan kepada sekolah-sekolah yang memiliki nilai daya serap kurang dari standar yang ditentukan pada kompetensi-kompetensi yang ada di dalam aturan asosiasi tersebut. Salah satu perbaikan yang dilakukan adalah dengan memperbaiki metode pembelajaran di masa yang akan datang yang berfokus pada kompetensi-kompetensi di dalam aturan asosiasi yang didapatkan.
1.2.
Rumusan Masalah Berdasarkan latar belakang yang telah dijelaskan sebelumnya, masalah yang
akan diselesaikan dalam penelitian ini adalah:
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1. Bagaimana menerapkan algoritma FP-Growth untuk menemukan aturan asosiasi antar kompetensi dari nilai daya serap Ujian Nasional? 2. Apakah algoritma FP-Growth dapat menemukan aturan asosiasi yang menarik berdasarkan ukuran lift ratio aturan asosiasi yang dihasilkan dari data nilai daya serap ujian nasional SMA di Yogyakarta?
1.3.
Batasan Masalah Batasan masalah yang dibahas dalam penulisan tugas akhir ini adalah sebagai
berikut: b. Sistem menggunakan data nilai daya serap UN SMA di Yogyakarta jurusan IPA dengan mata pelajaran Bahasa Indonesia tahun ajaran 2012/2013, 2013/2014, 2014/2015. c. Data yang digunakan merupakan data yang diambil dari situs www.litbang.kemendikbud.go.id.
1.4.
Tujuan Penelitian Tujuan dari penelitian ini adalah menerapkan algoritma FP-Growth pada data
nilai daya serap untuk menenemukan pola asosiasi antara kompetensi yang satu dengan yang lainnya pada suatu mata pelajaran.
1.5.
Manfaat Penelitian Hasil dari penelitian yang dilakukan, diharapkan dapat digunakan untuk
mengetahui apakah algoritma FP-Growth dapat digunakan untuk mengetahui adanya keterkaitan antar kompetensi dari data nilai daya serap ujian nasional khususnya mata pelajaran Bahasa Indonesia. Sedangkan untuk peneliti lain di bidang pendidikan, penelitian ini juga dapat digunakan sebagai referensi maupun rekomendasi contoh menganalisis data nilai daya serap Ujian Nasional.
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1.6
Metodologi Penelitian 1.6.1
Penelitian Pustaka
Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan menggali teori-teori tentang teknik data mining. Dalam penelitian ini penulis mempelajari literatur yang berkaitan dengan teknik data mining asosiasi khususnya algoritma FP-Growth dan literatur lainnya yang berguna bagi sistem yang akan dibangun.
1.6.2
Knowledge Discovery in Database (KDD)
KDD ini merupakan tahap-tahap yang perlu dilakukan dalam penelitian di bidang penambangan data (data mining). Proses KDD ini pula terdiri dari data cleaning, data integration, data selection, data transformation, data mining, pattern evaluation dan knowledge presentation. Tujuan dari proses ini adalah untuk mendapatkan informasi dari data nilai daya serap SMA di Yogyakarta. Pada salah satu tahap yang akan dilalui pada proses KDD ini adalah pembuatan perangkat lunak sebagai alat uji yang menggunakan metodologi waterfall. Metodologi tersebut terdiri dari analisa terhadap kebutuhan sistem, desain perangkat lunak dan yang terakhir adalah pengujian. Hasil yang didapatkan, kemudian akan dianalisa apakah hasil tersebut menghasilkan sebuah informasi yang bermanfaat.
1.6.3
Pembuatan Laporan
Analisis yang akan dilakukan adalah analisis kinerja dari alat uji yang dibuat berdasarkan metode FP-Growth. Hasil dari analisis tersebut akan disusun kedalam sebuah laporan tugas akhir.
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1.7
Sistematika Penulisan BAB I. Pendahuluan Bab ini berisi latar belakang, rumusan masalah, tujuan, manfaat, batasan masalah, metodologi penelitian, dan sistematika penulisan.
BAB II. Landasan Teori Bab ini akan menjelaskan mengenai teori yang berkaitan dengan judul/masalah di tugas akhir.
BAB III. Metode Penelitian Bab ini akan menjelaskan tentang penelitian pustaka yang berisikan data dan sumber data yang digunakan dan juga ada proses KDD yang menjelaskan tentang langkah-langkah yang digunakan dalam penelitian ini. Dan yang terakhir dijelaskan pula tentang pembuatan laporan.
BAB IV Pemrosesan Awal dan Perancangan Perangkat Lunak Penambangan Data Bab ini berisikan langkah awal perancangan penelitian dan perancangan pembuatan perangkat lunak.
BAB V Implementasi Penambangan Data dan Evaluasi Hasil Bab ini akan menjelaskan mengenai proses pengujian sistem dan juga beserta analisis dari hasil pengujian tersebut.
BAB VI Penutup Bab ini akan menjelaskan mengenai kesimpulan beserta kelebihan dan kelemahan sistem yang dibuat.
LAMPIRAN 6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB II LANDASAN TEORI
2.1 Pengertian Penambangan Data Penambangan data adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terakit dari berbagai database besar (Turban et al, 2005). Sedangkan menurut Pramudiono (2006) data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Terkadang penambangan data biasa juga dikenal dengan KDD (Knowledge Discovery in Database), padahal sebenarnya penambangan data merupakan salah satu tahapan pada proses KDD. Pemanfaatan penambangan data ini juga sudah banyak diterapkan dalam banyak bidang. Salah satu contoh pemanfaatan penambangan data yaitu untuk menganalisa pasar sehingga sebuah pelaku bisnis bisa lebih mengetahui pola pembelian para konsumennya.
2.2 Tujuan Penambangan Data Tujuan dari penambangan data (Hoffer et al, 2005) adalah: 1. Explanatory Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick-up meningkat di Colorado. 2. Confirmatory Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga lebih suka dipakai untuk membeli peralatan keluarga dibandingkan dengan satu kali pendapatan keluarga.
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3. Exploratory Untuk menganalisa data yang memiliki hubungan yang baru. Misalnya, pola apa yang cocok untuk kasus penggelapan kartu kredit.
2.3 Teknik Data Mining 2.3.1 Classification Klasifikasi merupakan proses pembelajaran suatu fungsi tujuan (target) yang memetakan tiap himpunan atribut x sebagai input ke satu dari label kelas y yang didefinisikan sebelumnya sebagai output. Fungsi target disebut juga model klasifikasi (Hermawati, 2013). Input
Classification model
Himpunan atribut (x)
Output Label kelas (y)
Gambar 2. 1 Diagram Model Klasifikasi Beberapa algoritma klasifikasi antara lain pohon keputusan, nearest neighbor, naïve bayes, neural networks dan support vector machines.
2.3.2 Clustering Analisa cluster yaitu menemukan kumpulan objek hingga objek-objek dalam satu kelompok sama (atau punya hubungan) dengan yang lain dan berbeda (atau tidak berhubungan) dengan objek – objek dalam kelompok lain. Tujuan dari analisa cluster adalah meminimalkan jarak di dalam cluster dan memaksimalkan jarak antar cluster (Hermawati, 2013).
8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.3.3 Association Rules Association juga disebut sebagai Market Basket Analysis. Sebuah problem bisnis
yang
khas
adalah
menganalisa
tabel
transaksi
penjualan
dan
mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer, misalnya apabila orang membeli sambal, biasanya juga dia membeli kecap. Kesamaan yang ada dari data pembelian digunakan untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan cross-selling.
2.3.4 Regresi Regresi ini biasanya digunakan untuk memprediksi nilai dari suatu variabel kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau nonlinier. Teknik ini banyak dipelajari dalam statistika, bidang jaringan syaraf tiruan (neural network). Contoh aplikasi untuk teknik regresi adalah (Hermawati, 2013). a. Memprediksi jumlah penjualan produk baru berdasarkan pada belanja promosi/iklan b. Memprediksi kecepatan angina sebagai suatu fungsi suhu, kelembaban, tekanan udara, dsb. c. Time series prediction dari indeks stock market.
2.4 Knowledge Discovery in Database (KDD) Istilah data mining dan knowledge discovery in database (KDD) seringkali digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Salah satu tahapan dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar dapat dijelaskan sebagai berikut (Fayyad, 1996).
9
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 2. 2 Penambangan data sebagai tahapan dalam proses KDD (Sumber : Fayyad, 1996)
a.
Data Cleaning Sebelum proses penambangan data dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Lalu dilakukan juga proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.
b.
Data Integration Tahap ini berisikan penggabungan dari bermacam- macam data dari berbagai sumber.
10
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
c.
Data Selection Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses penambangan data, disimpan dalam suatu berkas, terpisah dari basis data operasional.
d.
Data Transformation Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses penambangan data. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
e.
Penambangan Data Penambangan data adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam penambangan data sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
f.
Pattern Evaluation Pola informasi yang dihasilkan dari proses penambangan data perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
g.
Knowledge Presentation Tahap ini merupakan proses teknik visualisasi dan representasi pengetahuan
digunakan
untuk
penambangan kepada pengguna.
11
menyajikan
pengetahuan
hasil
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.5 Association Rules 2.5.1 Pengertian Association Rules Association rules merupakan sebuah ekspresi implikasi yang berbentuk X Y, dimana X dan Y merupakan disjoint itemset (X∩Y) = ø. Contoh: {Pena,Tinta} {Jus}. Dalam association rule, kita dapat menghitung support dan confidence. Confidence menyatakan seberapa sering item-item dalam Y muncul dalam transaksi yang berisi X. Sedangkan support menyatakan seberapa sering item-item dalam X dan Y muncul dalam transaksi secara bersamaan. Secara formal dapat dinyatakan dengan persamaan berikut ini: ∑(𝑋𝜐𝑌)
s(XY) =
…………………………(2.1)
𝑁 ∑(𝑋𝜐𝑌)
c(XY) =
…………………………(2.2)
∑(𝑋)
Dimana s adalah support dan c adalah confidence (Hermawati, 2013).
2.5.2 Frequent Pattern Frequent Patterns adalah pola yang sering terjadi di dalam data. Ada banyak jenis dari frequent patterns, termasuk di dalamnya pola, sekelompok item set, sub-sequence, dan sub-struktur. Sebuah frequent patterns biasanya mengacu pada satu set item yang sering muncul bersama-sama dalam suatu kumpulan data transaksional, misalnya seperti susu dan roti.
2.6 Frequent Pattern Growth (FP-Growth) Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data (Samuel, 2008).Penggalian itemset yang frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara membangkitkan struktur data tree atau disebut dengan FPTree. Pembuatan tree ini dilakukan dengan melakukan scanning data dari tabel transaksi seperti pada Gambar 12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.3 hanya saja item-item dari tiap transaksi tersebut harus diurutkan kembali berdasarkan jumlah count-nya (Gambar 2.4).
Gambar 2. 3 Tabel data transaksi (Sumber : Han et al. 2006 )
Gambar 2. 4 Tabel daftar support count tiap item (Sumber : Han et al. 2006 ) Pada TID T100 daftar item-nya akan berubah menjadi {I2,I1,I5}, T200 menjadi {I2,I4}, T300 {I2,I3}, T400 {I2,I1,I4}, T500 {I1,I3}, T600 {I2,I3}, T700 {I1,I3}, T800 {I2,I1,I3,I5}, T900 {I2,I1,I3}. Setelah data list item tersebut diurutkan, dibuatlah data transaksi tersebut ke dalam bentuk tree seperti Gambar 2.5.
13
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 2. 5 Pembuatan FP Tree
(Sumber : Han et al. 2006 ) Cara pembuatan FPTree dilakukan dengan cara membaca satu persatu dari transaksi pertama. Misalnya untuk TID T100 daftar item-nya adalah {I2,I1,I5}, maka untuk dibuat kedalam FP Tree buatlah 3 node untuk I2, I1 dan I5 beserta path sehinga menjadi null I2 I1 I5 dengan count untuk I2, I1 dan I5 adalah 1. Selanjutnya untuk TID T200 dengan daftar item {I2,I4}, maka dibuat 2 node untuk I2 dan I4 beserta path-nya null I2 I4. TID T100 dan T200 memiliki prefix yang sama yaitu I2. Maka count I2 bertambah menjadi 2.
Metode FPGrowth dapat dibagi menjadi 3 tahapan utama (Han et al. 2006). Ketiga tahapan ini akan dilakukan secara berulang-ulang untuk setiap item di header table yang diurutkan berdasarkan frekuensinya: a.
Tahap pembangkitan conditional pattern base Conditional Pattern base merupakan subdatabase yang berisi prefix path (lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional pattern base didapatkan melalui FPtree yang telah dibangun sebelumnya. Contoh berikut adalah proses pencarian conditional pattern base untuk item I3. Keberadaan node I3 didalam tree dapat dengan mudah ditelusuri dari link yang menghubungkan tree dan headertable sudah dibuat sebelumnya.
14
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Setelah menemukan node tersebut, maka dapat ditelusuri node-node apa saja yang dilalui dari I3 sampai ke root. Node-node yang dilewati tersebut akan menjadi sebuah lintasan. Lintasan-lintasan yang terbentuk untuk node I3 adalah {I2,I1: 2},{I2:2} dan {I1:2}. Lintasan-lintasan tersebutlah yang akan menjadi conditional pattern base.
Gambar 2. 6 Sub-database node I3
b.
Tahap pembangkitan conditional FPTree Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar sama dengan minimum support count yang akan dibangkitkan dengan conditional FPtree. Berdasarkan hasil conditional pattern base untuk node I3 yang telah dijelaskan pada tahap sebelumnya, dapat dihitung support count dari setiap itemnya adalah {I2:4, I1:2} dan {I1:2}
c.
Tahap pencarian frequent itemset Pada tahap ini, apabila conditional FPtree merupakan single path, maka akan didapatkan frequent itemsets dengan melakukan kombinasi item untuk setiap conditional FPtree. Jika bukan single path maka, akan dilakukan pembangkitan FPGrowth secara rekursif. Untuk pencarian frequent itemset pada node I3 akan dilakukan rekursif karena conditional FPtree-nya bukan
15
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
merupakan single path melainkan bercabang. Untuk setiap single path akan dikombinasikan dan hasil frequent pattern-nya adalah {{I2, I3: 4},{I1, I3: 4},{I2, I1, I3: 2}}.
2.7 Lift ratio Salah satu cara yang lebih baik untuk melihat kuat tidaknya aturan asosiasi adalah dengan menghitung lift ratio. Cara kerja metode ini adalah membagi confidence dengan expected confidence. Confidence dapat dihitung dengan rumus 2.3. Anteseden merupakan sebab yang menjadikan item konsekuen. Sedangkan konsekuen adalah sebuah akibat atau juga item yang akan dibeli setelah membeli anteseden. Jika didapatkan aturan asosiasi A B maka A sebagai anteseden dan B sebagai konsekuen. Nilai dari expected confidence dapat dihitung dengan rumus 2.4.
𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 =
jumlah transaksi yang mengandung anteseden dan konsekuen …(2.3) jumlah transaksi yang mengandung anteseden
𝐸𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 =
jumlah transaksi yang mengandung konsekuen jumlah transaksi dalam database
…(2.4)
Lift ratio dapat dihitung dengan cara membandingkan antara confidence untuk suatu aturan dibagi dengan expected confidence. Berikut rumus dari lift ratio:
𝐿𝑖𝑓𝑡 𝑅𝑎𝑡𝑖𝑜 =
𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 expected 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒
..…(2.5)
Nilai lift ratio lebih besar dari 1 menunjukkan adanya manfaat dari aturan tersebut. Lebih tinggi nilai lift ratio, lebih besar kekuatan asosiasinya (Santosa, 2007). Jika 16
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
nilai lift ratio < 1 maka kemunculan A berkorelasi negative dengan kemunculan B, artinya kemunculan salah satu item mempengaruhi hal yang sebaliknya pada kemunculan item lainnya. Contoh dari korelasi negative adalah jika penjualan item A naik maka mempengaruhi jumlah penjualan B menjadi menurun. Jika didapatkan lift ratio > 1 maka kemunculan A berkorelasi positive dengan kemunculan B, artinya kemunculan A ini berhubungan dengan kemunculan B. Contoh dari korelasi positive adalah jika item A dibeli maka item B juga akan dibeli. Sedangkan jika lift ratio = 1 maka kemuncul item A dan B independent dan tidak ada korelasi diantara kedua item tersebut (Han et al. 2006).
2.8 Evaluasi Pengajaran 2.8.1 Pengertian Evaluasi Dalam dunia pendidikan kita sering mendengar kata evaluasi. Tidak banyak orang yang mengetahui bahwa hakikat dari dari evaluasi dan bahkan apa itu itu evaluasi terkadang disalah artikan oleh seorang guru. Padahal seorang guru memiliki salah satu kewajiban yakni melakukan evaluasi kepada program pembelajaran yang telah dilakukan. Evaluasi sering disalah artikan oleh seorang guru dengan kata ujian, padahal ujian hanya salah satu bentuk evaluasi. Jika ujian tidak dilaksanakan dengan baik dari segi penyusunan Intsrumennya, bahkan ujian pun yang dibuat asal-asal tidak dapat dikategorikan sebagai bentuk evaluasi. Bloom (1971) mendefinisikan evaluasi, sebagaimana kita lihat, adalah pengumpulan kenyataan secara sistematis untuk menetapkan apakah dalam kenyataannya terjadi perubahan dalam diri siswa dan menetapkan sejauh mana tingkat perubahan dalam pribadi siswa. Sejalan dengan itu, Stufflebeam (1985), mengatakan bahwa evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan informasi yang berguna untuk menilai alternatif keputusan. Tujuan evaluasi bisa berbeda dengan tujuan dari ujian. Secara sederhana evalusi digunakan untuk memeperbaiki sistem dengan cara memberi penilaian berdasarkan
17
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
data yang diambil dari suatu atau sekelompok objek. Sedangkan ujian dapat dilakukan tanpa ada tujuan untuk memeperbaiki nilai. Ujian juga dapat dilakukan hanya untuk menyaring dan menentukan kelas dari kumpulan objek. Salah satu cara untuk melihat pemetaan hasil evaluasi adalah dengan melihat nilai daya serap. Untuk mengetahui daya serap siswa dari hasil belajarnya digunakan analisis dengan menggunakan interval daya serap siswa pada tabel 2.1. Tabel 2. 1 Interval Daya Serap Siswa No.
Interval
Kategori
1
0% - 39%
Sangat Rendah
2
40% - 59%
Rendah
3
60% - 74%
Sedang
4
75% - 84%
Tinggi
5
85% - 100%
Sangat Tinggi
2.8.2 Manfaat Pelaksanaan Evaluasi Manfaat pelaksanaan evaluasi dalam dunia pendidikan, khususnya dunia persekolahan, evaluasi mempunyai makna ditinjau dari berbagi segi (Dahlan,2014):
a. Makna bagi siswa Dengan diadakannya evaluasi, maka siswa dapat mengetahui sejauh mana telah berhasil mengikuti pelajaran yang diberikan oleh guru. Hasil yang diperoleh siswa dari pekerjaan menilai ini ada kemungkinan: Memuaskan- Jika siswa memperoleh hasil yang memuaskan dan hal itu menyenangkan, tentu kepuasan itu ingin diperolehnya lagi pada kesempatan yang lain. Tidak memuaskan- Jika siswa tidak puas dengan hasil yang diperoleh, ia akan berusaha agar lain kali keadaan itu tidak terulang lagi.
18
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
b. Makna bagi guru
Dengan hasil penilaian yang diperoleh guru akan dapat mengetahui siswa-siswa mana yang sudah berhasil menguasai bahan, maupun mengetahui siswa-siswa yang belum berhasil menguasai bahan. Guru akan mengetahui apakah materi yang diajarkan sudah tepat bagi siswa sehingga untuk memberikan pengajaran di waktu yang akan datang tidak perlu diakan perubahan.
c. Makna bagi sekolah Apabila guru-guru mengadakan penilaian dan diketahui bagaimana hasil belajar siswasiswanya, dapat diketahui pula apakah kondisi belajar yang diciptakan oleh sekolah sudah sesuai dengan harapan atau belum. Hasil belajar merupakan cermin kualitas sesuatu sekolah. Informasi dari guru tentang tidak tepatnya kurikulum untuk sekolah itu dapat merupakan bahan pertimbangan bagi perencanaan sekolah untuk masa-masa yang akan datang. Informasi hasil penilin yang diperoleh dari tahun ke tahun, dapat digunakan sebagai pedomana bagi sekolah, yang dilakukan oleh sekolah sudah memenuhi standar atau belum. Pemenuhan standar akan terlihat dari bagusnya angkaangka yang diperoleh siswa.
19
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB III METODE PENELITIAN
3.1 Sumber Data 3.1.1 Sumber Data Data
yang
digunakan
pada
penelitian
ini
didapat
dari
situs
www.litbang.kemdikbud.go.id. Data yang didapat tersebut berekstensi .xls dan berisikan nilai daya serap siswa SMA pada saat ujian nasional pada tahun akademik 2012/2013, 2013/2014 dan 2014/2015 yang terbagi ke dalam tiap-tiap kompetensi. Data yang dipakai merupakan data siswa program IPA dengan mata pelajaran Bahasa Indonesia yang memiliki 21 kompetensi. Untuk masukan sistem, pengguna akan memilih 1 dari beberapa mata pelajaran yang ada. Mata pelajaran Bahasa Indonesia memiliki 21 kompetensi yang diujikan pada Ujian Nasional SMA tahun akademik 2012/2013 & 2013/2014. Kompetensi-kompetensi yang diujikan tersebut adalah:
Tabel 3. 1 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2012/2013 & 2013/2014 Kode Atribut
Keterangan
KODE_SEKOLAH
Kode Sekolah
NAMA_SEKOLAH Nama Sekolah JNS_SEK
Jenis Sekolah (SMA/NA)
STS_SEK
Status Sekolah (Negeri/Swasta)
BIND1
Melengkapi berbagai bentuk dan jenis paragraf dengan kalimat yang padu
BIND2
Melengkapi dialog drama
20
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND3
Melengkapi
larik
puisi
lama/baru
(dengan
kata
kias/berlambang/ berima/bermajas BIND4
Melengkapi paragraf dengan kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa
BIND5
Melengkapi teks pidato
BIND6
Menentukan isi dan simpulan grafik, diagram atau tabel
BIND7
Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi
BIND8
Menentukan isi puisi lama, pantun, gurindam
BIND9
Menentukan kalimat resensi
BIND10
Menentukan kalimat kritik
BIND11
Menentukan opini penulis dan pihak yang dituju dalam tajuk rencana/editorial
BIND12
Menentukan unsur-unsur intrinsik dan ekstrinsik sastra Melayu klasik/hikayat
BIND13
Menentukan unsur-unsur intrinsik puisi
BIND14
Menentukan unsur-unsur intrinsik puisi
BIND15
Menentukan
unsur-unsur
intrinsik/
ekstrinsik
novel/cerpen/drama BIND16
Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas
BIND17
Menulis judul sesuai EYD
BIND18
Menulis karya ilmiah (latar belakang dan rumusan masalah)
BIND19
Menulis surat resmi
21
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND20
Menyunting kalimat dalam surat resmi
BIND21
Menyunting
penggunaan
kalimat/frasa/kata
penghubung/istilah dalam paragraf
Sedangkan pada tahun 2014/2015 ada sedikit perubahan pada kompetensi yang diujikan. Ada satu kompetensi yang dibedakan dengan tahun-tahun sebelumnya. Perbedaan tersebut terletak pada munculnya kompetensi baru yaitu BIND18 “Menulis paragraf padu”. Daftar kompetensi yang diujikan adalah sebagai berikut:
Tabel 3. 2 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2014/2015 Kode Atribut
Keterangan
KODE_SEKOLAH
Kode Sekolah
NAMA_SEKOLAH Nama Sekolah JNS_SEK
Jenis Sekolah (SMA/NA)
STS_SEK
Status Sekolah (Negeri/Swasta)
BIND1
Melengkapi berbagai bentuk dan jenis paragraf dengan kalimat yang padu
BIND2
Melengkapi dialog drama
BIND3
Melengkapi
larik
puisi
lama/baru
(dengan
kata
kias/berlambang/ berima/bermajas BIND4
Melengkapi paragraf dg kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa
BIND5
Melengkapi teks pidato
BIND6
Menentukan isi dan simpulan grafik, diagram atau tabel
BIND7
Menentukan isi paragraf: fakta, opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi
22
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND8
Menentukan isi puisi lama, pantun, gurindam
BIND9
Menentukan kalimar resensi
BIND10
Menentukan kalimat kritik
BIND11
Menentukan opini penulis dan pihak yang dituju dalam tajuk rencana/editorial
BIND12
Menentukan unsur-unsur intrinsik dan ekstrinsik sastra Melayu klasik/hikayat
BIND13
Menentukan unsur-unsur intrinsik puisi
BIND14
Menentukan
unsur-unsur
intrinsik/
ekstrinsik
novel/cerpen/drama BIND15
Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas
BIND16
Menulis judul sesuai EYD
BIND17
Menulis karya ilmiah (latar belakang dan rumusan masalah)
BIND18
Menulis paragraf padu
BIND19
Menulis surat resmi
BIND20
Menyunting kalimat dalam surat resmi
BIND21
Menyunting
penggunaan
kalimat/frasa/kata
penghubung/istilah dalam paragraf
Teknik pengumpulan data yang digunakan oleh peneliti adalah dengan teknik wawancara. Teknik wawancara yaitu kegiatan melakukan tanya jawab dengan narasumber yang terkait. Dalam penelitian ini, penulis melakukan wawancara dengan seorang dosen yang memiliki research di bidang pendidikan yang digunakan untuk memberikan gambaran umum penelitian.
23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.2 Spesifikasi Alat Sistem dibuat dengan menggunakan hardware dan software sebagai berikut : a. Spesifikasi hardware a. Proses Intel Pentium Core i3 2.30GHz b. RAM 2 GB c. Harddisk 500 GB b. Spesifikasi Software a.
Sistem Operasi Microsoft Windows 10
b.
Compiler IDE NetBeans 8.0 Software ini akan digunakan untuk membuat tampilan interface dan sekaligus membuat source code.
3.3 Tahap – Tahap Penelitian a. Studi Kasus Ujian nasional adalah salah satu sistem evaluasi standar pendidikan yang ada di Indonesia. Ujian ini diadakan dengan tujuan untuk pengendalian mutu pendidikan secara nasional. Demi meningkatnya mutu pendidikan nasional, maka ada baiknya jika para pengajar dapat selalu mengevaluasi hasil dari ujian nasional sekolahnya masing-masing. Untuk mendapatkan evaluasi yang lebih mendalam, maka digunakanlah nilai daya serap yang terdiri dari beberapa kompetensi dari setiap mata pelajaran. Penelitian ini diharapkan dapat menemukan pola keterkaitan antara satu kompetensi dengan kompetensi lainnya yang mempengaruhi sebuah sekolah mendapatkan nilai lebih dari standar nilai daya serap yang ditentukan pada kompetensi-kompetensi tertentu.
b. Penelitian Pustaka Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan menggali teori-teori tentang teknik penambangan data. Dalam penelitian ini
24
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
penulis mempelajari literatur yang berkaitan dengan teknik penambangan data asosiasi khususnya algoritma FP-Growth dan literatur lainnya yang berguna bagi sistem yang akan dibangun.
c. Knowledge Discovery in Database (KDD) Setelah tahap-tahap sebelumnya dilakukan, maka tahap ini sangat diperlukan karena penelitian ini berada di bidang penambangan data. Proses KDD pula terdiri dari data cleaning, data integration, data selection, data transformation, data mining, pattern evaluation dan knowledge presentation. Pada tahap awal akan dilakukan data cleaning dan data integration pada data nilai daya serap sehingga data tersebut dapat digunakan untuk mencari pola asosiasinya. Proses awal ini dilakukan secara manual menggunakan tool Microsoft Excel. Lalu untuk proses selanjutnya seperti data selection, data transformation dan data mining akan dilakukan di dalam perangkat lunak yang akan dibuat. Sedangkan proses pattern evaluation dan knowledge presentation baru dapat dilakukan setelah perangkat lunak selesai dibangun karena proses ini membutuhkan hasil dari alat uji tersebut.
d. Pengembangan Perangkat Lunak 1. Metode Pengembangan Sistem Metode yang digunakan oleh penulis dalam pengembangan sistem adalah metode waterfall. Metode ini merupakan salah satu metode yang paling sering dipakai oleh para pengembang perangkat lunak. Inti dari metode ini adalah pengerjaan dari sistem dilakukan secara linier. Jadi jika tahap pertama belum dilakukan, maka tahap kedua dan selanjutnya otomatis tidak bisa dikerjakan. Secara garis besar metode waterfall mempunyai langkah – langkah sebagai berikut:
25
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
a.
Analisa Langkah
ini
merupakan
analisa
terhadap
kebutuhan
sistem.
Pengumpulan data dalam tahap ini bisa melakukan sebuah penelitian, wawancara atau studi literatur. Seorang sistem analis bertugas dalam mencari informasi sebanyak mungkin dari pengguna sehingga sistem yang dibuat dapat sesuai dengan keinginan pengguna. Tahapan ini biasanya akan menghasilkan dokumen user requirement yang dapat digunakan sistem analis untuk menerjemahkan ke dalam bahasa pemrograman. b. Design Proses desain akan menerjemahkan syarat kebutuhan ke sebuah perancangan perangkat lunak yang dapat diperkirakan sebelum di ubah ke dalam bahasa pemrograman. Proses ini berfokus pada struktur data, arsitektur perangkat lunak, representasi interface, dan detail algoritma. Tahapan ini akan menghasilkan dokumen yang disebut software requirement. Dokumen ini yang digunakan seorang programmer untuk membangun sistemnya. c. Code dan Testing Coding
merupakan
penerjemahan
design
ke
dalam
bahasa
pemrograman. Pada tahap ini programmer akan mengubah proses transaksi yang diinginkan pengguna ke dalam sistem yang dibuatnya. Setelah pengkodean selesai maka akan dilakukan testing terhadap sistem yang telah dibuat tadi. Tujuan testing adalah menemukan kesalahan – kesalahan terhadap sistem tersebut dan kemudian dapat diperbaiki.
26
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Pengujian Pengujian dilakukan dengan alat uji yang sudah dibuat pada tahap sebelumnya. Metode untuk pengujian sistem ini adalah metode pengujian black box, pengujian dataset dan uji validasi. Pengujian black box ini berisi pengujian dengan pengisian data secara benar dan tidak benar. Untuk pengujian
dataset,
pengujian
dilakukan
dengan
mencoba
mengkombinasikan nilai min support dan min confidence untuk melihat nilai lift ratio yang dihasilkan. Selain itu, dari hasil kombinasi tersebut juga dapat dilihat nilai running time. Kemudian untuk pengujian validasi, hasil dari perangkat lunak yang dibuat akan dibandingkan dengan hasil dari aplikasi WEKA yang telah terpercaya hasilnya.
e. Analisis dan Pembuatan Laporan Analisis yang akan dilakukan adalah analisis hasil dari perangkat lunak yang dibuat berdasarkan penerapan algoritma FP-Growth. Analisis yang dimaksud adalah melakukan analisis dari pola yang terbentuk. Pola yang dipilih untuk dianalisis adalah pola yang memiliki nilai lift ratio dan confidence tertinggi. Cara untuk menganalisis pola yang dihasilkan tersebut digunakan 2 metode, yang pertama yaitu secara obyektif dan yang kedua adalah secara subyektif. Analisis secara obyektif ini dilihat dari nilai lift ratio. Sedangkan analisis secara subyektif ini dilakukan dengan menanyakan pendapat kepada seorang praktisi pendidikan mengenai pola yang terbentuk tersebut. Hasil dari semua pengujian tersebut akan disusun kedalam sebuah laporan tugas akhir.
27
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB IV PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK PENAMBANGAN DATA 4.1
Perancangan Awal Sumber Data
4.1.1 Pembersihan Data Proses pembersihan data yang dilakukan dalam penelitian ini adalah dengan membuang data yang tidak lengkap. Pada penelitian ini ada 2 sekolah yang harus dihapus karena tidak memiliki nilai. Dua sekolah tersebut adalah SMA Piri 2 Yogyakarta dengan id 01-032 dan SMA Proklamasi’45 dengan id 04-071.
4.1.2 Integrasi Data Tahap ini berisikan penggabungan dari bermacam- macam data dari berbagai sumber. Dalam penelitian ini peneliti menggunakan 3 data yaitu data tahun akademik 2012/2013 dan 2013/2014 dan 2014/2015. Data pada tiap tahun tersebut memiliki 21 kompetensi. Data pada tahun 2012/2013 & 2013/2014 memiliki kompetensikompetensi yang sama. Sedangkan pada tahun 2014/2015 ada satu kompetensi yang berbeda. Data tahun 2012/2013 & 2013/2014 tersebut akhirnya digabungkan menjadi satu karena memiliki kompetensi yan g sama. Penggabungan ini bertujuan untuk memperbanyak data yang akan digunakan sebagai dataset karena walaupun nama sekolah sama tetapi tetap berbeda siswanya. Sedangkan data tahun 2014/2015 tetap menjadi satu dataset tanpa digabung dengan data lainnya.
4.1.3 Seleksi Data Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Pada data nilai daya serap terdapat 4 atribut tetap yaitu KODE SEKOLAH, NAMA SEKOLAH, JNS SEK, STS SEK dan sisanya merupakan atribut nama kompetensi yang berjumlah 21 untuk mata
28
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
pelajaran Bahasa Indonesia. Dari semua atribut tersebut yang dipakai hanya atribut nama kompetensi tiap mata pelajaran. Daftar atribut yang digunakan dapat dilihat pada tabel 3.1 dan tabel 3.2 di bab 3. Sedangkan contoh data yang akan digunakan dapat dilihat pada Lampiran 6.
4.1.4 Transformasi Data Proses transformasi dilakukan pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses penambangan data. Pada tahap ini dilakukan proses preprocessing dengan cara hanya mengambil nilai yang memenuhi standar nilai yang dimasukkan oleh pengguna. Dari Gambar 3.1 dapat dilihat nilai yang block warna berarti memenuhi nilai standar yakni lebih dari 75. Nilai 75 itu adalah nilai yang diisikan oleh pengguna. Berdasarkan tabel 2.1 di bab 2, nilai 75 masuk kedalam kategori tinggi. Nilai-nilai kompetensi yang di block tersebut kemudian diambil dimasukkan kedalam array. Misalnya untuk kode sekolah 01-001 maka kompetensi yang digunakan adalah BIND1, BIND2, BIND3, BIND4, BIND5, BIND6, BIND7, BIND8, BIND9, BIND10, BIND11, BIND14, BIND15, BIND17, BIND18, BIND19, BIND20, BIND21.
Gambar 3. 1 Data Nilai Daya Serap
Setelah itu kompetensi juga diurutkan berdasarkan kompetensi yang memiliki jumlah frekuensi dari yang tertinggi ke terendah. Setelah itu data siap digunakan untuk masuk ke proses penambangan data.
4.2
Pengembangan Perangkat Lunak Penambangan Data
4.2.1 Perancangan Umum 4.2.1.1 Input Inputan dari sistem ini adalah data yang berasal dari file yang berekstensi .xls yang dapat dipilih langsung oleh pengguna. Pengguna juga berperan dalam 29
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
memasukkan nilai minimum support, minimum confidence dan nilai standar daya serap terlebih dahulu. Data yang dipakai adalah data nilai daya serap siswa SMA yang terdiri dari beberapa kolom kompetensi.
min support, min confidence, data daya serap
Pengguna
Pencarian Aturan Asosiasi dengan FP Growth
aturan asosiasi
Gambar 4. 1 Diagram Konteks
4.2.1.2 Proses Proses sistem terdiri dari beberapa langkah untuk dapat menemukan aturan asosiasi yang berfungsi untuk menemukan pola keterkaitan antar kompetensi yaitu: 1
Pengambilan data yang sudah melalui tahap preprocessing untuk digunakan saat proses penambangan data.
2
Penentuan minimum support dan minimum confidence yang berfungsi dalam menentukan aturan asosiasi.
3
Proses asosiasi untuk mencari pola keterkaitan kompetensi dijalankan.
4
Analisis hasil asosiasi terhadap proses penambangan data yang telah dijalankan.
4.2.1.3 Output Sistem yang akan dibangun ini nantinya akan memberikan keluaran berupa aturan asosiasi yang memenuhi nilai minimum support dan minimum confidence beserta nilai lift ratio dan nilai confidence.
30
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.2.2 Diagram Use Case Diagram usecase merupakan sebuah gambaran sistem yang dilihat dari sudut pandang pengguna sistem (user). Pengguna sistem dalam diagram usecase dapat juga disebut actor. Actor pada sistem ini hanya akan ada satu actor saja dan dapat melakukan 3 aktivitas seperti memilih data, mencari aturan dan menyimpan hasil. Ketiga aktivitas tersebut merupakan aktivitas yang saling berhubungan, sehingga tiap aktivitas harus dijalankan berurutan.
Memilih Data <
>
Mencari aturan asosiasi
Pengguna
<>
Menyimpan Hasil
Gambar 4. 2 Diagram Usecase
31
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.2.3 Diagram Aktivitas Diagram aktivitas sistem yang akan dibuat terlampir pada Lampiran 1. Diagram aktivitas yang dipakai sebanyak 3 buah menyesuaikan dengan jumlah aktivitas dari usecase yang ada. Diagram aktivitas tersebut terdiri dari: 1. Memilih data 2. Mencari aturan 3. Menyimpan hasil 4. Mencari aturan
4.2.4 Diagram Kelas Analisis Fungsi dari pembuatan diagram kelas tahap analisis ini berguna untuk mempermudah dalam penyusunan sequence diagram. Diagram kelas analisis dapat dilihat pada Lampiran 2.
Tabel 4. 1 Daftar Kelas Untuk Tiap Usecase Usecase
Boundary
Memilih
view_home
data
view_preprocessing
Mencari
view_asosiasi
Control Class
Model Class (Entity)
Control_atributSelection Model_atribuSelection
Control_algorithm
comparitorHeaderTable
aturan
TreeNode
asosiasi
Model_combination
Menyimpan view_asosiasi hasil
4.2.5 Diagram Sequence Diagram sequence adalah diagram yang memperlihatkan atau menampilkan interaksiinteraksi antar objek di dalam sistem. Interaksi objek-objek tersebut termasuk
32
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
pengguna, boundary, controller dan model berupa pesan/message. Diagram sequence pada sistem ini terdiri dari 3 diagram sesuai dengan usecase. Diagram dapat dilihat pada Lampiran 3.
4.2.6 Struktur Data Sistem pencarian aturan asosiasi ini membutuhkan suatu tempat penyimpanan data yang tidak membutuhkan memori yang terlalu banyak dan tidak menghabiskan waktu yang cukup banyak ketika sistem dijalankan karena dapat mengolah data dengan efisien. Berdasarkan kebutuhan diatas maka penelitian ini akan menggunakan konsep penyimpanan data menggunakan struktur data karena penyimpanan dengan struktur data tidak membutuhkan memori yang besar dan lebih efisien dalam mengolah data. Struktur data yang digunakan pada sistem ini adalah Tree dan Arraylist. Tree pada sistem ini dapat memiliki jumlah anak yang tidak sama jumlahnya untuk setiap node dan juga tidak bisa ditetapkan di awal. Maka struktur data Tree ini ditambahkan struktur data yang dinamis seperti List untuk menyimpan jumlah anaknya.
a. Tree Dalam
ilmu komputer, tree adalah sebuah struktur data yang
secara
bentuk
menyerupai sebuah pohon, yang terdiri dari serangkaian node (simpul) yang saling berhubungan. Node-node tersebut dihubungkan oleh sebuah pointer parent dan child. Setiap node dapat memiliki 0 atau lebih node anak (child). Pada penelitian ini, pohon yang dibuat mempunyai anak yang bertipe List. List ini dipilih karena ada beberapa node yang memiliki jumlah anak yang tidak bisa ditentukan dan tidak sama untuk tiap node-nya. Dalam perangkat lunak yang dibuat pembuatan node ini dilakukan di kelas TreeNode. Node yang dibuat akan berisikan informasi name, counts, next, parent dan child.
33
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 4. 3 Ilustrasi FPTree
b. Arraylist Arraylist memiliki sifat seperti array, tetapi perbedaan utamanya adalah Arraylist bersifat dinamis dalam arti dapat memperbesar kapasitasnya secara otomatis apabila diperlukan (Rickyanto,2003). Pada
penelitian
ini
penulis
(ArrayList>)
menggunakan untuk
membuat
arraylist
dalam
arraylist
matriks.
Penulis
memilih
menggunakan arraylist karena dapat digunakan untuk membuat matrik dengan panjang data baris yang berbeda. Cara kerja arraylist pada sistem ini adalah yang pertama membuat objek arraylist yang pertama untuk menampung nama-nama kompetensi yang memenuhi syarat untuk satu sekolah. Contohnya seperti gambar di bawah ini. Berikut daftar kompetensi yang memenuhi standar nilai ketuntasan 75 yang dimasukkan kedalam array:
34
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND6
BIND12
BIND16
Gambar 4. 4 Susunan arraylist untuk kode sekolah 01-010 BIND3
BIND4
Gambar 4. 5 Susunan arraylist untuk kode sekolah 01-019
Objek arraylist baru akan selalu dibuat untuk setiap kode sekolah yang berbeda. Setelah membuat objek arraylist untuk tiap sekolah maka akan dibuat objek arraylist untuk menjadikan satu semua objek arraylist sebelumnya. Gambaran datanya akan berubah menjadi seperti di gambar 4.6.
BIND6
BIND12
BIND3
BIND4
BIND6
BIND4
BIND16
BIND15 BIND17
Gambar 4. 6 Data arraylist dalam arraylist
c. TreeNode
4.2.7 Diagram Kelas Desain Diagram kelas dapat memperlihatkan hubungan antar kelas. Diagram ini dapat membantu memvisualisasikan struktur kelas-kelas dari suatu sistem. Untuk detail kelas dapat dilihat pada Lampiran 5.
35
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
<> view_about
<> view_help
<> view_home
<> control_atributSelection
<> view_preprocessing
<<model>> model_atributSelection
<> view_asosiasi <<model>> comparatorHeaderTable
<> control_algorithm
<<model>> model_combination
<<model>> TreeNode
Gambar 4. 7 Diagram Kelas Desain
4.2.8 Rincian Algoritma untuk Setiap Metode 4.2.8.1 Metode-metode di dalam kelas control_algorithm Nama Metode
FPTree(ArrayList> array1, ArrayList newArray)
36
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Fungsi Metode
Mengubah data yang sudah dikenai preprocessing menjadi bentuk Tree
Algoritma : 1
Method ini memiliki masukkan berupa arraylist yang berisi data nilai daya serap.
2
Satu persatu persatu nilai dalam array akan dibuat pohon dengan memanggil method insertNode().
3
Setelah pohon FPTree selesai dibuat maka headerTable yang sudah terisi akan diurutkan dari yang terkecil ke terbesar count-nya.
Nama Metode
insertNode(LinkedList<String> array1, TreeNode treenode, ArrayList headerTable)
Fungsi Metode
Menambah node pada pohon
Algoritma: 1.
Pertama kali yang dilakukan adalah mengecek apakah array yang sebagai inputan kosong atau tidak. Jika kosong maka akan langsung me-return.
2.
Jika array tidak kosong, maka akan dicek apakah root pada treenode sudah ada isinya atau belum.
3.
Jika root belum memiliki anak, maka akan dibuat node baru yang lalu akan dibuat menjadi anak dari root. Node tersebut juga akan di link-an dengan headerTable.
4.
Sedangkan jika root memiliki anak maka akan dicek apakah item pertama pada array tersebut sudah ada pada pohon atau belum. Jika sudah maka akan ditambahkan countnya.
5.
Setelah itu, item petama pada array tersebut dihapus.
6.
Array tadi lalu dimasukkan kembali menjadi parameter saat memanggil method dirinya sendiri.
37
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Nama Metode
FPGrowth(ArrayList> array1, double batas, int totalTransaction, double minConfidence)
Fungsi Metode
Memanggil method FPGrowth dan menghitung nilai confidence dan lift ratio
Algoritma: 1
Method ini pertama tama akan memanggil method FPgowth() untuk membuat conditional pattern base, conditional fp tree dan frequent itemset.
2
Setelah mendapatkan frequent-k itemset, lalu frequent-k itemset tersebut dicari yang k-nya paling tinggi.
3
Frequent itemset yang paling tinggi tersebut akan digunakan untuk membuat kombinasi aturan asosiasi dengan memanggil method CountConfAndLift yang ada di kelas model_combination
Nama Metode
FPgrowth(TreeNode treeNode, String base, double threshold, ArrayList headerTable, Map<String, Integer> frequentPatterns)
Fungsi Metode
Mencari conditional pattern base, conditional fp tree dan frequent itemset
Algoritma: 1.
Lakukan perulangan dari data pada headerTable yang memiliki nilai count paling kecil.
2.
Lalu akan dilakukan perulangan juga untuk mencari letak item tadi pada pohon. Setelah diketahui letaknya maka akan diruntut ke parentnya hingga sampai ke root. Proses tersebut dicatat sebagai conditional pattern base.
3.
Jika item pada headerTable memiliki conditional pattern base yang count-nya lebih dari minimum support maka item tersebut akan disimpan di hashmap frequentPattern.
38
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.
Setelah itu maka akan dipanggil method conditional_fp_tree_constructor untuk mencari conditional fp tree
5.
Selama conditional fptree memiliki anak maka proses selanjutnya adalah memanggil method dirinya sendiri sampai conditional fptree tidak memiliki anak.
Nama Metode
conditional_fptree_constructor(Map<String, Integer> conditionalPatternBase, Map<String, Integer> conditionalItemsMaptoFrequencies, double threshold, ArrayList conditional_headerTable)
Fungsi Metode
Membuat pohon yang akan digunakan untuk mencari conditional fp tree
Algoritma: 1.
Masukan dari method ini adalah conditional pattern base yang sudah didapatkan sebelumnya.
2.
Setelah itu conditional pattern base tersebut dicek apakah countnya lebih besar atau sama dengan minimum support.
3.
Jika iya maka pattern base tersebut akan disimpan pada array baru.
4.
Setelah pattern base dicek maka akan dibuat pohonnya dari pattern base yang memenuhi minimum support
5.
Method akan mengembalikan nilai berupa TreeNode
Nama Metode
insert(LinkedList<String> pattern_vector, int count_of_pattern, TreeNode conditional_fptree, ArrayList conditional_headerTable)
Fungsi Metode
Membuat pohon untuk mencari conditional fp tree
Algoritma: 1.
Pertama kali yang dilakukan adalah mengecek apakah array yang sebagai inputan kosong atau tidak. Jika kosong maka akan langsung me-return.
39
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.
Jika array tidak kosong, maka akan dicek apakah root pada treenode sudah ada isinya atau belum.
3.
Jika root belum memiliki anak, maka akan dibuat node baru yang lalu akan dibuat menjadi anak dari root. Node tersebut juga akan di link-an dengan headerTable.
4.
Sedangkan jika root memiliki anak maka akan dicek apakah item pertama pada array tersebut sudah ada pada pohon atau belum. Jika sudah maka akan ditambahkan countnya.
5.
Setelah itu, item petama pada array tersebut dihapus.
6.
Array tadi lalu dimasukkan kembali menjadi parameter saat memanggil method dirinya sendiri.
4.2.8.2 Algoritma Kelas model_combination
Nama Metode
Combine(int start, HashMap temp, Map freqmap)
Fungsi Metode
Membuat kombinasi dari string yang menjadi inputan
Algoritma: 1. Lakukan perulangan dari iterasi=1 sampai jumlah karakter dari string yang diinputkan 2. Satu persatu karakter diambil di gabungkan 3. Gabungan karakter tersebut lalu dicek, selama jumlahnya masih kurang dari jumlah string maka akan disimpan didalam arraylist antecendent 4. Langkah selanjutnya adalah memanggil dirinya sendiri untuk rekursif
Nama Metode
CountConfAndLift(Map freqmap, HashMap map, int max, int total, double minCon)
Fungsi Metode
Menghitung nilai confidence dan lift ratio dari aturan yang dihasilkan
40
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Algoritma: 1. Lakukan nested-loop untuk membuat kombinasi dari anteseden dan konsekuen 2. Setelah ditemukan kombinasinya, tiap kombinasi dihitung nilai confidence dan lift rationya 3. Jika nilai confidence memenuhi nilai minimum confidence yang ditentukan maka kombinasi tersebut akan dijadikan aturan asosiasi dan disimpan didalam arraylist
4.2.8.3
Algoritma Kelas View_Asosiasi
Nama Metode
BubbleSortODesc(LinkedList<String> data, HashMap map)
Fungsi Metode
Mengurutkan data bertipe LinkedList dari besar ke kecil
Algoritma: 1. Lakukan perulangan dari iterasi=1 sampai data.size()-1 2. Lakukan perulangan kembali dari elemen=0 sampai data.size()-1-elemen 3. Lalu bandingkan count dari data sekarang dengan yang data setelahnya. Jumlah count dapat diambil dari hashmap. 4. Jika count data sekarang lebih kecil maka indeks data akan ditukar dengan indeks data setelahnya.
Nama Metode
BubbleSortODescArrayList(ArrayList data)
Fungsi Metode
Mengurutkan data bertipe ArrayList dari besar ke kecil
Algoritma: d. Lakukan perulangan dari iterasi=1 sampai data.size()-1 e. Lakukan perulangan kembali dari elemen=0 sampai elemen
41
data.size()-1-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
f. Lalu bandingkan count dari data sekarang dengan yang data setelahnya. Jumlah count dapat diambil dari object TreeNode. g. Jika count data sekarang lebih kecil maka indeks data akan ditukar dengan indeks data setelahnya.
Nama Metode
RemoveNoFequentItem()
Fungsi Metode
Menghapus data yang memiliki count lebih kecil dari minimum support
Algoritma: 1. Lakukan nested-loop untuk mengambil data ArrayList 2. Cek count dari tiap data 3. Jika count lebih besar atau sama dengan minimum support maka data akan dimasukkan ke dalam array baru.
42
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.2.9 1.
Antarmuka Halaman Awal
MASUK SISTEM
Gambar 4. 8 Halaman Awal Halaman ini merupakan halaman utama yang akan ditampilkan pertama kali saat sistem dijalankan. Halaman ini berisi 4 tombol yaitu BERANDA, BANTUAN, TENTANG dan MASUK SISTEM. Tombol BERANDA akan menghubungkan dengan halaman view_home. Sedangkan tombol BANTUAN ia akan menghubungkan dengan view_help, tombol TENTANG akan menghubungkan dengan view_about. Dan yang terakhir yaitu tombol MASUK SISTEM yang akan menghubungkan dengan halaman view_preprocessing untuk memulai memilih data yang akan digunakan.
43
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.
Halaman About
Gambar 4. 9 Halaman About Halaman ini digunakan untuk memberikan informasi tentang sistem seperti tujuan sistem ini dibuat dan kegunaanya. Pada halaman ini jg masih dapat digunakan tombol-tombol seperti halaman utama (Gambar 4.15).
44
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.
Halaman Help
Gambar 4. 10 Halaman Help Halaman bantuan ini berisikan panduan penggunaan sistem yang bertujuan untuk memudahkan pengguna dalam menggunakan aplikasi ini. Pada halaman ini jg masih dapat digunakan tombol-tombol seperti halaman utama (Gambar 4.15).
45
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4.
Halaman Preprocessing
Gambar 4. 11 Halaman Preprocessing Halaman preprocessing ini digunakan untuk melakukan pemilihan data yang akan digunakan dengan cara menekan tombol PILIH FILE untuk mencari file bertipe .xls atau .csv. Setelah data muncul pada tabel dapat dilakukan juga penyeleksian atribut. Pada halaman ini kita dapat menghapus atribut-atribut yang tidak diperlukan. Setelah melakukan seleksi atribut, kita dapat menekan tombol KONVERSI untuk mengambil data yang memenuhi standar nilai keberhasilan yang sudah dimasukkan sebelumnya. Setelah itu tombol SUBMIT akan muncul dan dapat digunakan untuk melanjutkan proses selanjutnya.
46
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5.
Halaman Asosisasi
PROSES
Gambar 4. 12 Halaman Asosiasi Halaman ini akan berisikan tabel dengan data yang sudah melalui proses preprocessing. Setelah itu pengguna dapat memasukkan nilai minimal support dan minimal confidence yang dapat digunakan untuk proses pencarian aturan asosiasi dengan algoritma FPGrowth dengan menekan tombol PROSES.
47
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6.
Halaman Database
Gambar 4. 13 Halaman Database Halaman ini digunakan untuk menyambungkan dengan database. Dari database yang ada nanti dapat dipakai datanya untuk proses pencarian aturan asosiasi selanjutnya.
48
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB V IMPLEMENTASI PENAMBANGAN DATA DAN EVALUASI HASIL
5.1 Implementasi Rancangan Perangkat Lunak Penambangan Data Sistem pencarian aturan asosiasi ini menggunakan beberapa kelas yang mendukung jalannya sistem. Kelas yang digunakan totalnya berjumlah 11 yang dibagi menjadi 3 package. Package – package tersebut bernama model, view dan controller. Berikut adalah daftar kelas-kelas yang digunakan: 5.2.1 Implementasi Kelas Model Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package model. Pada tabel tersebut disertakan juga nama file fisik dan nama file executable. Tabel 5. 1 Tabel Implementasi Kelas Model No
Nama Kelas
Nama File Fisik
Nama File Executable
1
TreeNode
TreeNode.java
TreeNode.class
2
model_atributSelection
model_atributSelection.java
model_atributSelection.class
3
model_combination
model_combination.java
model_combination.class
4
comparatorHeaderTable
comparatorHeaderTable.java
comparatorHeaderTable.class
5.2.2 Implementasi Kelas View Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package view. Pada tabel tersebut disertakan juga nama file fisik dan nama file executable. Tabel 5. 2Tabel Implementasi Kelas View No
Nama Kelas
Nama File Fisik
Nama File Executable
1
view_about
view_about.java
view_about.class
2
view_asosiasi
view_asosiasi.java
view_asosiasi.class
49
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
view_help
view_help.java
view_help.class
4
view_home
view_home.java
view_home.class
5
view_preprocessing view_preprocessing.java
view_preprocessing.class
5.2.3 Implementasi Kelas Controller Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package controller. Pada tabel tersebut disertakan juga nama file fisik dan nama file executable.
Tabel 5. 3 Tabel Implementasi Kelas Controller No Nama Kelas
Nama File Fisik
Nama File Executable
1
Control_algorithm
Control_algorithm.java
Control_algorithm.class
2
Control_atributSelection
Control_atributSelection
Control_atribut
.java
Selection.class
5.2 Evaluasi Hasil 5.2.1 Uji Coba Perangkat Lunak (Black Box Testing) a. Pengujian Pada Halaman Preprocessing Pada halaman ini, yang dapat dilakukan oleh pengguna adalah memilih file yang isinya akan digunakan sebagai data yang akan diolah pada sistem. Pada pengujian ini, peneliti mencoba memilih file dengan format yang benar yaitu .xls atau .csv dan hasil keluarannya dapat dilihat pada Gambar 5.1(a) dan Gambar 5.1(b). Sedangkan jika memilih format yang salah maka akan tampil message dialog jika format yang dipilih salah (Gambar 5.2).
50
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5. 1 (a)Kotak Dialog “Pilih File” (b)Tabel Dataset
Gambar 5. 2 Kotak Dialog Salah Pilih File
Selanjutnya ketika pengguna melakukan seleksi atribut, pengguna diberikan 3 fasilitas tombol. Tombol pertama yaitu tombol “Tandai Semua” untuk menandai semua checkbox pada tabel sekaligus (Gambar 5.3). Tombol kedua yaitu tombol “Hapus Atribut” untuk menghapus atribut-atribut yang sudah dipilih (Gambar 5.4). Tombol terakhir yaitu “Batal” yang dapat digunakan untuk menghapus tanda centang pada semua checkbox (Gambar 5.5).
51
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5. 3 Tampilan Setelah Menekan Tombol “Tandai Semua”
Gambar 5. 4 Tampilan Setelah Menekan Tombol “Hapus Atribut”
Gambar 5. 5 Tampilan Setelah Menekan Tombol “Batal”
Berikut ini adalah tabel yang mencatat hasil dari pengujian blackbox pada aktivitas-aktivitas yang dapat dilakukan pada Halaman Preprocessing Tabel 5. 4 Tabel Hasil Uji Pada Halaman Preprocessing Kasus dan Hasil Uji Pada Halaman Preprocessing Require
Skenario Uji
Hasil yang diharapkan
Hasil Pengujian
52
Gambar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Pilih File
Seleksi Atribut
Pilih file
Data tampil pada tabel
(jika benar)
preprocessing
Pilih file
Tampil konfirmasi
(jika salah)
salah memilih file
Seleksi
Semua checkbox pada
Atribut: tandai
tabel seleksi atribut
semua
terisi sekaligus
Seleksi
Atribut yang ditandai
Atribut:
checkboxnya terhapus
Hapus atribut
Seleksi
Semua tanda centang
Atribut:
pada checkbox atribut
Batal
yang dipilih pada tabel
Sesuai
Gambar 5.1
Sesuai
Gambar 5.2
Sesuai
Gambar 5.3
Sesuai
Gambar 5.4
Sesuai
Gambar 5.5
seleksi atribut akan langsung hilang
b. Pengujian Pada Halaman Asosiasi Pada halaman asosiasi yang dapat dilakukan oleh pengguna adalah melihat aturan asosiasi yang dihasilkan oleh sistem. Ada beberapa aktivitas yang harus dilakukan oleh pengguna untuk mendapatkan aturan asosiasi tersebut. Aktivitas pertama adalah mengisikan nilai minimum support dan minimum confidence. Setelah itu pengguna akan menekan tombol “Proses” dan menampilkan hasil aturan yang memenuhi minimum support dan minimum confidence dan ditampilkan pada tabel (Gambar 5.6). Jika minimum confidence dan minimum support tidak diisi maka akan menampilkan pesan berupa message dialog
53
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
(Gambar 5.7). Setelah hasil didapatkan, pengguna dapat menyimpan hasil aturan asosiasi menjadi file dengan format .xls, .pdf, .doc dan .txt (Gambar 5.8).
Tabel 5. 5 Tabel Pengujian Halaman Preprocessing Kasus dan Hasil Uji Pada Halaman Preprocessing Require
Skenario Uji
Hasil yang diharapkan
Hasil Pengujian
Gambar
Sesuai
Gambar 5.6
Sesuai
Gambar 5.7
Sesuai
Gambar 5.8
Memasukkan nilai Menampilkan hasil minimum support
aturan pada tabel
dan minimum confidence Mencari
(jika benar)
Aturan
Memasukkan nilai Menampilkan message
Simpan Hasil
minimum support
dialog agar pengguna
dan minimum
mengisikan minimum
confidence
support dan minimum
(jika benar)
confidence
Menekan tombol
Menampilkan message
“Simpan Hasil”
dialog jika data tersimpan
54
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5. 6 Hasil Pencarian Aturan asosiasi
Gambar 5. 7 Tampilan Ketika Min Support dan Minimum confidence Tidak Diisi
55
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5. 8 Kotak Dialog Simpan Hasil
Gambar 5. 9 Kotak Dialog Jika Berhasil Menyimpan Data
c. Uji Dengan Perhitungan Manual
Salah satu pengujian lainnya selain mencoba membandingkan hasil yang didapat dari alat uji dengan aplikasi WEKA, cara lainnya adalah membandingkan hasil dengan perhitungan manual. Untuk perhitungan manual ini, peneliti menggunakan contoh 10 data saja. Data yang digunakan adalah data nilai daya serap mata pelajaran Bahasa Indonesia.
56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 5. 6 Tabel Pengujian dengan Hitungan Manual Hasil Pengujian Min Support Min Confidence
70
70 Alat Uji
Hitung Manual
Frequent BIND3
7 BIND3
7
Itemset BIND4
8 BIND4
8
BIND16
7 BIND16
7
BIND2
8 BIND2
8
BIND17
7 BIND17
7
BIND6
9 BIND6
9
BIND17 BIND6
7 BIND6 BIND17
7
BIND17 BIND2
7 BIND2 BIND17
7
BIND16 BIND6
7 BIND6 BIND16
7
BIND3 BIND4
7 BIND3 BIND4
7
BIND4 BIND6
7 BIND4 BIND6
7
BIND4 BIND2
7 BIND4 BIND2
7
BIND2 BIND6
8 BIND2 BIND6
8
BIND4 BIND2
7 BIND4 BIND2
7
BIND6
BIND6
BIND17 BIND2
7 BIND17 BIND2
BIND6
BIND6
57
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
d.
Kesimpulan Black Box Testing
Berdasarkan semua pengujian yang sudah dilakukan untuk halaman preprocessing dan halaman asosiasi dapat disimpulkan bahwa sistem sudah dapat dijalankan dengan baik karena sistem dapat dijalankan sesuai tabel pengujian black box. Untuk output yang dihasilkan oleh sistem, peneliti juga mencoba untuk membandingkannya dengan hasil dari perhitungan manual. Hasil yang didapatkan dari perhitungan, hasil frequent itemset yang dihasilkan antara perangkat lunak yang dibuat dan perhitungan manual memiliki hasil yang sama.
5.2.2 Uji Validitas a. Uji Validitas Dengan Aplikasi WEKA Salah satu metode yang dilakukan peneliti untuk mengetahui valid atau tidaknya hasil dari alat uji yang dibuat, maka peneliti melakukan perbandingan hasil antara alat uji dengan aplikasi yang hasilnya sudah pasti dapat dipercaya kebenarannya. Aplikasi yang dipilih oleh peneliti adalah aplikasi Weka versi 3.6. Weka adalah salah satu aplikasi penambangan data open source berbasis Java. Aplikasi ini dibuat oleh Universitas Waikato, New Zealand dengan tujuan untuk penelitian dan pendidikan. WEKA sendiri merupakan singkatan dari Waikato Environment for Knowledge Analysis. Pengujian ini menggunakan dataset yang diambil dari WEKA yang berjudul supermarket.arff. Dataset ini memiliki 217 atribut dengan jumlah data sebanyak 4627 buah. Untuk pengujian ini peneliti melakukan preprocessing terlebih dahulu terhadap dataset ini. Data asli dari dataset ini dapat dilihat pada Gambar 5.10.
58
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5. 10 Dataset Supermarket.arff
Dari data asli tersebut, peneliti memilih menggunakan 5 atribut saja yaitu ‘grocery misc’, ‘baby needs’, ‘bread and cake’, ‘baking needs’ dan ‘juicesat-cord-ms’. Dataset ini berisikan nilai ‘?’ dan ‘t’. Agar dataset ini dapat digunakan pada alat uji yang dibuat peneliti maka peneliti mengubah nilai ‘?’ menjadi ‘0’ dan ‘t’ menjadi ‘1’. Atribut pada dataset ini juga diubah menjadi ‘A’,’B’,’C’,’D’,’E’. Sehingga data setelah diubah menjadi seperti Gambar 5.11.
59
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 5. 11 Dataset Setelah di Preprocessing
Setelah proses preprocessing, data langsung dicobakan terhadap alat uji dan juga aplikasi WEKA. Dari hasil yang didapat, dapat dibuktikan bahwa alat uji telah berhasil menghasilkan aturan asosiasi yang sama dengan aturan asosiasi yang dihasilkan oleh aplikasi WEKA. Hasil dari keduanya dapat dilihat pada tabel dibawah ini (Tabel 5.7). Item C adalah ‘bread and cake’, item D adalah ‘baking needs’ dan item E merupakan ‘juice-sat-cord-ms’. Tabel 5. 7 Tabel Hasil Pengujian dengan WEKA Hasil Pengujian Min Support Min Confidence Jumlah Aturan
40
60
3 Alat Uji
WEKA
60
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Aturan
Confidence
Lift
Aturan Confidence Lift
ratio
ratio
EC
78.39%
1.09
EC
0.78
1.09
CD
65.8%
1.09
CD
0.66
1.05
DC
75.88%
1.05
DC
0.76
1.09
b. Kesimpulan Uji Validitas Dengan Aplikasi WEKA Setelah menggunakan dataset yang sama, dataset tersebut dicobakan kepada 2 aplikasi berbeda. Aplikasi pertama yaitu aplikasi WEKA dan yang kedua aplikasi yang sudah peneliti buat. Dari hasil yang didapatkan (Tabel 5.6) dapat dilihat bahwa hasil antara kedua aplikasi tersebut sama, sehingga aplikasi yang dibuat ini sudah baik dan dapat digunakan untuk pengujian.
5.2.3 Uji Coba Data Set a. Ujicoba Dataset Tahun 2012/2013-2013/2014 Pengujian ini dilakukan dengan menggunakan dataset nilai daya serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia jurusan IPA pada tahun ajaran 2012/2013-2013/2014. Data ini memiliki 280 baris data. Pengujian dilakukan sebanyak 30 kali dengan kombinasi nilai minimal support dan minimum confidence yang berbeda. Nilai confidence yang dipilih adalah nilai 60% dan 90% karena besar kecilnya confidence hanya akan mempengaruhi jumlah aturan yang terbentuk tanpa mempengaruhi nilai lift ratio dan confidencenya. Pada pengujian dengan nilai standar nilai daya serap 80% dan minimum support 90% sudah tidak ditemukan lagi aturan yang muncul.
61
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Berikut ini adalah contoh cara membaca tabel kombinasi antara minimum support dan minimum confidence yang digunakan dengan nilai standar nilai daya serap sebesar 75%: 1. Ketika minimum support 50% dan minimum confidence 60% maka akan ditemukan sebanyak 1442 aturan dengan running time mencapai 0.86 second dan didapatkan lift ratio tertingginya sebesar 1.57. 2. Ketika minimum support 55% dan minimum confidence 60% maka akan ditemukan sebanyak 481 aturan dengan running time mencapai 0.156 second dan didapatkan lift ratio tertingginya sebesar 1.39. 3. Ketika minimum support 60% dan minimum confidence 60% maka akan ditemukan sebanyak 300 aturan dengan running time mencapai 0.031 second dan didapatkan lift ratio tertingginya sebesar 1.21. 4. Ketika minimum support 70% dan minimum confidence 60% maka akan ditemukan sebanyak 42 aturan dengan running time mencapai 0.015 second dan didapatkan lift ratio tertingginya sebesar 1.09. 5. Ketika minimum support 80% dan minimum confidence 60% maka akan ditemukan sebanyak 6 aturan dengan running time mencapai 0.0019 second dan didapatkan lift ratio tertingginya sebesar 1.04. 6. Ketika minimum support 90% dan minimum confidence 60% maka akan ditemukan sebanyak 2 aturan dengan running time mencapai 0.0014 second dan didapatkan lift ratio tertingginya sebesar 1.01.
62
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 5. 8 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf=60% Standar Tahun
Daya
Min Support
Serap
(%)
(%)
75
Min
Jumlah
Confidence
Aturan
(%)
Asosiasi
Runing
Lift ratio
Time(s)
Terbesar
50
1442
0.86
1.57
55
481
0.156
1.39
300
0.031
1.21
42
0.015
1.09
60 70
60
1213
80
6
0.0019
1.04
&
90
2
0.0014
1.01
1314
50
87
0.0043
1.44
55
42
0.002
1.25
30
0.0021
1.17
6
0.0011
1.11
80
2
0.0011
1.06
90
0
0.0009
0
80
60 70
60
Tabel 5. 9 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf = 90% Standar Tahun
Daya
Min Support
Serap
(%)
(%)
1314
Jumlah
Confidence
Aturan
(%)
Asosiasi
50
1213 &
Min
75
55 60
90
70
63
Runing
Lift ratio
Time(s)
Terbesar
415
0.229
1.57
155
0.0256
1.39
82
0.0091
1.20
21
0.0026
1.09
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
4
0.0016
1.04
90
2
0.0014
1.01
50
22
0.0035
1.37
55
16
0.0021
1.25
13
0.0018
1.17
2
0.0012
1.11
80
1
0.0011
1.06
90
0
0.0010
0
50
1
0.00088
1.09
55
1
0.00085
1.09
60
1
0.00083
1.09
70
0
0.00075
-
80
0
0.00070
-
-
-
-
60 80
90
70
90
90
90
b. Ujicoba Dataset Tahun 2014/2015 Pengujian ini dilakukan dengan menggunakan dataset berupa nilai daya serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia jurusan IPA pada tahun ajaran 2014/2015. Data ini terdiri dari 140 sekolah yang ada di Provinsi DI Yogyakarta. Pengujian dilakukan sebanyak 30 kali dengan kombinasi nilai minimal support dan minimum confidence yang berbeda. Nilai confidence yang dipilih adalah 60% dan 90% karena besar kecilnya confidence hanya akan mempengaruhi jumlah aturan yang terbentuk tanpa mempengaruhi nilai lift ratio dan confidencenya. Berikut ini adalah contoh cara membaca tabel kombinasi antara minimum support dan minimum confidence yang digunakan dengan nilai standart nilai daya serap sebesar 75%:
64
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1. Ketika minimum support 50% dan minimum confidence 60% maka akan ditemukan sebanyak 8186 aturan dengan running time mencapai 84.957 second dan didapatkan lift ratio tertingginya sebesar 1.37. 2. Ketika minimum support 55% dan minimum confidence 60% maka akan ditemukan sebanyak 8186 aturan dengan running time mencapai 84.007 second dan didapatkan lift ratio tertingginya sebesar 1.37. 3. Ketika minimum support 60% dan minimum confidence 60% maka akan ditemukan sebanyak 4094 aturan dengan running time mencapai 19.904 second dan didapatkan lift ratio tertingginya sebesar 1.34. 4. Ketika minimum support 70% dan minimum confidence 60% maka akan ditemukan sebanyak 1530 aturan dengan running time mencapai 1.235 second dan didapatkan lift ratio tertingginya sebesar 1.28. 5. Ketika minimum support 80% dan minimum confidence 60% maka akan ditemukan sebanyak 186 aturan dengan running time mencapai 0.016 second dan didapatkan lift ratio tertingginya sebesar 1.1. 6. Ketika minimum support 90% dan minimum confidence 60% maka akan ditemukan sebanyak 12 aturan dengan running time mencapai 0 second dan didapatkan lift ratio tertingginya sebesar 1.04.
Tabel 5. 10 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 60% Standar Tahun
Daya
Min Support
Serap
(%)
(%) 1415
Min
Jumlah
Confidence
Aturan
(%)
Asosiasi
50 75
55
60
60
65
Runing
Lift ratio
Time(s)
Terbesar
8186
84.957
1.37
8186
84.007
1.37
4094
19.904
1.34
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
70
1530
1.235
1.28
80
186
0.016
1.1
90
12
0
1.04
50
994
0.766
1.46
55
506
0.125
1.37
504
0.062
1.38
62
0.016
1.18
80
42
0
1.11
90
2
0.015
1.03
60 70
60
Tabel 5. 11 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 90% Standar Tahun
Daya
Min Support
Serap
(%)
(%)
Min
Jumlah
Confidence
Aturan
(%)
Asosiasi
1415
80
Lift ratio
Time(s)
Terbesar
50
2263
82.34
1.37
55
2263
78.26
1.37
1665
18.01
1.34
913
0.645
1.28
80
143
0.010
1.1
90
12
0.001
1.04
50
260
0.448
1.46
55
158
0.106
1.37
218
0.049
1.38
32
0.004
1.18
80
33
0.0018
1.11
90
2
0.0009
1.03
60 75
Runing
70
60 70
90
90
66
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
50
1
0.00083
1.09
55
1
0.00080
1.09
60
1
0.00081
1.09
70
0
0.00071
-
80
0
0.00071
-
-
-
-
90
90
c. Uji Running Time Untuk pengujan running time akan digunakan percobaan dengan nilai minimum confidence yang berbeda karena minimum confidence mempengaruhi jumlah aturan asosiasi yang terbentuk. Nilai confidence yang digunakan adalah 60% dan 90%.
1. Data Tahun 2012/2013 & 2013/2014
Running Time(s)
Running Time Data Tahun 2012/2013 & 2013/2014 1.3 1.2 1.1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
50
55
Standar 75
0.86
0.156
Standar 80
0.0043
0.002
60
70
80
90
0.031
0.015
0.0019
0.0014
0.0021
0.0011
0.0011
0.0009
Minimum support (%)
Gambar 5. 12 Uji Running Time Min Confidence=60%
67
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Running Time(s)
Running Time Data Tahun 2012/2013 & 2013/2014 1.3 1.2 1.1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
50
55
60
70
80
90
Standar 75
0.229
0.0256
0.0091
0.0026
0.0016
0.0014
Standar 80
0.0035
0.0021
0.0018
0.0012
0.0011
0.001
Minimum support(%)
Gambar 5. 13 Uji Running Time Min Confidence=90%
2.
Data Tahun 2014/2015
Data Tahun 2014/2015 90 80
Running Time(s)
70 60 50 40 30 20 10 0
50
55
60
70
80
Standar 75
84.957
84.007
19.904
1.235
0.016
0
Standar 80
0.766
0.125
0.062
0.016
0
0.015
Minimum support(%)
Gambar 5. 14 Uji Running Time Min Confidence=60%
68
90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Data Tahun 2014/2015 90 80
Running Time(s)
70 60 50 40 30 20 10 0
1
2
3
4
5
6
Standar 75
82.34
78.26
18.01
0.645
0.01
0.001
Standar 80
0.448
0.106
0.049
0.004
0.0018
0.0009
Minimum support(%)
Gambar 5. 15 Uji Running Time Min Confidence=90%
d. Kesimpulan Uji Dataset Hasil yang didapatkan dengan melakukan pengujian dataset 2012/20132013/2014 dan 2014/2015 menghasilkan jumlah aturan asosiasi yang berbeda. Pada tahun 2014/2015 jika diamati baik-baik atau dihitung nilai rata-ratanya, nilai daya serap pada tahun tersebut memang lebih baik karena banyak nilai yang lebih dari nilai standar daya serap yang ditetapkan saat pengujian dibandingkan nilai daya serap tahun 2012/2013-2013/2014. Nilai pada tahun 2014/1015 tersebut lebih baik karena bisa juga disebabkan karena adanya peralihan kurikulum dari KTSP menjadi kurikulum 2013 yang lebih menekankan kepada keaktifan murid dalam memahami materi. Nilai lift ratio yang didapatkan pada pengujian dataset mencapai nilai lebih dari 1 yang berarti dapat diartikan aturan tersebut dapat dikatakan aturan asosiasi tersebut menarik dan memiliki korelasi antar anteseden dan konsekuen. Sedangkan jika ada aturan asosiasi yang memiliki nilai lift ratio sama dengan 1 maka dapat
69
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
diartikan kompetensi-kompetensi tersebut saling independen. Lalu jika nilai lift ratio kurang dari 1 maka kompetensi-kompetensi tersebut tidak menunjukkan adanya saling keterkaitan antara anteseden dan konsekuen. Jika dilihat pula dari pengujian yang dilakukan dengan menggunakan kombinasi antara minimum support dan minimum confidence maka didapat hasil seperti pada grafik di gambar 5.12 sampai 5.15. Dari semua pengujian dengan dataset yang berbeda, hasil running time yang didapatkan selalu menurun ketika minimum supportnya semakin besar. Nilai running time akan bernilai besar jika minum supportnya kecil.
e. Evaluasi Pola Asosiasi Berdasarkan pengujian yang sudah dilakukan pada 2 dataset dapat diketahui bahwa pada saat minimum support-nya 50% maka dapat dihasilkan nilai lift ratio yang tinggi. Untuk setiap percobaan ditemukan ada beberapa aturan asosiasi yang memiliki nilai ratio yang tinggi, jadi bukan hanya ada 1 aturan asosiasi saja. Pada sub bab ini, akan dianalisis kembali aturan-aturan asosiasi yang memiliki nilai lift ratio tertinggi. Analisis tersebut bertujuan untuk melihat apakah aturan tersebut menarik jika dianalisa secara obyektif maupun subyektif. Analisa yang bersifat obyektif dapat dilihat dari nilai lift ratio, sendangkan analisa yang bersifat subyektif didapatkan dari menanyakan pendapat kepada seorang praktisi pendidikan yang merupakan guru SMA mata pelajaran Bahasa Indonesia. Pertanyaan yang diberikan kepada guru SMA tersebut adalah mengenai apakah aturan asosiasi yang dihasilkan relevan dan apakah benar jika memahami kompetensi yang menjadi anteseden maka akan memahami kompetensi yang menjadi konsekuen. Berikut ini adalah aturan asosiasi yang dipilih berdasarkan nilai lift ratio tertinggi beserta hasil analisa secara subyektifnya.
70
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1. Data Tahun 2012/2013-2013/2014 Berikut ini adalah aturan asosiasi yang didapatkan ketika nilai minimum support 50%, minimum confidence 60% dan standar nilai daya serap sebesar 75%. Dari banyaknya aturan asosiasi yang dihasilkan, ditemukan 6 aturan asosiasi yang memiliki nilai lift ratio tertinggi sebesar 1.57. Keenam aturan asosiasi tersebut memiliki nilai confidence yang berbeda. Perbedaan nilai confidence disebabkan oleh nilai support untuk setiap kompetensi yang menjadi anteseden dan konsekuen pada setiap aturan asosiasinya tidak sama.
Tabel 5. 12 Daftar aturan asosiasi data tahun 2012/2013-2013/2014 Rule Aturan 1
BIND9 BIND17 BIND2 BIND7 BIND16 BIND4 BIND6
2
BIND7 BIND16 BIND2 BIND4 BIND9 BIND17 BIND6
3
BIND7 BIND16 BIND2 BIND4 BIND6 BIND9 BIND17
4
BIND9 BIND17 BIND7 BIND16 BIND2 BIND4 BIND6
5
BIND9 BIND17 BIND6 BIND7
Lift
Analisa
Confidence
ratio
Subyektif
90.91%
1.57
90.91%
1.57
90.91%
1.57
86.42%
1.57
86.42%
1.57
Ya
86.42%
1.57
Ya
BIND16 BIND2 BIND4 6
BIND7 BIND16 BIND4 BIND6 BIND9 BIND17 BIND2
Belum Tentu Ya Belum Tentu Belum Tentu
[Rule 1] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”, “Menulis judul sesuai EYD” dan “Melengkapi dialog drama” MAKA sekolah
71
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi paragraf dengan kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.
[Rule 2] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi dialog drama” dan “Melengkapi paragraf dengan kata baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menentukan kalimat resensi”, “Menulis judul sesuai EYD” dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.
[Rule 3] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi dialog drama”, “Melengkapi paragraph dengan kata baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau tabel” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menentukan kalimat resensi” dan “Menulis judul sesuai EYD".
72
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
[Rule 4] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”, “Menulis judul sesuai EYD” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi dialog drama”, “Melengkapi paragraph dengan kata baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.
[Rule 5] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”, “Menulis judul sesuai EYD” dan “Menentukan isi dan simpulan grafik, diagram atau tabel” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi dialog drama” dan “Melengkapi paragraf dengan kata baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa”.
[Rule 6] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi paragraph dengan kata
73
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau tabel” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menentukan kalimat resensi”, “Menulis judul sesuai EYD” dan “Melengkapi dialog drama”.
2. Data Tahun 2014/2015 Berikut ini adalah aturan asosiasi yang didapatkan ketika nilai minimum support 50%, minimum confidence 60% dan standar nilai daya serap sebesar 80%. Dari banyaknya aturan asosiasi yang dihasilkan, ditemukan 8 aturan asosiasi yang memiliki nilai lift ratio tertinggi sebesar 1.46. Kedelapan aturan asosiasi tersebut memiliki nilai confidence yang berbeda. Perbedaan nilai confidence disebabkan oleh nilai support untuk setiap kompetensi yang menjadi anteseden dan konsekuen pada setiap aturan asosiasinya tidak sama. Berikut ini adalah tabel yang berisikan 2 aturan asosiasi yang memiliki nilai confidence tertinggi dari 8 aturan asosiasi yang memiliki nilai lift ratio 1.46:
Tabel 5. 13 Daftar aturan asosiasi data tahun 2014/2015 Rule
Lift Aturan
Confidence
Analisa
ratio Subyektif
BIND7 BIND14 BIND4 BIND17 7
BIND1 BIND16 BIND20 BIND2 BIND6
74
91.03%
1.46
Ya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND7 BIND14 BIND4 BIND6 BIND17 BIND1 BIND16 BIND20
8
91.03%
1.46
Ya
BIND2
[Rule 7] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi
biografi”,
“Menentukan
unsur-unsur
intrinsik/
ekstrinsik
novel/cerpen/drama” dan “Melengkapi paragraf dg kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menulis karya ilmiah (latar belakang dan rumusan masalah)”, “Melengkapi berbagai bentuk dan jenis paragraf dengan kalimat yang padu”, “Menulis judul sesuai EYD”, “Menyunting kalimat dalam surat resmi”, “Melengkapi dialog drama” dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.
[Rule 8] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta, opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi
biografi”,
“Menentukan
unsur-unsur
intrinsik/
ekstrinsik
novel/cerpen/drama”, “Melengkapi paragraf dg kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menulis judul sesuai EYD” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menulis karya ilmiah (latar belakang dan rumusan masalah)”, “Melengkapi berbagai bentuk dan jenis paragraf dengan kalimat yang padu”, “Menulis judul sesuai EYD”, “Menyunting kalimat dalam surat resmi” dan “Melengkapi dialog drama”.
75
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Dari percobaan yang dilakukan dengan dataset tahun 2012/2013-2013/2014 dan 2014/2015 dihasilkan banyak sekali aturan asosiasi. Dari kumpulan aturan asosiasi tersebut tidak semua aturan dapat dimbil sebagai dasar membuat suatu keputusan. Aturan yang dapat digunakan adalah aturan-aturan yang memiliki nilai lift ratio dan confidence tinggi (analisa secara obyektif) dan aturan yang memiliki relevansi dengan kebutuhan (analisa secara subyektif). Analisa secara subyektif ini dilakukan dengan cara menanyakan pendapat kepada salah seorang praktisi pendidikan di bidang Bahasa Indonesia. Hasil analisa secara subyektif ini adalah dapat mengetahui aturan-aturan yang antar kompetensinya memang benar berkorelasi dan yang belum tentu berkorelasi. Berikut ini adalah aturan asosiasi yang dinyatakan berkorelasi untuk dataset tahun 2012/20132013/2014: 1. [Rule 2] {BIND7 BIND16 BIND2 BIND4} {BIND9 BIND17 BIND6} (support = 50%, confidence 90.91%) 3. [Rule 3] {BIND7 BIND16 BIND2 BIND4 BIND6} {BIND9 BIND17} (support = 50%, confidence 90.91%) 4. [Rule 6] {BIND7 BIND16 BIND4 BIND6} {BIND9 BIND17 BIND2} (support = 50%, confidence 86.42%) Ketiga aturan asosiasi diatas, jika dilihat dari nilai standar daya serap, support dan nilai confidence-nya dapat diartikan bahwa ada 50% sekolah yang mendapatkan nilai daya serap lebih dari 75% untuk kompetensi-kompetensi yang menjadi aturan asosiasi. Sebesar 90.91% sekolah yang mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi anteseden juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi konsekuen pada rule 2 dan 3. Sedangkan rule 6, sebesar 86.42% sekolah yang mendapatkan nilai daya serap lebih dari 75% di kompetensikompetensi yang menjadi anteseden juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi konsekuen Di bawah ini 76
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
adalah aturan asosiasi yang dinyatakan berkorelasi untuk dataset tahun 2014/2015: 1. [Rule 7] BIND7 BIND14 BIND4 BIND17 BIND1 BIND16 BIND20 BIND2 BIND6 (support = 57.85%, confidence 91.03%) 2. [Rule 8] BIND7 BIND14 BIND4 BIND6 BIND17 BIND1 BIND16 BIND20 BIND2 (support = 57.85%, confidence 91.03%) Kedua aturan asosiasi diatas, jika dilihat dari nilai standar daya serap, support dan nilai confidence-nya dapat diartikan bahwa ada 57.85% sekolah yang mendapatkan nilai daya serap lebih dari 75% untuk kompetensi-kompetensi yang menjadi aturan asosiasi. Sebesar 91.03% sekolah yang mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi anteseden juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi konsekuen.
77
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB VI PENUTUP 6.1 Kesimpulan Dari pengujian-pengujian yang dilakukan pada sistem pencarian pola asosiasi menggunakan algoritma Frequent Pattern Growth (FP-Growth) terhadap data nilai daya serap Ujian Nasional jurusan IPA dengan mata pelajaran Bahasa Indonesia ini dapat ditarik kesimpulan sebagai berikut: 1. Algoritma FP-Growth untuk menemukan aturan asosiasi yang menarik dari data nilai daya serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia ini telah berhasil diterapkan dengan cara melakukan proses awal pembersihan data, integrasi data dan seleksi data. Setelah itu dilakukan transformasi data dengan memasukkan nilai standar daya serap. Proses selanjutnya adalah melakukan proses data mining dengan menerapkan algritma FP Growth yang diawali dengan pembangkitan FPTree. Selanjutnya metode FP Growth diimplementasikan dengan 3 tahap utama yaitu pembangunan conditional pattern base, conditional fp tree dan pencarian frequent itemset. Hasil frequent itemset yang dihasilkan kemudian dikombinasikan untuk dijadikan aturan asosiasi dan dihitung confidence beserta lift ratio-nya. 2. Sistem yang dibuat dengan melakukan penerapan metode FP-Growth ini menghasilkan 5 aturan asosiasi yang menarik berdasarkan nilai lift ratio tertinggi untuk tahun akademik 2012/2013-2013/2014 adalah {BIND7 BIND16 BIND2 BIND4} {BIND9 BIND17 BIND6}, {BIND7 BIND16 BIND2 BIND4 BIND6} {BIND9 BIND17}, {BIND7 BIND16 BIND4 BIND6} {BIND9 BIND17 BIND2}. Sedangkan untuk tahun 2014/2015 aturan asosiasi yang menarik adalah {BIND7 BIND14 BIND4} {BIND17 BIND1 BIND16 BIND20 BIND2} dan {BIND7 BIND14 BIND4 BIND6} {BIND17 BIND1 BIND16 BIND20 BIND2}. Secara subyektif
78
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
kompetensi-kompetensi dalam aturan-aturan asosiasi tersebut memang saling berkaitan. 3. Nilai standar minimal daya serap mempengaruhi perhitungan algoritma FPGrowth karena semakin besar nilai standar ketuntasan yang dimasukkan maka jumlah aturan asosiasi yang dihasilkan semakin banyak. 6.2 Saran 1. Sistem dapat mengubah hasil aturan asosiasi ke dalam bentuk yang lebih komunikatif agar semua pengguna dapat mengerti maksud dari aturan asosiasi yang dihasilkan. 2. Sistem dapat dikembangkan kedalam bentuk sistem berbasis web. 3. Sistem dapat dikembangkan dengan data inputan dari database. 4. Sistem dapat melakukan proses preprocessing. 5. Sistem dapat membaca hasil yang dulu pernah disimpan, sehingga pengguna langsung dapat melihat hasilnya di dalam sistem.
79
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DAFTAR PUSTAKA Bloom, Benjamin S. 1971. Taxonomy of Objective : The Clasification Of Educational Goals. Hanbook 1. Cognitive Domain New York : David McKay Company.Inc Dahlan,
Ahmad.
2014.
Pengertian
dan
Peranan
Evaluasi
Pembelajaran.
http://www.eurekapendidikan.com diakses taggal 2 Juni 2016 Fayyad,Usama. 1996. Advances in Knowledge Discovery and Data Mining . MIT Press Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques, Morgan Kaufmann, USA. Hermawati, Fajar Astuti.2013. Pengolahan Citra Digital Konsep dan Teori, Andi, Yogyakarta. Hoffer,J.A., M.B. Prescott, dan F.R McFadden. 2005. Modern Database Management. New Jersey :Pearson, Prentice Hall. Kemendikbud, 2015. Kemendikbud Umumkan Tujuh Provinsi Dengan Indeks Integritas Tertinggi Dalam UN 2015. http://litbang.kemdikbud.go.id diakses tanggal 12 Desember 2015. Kemendikbud, Puspendik Balibang. 2015. Buku Panduan Pemanfaatan PAMER UN2015. Jakarta. Octaviani, Anmetatika Angelia.2010. ”Analisis Perbandingan Algoritma FP-Growth Dan Algoritma Apriori pada Market Basket Analysis”. Universitas Telkom, Bandung Pramudiono, Ika. 2006. Model Pencarian pada Mesin Pencari. Bandung Rickyanto, Isak. 2003. Membuat Aplikasi Windows dengan Visual Basic.NET, Elek Media Komputindo, Jakarta.
80
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Samuel, David. 2008. Penerapan Stuktur FPTree dan Algoritma FPGrowth dalam Optimasi Penentuan Frequent Itemset”. Institut Teknologi Bandung, Bandung Santosa, Budi. 2007. “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu, Yogyakarta Stufflebeam, L.D. & Shrinkfiel,J. (1985). Systematic evaluation : A self-instructional guide to theory and practice. New York : Kluwer Nijhoff Pulishing. Turban,Efraim., Ramesh Sharda, Dursun Delen. 2005. Decision Support System and Intelligent System (Sistem Pendukung Keputusan dan Sistem Cerdas), Andi, Yogyakarta
81
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
LAMPIRAN
Lampiran 1: Diagram Aktivitas Diagram Aktivitas 001 Memilih Data
USER
SISTEM
Menekan tombol "Pilih File"
Menampilkan kotak dialog file chooser
Memilih file yang akan digunakan
Menampilkan kotak dialog bertulis " Maaf, Sistem Hanya Menerima File Bertipe .xls dan .csv"
Apakah file bertipe .csv atau .xls?
Phase
Menampilkan data pada table
Gambar 1 Diagram Aktivitas 001
82
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Diagram Aktivitas 002 Mencari Aturan Asosiasi
USER
SISTEM
Mengisikan nilai minimum support dan minimum confidence
Menjalankan algoritma FP Growth dan menampilkan hasil rules dihasilkan
Phase
Menekan tombol "Proses"
Gambar 2 Diagram Aktivitas 002
83
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Diagram Aktivitas 003 Menyimpan Hasil
USER
SISTEM
Menekan tombol "Simpan Hasil"
Menampilkan kotak save dialog
Memilih lokasi dan tipe file untuk meyimpan hasil
Phase
File berhasil disimpan di direktori komputer
Gambar 3 Diagram Aktivitas 003
84
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Lampiran 2 : Diagram Kelas Analisis
view_about
view_help
view_home
view_preprocessing
view_asosiasi
control_atributSelection
model_atributSelection
comparatorHeaderTable control_algorithm model_combination
TreeNode
Gambar 4 Diagram Kelas Analisis
85
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Lampiran 3:Diagram Sequence
1. Memilih Data
USER
<> view_home.java
<> view_preprocessing.java
<> control_atributSelection.java
1. Klik "Masuk Sistem" 2. Menampilkan view_preprocessing.java
3. Klik tombol Pilih File
4. Menampilkankotak dialog file chooser
5. Memilih file bertipe .xls atau .csv
6. bt_chFileActionPerformed
(java.awt.event.ActionEvent evt)
7. new control_atributSelection()
8. setAtribut(dft.getColumnName(i)) , setPilih(false)
9. addRow(i, asModel) 11. Menampilkan data
di table tb_fileInput
Gambar 5 Diagram Sequence Memilih Data
86
<<model>> model_atributSelection.java
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Mencari Aturan Asosiasi <> view_asosiasi.java
USER
<> control_algorithm.java
<<model>> comparitorHeaderTable. java
<<model>> TreeNode. java
1. Isikan minimum support dan minimum confidence 2. Tekan tombol "Proses"
6. bt_processActionPerformed (java.awt.event.ActionEvent evt)
7. FPTree() 8. InsertNode() 9. new TreeNode()
10. new comparitorHeaderTable() 11. FPgrowth(ArrayList>, double,int, double) 12. FPgrowth(TreeNode, String, double, ArrayList, Map<String, Integer>), conditional_fptree_constructor() 13. new comparitorHeaderTable()
14. new model_combination(itemChange) 15.Menampilkan rule yang dihasilkan
Gambar 6 Diagram Sequence Mencari Aturan Asosiasi
87
<<model>> model_combination.java
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3. Menyimpan Hasil
<> view_asosiasi.java
USER
1. Menekan tombol "Simpan Hasil"
2.Menampilkan save dialog
3. Memilih lokasi penyimpanan, tipe file dan mengisikan nama file 4. Menekan tombol Save 5. bt_saveActionPerformed (java.awt.event.ActionEvent evt) 6. File berhasil disimpan di direktori komputer
Gambar 7 Diagram Sequence Menyimpan Hasil
88
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Lampiran 4: Diagram Kelas Desain
Berikut ini adalah detail kelas yang berisi atribut dan method-method yang dipakai dalam pembuatan perangkat lunak : 1. Kelas control_algorithm
control_algorithm -frequentPatterns : Map<String,Integer> -headerTable : ArrayList -treeNode : TreeNode -treenode : TreeNode -FPGrowth() : ArrayList> -FPTree() : void -FPgrowth() : void -conditional_fptree_constructor() : TreeNode -insert() : void -insertNode() : void
2. Kelas control_atributSelection
control_atributSelection -atribut : List<model_atributSelection> -atributSelection : model_atributSelection -column : String[] +control_atributSelection<> +Delete_Atribut() : void +addRow(int,model_atributSelection) : void +getColumnClass(int) : Class +getColumnCount() : int +getColumnName() : String +getRowCount() : int +getValueAt() : Object +isCellEditable() : boolean +setValueAt() : void
3. Kelas Koneksi
89
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Koneksi -connect : Connection -database : String -driverName : String -host : String -jdbc : String -password : String -port : String -url : String -username : String +getConnect() : Connection +getKoneksi() : Connection +setConnect() : void
4. Kelas TreeNode
TreeNode -child : List -counts : int -name : String -next : TreeNode -parent : TreeNode -root : boolean +TreeNode() <> +TreeNode(int,String,TreeNode) <> +TreeNode(int, String) <> +TreeNode(String) <> +addCount() : void +getChild() : List +getCounts() : int +getName() : String +getNext() : TreeNode +getParent() : TreeNode +isRoot() : boolean +setChild() : void +setCounts() : void +setName() : void +setNext() : void +setParent() : void +setRoot() : void
5. Kelas comparitorHeaderTable
90
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
comparitorHeaderTable +comparitorHeaderTable <> +compare() : int
6. Kelas model_atributSelection
model_atributSelection -atribut : String -pilih : boolean +model_atributSelection(String,boolean) <> +model_atributSelection()<> +getAtribut() : String +getPilih() : boolean +setAtribut() : void +setPilih() : void
7. Kelas model_combination
model_combination -antecedent : ArrayList -consequent : ArrayList -inputString : String -output : StringBuilder +model_combination()<> +Combine() : void +CountConfAndLift() : ArrayList<String>
8. Kelas model_competence
91
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
model_competence +model_competence(String, String) <> +model_competence(String) <> +model_competence(Connection) <> +model_competence() +addCompetence() : void +getCompetenceName() : String +getCon() : Connection +getIdCompetence : String +getKoneksiBaru() : model_competence +getSubject() : String +setCompetenceName() : void +setCon() : void +setIdCompetence() : void +setSubject() : void
9. Kelas view_preprocessing
view_preprocessing -array1 : Arraylist> -array2: LinkedList <String> -asControl : control_atributSelection -asModel : model_atributSelection -map: HashMap<String,Integer> +view_preprocessing() <> -bt_aboutActionPerfomed() -bt_cancelActionPerfomed() -bt_chFileActionPerfomed() -bt_convertActionPerfomed() -bt_delAtributActionPerfomed() -bt_helpActionPerfomed() -bt_homeActionPerfomed() -bt_markAllActionPerfomed() -bt_submitActionPerfomed() +initComponents()
10. Kelas view_home
92
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
view_home +view_home() <> -bt_aboutActionPerfomed() -bt_helpActionPerfomed() -bt_systemActionPerfomed() +initComponents()
20.Kelas view_help
view_help -memberName +view_help()<> -bt_aboutActionPerfomed() -bt_homeActionPerfomed() +initComponents(
11. Kelas view_asosiasi
93
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
view_asosiasi -arrayBaru : ArraList> -arayData : ArrayList> -con : control_algorithm -mapdata : HashMap<String,Integer> -minConfidence : double -minSupport : double -newArray : ArrayList -sortedItemsbyFrequencies: ArrayList -totalData : String -totalItem : int -totalTransaction :int -transactionFile : String +view_asosiasi()<> +BubbleSortODesc() : void +BubleSortODescArayList() : void +RemovbleNoFequentItem() : void -bt_aboutActionPerfomed() : void -bt_helpActionPerfomed() : void -bt_homeActionPerfomed() : void -bt_processActionPerfomed() : void -bt_saveActionPerfomed() : void +initComponents() : void +setTableAsosiasi() : void
12. Kelas view_about
view_about +view_about() -bt_helpActionPerfomed() -bt_homeActionPerfomed() +initComponents()
94
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Lampiran 5: Penghitungan Manual
Berikut adalah proses perhitungan manual yang akan dilakukan. 1. Hal pertama yang dilakukan pada tahap ini adalah menentukan standart nilai daya serap yang dianggap baik. Untuk contoh, penulis menggunakan standar nilai 76 dengan data 10 sekolah saja.
Gambar 8 Tabel Data Setelah Preprocessing
1. Setelah didapatkan tabel data seperti diatas maka langkah selanjutnya adalah menghitung frequent itemset tiap sekolah. Tabel 1 Daftar Jumlah Tiap Item Pada Transaksi Kompetensi BIND1 BIND2 BIND3 BIND4 BIND5 BIND6 BIND7 BIND8 BIND9 BIND10 BIND11 BIND12 BIND13 BIND14 BIND15 BIND16 BIND17 BIND18 BIND19
Frequent 5 8 7 8 0 9 6 2 5 4 0 5 3 3 4 7 7 5 0
95
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2. Setelah itu tetapkan nilai minimum support dan minimum confidence terlebih dulu. Penulis menggunakan nilai minimum support 70% atau sama dengan 7 dan minimum confidence 80%. Tabel 2 frequent itemset Kompetensi BIND17 BIND16 BIND3 BIND4 BIND2 BIND6
Frequent 7 7 7 8 8 9
3. Setelah ditemukan kompetensi-kompetensi yang sering muncul dan jumlahnya sesuai dengan minimum support, selanjutnya akan diurutkan berdasarkan kompetensi yang paling sering muncul karena akan digunakan untuk menentukan prioritas. Tabel Prioritas ini selanjutkan akan digunakan untuk tahap-tahap selanjutnya dan digunakan sebagai header table. Tabel 3 Prioritas Kompetensi BIND17 BIND16 BIND3 BIND4 BIND2 BIND6
Frequent 7 7 7 8 8 9
Prioritas 6 5 4 3 2 1
4. Berdasarkan prioritas yang sudah ada maka data yang ada diurutkan kembali berdasarkan prioritas yang sudah ditetapkan. Tabel 4 Data Setelah Item-nya Diurutkan Id Sekolah 01-010 01-011
Kompetensi BIND6,BIND16 BIND6,BIND2,BIND4
96
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
01-012 01-015 01-017 01-018 01-019 01-020 01-021 01-022
BIND6,BIND2,BIND4,BIND3,BIND16,BIND17 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17 BIND4,BIND3 BIND6,BIND2,BIND17 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
5. Setelah data sudah diurutkan berdasarkan prioritas dan memenuhi minimum support yang ditentukan, langkah selanjutnya adalah membuat struktur pohon fp tree untuk setiap baris data. Berikut adalah struktur pohon dari semua data yang ada.
Gambar 9 Struktur FP Tree
6. Setelah pohon fp tree terbentuk, langkah selanjutnya adalah menghitung conditional pattern base dan conditional fp tree. Pencarian conditional pattern base dan conditional fp tree didapat dari sub tree berdasarkan item yang memiliki count paling kecil. 97
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7. Item pertama yang memiliki count paling kecil berdasarkan urutan prioritas adalah BIND17 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang berakhiran node BIND17. Dari subtree tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND17 ini memiliki 2 pattern base yakni {BIND6, BIND2:1} dan {BIND6, BIND2, BIND4, BIND3, BIND16:6}. Dari pattern base tersebut dapat ditemukan conditional fptree-nya yaitu BIND6:7 dan BIND2:7. Selanjutnya untuk mendapatkan frequent itemset maka dilakukanlah pengkombinasian dari item yang akan dibuat conditional fp tree nya selama count dari item tersebut memenuhi minimum support.
Gambar 10 Sub-Database BIND17
Tabel 5 Daftar Frequent Itemset BIND17 Conditional Pattern Base
Conditional FP Tree
Frequent Itemset
{BIND6, BIND2:1} {BIND6, BIND2, BIND4, BIND3, BIND16:6}
{BIND6:7 ,BIND2:7}
BIND17: 7 BIND6 BIND17: 7 BIND2 BIND17:7 BIND17 BIND2 BIND6:7
98
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8. Item kedua yang memiliki count paling kecil berdasarkan urutan prioritas adalah BIND16 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang berakhiran node BIND16. Dari subtree tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND16 ini memiliki 2 pattern base yakni {BIND6:1} dan {BIND6, BIND2, BIND4, BIND3, BIND16 :6}. Dari pattern base tersebut dapat ditemukan conditional fp-treenya yaitu BIND6 dengan count 7.
Gambar 11 Sub-Database BIND16
Tabel 6 Daftar Frequent Itemset BIND16 Conditional Pattern Base
Conditional FP Tree
Frequent Itemset
{BIND6:1} {BIND6, BIND2, BIND4, BIND3, BIND16 :6}
{BIND6:7}
BIND16:7 BIND6 BIND16: 7
9. Item ketiga yang memiliki count paling kecil berdasarkan urutan prioritas adalah BIND3 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang berakhiran node BIND3. Dari subtree tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND3 ini memiliki 2 pattern
99
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
base yakni {BIND6:1, BIND2:6, BIND4:6} dan{BIND4:1}. Dari pattern base tersebut dapat ditemukan conditional fp-treenya yaitu BIND4 dengan count 7.
Gambar 12 Sub-Database BIND3
Tabel 7 Daftar Frequent Itemset BIND3 Conditional Pattern Base
Conditional FP Tree
Frequent Itemset
{BIND6:1, BIND2:6, BIND4:6} {BIND4:1}
{BIND4:7}
BIND3:7, BIND3 BIND4 : 7
10. Item keempat yang memiliki count paling kecil berdasarkan urutan prioritas adalah BIND4 dengan nilai count 8. Setelah itu maka akan dibuat subtree yang berakhiran node BIND4. Dari subtree tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND4 ini memiliki 1 pattern
100
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
base yakni {BIND6:7, BIND2:7}. Dari pattern base tersebut dapat ditemukan conditional fp-treenya yaitu BIND6 dengan count 7 dan BIND2 dengan count 7.
Gambar 13 Sub-Database BIND4
Tabel 8 Daftar Frequent Itemset BIND4 Conditional Pattern Base {BIND6:7, BIND2:7}
Conditional FP Tree {BIND6:7, BIND2:7}
Frequent Itemset BIND4:8 BIND4 BIND2 :7 BIND4 BIND2 BIND6:7 BIND4 BIND6 :7
11. Item kelima yang memiliki count paling kecil berdasarkan urutan prioritas adalah BIND2 dengan nilai count 8. Setelah itu maka akan dibuat subtree yang berakhiran node BIND2. Dari subtree tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND2 ini memiliki 1 pattern base yakni {BIND6:8}. Dari pattern base tersebut dapat ditemukan conditional fptreenya yaitu BIND6 dengan count.
101
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 14 Sub-Database BIND2
Tabel 9 Daftar Frequent Itemset BIND2 Conditional Pattern Base
Conditional FP Tree
Frequent Itemset
{BIND6:8}
{BIND6:8}
BIND2:8 BIND2,BIND6 :8
12. Item terakhir berdasarkan urutan prioritas adalah BIND6 dengan nilai count 9. Setelah itu maka akan dibuat subtree yang berakhiran node BIND9. Dari subtree tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND6 ini tidak memiliki pattern base dan conditional fp-tree.
Gambar 15 -Database BIND6
Tabel 10 Daftar Frequent Itemset BIND6 Conditional Pattern Conditional FP Tree Frequent Itemset Base BIND6:9 13. Berikut ini adalah daftar frequent itemset yang didapatkan. Untuk pembuatan aturan asosiasi yang dipakai adalah frequent itemset dengan jumlah item terbanyak.
Item BIND17
Frequent Itemset BIND17: 7, BIND6 BIND17: 7, BIND2 BIND17:7, BIND17 BIND2 BIND6:7 102
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND16 BIND3 BIND4 BIND2 BIND6
BIND16:7, BIND6 BIND16: 7 BIND3:7, BIND3 BIND4: 7 BIND4:8, BIND4 BIND2 :7, BIND4 BIND2 BIND6:7, BIND4 BIND6 :7 BIND2:8, BIND2 BIND6 :8 BIND6:9
14. Berikut ini adalah frequent itemset yang digunakan untuk dikombinasikan {BIND17 BIND2 BIND6:7}, {BIND4 BIND2 BIND6:7}. Dua frequent itemset ini tetap harus dalam urutan yang benar berdasarkan jumlah count pada tiap item. Urutannya akan menjadi seperti berikut {BIND6 BIND2 BIND17 : 7} dan {BIND6 BIND2 BIND4 : 7}. Salah satu contoh menghitung confidence dan lift ratio untuk aturan asosiasi yang pertama adalah sebagai berikut. Confidence dapat dihitung dari support {BIND 6 BIND2 BIND17}=7 dibagi dengan support dari {BIND6}=9 yang menjadi antecedent adalah 0.77. Ketika nilai confidence tersebut dikalikan dengan 100% maka akan menjadi 77%. Sedangkan nilai lift ratio dapat dihitung dari nilai confidence dibagi nilai expected confidence yang didapat dari support {BIND2 BIND17}=7 sebagai item konsekuen dibagi jumlah transaksi sebanyak 10, maka nilai expected confidence-nya sebesar 0.7. Setelah itu nilai lift ratio dapat dihitung dari 0.77/0.7, sehingga didapat nilai 1.1 Tabel 2 Tabel Aturan Asosiasi Aturan Asosiasi BIND6 BIND2 BIND17 BIND6 BIND2 BIND17 BIND6 BIND17 BIND2 BIND2 BIND6 BIND17 BIND2 BIND17 BIND6 BIND17 BIND6 BIND2 BIND6 BIND2 BIND4 BIND6 BIND2 BIND4 BIND6 BIND4 BIND2 BIND2 BIND6 BIND4 BIND2 BIND4 BIND6
Confidence 77% 87% 100% 87% 100% 100% 77% 87% 100% 87% 100% 103
Lift Ratio 1.1 1.24 1.25 1.24 1.11 1.25 1.1 1.08 1.25 1.24 1.11
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BIND4 BIND6 BIND2
87%
1.08
Setelah didapatkan aturan asosiasi beserta confidence dan lift ratio nya, aturan asosiasi yang digunakan adalah yang memiliki nilai lift ratio tertinggi. Aturan asosiasi tersebut adalah BIND6 BIND17 BIND2, BIND17 BIND6 BIND2 dan BIND6 BIND4 BIND2 dengan nilai lift ratio 1.25
104
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Lampiran 6 : Data Berikut ini adalah contoh data nilai daya serap tahun akademik 2014/2015.
105