PENERAPAN SUPERVISED EMERGING PATTERNS UNTUK MULTI ATRIBUT PADA DATA ONLINE IZIN USAHA PERTAMBANGAN DI INDONESIA (STUDI KASUS: EITI INDONESIA) Yohana Tri Utami1, Harco Leslie Hendric Spits Warnars2 Abstract—Indonesian
EITI (Extractive Industries Transparency Initiative) is an organization under Ministry of Economic Coordination which used to increase the transparency of extractive industry in Indonesia. EITI Indonesia manage a lot of data about mining, one of the managed data is data Mining Business License in Indonesia. The data has many records that require large storage allocation and difficult process data that is used by the EITI for decision making. .This data Mining Business License will be used for the processing of data mining that aims to help look for interesting patterns to determine a learning and two itemsets (attributes) that exist. Application Data Mining with Emerging Patterns Supervised methods will be used as a solution for managing data such large, so it is easy to produce a decision in the form of an interesting pattern information to determine the transparency of mining license in Indonesia. System development methods using CRISP-DM. The design of data mining applications using the programming language Java, NetBeans and MySQL database tools used to build a technology Supervised Emerging Patterns in multi-attribute decision making. Index Terms—CRISP-DM, Data Mining, Emerging Patterns, Java, Supervised
I. PENDAHULUAN Indonesia merupakan negara yang kaya sumber daya alam, salah satunya hasil tambang (batubara, minyak bumi, gas alam, timah). Di era globalisasi ini, setiap negara membangun perekonomiannya melalui kegiatan industri dengan mengolah sumber daya alam yang ada dinegaranya. Hal ini dilakukan agar dapat bersaing dengan negara lain dan memajukan perekonomiannya. Oleh karena itu, banyak perusahaan dari sektor privat maupun sektor swasta yang mengolah hasil tambang untuk di produksi. EITI (Extractive Industries Transparency Initiative) Indonesia adalah sebuah organisasi pemerintah yang berada di bawah Kementerian Koordinasi Perekonomian yang memiliki fungsi utama untuk meningkatkan transparansi dari industri ekstrakti/pertambangan di Indonesia. EITI Indonesia mengelola banyak data mengenai pertambangan, salah satu data yang dikelola adalah data Izin Usaha Pertambangan (IUP) 1 Yohana Tri Utami, Program Pasca Sarjana, Universitas Budi Luhur, Jl. Raya Ciledug, Jakarta Selatan, Indonesia (email:
[email protected]) 2 Harco Leslie Hendric Spits Warnars, Doctor of Computer Science, Bina Nusantara university, Jl. Kebon Jeruk Raya No. 27 Kebon Jeruk Jakarta Barat, Indonesia (email:
[email protected])
yang ada di Indonesia. Data ini dikelola oleh bagian Direktorat Mineral dan Batubara dibawah pengawasan Kementrian ESDM. Penelitian ini menggunakan data izin usaha pertambangan pada tahun 2011 dan 2013 yang ada di wilayah Indonesia yang merupakan public datasets yang bersumber dari website pemerintahan Jakarta dan website EITI Indonesia. Berdasarkan data yang ada, peneliti akan mencari manakah data-data yang menarik sehingga dapat menghasilkan pola (patterns) untuk memudahkan dalam pengambilan keputusan dan pembuatan laporan. Pola yang dihasilkan dipilih dengan cara menentukan sebuah learning dan dua atribut yang dipilih sebagai itemset. Aplikasi ini diimplementasikan dengan aplikasi Data Mining menggunakan metode Supervised Emerging Patterns sebagai solusi untuk mengelola data-data yang besar yang diharapkan dapat membantu mempermudah dalam pengambilan keputusan. Berdasarkan data yang ada nantinya akan diperoleh suatu knowledge tentang pola (pattern) yang ada pada data izin usaha pertambangan. II. TINJAUAN PUSTAKA A. Supervised Data mining adalah proses yang menggunakan berbagai metode analisis data untuk menemukan yang tidak diketahui, tak terduga, menarik dan relevan pola dan hubungan di data yang dapat digunakan untuk membuat prediksi yang valid dan akurat. Secara umum, ada dua metode analisis data: supervised dan unsupervised. [4] B. Emerging Patterns Emerging Patterns adalah pola yang muncul sebagai itemset yang support meningkat secara signifikan dari satu set data yang lain. [3] Pola yang muncul dikatakan untuk menangkap kecenderungan yang database muncul, atau untuk menangkap membedakan karakteristik antara kelas data”. [8] [9] [10] Kualitas Emerging Patterns dapat diukur dengan tingkat pertumbuhan (rasio 2 mendukung) atau disebut (frekuensi perubahan-rasio). a. Supp 2 (X) adalah dukungan dari X pola / itemset di Dataset 2. b. Supp 1 (X) adalah dukungan dari pola / itemset X di Dataset 1. c. EP atau, di mana 1) supp 2 (X) sebagai dataset target atau kelas positif 2) supp 1 (X) sebagai dataset latar belakang atau kelas negative dalam diagram:
70 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456
3) supp1 (X)s
supp 2(X) d. EP atau adalah tingkat pertumbuhan pola / itemset X dari supp1 (X) untuk mendukung 2 (X) atau EP dari supp 2 (X) e. EP atau adalah tingkat pertumbuhan pola / itemset X dari Dataset 1 ke Dataset2 atau EP dari Dataset 2 f. EP atau adalah tingkat pertumbuhan rasio dukungan X di Dataset 2 untuk dukungan dari X di Dataset 1 g. Jumlah item di kelas 2 (dukungan 2 (X)) adalah GR atau atau ( ) waktu jumlah item di kelas 1 (supp 1 (X)) h. Ambang batas tingkat pertumbuhan ρ> 1, adalah itemset ketika tingkat pertumbuhan> = ρ i. Formula untuk memperoleh kepercayaan untuk memprediksi:
j.
EP dapat dikonversi dari aturan klasifikasi induksi seperti Pohon Keputusan dan Decision Tree dapat dibangun oleh EP. k. Semakin besar perbedaan dukungan pola, yang lebih menarik pola l. JEP (Jumping Berkembang Pola) 1) EP yang memiliki tingkat pertumbuhan yang tak terbatas ( ).[6] 2) Jumping Berkembang Pola (JEP) adalah tipe khusus dari EP dan jenis khusus diskriminan / aturan klasifikasi 3) JEP adalah EP dengan dukungan = 0 dalam 1 set data dan> 0 dalam data lain yang ditetapkan. [5] [11] [12] [13] III. IMPLEMENTASI SISTEM DAN APLIKASI A. Langkah-langkah Penelitian Metode pengembangan sistem yang digunakan dalam penelitian ini adalah Cross-Industry Standard Process for Data Mining (CRISP-DM). Metode CRISP-DM terdiri dari enam fase yaitu: 1. Fase pemahaman bisnis (Business Understanding) Tahap pertama dalam proses standar CRISP-DM dapat disebut tahap pemahaman penelitian. [1] CRISP-DM yang paling popular presentase 43%. [2] Pada tahap ini berfokus pada pemahaman mengenai tujuan dari proyek dan kebutuhan secara persepktif bisnis, kemudian mengubah hal tersebut menjadi sebuah permasalahan data mining dan rencana awal untuk
mencapai tujuan tersebut. Tujuan dari penelitian yang dilakukan ini adalah untuk membangun sebuah teknologi Supervised Emerging Patterns untuk pengambilan keputusan yang diterapkan pada data Izin Usaha Pertambangan (IUP) di Indonesia sehingga dapat membantu mempermudah pihak Direktorat Mineral dan Batubara untuk dapat mengelola data tersebut dengan menentukan pola (patterns) dari learning dan itemset yang dipilih sehingga akan diperoleh suatu keputusan dan knowledge tentang pola (pattern) yang ada pada data izin usaha pertambangan. Penelitian ini hanya berfokus pada pengembangan aplikasi supervised emerging patterns yang hanya menggunakan 2 atribut yang dijadikan sebagai itemset terhadap sebuah learning yang dipilih. Sebagai strategi awal dalam penelitian ini adalah dengan mengumpulkan data yang berkaitan dari berbagai sumber yang nantinya akan dijalankan dalam bahasa pemrograman Java. 2. Fase Pemahaman Data (Data Understanding) Jenis data yang dihasilkan merupakan data sekunder yang bersifat internal yang didapatkan berasal dari dua sumber yang berbeda. Untuk data izin usaha pertambangan tahun 2011 didapatkan dari website pemerintahan DKI Jakarta dalam bentuk format xls dengan jumlah record sebanyak 3.902 sedangkan untuk data izin usaha pertambangan tahun 2013 didapatkan dari website EITI Indonesia dalam bentuk format pdf dengan jumlah record sebanyak 10.790. Kedua data itu nantinya akan dilakukan proses integrasi data agar dapat mempermudah dalam mengelolanya. Teknik pengumpulan data tersebut diperoleh dengan menggunakan teknik studi literatur dan wawancara para staff EITI terkait dengan tujuan untuk mengetahui harapan dari kebutuhan pengguna. Berdasarkan data yang diperoleh, akan diperiksa dan di uji kualitas data nya dengan melakukan proses data cleaning atau proses menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan apabila terdapat data yang dianggap tidak valid. Pada data di tahun 2011, terdapat 2 record yang tidak valid yang terdapat pada field tahapan kegiatan yang berisi “Na” dan pada data di tahun 2013 terdapat 2 record yang tidak valid terdapat pada field luaswilayah, 22 record pada field tgl mulai dan 1 record pada field komoditas. 3. Fase Persiapan Data (Data Preparation) Pada tahap ini dilakukan rancangan set data yang sesuai dengan kebutuhan untuk mempermudah proses pemilihan data. Data yang dipilih adalah kedua data yang sudah didapat sebagai bahan perbandingan. Pada tahap ini atribut yang akan di pilih dari data IUP yaitu : tahun, nama wilayah, nama perusahaan, tahapan kegiatan, dan komoditas. Pemilihan attribut tersebut sudah di validasi oleh staf EITI terkait dengan cara
71 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456
melakukan kuesioner dan bertanya apakah atribut tersebut bisa membantu menentukan izin usaha pertambangan di Indonesia. Setelah itu ke tahap integrasi data (integrate data) dengan melakukan penggabungan antara tabel yang telah disiapkan pada tahap awal data preparation, yaitu tabel izin usaha pertambangan di tahun 2011 dan tahun 2013. Tabel yang diintegrasikan berupa hasil transformasi data pada tahap sebelumnya. 4. Fase Penentuan Teknik Data Mining (Modelling) Teknik data mining dan algoritma data mining yang akan diterapkan pada penelitian ini adalah metode data mining Emerging Patterns untuk menentukan pola (patterns) yang menarik dari data izin usaha pertambangan di Indonesia. Teknik Emerging Patterns dipilih berdasarkan penelitian terdahulu, yang di bahas pada salah satu penelitian milik Spits Warnars (2014) melakukan penelitian tentang “Mining Frequent Pattern with Attribute Oriented Induction High Level Emerging Pattern (AOI-HEP)”. Berdasarkan penelitian tersebut dijelaskan kegunaan dari Emerging Patterns yaitu pemanfaatan High Level Emerging Pattern (HEP) yang berguna untuk menentukan pola yang sering muncul dan hasil Pola akan dipengaruhi oleh learning atribut yang mereka pilih. Pada penelitian Tubagus M. Akhriza , Yinghua MA, Jianhua LI (2015) melakukan penelitian tentang “A Novel Fibonacci Windows Model for Finding Emerging Patterns over Online Data Stream” mengatakan bahwa Pemanfaatan Emerging Patterns untuk memunculnyakan pola dari streaming data yang begitu besar. Berdasarkan beberapa penelitian terdahulu peneliti tertarik untuk melakukan penelitian pada data izin usaha pertambangan di Indonesia dengan menggunakan teknik emerging patterns. Sesuai dengan tujuan yang akan dicapai bahwa penelitian ini akan dibangun aplikasi data mining supervised emerging patterns yang akan diterapkan pada data izin usaha pertambangan. Aplikasi berbasis java dan metode supervised diharapkan dapat membantu menampilkan hasil pola (patterns) yang menarik dari data izin usaha pertambangan di Indonesia. Pemodelan dilakukan dengan menggunakan sebuah learning dengan menentukan dua atribut sebagai itemsetnya. Berdasarkan hasil growth rate dan confidence akan dinilai apakah pola tersebut menarik atau tidak untuk digunakan sebagai pengambilan keputusan yang dilihat berdasarkan persentase yang dihasilkan pada perhitungan confidence yang dihasilkan. 5. Fase Evaluasi (Evaluation) Fase evaluasi dilakukan dengan bertanya pada form kuesioner apakah dari atribut yang sudah pilih sesuai atau tidak dengan data izin usaha pertambangan. Hasil
kuesioner mengatakan bisa mewakili dari attribut yaitu: tahun, nama wilayah, nama perusahaan, tahapan kegiatan, dan komoditas untuk penentuan pola yang ingin dihasilkan. 6. Fase Pengembangan (Deployment) Pada tahap ini sistem akan di implementasikan dan menterjemahkan pola pola (patterns) terhadap hasil yang didapat dari evaluasi pada tahap sebelumnya atau dari proses data mining yang dilakukan secara keseluruhan. Memanfaatkan model yang dibuat menggunakan Emerging Patterns. Tidak cukup dengan model Emerging Patterns saja, dalam pengembangan sistem data mining ini digunakan aplikasi pemprograman Java untuk mengimplemtasikan hasil laporan pola (patterns). Hasil dari pengembangan sistem data mining ini adalah menghasilkan laporan pola (patterns), menghasilkan teknologi Supervised Emerging Patterns untuk pengambilan keputusan pada data izin usaha pertambangan di Indonesia. Pengembangan yang lebih kompleks: Diharapkan pihak EITI dapat menerapkan sistem data mining Supervised Emerging Patterns untuk pengambilan keputusan pada data izin usaha pertambangan di Indonesia. IV. HASIL DAN PEMBAHASAN Pada penelitian ini, peneliti akan melakukan pencarian pola yang menarik dari data izin usaha pertambangan di Indonesia. Penarikan data dari database ini dilakukan dengan menarik data dari beberapa tabel. Berdasarkan data yang diperoleh, akan diperiksa dan di uji kualitas data nya dengan melakukan proses data cleaning atau proses menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan apabila terdapat data yang dianggap tidak valid. Pada data di tahun 2011, terdapat 2 record yang tidak valid yang terdapat pada field tahapan kegiatan yang berisi “Na” dan pada data di tahun 2013 terdapat 2 record yang tidak valid terdapat pada field luaswilayah, 22 record pada field tgl mulai dan 1 record pada field komoditas. Data izin usaha pertambangan di tahun 2011 dan tahun 2013 terdapat beberapa field yang berbeda. Untuk dapat mempermudah dalam pembuatan pola (pattern) maka dipilihlah field yang sama dari kedua data tersebut, yaitu: tahun, nama wilayah, nama perusahaan, tahapan kegiatan, dan komoditas. A. Implementasi Aplikasi Supervised Emerging Patterns Pada tahap ini sistem akan di implementasikan dan menterjemahkan pola (patterns) terhadap hasil yang didapat dari evaluasi pada tahap sebelumnya atau dari proses data mining yang dilakukan secara keseluruhan. 1. Tampilan Form Login
72 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456
Login password merupakan tampilan pertama pada saat aplikasi data mining dijalankan. Tampilan form ini, berfungsi untuk keamanan data di mana pengguna diminta untuk menginputkan password yang telah ditentukan sebelumnya. Adapun tampilan form login dapat dilihat pada gambar 1 berikut :
3. Tampilan Form Menu Menghitung Nilai Confidence dari Learning Pada Tahapan Kegiatan, Itemset 1 (Tahun) dan Itemset 2 (Komoditas) Berdasarkan hasil implementasi pada learning Tahapan Kegiatan, Itemset 1 (Tahun) dan Itemset 2 (Komoditas) terdapat nilai tertinggi pada record yang sudah di hitung nilai confidence. Nilai confidence tertinggi yaitu learning tahapan kegiatan eksploitasi berbanding tahapan kegiatan operasi produksi dan itemset 1 (tahun, 2011) dan itemset 2 (komoditas,tanah liat) dengan nilai confidence mencapai 95%. Perhitungan untuk mencari growth rate tertinggi dengan membandingkan tahapan kegiatan eksploitasi dan operasi produksi adalah: itemset ={(tahun,2011),(komoditas,trass)} countD1 (X ) | D1| Support D1(X) =
= 5/84= 0.05952381 (frequency: 5.95%)
Gambar 1. Tampilan Form Login 2. Tampilan Form Menu Utama Form Menu Utama merupakan menu utama dalam aplikasi data mining karena berfungsi untuk mengakses menu-menu lainnya yang terdapat pada aplikasi data mining. Tampilan form menu utama program dapat dilihat pada gambar 2 berikut:
Growth Rate (GR) = Support D1(X) Support D3(X)
Confidence =
Support D1(X)/ (Support D1(X)+ Support D3(X))
(5/84)/( 20/7376) = = 0.05952381/0.0 0271149 = 21.95238 =
0.05952381/(0.0 5952381 + 0.0027114968)
= 0.956432 = 95%
Support D3(X) =
countD3 (X ) = 20/7376= 0.00271149 | D3 | (frequency: 0%)
Dilihat dari hasil kedua support D 1 dan D3, maka didapatkan bahwa untuk support D 1(X) disebut dengan EP positif karena nilainya lebih besar sedangkan untuk support D3(X) disebut EP negatif karena memiliki nilai support yang lebih kecil. Untuk menghitung nilai Growht rate dari itemset diatas, maka: Hasil confidence 0.956432 atau 95% merupakan subdataset yang menarik dalam emerging pattern karena nilai confidence yang dihasilkan mencapai nilai tertinggi dibanding dengan yang lain. Tampilan form nilai confidence yang dihasilkan pada learning tahapan kegiatan eksploitasi berbanding operasi produksi dan itemset 1 (tahun, 2011) dan itemset 2 (komoditas,tanah liat) dapat dilihat pada gambar 3 berikut ini: Gambar 2. Tampilan Form Menu Utama
73 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456
dan itemset 1 (tahun, 2011) dan itemset 2 (komoditas,tanah liat). Perhitungan untuk mencari growth rate dari nilai jumping emerging pattern dengan membandingkan tahapan kegiatan eksploitasi dan eksplorasi adalah: itemset ={(tahun,2011),(komoditas,tanah liat)}
Support D1(X) =
Gambar 3. Tampilan Form Menu Menghitung Nilai Confidence Supp D1(X)/ Supp D2(X)
Hasil Output : Itemset{(Tahun,2011),(Komoditas,Tanah Liat)} Supp D1(x) = Tahapan kegiatan Eksploitasi yaitu 5/84 = 0.05952381 Supp D3(x) = Tahapan kegiatan Operasi Produksi yaitu 20/7376 = .0027114968 Growth Rate = Supp D1(x))/Supp D3(x) = Tahapan kegiatan Eksploitasi/Tahapan kegiatan Operasi Produksi = 0.05952381/0.0027114968 = 21.952 Confidence = Supp D1(x) / (Supp D1(x)+Supp D3(x)) = 0.05952381/(0.05952381 + 0.0027114968) = 0.956 = 95% Berdasarkan hasil proses diatas didapatkan bahwa {learning, tahapan kegiatan, itemset 1, tahun dan itemset 2, komoditas} pada tahapan kegiatan eksploitasi memiliki persentase frekuensi 5%. Nilai frekuensi tersebut lebih tinggi dibandingan dengan tahapan kegiatan operasi produksi yaitu 0% . Jika tahapan kegiatan eksploitasi dibandingkan dengan tahapan kegiatan operasi produksi akan menghasilkan presentase nilai confidence 95%. Berdasarkan hasil tersebut maka dapat disimpulkan bahwa perbandingan ini merupakan subdataset yang menarik dalam emerging pattern.
countD1 (X ) | D1|
= 5/84 = 0.05952381 (frequency: 6%)
countD2 (X ) = 0/7227= 0 Support (frequency: 0%) | D2 D2(X) = Dilihat dari hasil kedua support D 1 dan D2, maka didapatkan bahwa untuk support D 1(X) disebut dengan EP positif karena nilainya frekuensi yang dihasilkan lebih besar sedangkan untuk support D2(X) disebut EP negatif karena memiliki nilai frekuensi yang lebih kecil. Untuk menghitung nilai Growth rate dari itemset diatas, maka: Growth Rate =
Confiden ce=
Support D1(X) Support D2(X)
=
(5/84)/( 0/7227) = 0.05952381 /0 = ∞
Support D 1(X)/ (Support D 1(X)+ Support D 2(X))
=
0.05952381/(0.05952381 + 0.0)
= 100% Hasil confidence adalah 100% atau bisa dikatakan subdataset yang paling mendiskriminasi jika dibandingkan dengan data lainnya (jumping emerging pattern). Tampilan form nilai confidence yang dihasilkan pada learning tahapan kegiatan eksploitasi berbanding eksplorasi dan itemset 1 (tahun, 2011) dan itemset 2 (komoditas,tanah liat) dapat dilihat pada gambar 4 berikut ini:
4. Tampilan Form Menu Menghitung Nilai Jumping Emerging Pattern pada Learning Tahapan Kegiatan, Itemset 1 (Tahun) dan Itemset 2 (Komoditas) Berdasarkan hasil implementasi pada learning tahapan kegiatan, Itemset 1 (Tahun) dan Itemset 2 (Komoditas) terdapat nilai jumping emerging pattern pada record yang sudah di hitung nilai confidence. Nilai jumping emerging pattern tersebut terletak pada learning tahapan kegiatan eksploitasi berbanding dengan tahapan kegiatan eksplorasi, 74 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456
Gambar 4. Tampilan Form Menu Menghitung Nilai Jumping Emerging Pattern Supp D1(X) Tahapan Kegiatan Eksploitasi/Supp D2(X) Tahapan Kegiatan Eksplorasi
Hasil Output : Itemset{(Tahun,2011),(Komoditas,Tanah Liat)} Supp D1(x) = Tahapan kegiatan Eksploitasi yaitu 5/84 = 0.05952381 Supp D2(x) = Tahapan kegiatan Eksplorasi yaitu 0/7227 = 0.000 Growth Rate = Supp D1(x))/Supp D2(x) = Tahapan kegiatan Eksploitasi / Tahapan kegiatan Eksplorasi = 0.05952381/0.000 =∞ Confidence = Supp D1(x) / (Supp D1(x)+Supp D2(x)) = 0.05952381/(0.05952381 + 0.0) = 1.000 = 100 % II. KESIMPULAN DAN SARAN Berdasarkan analisa dan pembahasan dapat disimpulkan bahwa: 1) Peneliti melakukan perancangan model Data mining Supervised Emerging Patterns untuk menentukan pola (patterns) yang menarik yang ada pada data Izin Usaha Pertambangan di Indonesia. Pola yang dihasilkan dengan nilai tertinggi terdapat pada learning tahapan kegiatan dan itemset {(tahun,komoditas)} dengan nilai confidence 0.956432 atau dengan presentase mencapai 95%. 2) Data mining Supervised Emerging Patterns merupakan solusi alternatif yang sesuai untuk mengelola data-data yang besar sehingga dapat membantu dalam pengambilan keputusan dan menghasilkan laporan berdasarkan pola (patterns) yang ada pada data izin usaha pertambangan tersebut. 3) Berdasarkan hasil pengujian penerimaan penggunaan aplikasi dari 15 orang responden maka dapat disimpulkan aplikasi supervised emerging patterns dapat diterima dengan nilai rata-rata 4 (setuju). Adapun saran yang dapat diberikan sehubungan dengan pelaksanaan penelitian ini adalah: 1. Untuk penelitian lebih lanjut sebaiknya tidak hanya menggunakan dua atribut saja yang dijadikan sebagi itemset, agar pola yang dihasilkan dapat terlihat lebih menarik sehingga dapat memudahkan pihak EITI Indonesia dalam pengambilan keputusan. 2. Menggunakan data Izin Usaha Pertambangan untuk dijalankan dengan algoritma data mining yang lain, guna mencari perbedaan dan persamaan dengan teknik data mining emerging patterns.
3. Untuk penelitian selanjutnya, sebaiknya data yang diberikan untuk penelitian yang serupa, mengunakan dataset yang lebih banyak lagi agar mengoptimalkan kinerja algoritma yang digunakan.
[1] [2]
[3]
[4]
[5]
[6]
[7]
[8] [9] [10] [11]
[12]
[13]
PUSTAKA Daniel T. Larose, Discovering Knowledge In Data, An Introduction To Data Mining. America: 2005. Dong, G., & Li, J. (1999). Efficient mining of emerging patterns: discovering trends and differences. Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 43–52). San Diego, CA: ACM Press. Dong, G., Zhang, X., Wong, L., & Li, J. (1999). Classification by aggregating emerging patterns. Proceedings ofthe Second International Conference on Discovery Science (pp. 30–42). Tokyo, Japan: SpringerVerlag. Fan, H. (2004). Efficient mining of interesting emerging patterns and their effective use in classification, PhD thesis, The Department of Computer Science and Software Engineering, University of Melbourne. Guozhu Dong dan Jinyan Li., Mining border descriptions of emerging patterns from dataset pairs. Knowledge and Information Systems. USA, Singapore, 1999, vol. 8. Jinyan Li, Guozhu Dong, and Kotagiri Ramamohanarao. Instance-based classification by emerging patterns. In Proceedings of the 14th European Conference on Principles and Practice ofKnowledge Discovery in Databases (PKDD-2000), pages 191–200, 2000. Jinyan Li and Limsoon Wong. Identifying good diagnostic gene groups from gene expression profiles using the concept of emerging patterns. Bioinformatics, 18(10):1406–1407, 2002. John Wiley dan Sons, Ltd., A Practical Guide to Data Mining for Business and Industry”. Germany: 2014. Josef Bernadi,Suharjito, (2016). Executive Information system modelling to monitor Indonesian criminal rate, CommIT journal, 10(1), pp. 1-7. Kdnuggets website. [Online]. Available: http://www.kdnuggets.com/ Li, J ., Dong, G., & R amamohanarao, K . (2001). Making Use of the Most Expressive Jumping Emerging Patterns for Classification.Knowledge and Information Systems, 3 (2), 131-145. Spits, Warnars. 2014, Mining Frequent Pattern with Attribute Oriented Induction High Level Emerging Pattern (AOI-HEP). 20142nd International Conference on Information and Communication Technology (ICoICT). Jurnal Vol. 978-1-4799-3580-2/14/$31.00 ©2014 IEEE. Spits Warnars, (2014), “Mining Frequent and Similar Patterns with Attribute Oriented Induction High Level Emerging Pattern (AOI-HEP) Data Mining Technique”, International Journal of Emerging Technologies in
75 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456
Computational and Applied Sciences (IJETCAS), vol. 3, Issue 11, pp.266-276. [14] Tubagus M. Akhriza, Yinghua MA dan Jianhua LI. 2015, A Novel Fibonacci Windows Model for Finding Emerging Patterns over Online Data Stream. 2015 International Conference on Cyber Security of Smart cities, Industrial Control System and Communications (SSIC). Jurnal Vol. 978-1-46737977-9/15/$31.00 ©2015 IEEE. [15] Turban, E., J.E. Aronson dan T.P. Liang. 2005. Decision Support System and Intelligent Systems - 7 thed. Pearson Education, Inc. Pearson Education, Inc. Dwi Prabantini (penterjemah). 2005. Sistem Pendukung Keputusan dan Sistem Cerdas. Penerbit ANDI. Yogyakarta.
number: 140849 since April 2014, (www.IAENG.org), IACSIT (International Association of Computer Science and Information Technology) senior member since jan 2014, (www.IACSIT.org), INSTICC (the Institute for Systems and Technologies of Information, Control and Communication) member number 5279 since June 2014, (http://www.insticc.org/myINSTICC/). He is active as reviewer/program committee for some International journal or conferences and active as general chair, program chair, general committee for some international conferences, active as advisory and editorial board for 6 journals. His research publications can be reached at https://www.researchgate.net/profile/Harco_Leslie_Hendric_Spits_Warnars2
Yohana Tri Utami was born in Bandar Lampung, 1990. She has Bachelor degree in Computer Science in Information Systems field from STMIK Budi Luhur, Jakarta Selatan, Indonesia with title S.Kom (Sarjana Komputer) in 2008 and Master's degree from the University of Budi Luhur Jakarta in 2016. Currently, she is active as a lecturer in STMIK Teknokrat Lampung.
Harco Leslie Hendric Spits Warnars was born in Semarang, Central Java, Indonesia in 1972, married with 5 children. He has Bachelor degree in Computer Science in Information Systems field from STMIK Budi Luhur, Jakarta Selatan, Indonesia with title S.Kom (Sarjana Komputer) between 1991-1995 with bachelor thesis topic about information systems. Between 2004-2006 he continued his Master degree in Computer Science with major field Information Technology in University Indonesia, Depok, Indonesia with degree title M.T.I. (Magister Teknologi Informasi) with master thesis topic about Datawarehouses. His PhD Computer Science was done in The Manchester Metropolitan University, Manchester, United Kingdom, with Phd Thesis topic about data mining between 2008-2012. Currently He is Head of Concentration of Information Systems at Doctor of Computer Science (DCS) Bina Nusantara university (http://dcs.binus.ac.id). He has been teaching computer science subjects since 1995. He has Indonesian national lecturer degree Lektor Kepala (550) since 2007 which recognized as Associate Professor. He had awarded some research grants such as : Program of research incentive of national innovation system (SINAS) from Ministry of Research, Technology and Higher Education of the Republic of Indonesia and Incentives article in the International Journal from directorate of research and community service, Ministry of Research, Technology and Higher Education of the Republic of Indonesia. He is member of some professional membership such as IEEE (Institute of Electrical and Electronics Engineers) since 2011, member number : 92305834, (www.IEEE.org), SDIWC ( The Society of Digital Information and Wireless Communication) member ID:3518 since March 2014, (www.SDIWC.net), IAENG (International Association of Engineers) member
76 – jsiskom JURNAL SISTEM KOMPUTER – Vol. 6, No 2, November 2016, ISSN : 2087-4685, e-ISSN: 2252-3456