MENINGKATKAN INTERPRETASI PENGGUNA MENGGUNAKAN INTEGRASI TEKNIK CHERNOFF AND THE FACE UNTUK ALGORITHMA ANALISIS PADA APLIKASI DATA MINING VISUALIZATION TUGAS AKHIR
Diajukan Untuk Memenuhi Persyaratan Akademik Studi Strata Satu (S1) Teknik Informatika Universitas Muhammadyah Malang
Oleh : Septian Riza Saputra 08560393
JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADYAH MALANG 2013
LEMBAR PERSETUJUAN
MENINGKATKAN INTERPRETASI PENGGUNA MENGGUNAKAN INTEGRASI TEJNIK CHERNOFF AND THE FACE UNTUK ALGORITHMA ANALISIS PADA APLIKASI DATA MINING VISUALIZATION
TUGAS AKHIR
Oleh : Septian Riza Saputra 08560393
Telah Direkomendasikan Untuk Diajukan Sebagai Judul Tugas Akhir Di Teknik Informatika Universitas Muhammadiyah Malang
Menyetujui, Pembimbing I
Pembimbing II
Eko Budi Cahyono, S.Kom, MT NIP : 108.9504.0330
Ali Sofyan Kholimi, S.Kom NIDN : 0701038202
i
LEMBAR PENGESAHAN
MENINGKATKAN INTERPRETASI PENGGUNA MENGGUNAKAN INTEGRASI TEJNIK CHERNOFF AND THE FACE UNTUK ALGORITHMA ANALISIS PADA APLIKASI DATA MINING VISUALIZATION
TUGAS AKHIR
Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata Satu Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh : SEPTIAN RIZA SAPUTRA 08560393
Tugas Akhir ini telah diuji dan dinyatakan lulus oleh tim penguji pada tanggal 11 Januari 2013
Mengetahui/Menyetujui Pembimbing I
Pembimbing II
Yuda Munarko, S.Kom, M.Sc NIP : 108.0611.0443
Aminudin, S.Kom NIDN : 0701068603
Mengetahui Ketua Jurusan Teknik Informatika
Eko Budi Cahyono, S.Kom, MT NIP : 108.9504.0330
ii
LEMBAR PERNYATAAN Yang bertanda tangan di bawah ini: Nama Tempat / Tgl Lahir NIM Fakulats / Jurusan
: Septian Riza Saputra : Malang, 28 September 1989 :08560393 : Teknik / Teknik Informatika
Dengan ini saya
menyatakan bahwa Tugas Akhir
dengan judul
“MENINGKATKAN INTERPRETASI PENGGUNA MENGGUNAKAN INTEGRASI
TEJNIK
ALGORITHMA
CHERNOFF
ANALISIS
PADA
AND
THE
APLIKASI
FACE DATA
UNTUK MINING
VISUALIZATION” beserta seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya. Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya saya ini, atau ada klaim dari pihak lain terhadap keaslian karya saya ini maka saya siap menanggung segala bentuk resiko/sanksi yang berlaku.
Malang, Januari 2013 Yang Membuat Pernyataan
Septian Riza Saputra Mengetahui, Dosen Pembimbing I
Dosen Pembimbing II
Eko Budi Cahyono, S.Kom, MT NIP : 108.9504.0330
Ali Sofyan Kholimi, S.Kom NIDN : 0701038202
iii
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, yang telah memberi kekuatan dan petunjuk serta melimpahkan rahmat, dan hidayah-Nya, sehingga penulis dapat menyelesaikan
Tugas
Akhir
yang
berjudul “MENINGKATKAN
INTERPRETASI PENGGUNA MENGGUNAKAN
INTEGRASI TEJNIK
CHERNOFF AND THE FACE UNTUK ALGORITHMA ANALISIS PADA APLIKASI DATA MINING VISUALIZATION”. Dengan menyadari adanya keterbatasan waktu, kemampuan, pengetahuan, referensi dan pengalaman, Tugas Akhir ini masih jauh dari sempurna. Untuk itu saran dan masukkan untuk kesempurnaan sangat penulis harapkan. Akhir kata penulis berharap semoga Tugas Akhir ini dapat bermanfaat dan menjadi tambahan ilmu pengetahuan.
Malang, Januari 2013
Penulis
vi
DAFTAR ISI LEMBAR PERSETUJUAN ............................................................................... i LEMBAR PERNYATAAN ................................... Error! Bookmark not defined. ABSTRAKSI .......................................................... Error! Bookmark not defined. ABSTRACT ....................................................................................................... v KATA PENGANTAR ............................................ Error! Bookmark not defined. LEMBAR PERSEMBAHAN ................................ Error! Bookmark not defined. DAFTAR ISI ................................................................................................... viii DAFTAR GAMBAR ......................................................................................... xi DAFTAR TABEL ........................................................................................... xiv BAB I .................................................................................................................. 1 PENDAHULUAN .............................................................................................. 1 1.1 1.2 1.3 1.4 1.5 1.6
LATAR BELAKANG .................................................................................. 1 RUMUSAN MASALAH............................................................................... 2 TUJUAN .................................................................................................. 2 BATASAN MASALAH ............................................................................... 2 METODOLOGI PENYELESAIAN MASALAH .................................................. 3 SISTEMATIKA PENULISAN ........................................................................ 4
BAB II ................................................................................................................ 5 LANDASAN TEORI.......................................................................................... 5 2.1 DATA MINING VISUALIZATION ............................................................... 5 2.1.1 Definisi Data Mining Visualization .................................................... 5 2.1.2 Konsep Data Mining Visualization ..................................................... 6 2.1.2.1 Scientific Visualisation................................................................ 6 2.1.2.2 Information Visualization ............................................................ 7 2.1.3 Teknik Data Mining Visualization ..................................................... 9 2.1.3.1 Teknik Berbasis Proyeksi Geometri.......................................... 10 2.1.3.2 Teknik Berbasis Icon ................................................................. 14 2.1.3.3 Teknik Hirarki........................................................................... 15 2.2 METODE VISUALISASI CHERNOFF AND THE FACE .... ERROR! BOOKMARK NOT DEFINED. 2.2.1 Defenisi Chernoff And The Face....................................................... 17 2.2.2 Pembentukan Wajah Baru ................................................................ 19 2.2.3 Pemetaan Wajah .............................................................................. 20 2.2.4 Design Wajah ................................................................................... 22
viii
2.3 ALGORITHMA ID3 (ITERATIVE DICHOTOMISER 3) .................................. 23 2.3.1 Definisi Algorithma ID3 ................................................................... 25 2.3.2 Algorithma ....................................................................................... 25 BAB III ............................................................................................................. 25 ANALISA DAN PERANCANGAN SISTEM .......ERROR! BOOKMARK NOT DEFINED. 3.1 ANALISA .............................................................................................. 25 3.1.1 Analisa Kebutuhan ........................................................................... 25 3.1.1.1 Kebutuhan Fungsional ............................................................... 25 3.1.1.2 Kebutuhan Non-Fungsional ....................................................... 26 3.1.2 Analisa Sistem .................................................................................. 27 3.1.2.1 Analisa Pemetaan Wajah ........................................................... 27 3.2 PERANCANGAN SISTEM ......................................................................... 29 3.2.1 Use Case Diagram ........................................................................... 31 3.2.1.1 Activity Diagram Lihat Data Asli .............................................. 33 3.2.1.2 Activity Diagram Lihat Scientivic Visualization ....................... 35 3.2.1.3 Activity Diagram Lihat Information Visualization .............. Error! Bookmark not defined. 3.2.1.4 Activity Diagram Lihat Sample Data baru ................................ 37 3.2.1.5 Activity Diagram Zooming Chernoff Face ................................ 37 3.2.2 Class Diagram Level Analisis........................................................... 40 3.2.3 Sequence Diagram Level Analisis..................................................... 41 3.2.4 Design Chernoff Face ...................................................................... 42 3.2.5 Class Diagram Level Design ............................................................ 42 BAB IV ............................................................................................................. 42 IMPLEMENTASI DAN HASIL PENGUJIAN .............................................. 42 4.1 IMPLEMENTASI SISTEM ......................................................................... 42 4.1 .................................................................................................................. 42 4.1.1 Implementasi Antarmuka Pengguna ................................................. 42 4.1.1.1 Menu Data Awal ....................................................................... 42 4.1.1.2 Menu Measurement ................................................................... 43 4.1.1.3 Menu Scientivic ........................................................................ 43 4.1.1.4 Menu Information ..................................................................... 44 4.1.1.5 Menu Data Baru ........................................................................ 46 4.1.2 Implementasi Membaca Dataset ....................................................... 46 4.1.2.1 Membaca Stream File ............................................................... 47 4.1.2.2 Mencari Pattern Data................................................................. 49 4.1.2.3 Implementasi Chernoff Face...................................................... 53 4.1.3 Implementasi Transformation ........................................................... 53 4.1.3.1 Transformasi Measurement ....................................................... 54 ix
4.1.3.2 Transformasi Face Vector ......................................................... 54 4.1.3.3 Transformasi ID3 ...................................................................... 57 4.2 PENGUJIAN ........................................................................................... 57 4.2.1 Perancangan Pengujian ................................................................... 58 4.2.2 Pengujian Sistem .............................................................................. 58 4.2.2.1 Pengujian Proses Import Data dari Dataset ................................ 59 4.2.2.2 Pengujian Chernoff Face ........................................................... 60 4.2.2.3 Pengujian Akurasi Algorithma ID3 ........................................... 61 4.2.2.4 Pengujian Tujuan Penelitian ..................................................... 64 BAB V............................................................................................................... 64 KESIMPULAN DAN SARAN......................................................................... 64 5.1 5.2
KESIMPULAN ........................................................................................ 64 SARAN ................................................................................................. 64
DAFTAR PUSTAKA ....................................................................................... 66
x
DAFTAR GAMBAR Gambar 2. 1 Chernoff Faces dari data iris (Widya Silfianti,2006) ......................... 7 Gambar 2. 2 Plot Koordinat Paralel untuk data Iris (Widya Silfianti,2006) ........... 7 Gambar 2. 3 Sebuah information visualization dari kekuatan komunikasi antar situs menggunakan algoritma Graph (Sougata Mukherjea, C&C Research Laboratories)........................................................................................................ 9 Gambar 2. 4 Information visualization tentang hubungan situs antara .................. 9 Gambar 2. 5 Contoh scatterplot-matrices (Vienna,1997) .................................... 11 Gambar 2. 6 News articles di tampilkan dalam bentuk landscape ....................... 11 Gambar 2. 7 (gambar kiri) Representasi dari schema teknik projection views, (Gambar kanan) contoh penggunaan dari teknik projection views ...................... 12 Gambar 2. 8 Contoh visualisasi menggunakan metode Hyperslice ..................... 13 Gambar 2. 9 15.000 data dengan sebuah perwarnaan query-dependent ............... 13 Gambar 2. 10 Contoh penggunaan chernoff-faces .............................................. 14 Gambar 2. 11 Visualisasi Shape Coding dari data waktu penelitian tentang bumi pada NASA....................................................................................................... 14 Gambar 2. 12 Contoh schema visualisasi color icons pada data berdimensi 6 .... 15 Gambar 2. 13 Contoh visualisasi color icons pada data acak yang mengandung beberapa clusters ................................................................................................ 15 Gambar 2. 14 Contoh visualisasi minyak data mining dengan bujur dan lintang dipetakan ke x-, y-sumbu luar sedangkan bijih kelas dan kedalaman dipetakan ke x-, y-sumbu dalam ............................................................................................. 16 Gambar 2. 15 Contoh visualisasi tree map dari finansial data berbagai department di perusahaan Microsoft ..................................................................................... 17 Gambar 2. 16 Design gagasan awal dari Chernoff Face yang memiliki banyak kekurangan yang diantaranya bentuk wajah menjadi tidak realistis saat data memiliki nilai attribute yang besar ..................................................................... 18 Gambar 2. 17 Design Chernoff Face yang telah banyak mengalami penyempurnaan dan bentuk wajah menjadi lebih realistis ... Error! Bookmark not defined. Gambar 2. 18 contoh design Chernoff face ........... Error! Bookmark not defined.
xi
Gambar 3. 1 Use Case Diagram ......................................................................... 30 Gambar 3. 2 Activity Diagram Lihat Data Asli .................................................. 31 Gambar 3. 3 Activity Diagram Lihat Data Asli .................................................. 32 Gambar 3. 4 Activity Diagram Mencari Pattern Data ......................................... 33 Gambar 3. 5 Activity Diagram Lihat Scientivic Visualization ............................. 34 Gambar 3. 6 Activity Diagram Lihat Information Visualization ......................... 35 Gambar 3. 7 Activity Diagram Lihat Sample Data Baru ..................................... 36 Gambar 3. 8 Activity Diagram Zooming Chernoff face....................................... 37 Gambar 3. 9 Class Diagram Level Analisis ........................................................ 37 Gambar 3. 10 Sequence Diagram Lihat Data Asli .............................................. 38 Gambar 3. 11 Sequence Diagram Lihat Scientivic Visualization Error! Bookmark not defined. Gambar 3. 12 Sequence Diagram Lihat Information Visualization ..................... 39 Gambar 3. 13 Sequence Diagram Lihat Sample Data Baru ................................. 39 Gambar 3. 14 Design Chernoff face pada aplikasi ini ......................................... 40 Gambar 3. 15 Rancangan Class Diagram Level Design Dari Aplikasi ......... Error! Bookmark not defined. Gambar 4. 1 Menu Data Awal............................................................................ 42 Gambar 4. 2 Menu Add Measurementl ............................................................... 43 Gambar 4. 3 Menu Scientific Visualization......................................................... 43 Gambar 4. 4 Menu Information Visualization (Per Data) .................................... 44 Gambar 4. 5 Menu Information Visualization (Hipotesa) ................................... 44 Gambar 4. 6 Menu Information Visualization (Per Attribute) ............................. 45 Gambar 4. 7 Menu Data Baru............................................................................. 46 Gambar 4. 8 Proses Penampungan Stream Data ................................................. 47 Gambar 4. 9 Proses Membaca Stream Data ....................................................... 47 Gambar 4. 10 Pencarian data dengan pattern pertama ........................................ 48 Gambar 4. 11 Pencarian data dengan pattern kedua ........................................... 48 Gambar 4. 12 Pencarian pattern untuk menemukan nilai dari data ..................... 49 Gambar 4. 13 Penampungan nilai data ke vector ................................................ 49 Gambar 4. 14 Penyederhanaan nilai vector ......................................................... 50 Gambar 4. 15 Inisialisasi nilai vector ................................................................. 50
xii
Gambar 4. 16 Penggambaran bagian kepala ....................................................... 51 Gambar 4. 17 Penggambaran bagian mata .......................................................... 51 Gambar 4. 18 Penggambaran bagian pupil mata ................................................. 52 Gambar 4. 19 Penggambaran bagian alis mata ................................................... 52 Gambar 4. 20 Penggambaran bagian hidung....................................................... 52 Gambar 4. 21 Penggambaran bagian mulut ........................................................ 53 Gambar 4. 22 Fungsi transformasi measurement ................................................ 53 Gambar 4. 23 Fungsi pengambilan macam-macam nilai attribute ...................... 54 Gambar 4. 24 Fungsi transformasi face vector .................................................... 54 Gambar 4. 25 Fungsi penghitungan entropy ....................................................... 55 Gambar 4. 26 Fungsi penghitungan information gain ......................................... 56 Gambar 4. 27 Fungsi penentuan gain terbaik...................................................... 56 Gambar 4. 28 Fungsi untuk memeriksa root selanjutnya ..... Error! Bookmark not defined. Gambar 4. 29 Beberapa nama attribute pada dataset .......................................... 58 Gambar 4. 30 Beberapa nilai attribute pada dataset ........................................... 59 Gambar 4. 31 Beberapa nama attribute dan nilai attribute pada sistem............... 59 Gambar 4. 32 Bentuk obyek Chernoff face dengan nilai minimum dan maksimum .......................................................................................................................... 60
xiii
DAFTAR TABEL Tabel 2. 1 Maksimal Bagian wajah ...................... Error! Bookmark not defined. Tabel 3. 1 bagian wajah yang dipakai pada aplikasi............................................ 27 Tabel 3. 2 Contoh data yang belum di rolling dan belum memiliki measurement 28 Tabel 3. 3 Contoh data yang telah di rolling dan telah memiliki measurement ............................................................................ Error! Bookmark not defined. Tabel 4. 1 Pengujian Akurasi Prediksi Algorithma ID3 ...... Error! Bookmark not defined. Tabel 4. 2 Pengujian Tujuan Penelitian .............................................................. 62
xiv
DAFTAR PUSTAKA [1]
A. Keim, Daniel. 1997. Visual Techniques for Exploring Databases. University of Halle.-Wittenberg. Halle. Germany.
[2]
A.
Leverkuhn.
2003.
http://www.wisegeek.com/what-is-visual-data-
mining.htm. diakses pada tanggal 27 Juli 2012. [3]
Andrews, Keith.2012. Information Visualisation. Graz University of Technology. Inffeldgasse. Austria.
[4]
Breitner, Michael H. 2005. http://www.iwi.uni-hannover.de/lv/seminar _ss 05/bartke/iconbased.htm. Diakses tanggal 26 Agustus.
[5]
Chernoff, Herman. 1973. The Use of Faces to Represent Points in KDimensional Space Graphically. American Statistical Assosiation. USA.
[6]
Fieldmen, Ronen et.all. 1997. Visualization Techniques To Explore Data Mining Results For Document Selections. Bar-llan University. Ramat Gan Israel.
[7]
Flury, Benhard and Riedwyl, Hands. 1981. Graphical Representation of Multivariat Data by Means of Asymmetrical Face. American Statistical Assosiation. USA.
[8]
Har, Sariel. 2005. Class Notes For Randomized Algorithms. University Of Illinois. Urbana. USA.
[9]
Kohavi , Ron. 2000. Data Mining And Visualization. National Acedemy of Enginering. San Mateo. USA.
[10]
Lutfiati, Dewi. 2010. Penggunaan Pendekatan Visualisasi Chernoff Face Tentang Keaadaan Gizi Balita Di Surabaya. Airlangga University Library. Surabaya.
[11]
Mukherjea,
Sougata.
2005.
http://www9.org/w9cdrom/293/293.html.
Diakses pada tanggal 7 Agustus 2012.
66
[12]
Mulyana, Sri dan Winarko, Edi. 2009. Teknik Visualisasi Dalam Data Mining. Universitas Gadjah Mada. Yogyakarta.
[13]
NIST. 2012. http://www.itl.nist.gov/div898/handbook/eda/section3/eda3 3qb.htm. Diakses tanggal 15 Agustus 2012.
[14]
Nunez, Reyes and Jesus, Jose. 2010. Ideas For The Use Of Chernoff Faces In School Cartography. Eotvos Lorand University. Budapest. Hungaria.
[15]
Peng, Wei et.all. 2002. AlgorithmAn Implementation of ID3 - Decision Tree Learning Algorithm. University of New South Wales. Sydney. Australia.
[16]
Raciborski, Rafal. 2009. Graphical representation of multivariate data using Chernof faces. Emory University. Atlanta. GA.
[17]
S. Nelson, Elisabeth. 2007. Face Symbols: Research Issues and Cartographic Potential. University of Toronto. Toronto. USA
[18]
Stasko, John. 2012. http://www.cc.gatech.edu/~stasko/7450. Diakses pada tanggal 27 juli 2012.
[19]
Stolte, Chris et.all. 2002. “Query, Analysis, and Visualization of Hierarchically Structured Data using Polaris”. Stanford University. California. USA.
[20]
Yau, Nathan. 2010. http://flowingdata.com/2010/08/31/how-to-visualizedata-with-cartoonish-faces/. Diakses tanggal 25 Agustus 2012.
67