ANALISA POLA KEYWORD PENCARIAN PADA GOOGLE MENGGUNAKAN MARKET BASKET ANALYSIS. (STUDI KASUS : STIKOM Wireless Connection) Bayu Hendra Krisdhianto 1) 1)
S1 / Jurusan Sistem Informasi, STIKOM Surabaya, email :
[email protected]
Abstract: Market Basket Analysis with the Association Rules is one way to search for patterns of associations based on spending patterns by consumers, which will then be known to those items purchased any item simultaneously. And later can be used as an ingredient in the decision analysis, to increase profits or to determine marketing strategies. In this research, apriori methods used to obtain the association rules that describe the relationship between the keywords searched by users in the Google search engine on the network STIKOM Wireless Connection. From the results of empirical testing can be concluded that the computing time for generating association rules is influenced by the number of transactions, and the number of association rules is influenced by the value of minimum support and minimum confident. Keyword: Google, Apriori, Market Basket Analysis, Client – Server, Networking.
Kata “informasi” telah menjadi suatu topik
Web mining, dan penemuan pola-pola akses
yang cukup menarik untuk dibicarakan dan
pengguna dari layanan web, yaitu penggunaan
seolah tak ada habisnya untuk dikaji karena
Web mining”. (Cooley, Mobasher, & Srivastava
pertumbuhannya dan kebutuhannya yang sangat
(1997).
cepat
dan
mendesak.
Informasi
Sekolah Tinggi Manajemen Informatika
memacu dalam suatu lingkungan di mana
dan Teknik Komputer (STIKOM) Surabaya
informasi menjadi sangat penting dalam segala
memberikan banyak fasilitas tambahan untuk
sisi kehidupan kita baik di dunia nyata ataupun di
mendukung proses kegiatan pembelajaran di area
dunia maya atau biasa disebut internet. Internet
kampus STIKOM Surabaya. Salah satunya
telah secara dramatis mengubah cara orang dalam
adalah STIKOM Wireless Connection (SWC).
mencari suatu informasi. Berbagai web mesin
Dengan tersambung pada SWC, civitas akademik
pencari (search engine) banyak bermunculan dan
STIKOM Surabaya dapat mengakses internet
saling bersaing untuk menjadi yang teratas dalam
secara gratis untuk mendapatkan informasi
menyediakan informasi. Salah satu metode yang
penunjang
dapat
informasi lainnya.
digunakan
Teknologi
search
engine
untuk
pembelajaran
kuliah
ataupun
mengumpulkan semua data yang ada di internet
Usaha yang dilakukan oleh search engine
dan menyajikannya kembali sebagai sebuah
untuk mengumpulkan informasi juga berbanding
informasi bagi user adalah web mining. “Web
lurus bila dilihat dari sudut pandang pihak
mining adalah sebuah penemuan dan analisis
manajemen
informasi yang berguna dari World Wide Web.
manajemen menginginkan semua fasilitas yang
Ini menggambarkan pencarian otomatis sumber
ada di kampus dapat dimaksimalkan fungsinya
informasi on-line yang tersedia, yaitu, konten
bagi kepentingan civitas akademik STIKOM
STIKOM
Surabaya.
Pihak
1
Surabaya. Banyaknya audience yang menghadiri
STIKOM wireless Connection, dapat dijadikan
pelatihan atau seminar yang diadakan pihak
sumber data untuk kemudian dianalisa sehingga
kampus, padatnya kerumunan mahasiswa di
dapat diketahui kata-kata yang berkaitan dengan
perpustakaan karena selalu tersedia koleksi baru
topik tertentu dengan kadar relasi interest yang
yang sekarang ini sedang trend, dan masih
tinggi sedang menjadi trend di kampus STIKOM
banyak lagi tujuan yang lain
sekarang ini. Dari hasil pencarian user internet di
Internet seakan-akan telah menjadi tempat
Google, dirasa ada beberapa hubungan yang unik
rujukan kedua bila ada sesuatu hal yang tidak
antara kata ataupun topik yang dimasukkan
bisa didapatkan langsung di dunia nyata karena
sebagai keyword pencarian di Google.
adanya beberapa keterbatasan seperti letak
Penelitian ini membahas tentang analisa
geografis ataupun waktu. Google adalah salah
keyword
satu websearch terkenal yang sering dipakai oleh
aktivitas Google search dari jaringan STIKOM
civitas
mencari
Wireless Connection (SWC) dengan metode
informasi yang tidak bisa didapatkan langsung di
Market Basket Analysis (MBA). Dari hasil analisa
kampus STIKOM Surabaya. Tidak diadakannya
akan didapatkan suatu pola assosiasi dari
seminar atau pelatihan pada topik tertentu,
keyword tertentu beserta nilai confidence yang
minimnya jumlah koleksi pustaka yang dimiliki
dimiliki. Hasil analisa tersebut yang kemudian
perpustakaan
mendorong
dapat menjadi masukan bagi pihak manajemen
mereka harus mencari informasi dimana dan
STIKOM Surabaya selaku pembuat keputusan
bagaimana hal tersebut bisa mereka dapatkan.
untuk memaksimalkan fungsi fasilitas yang ada
Diantaranya
di
berkaitan dengan hasil analisa sistem ini.
Google. Hal ini menjadi peluang bagi pihak
Misalnya bagi pihak PSDM dapat mengadakan
manajemen agar event yang diadakan di kampus
pelatihan atau seminar yang berkaitan dengan
ataupun fasilitas yang disediakan selalu dipadati
topik yang sedang menjadi trend dikalangan
oleh civitas akademik
civitas
STIKOM
di
Surabaya
untuk
topik tertentu,
dengan
mencari
informasi
STIKOM Surabaya.
pencarian
akademik
di
Google
STIKOM,
berdasarkan
bagi
pihak
Diantaranya adalah dengan mengetahui trend apa
Perpustakaan dapat menyediakan koleksi pustaka
yang sekarang ini sedang diminati di kalangan
yang baru berkaitan dengan topik yang sama.
civitas akademik STIKOM Surabaya.
Dan masih banyak lagi manfaat tidak langsung
Untuk mengetahui trend apa yang sekarang
dari diketahuinya topik yang sekarang ini sedang
ini sedang diminati oleh civitas STIKOM
menjadi trend interest di kampus STIKOM
Surabaya, pihak manajemen STIKOM Surabaya
sebagaimana didapat dari hasil analisa sistem
merasa perlu memantau hasil pencarian yang
yang akan dibuat ini.
dilakukan oleh user internet di STIKOM Surabaya
pada
websearch
Google.
Dari
kumpulan keyword yang dicari oleh user internet
TUJUAN 1. Menghasilkan perangkat lunak (Client Side)
di STIKOM Surabaya, baik yang terkoneksi
yang
lewat
keyword pencarian pada Google.
wired
local
area
network
ataupun
dapat
mengumpulkan
data
history
2
2. Mengetahui bahwa Market Basket Analysis
masa yang akan datang atau nilai variabel lain
dapat digunakan untuk menganalisa pola
berdasarkan beberapa variabel yang saat ini telah
keyword pencarian pada Google.
diketahui nilainya. Yang termasuk dalam tipe ini
3. Menghasilkan perangkat lunak (Server Side) yang dapat menganalisa data history keyword pencarian pada Google yang dikirimkan oleh
antara lain: klasifikasi, re gresi, dan deteksi deviasi. Knowledge Discovery / Description Data
sistem (Client Side) menggunakan metode
Mining
yang
juga
sering
disebut
sebagai
Apriori.
pencarian pola (pattern discovery) adalah tipe
4. Menghasilkan perangkat lunak yang dapat
data mining yang digunakan untuk mendapatkan
menyusun daftar hubungan assosiasi antar
pola yang tersembunyi dalam data dan bisa
keyword beserta tingkat confidence yang
dipahami oleh manusia, biasanya ditampilkan
dimiliki
minimum
dalam bentuk kalimat yang mudah dimengerti,
frequent, minimum support dan minimum
misalnya “Jika seseorang membeli produk A
confidence.
maka juga membeli produk B”. Meskipun pola
berdasarkan
parameter
ini bisa ditemukan oleh manusia tanpa bantuan komputer – khususnya jika jumlah variabel dan
LANDASAN TEORI DATA MINING
datanya kecil – namun jika jumlah variabel
Secara sederhana data mining adalah suatu
puluhan bahkan ratusan dan jumlah data ribuan
proses untuk menemukan interesting knowledge
bahkan jutaan maka diperlukan waktu bertahun-
dari sejumlah data yang disimpan dalam basis
tahun untuk mendapatkan pola-pola tersebut.
data atau media penyimpanan data lainnya.
Disinilah peran teknologi informasi dengan
Dengan
dukungan sistem data mining membantu dalam
melakukan
sekumpulan
data,
data akan
mining
terhadap
didapatkan
suatu
penyelesaian permasalahan ini. Yang termasuk
interesting pattern yang dapat disimpan sebagai
tipe ini adalah: klusterisasi, aturan asosiasi, dan
knowledge baru. Pattern yang didapat akan
penemuan pola sekuensial.
digunakan untuk melakukan evaluasi terhadap data-data
tersebut
untuk
selanjutnya
akan
didapatkan informasi. Tehnik dalam data mining datang dari
Dengan data mining pemilik toko bisa mendapatkan informasi penting dan profitable tentang konsumen yang pada akhirnya bisa meningkatkan
keuntungan
toko dan
angka
Basis Data, Machine Learning, dan Statistik.
penjualan. Kegunaan informasi pada data mining
Elemen-elemen kunci untuk data mining ini telah
seperti diatas sering disebut sebagai Market
dibuat dalam beberapa tahun terakhir. Secara
Basket Analysis. Dalam jangka panjang, data
umum tugas dari data mining dapat dibagi ke
mining dapat membuat sebuah toko menjadi lebih
dalam dua tipe, yaitu Predictive Data Mining dan
kompetitif.
Knowledge Discovery / Description Data Mining.
MARKET BASKET ANALYSIS (MBA)
Predictive Data Mining adalah tipe data
Market Basket Analysis merupakan sebuah
mining untuk memprediksi nilai suatu variabel di
analisis terhadap kebiasaan customer berbelanja
3
pada supermarket dengan cara menemukan
menunjukkan terjadinya kecurangan dalam
asosiasi dan korelasi di antara berbagai macam
proses absensi.
item yang dimasukkan customer di dalam
7. Catatan medis pasien : kombinasi tertentu
shopping basket mereka. Secara lebih spesifik
dari
Market
bertambahnya resiko dari sebuah komplikasi dari
Basket
Analysis
bertujuan
untuk
mengetahui item apa saja yang sering dibeli
supermarket (Han, Yongjian Fu, 1999).
dapat diaplikasikan pada :
dibeli menggunakan kartu kredit dapat menjadi analisa atas produk sejenis lainnya yang juga dibeli secara bersamaan.
yang
telah
dapat
dibeli
digunakan
oleh untuk
menentukan peletakan posisi barang di rak. 3. Transaksi produk telekomunikasi : fasilitas yang saling berhubungan (Seperti nada sela, nama
pemanggil,
fungsi
multimedia, kamera, koneksi dan lain-lain) membantu menentukan paket dan fungsi dari suatu produk.
item
yang
dibeli
secara
bersamaan
oleh
dibeli bersamaan dengan roti. Namun, mungkin
tidak pernah terpikirkan sebelumnya. Misalnya, pembelian minyak goreng dengan deterjen. Mungkin saja pola seperti ini tidak pernah
dan deterjen tidak mempunyai hubungan sama sekali, baik sebagai barang pelengkap maupun barang pengganti. Hal ini mungkin tidak pernah terpikirkan sebelumnya sehingga tidak dapat diantisipasi
jika
terjadi
sesuatu,
seperti
kekurangan stok deterjen misalnya. Inilah salah satu
manfaat
yang
dapat
diperoleh
dari
melakukan market basket analysis. Dengan melakukan proses ini secara otomatis, seorang manajer tidak perlu mengalami kesulitan untuk
4. Transaksi perbankan : pola dari pelayanan yang digunakan oleh nasabah digunakan oleh pihak bank untuk menawarkan pelayanan yang juga banyak digunakan oleh nasabah lainnya.
menemukan pola item apa saja yang mungkin dibeli secara bersamaan. ASSOCIATION RULES Association
rules
digunakan
untuk
menemukan hubungan di antara data atau
5. Transaksi asuransi : kombinasi yang tidak lazim
Untuk beberapa kasus, pola dari item-
terpikirkan sebelumnya karena minyak goreng
2. Transaksi Supermarket : kombinasi dari
tampilan
menggambarkan
saja terdapat suatu pola pembelian item yang
1. Transaksi kartu kredit : barang-barang yang
pelanggan
dapat
konsumen mudah untuk ditebak, misalnya susu
Pada umumnya Market Basket Analysis
barang-barang
kondisi
suatu penyakit
bersamaan oleh customer. Item di sini diartikan sebagai berbagai macam produk atau barang pada
suatu
dari
sebuah
klaim
asuransi
menunjukkan terjadinya kecurangan sebuah klaim (klaim fiktif/ rekayasa). 6. Prosedur absensi mesin : kombinasi yang tidak lazim dari jam kedatangan seseorang
bagaimana suatu kelompok data mempengaruhi suatu keberadaan data yang lain (M. Kantardzic, 2003). Metode ini dapat membantu mengenali pola-pola tertentu di dalam kumpulan data yang besar. Association rule meliputi dua tahap (Ulmer, David, 2002) :
4
1. Pencarian frequent itemset, dengan cara
Batasan tersebut umumnya terdiri dari
mencari kombinasi yang paling sering terjadi
minimum support, minimum cofidence, dan
dari suatu itemset.
minimum improvement. Sebuah association rule
2.
Penyusunan
rules,
mendefinisikan
dengan
cara
dan
Result
Condition
(conditional association rule).
terdapat suatu interestingness measure (ukuran yang
minimum confidence
dapat dikatakan sebagai
valid association rule (Agrawal R, Srikant,
Dalam menentukan suatu association rule,
kepercayaan)
dengan confidence sama atau lebih besar dari
Algoritma ini dicetuskan oleh Agrawal
pengolahan data dengan perhitungan tertentu.
(1994). Ide dasarnya adalah menghitung pola
Umumnya ada tiga ukuran, yaitu:
kemunculan item yang muncul dalam data
- Support : suatu ukuran yang menunjukkan
transaksi dengan beberapa iterasi. Iterasi ke i
seberapa
suatu
berarti mendapatkan semua frequent i-itemset
item/itemset dari keseluruhan transaksi. Ukuran
(suatu itemset yang jumlah item anggotanya
ini akan menentukan apakah suatu item/itemset
sejumlah i). Langkah umum tiap iterasi adalah
layak untuk dicari confidence-nya (misal, dari
menghasilkan
seluruh transaksi yang ada, seberapa besar tingkat
dihitung nilai support dari tiap candidate. Untuk
dominasi yang menunjukkan bahwa item A dan B
menghasilkan candidate, pada dasarnya dapat
dibeli bersamaan) dapat juga digunakan untuk
dilakukan dengan menyusun kombinasi item-item
mencari tingkat dominasi item tunggal.
yang sudah ditemukan sebelumnya. Algoritma ini
tingkat
dari
ALGORITMA APRIORI
hasil
besar
didapatkan
R.,1994).
dominasi
candidate
itemset
kemudian
didasari oleh hukum apriori, jika sebuah itemset - Confidence : suatu ukuran yang menunjukkan hubungan antar 2 item secara conditional (misal, seberapa sering item B dibeli jika orang membeli item A).
ternyata infrequent, maka seharusnya supersetnya
juga
infrequent
sehingga
tidak
perlu
diperiksa lagi. Pada iterasi pertama, setiap jenis item yang ditemukan dalam data dijadikan candidate untuk frequent 1-itemsets. Sedangkan candidate di
yang
iterasi berikutnya didapatkan dari frequent
menunjukkan besarnya kemungkinan 2 item
itemset yang ditemukan di iterasi sebelumnya.
dapat dibeli secara bersamaan.
Proses akan berhenti jika tidak ada lagi
-
Improvement
:
suatu
ukuran
kombinasi candidate yang bisa dibuat. Selain
algoritma
Apriori
yang
Ketiga ukuran ini nantinya akan berguna
diimplementasikan sendiri, dalam data mining
dalam menentukan interesting association rules,
workbench yang dibangun juga diintegrasikan
yaitu untuk dibandingkan dengan threshold
implementasi algoritma Apriori oleh Christian
(batasan) yang ditentukan.
5
Borgelt (2003) yang sering diacu dan digunakan
memberikan gambaran tentang sistem yang
oleh peneliti di bidang algoritma data mining.
dibuat.
GOOGLE Google adalah plesetan dari kata 'googol', yang dipakai oleh Milton Sirotta, keponakan dari ahli matematika Amerika Edward Kasner, untuk menyebutkan angka 1 dan mempunyai 100 angka nol dibelakangnya. Google memakai kata ini dalam
menjelaskan
misi
perusahaan
untuk
mengorganisasi sedemikian banyaknya informasi Gambar 1. Blok Diagram Aplikasi Go ‘N Run.
yang tersedia di Internet dan didunia ini. Google adalah sebuah raksasa pencarian yang banyak diminati sebagai search engine
Go ’n Run nantinya akan terbagi menjadi 2
favorit. Google seolah telah menembus ruang
(dua) bagian, yaitu aplikasi yang berada di sisi
waktu di berbagai belahan dunia. Google
server sebagai penganalisis data, dan aplikasi
merupakan mesin pencari yang mempunyai nama
yang berada di setiap client baik yang terhubung
yang cukup populer di mata para pengguna
secara wired ataupun wireless local area network
internet
sangat
sebagai pengumpul data. Server dan Client akan
sederhana, tetapi mengandung kekuatan dan
berada dalam satu jaringan yang sama meskipun
multifungsi. Selain itu, web Google sangat
tersambung dari hub wired network dan wireless
lengkap
access point yang berbeda.
sedunia.
dan
Tampilan
hampir
Google
menampung
semua
perbendaharaan kata dalam berbagai bahasa di
Aplikasi client hanya akan memonitor aktivitas dari browser Internet Explorer. Setiap
seluruh dunia. Mesin pencari (search engine) merupakan
url yang diketikkan pada addressbar Internet
cara yang efektif untuk mencari informasi secara
Explorer akan dicatat dan kemudian dikirimkan
online berdasarkan kata kunci (keyword) yang
ke aplikasi server. Sebagaimana umumnya
dimasukkan. Dalam sistem database, hal itu
aplikasi yang berjalan secara client-server, maka
disebut sebagai query, merupakan sistematika
terlebih dahulu harus ditentukan IP address dari
bahasa operasi untuk melakukan pencarian data
server dan juga port yang digunakan sebagai
berdasarkan kedekatan dengan keyword yang
jalur komunikasi antara client dan server.
dimasukkan.
ANALISA SISTEM
Setelah
dilakukan
analisa
terhadap
sistem, langkah berikutnya perancangan sistem. Dimana dalam perancangan sistem ini dapat
6
Aplikasi client akan mencatat semua url yang diketikkan di addressbar Internet Explorer. Url
akan
disaring
sehingga
hanya
akan
didapatkan url yang berasal dari domain Google. Data url Google akan disaring ulang, hingga akhirnya akan didapatkan kumpulan kata kunci yang dicari oleh user. Secara
periodik
kata
kunci
akan
dikirimkan ke aplikasi server untuk kemudian disimpan. Sehingga data dapat dianalisa di kemudian hari sesuai dengan kebutuhan analisis
Gambar 2. System Flow Aplikasi Client. Agar Go ’N Run client dapat digunakan dengan
sempurna,
terlebih
dahulu
harus
ditentukan alamat IP server yang terpasang aplikasi Go ’N Run Server beserta port yang sedang aktif digunakan menerima kiriman paket keyword Google. Begitu konfigurasi jaringan sudah
dilakukan
dan
client
sudah
dapat
terkoneksi dengan server, pada startup aplikasi Go ’N Run client berikutnya setiap aktifitas keluar masuknya client ke sistem server akan
.Gambar 3. System Flow Aplikasi Server..
selalu dicatat di log server. Pencatatan ini berguna untuk membantu identifikasi client, sehingga dapat diketahui client mana saja (siapa saja) yang sedang online dan terhubung dengan
Agar Go ’N Run server dapat digunakan dengan
konfigurasi
jaringan
komunikasi dengan aplikasi server oleh pihak lain.
dahulu
harus
melayani kiriman paket keyword dari client. Kumpulan pola keyword pencarian yang
Fitur password dapat diaktifkan untuk pengubahan
terlebih
ditentukan port manakah yang digunakan untuk
aplikasi Go ’N Run server.
mencegah
sempurna,
telah terkumpul di server kemudian dilakukan analisa
dengan
memberikan
batasan
nilai
Minimal Support dan Minimal Confident. Daftar yang
dihasilkan adalah data yang memenuhi
7
persyaratan nilai Minimal Support dan Minimal
Minimal Support dan Minimal Confident. Aliran
Confident.
proses Market Basket Analysis yang diterapkan
User diberikan pilihan apakah daftar
akan tampak seperti pada gambar 4.
tersebut akan dicetak menjadi sebuah dokumen. Modul PDF Generator akan memproses daftar tersebut hingga dihasilkan sebuah file PDF yang memuat deskripsi singkat dari hasil analisis Market Basket Analysis, grafik frekuensi data, dan daftar kesimpulan analisis data. Di akhir proses user kembali diberikan pilihan,
apakah
file
PDF
tersebut
akan
didistribusikan atau tidak. Media email dipilih sebagai media distribusi berkas kepada pihakpihak terkait. Untuk mempermudah identifikasi user penerima email, terlebih dahulu bisa diisikan data user pada buku alamat email Go ’N Run Server. Algoritma Market Basket Analysis Proses terpenting pada aplikasi ini adalah penerapan metode Market Basket Analysis. Proses dimulai dengan pencatatan url dari
Gambar 4. Flow Chart MBA.
browser Internet Explorer. Dari url yang berhasil dicatat, hanya akan diambil url yang berasal dari domain Google. Dari daftar baru yang hanya berisi url dari Google, akan dipecah-pecah sehingga didapatkan pola keyword yang dicari
Desain DFD dalam sistem ini seperti dalam Gambar 5. Context diagram merupakan diagram pertama dalam rangkaian suatu DFD yang
menggambarkan
entitas-entitas
berhubungan dengan suatu sistem informasi.
oleh user.
Hostname
0 Raw URL
Serverport
Pola-pola keyword kemudian akan dipecah
Client User
Internet Explorer
Password
menjadi daftar keyword tunggal. Kemudian
Usedport AttachedReport
dibuat tabel tabulasinkeyword untuk mengetahui
yang
Departemen
Analisis Pola Keyword Pencarian pada Google Menggunakan Market Basket Analysis
Min_Support Min_Confident
PPTI
mailAddress
jumlah keyword yang ditemukan per pola
Original PDF Report
+
keyword yang ada. Dari tabel tabulasi dapat diketahui nilai support dan nilai confident dari
Gambar 5 Context Diagram Sistem Go ’n Run
tiap pola. Dengan membandingkan dengan batasan nilai
Minimal Support dan Minimal
Confident didapatkan daftar akhir pola keyword yang ber-asosiasi dan memenuhi batasan nilai
8
HASIL DAN PEMBAHASAN
UJI COBA DATA
Bahasa pemrograman yang digunakan
Perangkat keras yang dipergunakan pada
untuk melakukan implementasi adalah Microsoft
uji coba ini adalah komputer dengan prosesor
Visual Basic.NET. Tampilan awal aplikasi client
Intel Pentium IV Core2Duo 2.0GHz
dapat dilihat pada gambar 6.
memori sebesar 2048 MB. Sedangkan sistem
dengan
operasi yang dipergunakan adalah Windows XP Profesional Edition Service Pack 2. Pada uji coba yang akan dilakukan, digunakan 3 sumber data transaksional yang berbeda. Spesifikasi ketiga sumber data transaksional yang akan digunakan adalah seperti yang terlihat pada tabel 1. Tabel 1 Spesifikasi Data Uji Coba Data 1
Data 2
Data 3
∑ Item
15
15
15
∑ Transaksi
26
58
108
Pada uji coba ini, yang akan dilakukan adalah menjalankan perangkat lunak dengan parameter yang sama pada tabel yang berbeda. Sumber data yang akan digunakan ada 3 (tiga), yaitu: Data 1, Data 2, dan Data 3. Sedangkan parameter yang digunakan adalah minsup dan Gambar 6 Aplikasi Client
minconf. Nilai minsup yang akan dimasukkan
Dan tampilan awal aplikasi server dapat dilihat
adalah 0%, 25%, 50%. Sedangkan nilai minconf
pada gambar 7.
yang dimasukkan adalah 20%. Hasil uji coba untuk masing-masing tabel dapat dilihat pada tabel 2, tabel 3 dan tabel 4. Tabel 2 Hasil Uji Coba 1 menggunakan Data1 Min. Support
0
25
50
00:00:24
00:00:08
00:00:09
30
10
10
(%) Waktu Proses ∑ Kaidah Asosiasi
Gambar 7 Aplikasi Server
9
Tabel 3 Hasil Uji Coba 1 menggunakan Data2 Min. Support
0
25
50
00:01:51
00:01:42
00:01:55
208
44
44
(%) Waktu Proses ∑ Kaidah Asosiasi
Tabel 4 Hasil Uji Coba 1 menggunakan Data3 Min. Support
0
25
50
UJI DATA LAPANGAN Perangkat keras yang dipergunakan pada
(%) Waktu
Gambar 9 Grafik Support – Jumlah Pola Asosiasi
00:07:34
00:07:05
00:07:13
260
80
80
Proses ∑ Kaidah
uji lapangan ini adalah komputer dengan prosesor Intel Pentium IV Core2Duo 2.0 GHz
Asosiasi
dengan
memori sebesar 2048 MB. Sedangkan sistem operasi yang dipergunakan adalah Windows XP
Berdasarkan hasil pengujian yang telah
Profesional Edition Service Pack 2. Uji lapangan
dilakukan pada tabel uji coba maka dapat ditarik
ini dilakukan selama 2 minggu yaitu mulai
kesimpulan sementara hasil pengujian sebagai
tanggal 1 Agustus 2011 sampai dengan tanggal
berikut :
16 Agustus 2011.
1. Semakin banyak jumlah transaksi maka akan
Dari hasil uji lapangan diketahui bahwa
semakin banyak waktu yang diperlukan untuk
selama periode uji lapangan telah terjadi 897 kali
proses analisa Market Basket Analysis.
pola pencarian di websearch Google. Untuk
2. Semakin tinggi nilai Minimum Support maka
mengetahui
semua
aturan
asosiasi
yang
akan semakin memperpendek waktu yang
dihasilkan, proses analisa Market Basket Analysis
diperlukan untuk proses analisa Market
dilakukan dengan memberikan batasan minimum
Basket Analysis.
support sebesar 0% dan minimum confidence
3. Semakin tinggi nilai Minimum Support maka akan semakin sedikit jumlah kaidah asosiasi yang dihasilkan.
sebesar 0%. Dari proses analisa dihasilkan 796 aturan asosiasi User pencari kata (buku) juga mencari kata (blog) dengan nilai confidence tertinggi sebesar 97% dan nilai confidence terendah sebesar 1%. Untuk melakukan proses analisa ini diperlukan waktu selama hampir 3,5 jam (03:24:44).
Gambar 8 Grafik Support – Waktu Komputasi
10
KESIMPULAN
pihak-pihak terkait sebagai bahan masukan
1. Metode Market Basket Analysis dapat
pembuatan keputusan.
digunakan untuk menganalisa pola keyword pencarian pada Google. 2. Arsitektur
aplikasi
6. Contoh
menerapkan
informasi
yang
dihasilkan oleh aplikasi Keyword Patern Keyword
Patern
Searching Analyzer
ini adalah dapat
Searching Analyzer pada dasarnya terbagi
disimpulkan bahwa semakin tinggi nilai
menjadi 2 (dua) bagian utama, yaitu client
confident dari suatu pattern, semakin
side (aplikasi yang di-install di client) dan
banyak pula peminat pattern tersebut. Dan
server side (aplikasi yang di-install di
bila pattern tersebut diterapkan sebagai
server).
topik
3. Client side dapat mencatat url yang
diskusi
seminar/workshop,
dalam maka
sebuah diharapkan
diketikkan user pada Internet Explorer pada
semakin tinggi pula jumlah peserta yang
masing-masing client PC. Pada saat user
mengikutinya. Baik peserta dari kalangan
melakukan pencarian di Google, dapat
umum
diketahu pola keyword yang pernah dicari
akademik STIKOM Surabaya. Dengan
oleh user. Keyword dikirimkan ke server
demikian semakin baik pula image kampus
untuk kemudian dilakukan analisa lebih
STIKOM
lanjut oleh aplikasi pada server side.
masyarakat sekitar.
4. Server
side dapat menangkap semua
7. Pada
maupun dari kalangan
Surabaya
di
civitas
pandangan
analisa terhadap sejumlah data
kiriman pola keyword dari client yang
ditemukan bahwa semakin banyak data
terkoneksi di jaringan. Berdasarkan pola
yang dianalisa, waktu proses akan lebih
keyword yang telah terkumpul, aplikasi
lama karena semakin banyak pula frequent
server side dapat menemukan association
items dan rules yang dihasilkan.
rule dari keyword yang dicari oleh user
8. Pada
analisa terhadap sejumlah data
client di Google sesuai kebutuhan dengan
ditemukan bahwa semakin tinggi nilai
parameter
minimum support dan minimum confident
pembatas
berupa
minimum
support dan minimum confident. 5. Output dari aplikasi Keyword Patern
Searching Analyzer yang berupa informasi
yang ditentukan, semakin sedikit jumlah kaidah asosiasi yang dihasilkan yang dihasilkan.
mengenai keyword apa saja yang dicari secara bersamaan oleh pengguna search
DAFTAR RUJUKAN
engine Google, masih berupa laporan
Agrawal
umum. Daftar ini dapat didistribusikan ke
R, Srikant, R.(1994). Fast Algorithms for Mining Association Rules, Proceedings of the 20th International Conference on Very 11
Large Data Bases (VLDB), Santiago, Chile, pp. 487-499. Amanda Spink, Dietmar Wolfram, Bernard J. Jansen, and Tefko Saracevic. Searching the Web: the public and their queries. Journal of the American Society for Information Science and Technology, 52(3), 226-234, 2001.
Languages and Systems. 19 April 2002. Pace University. http://csis.pace.edu/csis/masplas/p8. pdf (diakses pada tanggal 9 Februari 2010) Wicaksono, Soetam Risky, 2005, Kuliah Interaksi Manusia dan Komputer, STIKOMP, Surabaya
Borgelt C. (2003). Efficient Implementations of Apriori and Eclat. Proceeding of the 1st IEEE ICDM Workshop on Frequent Item Set Mining Implementations (FIMI 2003, Melbourne, FL). CEUR Workshop Proceedings 90, Aachen, Germany. Cooley, R., Mobasher, B., & Srivastava, J. “Web mining: Information and pattern discovery on the world wide web”, 1997 Google.com. “Official Supported Domains”, http://www.google.com/supported_d omains (diakses pada tanggal 9 Februari 2010) Han, Jiawei, Micheline Kamber, “Data Mining: Concepts and Techniques”, Morgan Kaufmann, 2001 Han, Jiawei, Yongjian Fu, “Discovery Of Multiple-Level Association Rules From Large Databases”, IEEE Transactions On Knowledge And Data Engineering, Vol. 11, No. 5, September/October 1999 Jansen, B. J., & Spink, A., “An Analysis of Document Viewing Patterns of Web Search Engine Users”, 2003 Kantardzic, M. (2003). Data Mining Concepts Models, Methods, and Algorithms. New Jersey: IEEE. Ulmer, David; “Mining an Online Auctions Data Warehouse.” The Mid-Atlantic Student Workshop on Programming 12