Prediksi Kebutuhan Penomoran Pada Jaringan Telekomunikasi ……………………………………. (Muztafid Khilmi)
PREDIKSI KEBUTUHAN PENOMORAN PADA JARINGAN TELEKOMUNIKASI MENGGUNAKAN METODE APRIORI Mustafid Khilmi 1) Achmad Affandi2) 1) Program Studi Teknik Informatika, Fakultas Teknik - Undar 2) Jurusan Teknik Elektro ITS, Surabaya 60111, email:
[email protected] Abstrak Sektor telekomunikasi mengalami pertumbuhan yang sangat pesat baik dari sisi teknologi, struktur industri, nilai bisnis dan ekonomi, maupun dampaknya bagi kehidupan sosial, sehinga berdampak pada kebutuhan penomoran pada jaringan telekomunikasi yang selalu meningkat di tiap tahunnya, disisi lain penomoran adalah resorce yang terbatas dikarenakan ada aturan yang mengatur tentang penomoran, standart penomoran internasional mengacu pada standarisasi ITU-T E-164[1], Tujuan dari penelitian ini adalah untuk menguji hipotesa awal peneliti bahwa metode apriori mampu memberikan informasi hubungan antar item pada jaringan telekomunikasai tertentu. Kata Kunci: Algoritma Apriori, E-164
1. PENDAHULUAN Perkembangan teknologi jaringan telekomunikasi yang kian pesat mengarah kepada konvergensi teknologi yang pada akhirnya berdampak pada perubahan struktur industri telekomunikasi. Terdapat sejumlah latar belakang persoalan yang dihadapi oleh infrastruktur telekomunikasi Indonesia dalam menghadapi era konvergensi jaringan. Semakin berkembang nya teknologi maka semakin banyak juga service-service yang disediakan antara lain jasa komunikasi melalui suara, data, video, dll. Pertumbuhan industri telekomunikasi di Indonesia akhir-akhir ini dan dimasa mendatang berkembang dan meningkat secara signifikan. Kecenderungan tersebut akan lebih menggairahkan bagi para penyelenggara (operator) telekomunikasi untuk mengembangkan bisnisnya dan hal ini dapat memicu pertumbuhan bisnis turutan/pendukung (complementary) dan sektor-sektor lainnya karena apabila sarana dan prasarana telekomunikasi telah tersedia serta terus dikembangkan seiring dengan kebutuhan masyarakat, maka kebutuhan masyarakat dan sektor-sektor lainnya akan jasa telekomunikasi diharapkan dapat terpenuhi. Hal tersebut mengindikasikan bahwa kegiatan bisnis telekomunikasi akan terjadi lebih intens begitu juga sebaliknya sehingga terjadi hubungan timbal balik yang saling memperkuat antara sektor telekomunikasi dengan sektor bisnis lainnya. Laju pertumbuhan dan perkembangan industri telekomunikasi sangat dipengaruhi parameter dan faktor-faktor demografi dan ekonomis yang melingkupi sektor-sektor industri tersebut serta parameter tersebut secara langsung akan terkait dengan beberapa variable dominan antara lain : 1. Populasi penduduk yang akan menentukan ukuran pasar industri telekomunikasi 2. Jumlah Operator pada jaringan telekomunikasi 73
JURNAL INTAKE---- Vol. 2, Nomor 1, April 2011
Hingga akhir triwulan pertama 2009, Indonesia memiliki 8,4 juta sambungan telepon saluran tetap, 25,5 juta sambungan telepon tetap nirkabel (fixed wireless access) atau memiliki teledensitas sebesar 11,07%, dan 159,2 juta pelanggan untuk jaringan seluler[2]. Adapun pertumbuhan pemakaian jasa telekomunikasi dapat terlihat pada gambar 1.1 Dari grafik diatas maka dapat diambil informasi bahwa pada jaringan telepon tetap mengalami penurunan pelanggan dan pada jaringan telepon FWA (Fixed Wireles Accses) mengalami sedikit kenaikan berbeda dengan jaringan telekomunikasi seluler yang mengalami kenaikan yang cukup signifikan dari tahun ketahunnya. Disisi lain Di Indonesia sistem penomoran dan pengalamatan mengacu kepada Fundamental Technical Plan (FTP) Nasional 2000. Penomoran pada FTP ini memberikan pokok-pokok tentang pengaturan dan pengalokasian nomor untuk penyelenggaraan telekomunikasi yang berada di dalam lingkup nasional. Penyajiannya dititik-beratkan pada jasa teleponi dasar, baik yang melalui jaringan tetap maupun yang melalui jaringan bergerak, dan pada jasa yang bersifat nasional, dalam lingkungan multi-penyelenggara yang kompetitif [3]. Tujuan dari penelitian ini adalah untuk menguji hipotesa awal peneliti bahwa metode apriori bisa memberikan informasi tentang pola hubungan antar item pada transaksi di salah satu jasa penyelenggara telekomunikasi tertentu yang berhubungan dengan penggunaan atau pemakaian penomoran yang ada dalam jaringan telekomunikasi di Indonesia.
Gambar 1.1 Pertumbuhan pemakaian jasa telekomunikasi 2. DATA MINING Akhir–akhir ini, kemampuan sistem komputer dalam menghasilkan dan mengumpulkan data meningkat dengan pesat. Terlihat dari semakin banyaknya komputerisasi pada setiap transaksi bisnis dan pemerintahan, dan tersedianya perangkat keras penyimpan basis data yang dapat menyimpan data yang sangat besar sekali. Berjuta–juta basis data dihasilkan pada manajemen bisnis, administrasi pemerintahan, dan pada banyak aplikasi lainnya. Pesatnya perkembangan ukuran basis data dapat disebabkan karena kemampuan dari sistem basis datanya. Kondisi ini menimbulkan kebutuhan baru yang penting, yaitu : teknik baru yang melakukan proses transformasi dari basis data transaksional yang besar tersebut untuk mendapatkan informasi penting yang dibutuhkan. Sehingga Data Mining menjadi bahan riset yang penting sekarang ini. Teknik baru yang akan diteliti pada penelitian ini, yang akan digunakan untuk menggali kaidah asosiasi adalah metode Apriori.
74
Prediksi Kebutuhan Penomoran Pada Jaringan Telekomunikasi ……………………………………. (Muztafid Khilmi)
Metode Apriori yang akan digunakan ini mempunyai tujuan utama adalah untuk mencari maksimal frequent itemset (didapatkan juga frequent itemset yang tidak maksimal). Metode Apriori yang akan digunakan pada penelitian ini, mempunyai beberapa kelebihan: a. Menggunakan format data vertical tid-list yang mengasosiasikan itemset dengan transaksi yang terjadi. b. Menggunakan pendekatan apriori untuk mencari maksimal frequent itemset. c. Membutuhkan hanya sedikit pembacaan database, dan meminimalkan penggunaan I/O. Untuk beberapa simbol, ada beberapa yang harus diketahui [AGR-1993] : I adalah himpunan item, D adalah data transaksi, dimana setiap transaksi mempunyai ID unik (tid) dan terdiri dari beberapa item. Himpunan item disebut itemset. Sebuah itemset yang terdiri dari k item disebut k-itemset. Support dari itemset X, dinotasikan sebagai σ(X), adalah jumlah transaksi dimana X berada sebagai subset. Sebuah subset dari itemset yang mempunyai panjang k disebut k-subset. Itemset disebut maksimal bila bukan merupakan subset dari itemset lainnya. Itemset disebut frequent bila support-nya sama atau lebih besar dari support minimum (minsup) seperti yang telah ditentukan sebelumnya. Sebuah frequent k- itemset dinotasikan sebagai Fk. Kaidah asosiasi merupakan ekspresi A B, dengan A dan B adalah itemset. Support = σ(A ∪ B) … Confidence = σ(A ∪ B)/ σ(A)…
(1) (2)
Support dari suatu association ruleadalah proporsi dari transaksi dalam database yang mengandung A dan B [Larose, Daniel T. 2005]. Confidence adalah nilai probabilitas adanya itemset A pada suatu transaksi, maka juga ada itemset B pada transaksi tersebut. Kaidah disebut confidence bila nilai confidence-nya sama atau lebih besar dari confidence minimum (minconf) seperti yang telah ditentukan sebelumnya. Confidence dari association rule adalah ukuran ketepatansuatu rule, yaitu persentase transaksi dalam database yang mengandung A dan mengandung B [Larose, Daniel T. 2005]. Tugas dari Data Mining adalah untuk menghasilkan semua kaidah asosiasi pada suatu tabel transaksional, yang mempunyai nilai support lebih dari minsup. Kaidah tersebut juga harus mempunyai confidence yang lebih besar dari minconf. Tugas tersebut dapat diselesaikan dengan melakukan 2 tahap penting [AGR-1996], yaitu: a. Mencari semua frequent itemset, dan b. Mencari aturan asosiasi yang confidence. Langkah-langkah Proses Penghitungan Association Rule Proses perhitungan association rule terdiri dari beberapa tahap. 1. Sistem men-scan database untuk mendapatkan kandidat 1-itemset (himpunan item yang terdiri dari 1 item) dan menghitung nilai supportnya. Misalnya T adalah himpunan semua jenis ikan dalam database. Support dari suatu itemset (S) merupakan prosentase dari transaksi dalam T yang mengandung S. Kemudian nilai support tersebut dibandingkan dengan minimum support yang telah ditentukan, jika nilainya lebih besar atau sama dengan minimum support maka itemset tersebut termasuk dalam large itemset. 2. Itemset yang tidak termasuk dalam large itemset tidak diikutkan dalam iterasi selanjutnya (di prune) Pada iterasi kedua sistem akan menggunakan hasil large itemset pada iterasi pertama (L1) untuk membentuk kandidat itemset kedua (L2). Pada iterasi selanjutnya 75
JURNAL INTAKE---- Vol. 2, Nomor 1, April 2011
3. 4.
5. 6. 7. 8.
sistem akan menggunakan hasil large itemset pada iterasi sebelumnya (Lk-1) untuk membentuk kandidat itemset berikutnya (Lk). Sistem akan menggabungkan (join) Lk-1 dengan Lk-1 untuk mendapatkan Lk, seperti pada iterasi sebelumnya sistem akan menghapus (prune) kombinasi itemset yang tidak termasuk dalam large itemset. Setelah dilakukan operasi join, maka pasangan itemset baru dari hasil proses join tersebut juga dihitung supportnya. Proses pembentukan kandidat yang terdiri dari proses join dan prune akan terus dilakukan hingga himpunan kandidat itemsetnya null, atau sudah tidak ada lagi kandidat yang akan dibentuk. Setelah itu, dari hasil frequent itemset tersebut dibentuk association rule yang memenuhi nilai support dan confidence yang telah ditentukan. Pada pembentukan association rule, nilai yang sama seperti "sendok, garpu" = ="garpu, sendok", dianggap sebagai satu nilai. Association rule yang terbentuk harus memenuhi nilai minimum yang telah ditentukan. Untuk setiap large itemset L, kita cari himpunan bagian L yang tidak kosong. Untuk setiap himpunan bagian tersebut, dihasilkan rule dengan bentuk a (L - a) jika support (L) dan support (a) lebih besar dari minimum support. start
Kelompk Transaksi terpilih
1. Freq. Item Generation Pembangkitan Frequent Itemset
Apriori
2. Rule Generation 1. Closed Freq. Itemset 2. Max Freq. Closed
Penggalian Kaidah Asosiasi
Kelompk Transaksi terpilih
Finish
Gambar 2.1 Blok Diagram Association Rule.
76
Prediksi Kebutuhan Penomoran Pada Jaringan Telekomunikasi ……………………………………. (Muztafid Khilmi)
3. ANALISA DAN PENERAPAN ALGORITMA 3.1 Algoritma Apriori Untuk penerapan algoritma Apriori, secara umum dibutuhkan struktur data untuk menyimpan candidate frequent itemset untuk suatu iteraksi ke k dan untuk menyimpan frequent itemset yang dihasilkan. Ketika membaca tiap item dari seluruh transaksi, selain mendapatkan item-item baru juga dilakukan perhitungan nilai support item-item yang sudah ditemukan, sehingga untuk mendapatkan candidate 1-itemset beserta nilai support-nya cukup membutuhkan satu kali pembacaan data. Prinsip dari Algoritma Apriori adalah: 1. Kumpulkan jumlah item tunggal, dapatkan item besar. 2. Dapatkan candidate pairs, hitung => large pairs dari item-item 3. Dapatkan candidate triplets, hitung => large triplets dari item-item dan seterusnya. 4. Sebagai petunjuk: Setiap subset dari sebuah frequent itemset harus menjadi frequent. Apriori Pseudocode (1) L1 = {large 1-itemsets}; (2) for (k =2 ; Lk-1 ≠ Ø ; k ++) do begin (3) Ck = apriori-gen(L k-1); //New candidates (4) forall transactions t € D do begin (5) Ct = subset(Ck,t); //Candidates contained in t (6) forall candidates c € Ct do (7) c.count++; (8) end (9) Lk ={c € Ck|c.count ≥ minsup}; (10) end (11) Return = U kLk; Association rule dan algoritma Apriori Seperti yang telah disebutkan sebelumnya, assosiation rule mining mencari dan menemukan hubungan antar item yang ada pada suatu dataset. Program data mining dengan association rule bertujuan menemukan informasi item-item yang saling berhubungan dalam bentuk rule, dengan demikian association rule paling tepat diterapkan pada market basket analysis. Berikut adalah penjelasan yang lebih mendalam mengenai association rule. Jika diasumsikan bahwa semesta sebagai suatu kumpulan item yang tersedia di toko, maka setiap item memiliki boolean variable yang merepresentasikan keberadaan atau ketidakberadaan dari item tersebut. Setiap transaksi kemudian dapat direpresentasikan oleh suatu nilai boolean yang di berikan pada setiap variabel. Nilai boolean tersebut bisa dianalisa untuk pola belanja yang menunjukan item yang sering dibeli bersamaan. Pola tersebut dapat direpresentasikan dengan bentuk association rule. Sebagai contoh, konsumen yang biasanya membeli roti tawar juga membeli keju ditunjukan sebagai berikut : Produk A Produk B [support = 2%, confidence = 60%] Dalam pencarian association rule, diperlukan suatu variabel ukuran yang dapat ditentukan oleh user, untuk mengatur batasan sejauh mana dan sebanyak apa hasil output yang diinginkan oleh user. Support dan confidence adalah dua ukuran kepercayaan yang menunjukan kepastian dan tingkat kegunaan suatu rule yang ditemukan. Support 2% diatas menunjukan bahwa hasil analisa dari semua transaksi yang ada, menunjukan bahwa produk A dan produk B di beli 77
JURNAL INTAKE---- Vol. 2, Nomor 1, April 2011
secara bersamaan. Confidence 60% menunjukan bahwa 60% dari pembeli yang membeli produk A juga pasti membeli produk B tersebut. Pada umumnya association rule yang ditemukan di katakan menarik apabila rule tersebut memenuhi baik minimum support maupun minimum confidence yang telah di tentukan oleh user. Secara sederhana perhitungan untuk mendapatkan support dan confidence dapat dijelaskan sebagai berikut : Support (AB) = Jumlah tuples yang mengandung A dan B Confidence (AB) = Jumlah Tuples yang Mengandung AdanB
.
Jumlah Tuples yang Mengandung A
Keterangan : a. Tuples adalah jumlah transaksi b. A dan B adalah nama item Rule yang memenuhi baik minimum support maupun minimum confidence disebut juga strong rule. Seperti yang umum di tuliskan pada literatur-literatur mengenai data mining, support dan confidence dituliskan dengan nilai antara 0% sampai 100%, demikian pula pada tulisan ini. Sebuah set dari item disebut juga Itemset. Sebuah Itemset yang mengandung k items adalah k-Itemset. Set {produk A,produk B} adalah 2-Itemset. Jumlah kejadian munculnya Itemset adalah jumlah transaksi yang mengandung Itemset tersebut, atau disebut juga frequency, support count, atau count dari Itemset. Sebuah Itemset akan memenuhi minimum support (min_sup), jika jumlah kejadian munculnya Itemset tersebut lebih besar atau sama dengan min_sup yang telah ditentukan. Jika suatu Itemset memenuhi minimum support, maka Itemset tersebut disebut juga frequent Itemset. Suatu set dari frequent k-Itemset pada umumnya di notasikan dengan Lk. Langkah-langkah untuk melakukan penghitungan untuk menemukan association rule terdiri dari 2 langkah utama, yaitu : Langkah 1 : Temukan frequent Itemsets, yaitu; suatu set item yang memenuhi minimum support dan confidence yang telah ditentukan. Langkah 2 : Gunakan frequent Itemsets tersebut untuk menghasilkan association rules. Pada dua tabel berikut, dapat dilihat langkah-langkah untuk menemukan association rule, berdasarkan data yang terlihat pada tabel contoh data transaksi (tabel 1), sampai kepada tabel hasil proses pencarian association rule dengan metode apriori (tabel 2).
78
Prediksi Kebutuhan Penomoran Pada Jaringan Telekomunikasi ……………………………………. (Muztafid Khilmi)
Tabel 2. Tabel Hasil Proses Pencarian Association Rule dengan Metode Apriori
4.
HASIL DAN PEMBAHASAN Nantinya data yang akan diolah dari salah satu perusahaan penyelenggara jasa telekomunikasi GSM di Indonesia, data transaksi penjualan yang telah dilakukan dari berbagai daerah dan jenis produk, dimana data tersebut akan berupa data yang telah dirubah dalam bentuk denormal data. Sehingga memudahkan dan mempercepat proses pengujian pengolahan data mining yang akan dilakukan. Data informasi transaksi yang terjadi di perusahaan penyelenggara jasa telekomunikasi tersebut selama periode tertentu ini nantinya yang akan diolah oleh aplikasi data mining hingga menghasilkan informasi penjualan yang diinginkan. Berdasar data transaksi penjualan tersebut kemudian di buat pengelompokan semua kandidat ItemSet yang muncul, baik ItemSetC dan ItemSetL. Setelah muncul kandidat ItemSet yang ada maka dihitunglah perhitungan confidence berdasarkan perhitungan minimum support. Misalkan frequent Itemset ke-l = {I1,I2,I5}. Untuk mengetahui association rule yang bisa di hasilkan dari frequent Itemset ke-1 tersebut, maka harus dicari lerlebih dahulu subset dari frequent Itemset ke-l yang tidak kosong, yang adalah {I1,I2},{I1,I5},{I2,I5},{1},{2},{5}. Maka association rule yang dihasilkan ditampilkan sebagai berikut : 1. Rule 1 : I1 ^ I2I5, mempunyai tingkat confidence = 2/4 = 50% 2. Rule 2 : I1 ^ I5I2, mempunyai tingkat confidence = 2/2 = 100% 3. Rule 3 : I2 ^ I5I1, mempunyai tingkat confidence = 2/2 = 100% 4. Rule 4 : I1I2 ^ I5, mempunyai tingkat confidence = 2/6 = 33% 5. Rule 5 : I2I1 ^ I5, mempunyai tingkat confidence = 2/7 = 29% 6. Rule 6 : I5I1 ^ I2, mempunyai tingkat confidence = 2/4 = 100%
79
JURNAL INTAKE---- Vol. 2, Nomor 1, April 2011
Table. 3 Hasil Pengujian Pengujia Jml suppor Confiden rules n transaksi t ce 1 0 275 5% 2 25 181 3 50 117 23517 4 0 72 10% 5 25 59 6 50 37 Dari table.3 dapat diperoleh informasi bahwa nilai rule yang paling banyak adalah pada nilai support 5% dan nilai confidence 0%, dari rule tersebut maka didapatkan informasi sebagai berikut : Item daerah yang sangat berpengaruh dan memiliki nilai confidence yang tinggi adalah daerah surabaya dan produk yang memiliki pengaruh terhadap daerah adalah produk IM3 dengan jenis layanan postpaid artinya jumlah pemakaian nomor dari layanan tersebut adalah yang paling banyak terpakai pada layanan jaringan telekomunikasi pada operator tersebut jika pertumbuhan pamakaian jasa telekomunikasi terutama pada jaringan GSM maka jumlah penomoran yang harus digunakan juga smakin banyak. 5. KESIMPULAN Pada penelitian ini telah diimplementasikan algoritma association rules yaitu Apriori, dari hasil analisa dapat diambil beberapa kesimpulan sebagai berikut : Aplikasi mampu mengolah data transaksi yang disediakan oleh user, untuk menemukan frequent itemset dan association rule yang memenuhi syarat minimum support, berdasarkan item yang ada dalam transaksi dan mampu menampilkan rule. Pada analisa terhadap sejumlah data, ditemukan bahwa semakin kecil minimum support dan confidence yang ditentukan, semakin banyak pula rules yang dapat dihasilkan, dengan konsekuensi waktu proses pun akan lebih lama dibandingkan minimum support yang lebih besar. Algoritma ini hanya bisa memberikan informasi hubungan antar item saja tanpa bisa memberikan prediksi, perlu adanya penelitian lanjut untuk memperkirakan seberapa besar jumlah kebutuhan penomoran yang harus disiapkan oleh operator pada jaringan telekomunikasi terutama pada layanan teknologi GSM 6. DAFTAR P U S T A K A ITU-T Rec. E.164, “The International Public Telecommunication Numbering Plan,” Feb. 2005. ___________’ Ditjen Komunikasi dan Informasi , Data pertumbuhan pelanggan telekomunikasi ______’, Departemen Perhubungan’, Keputusan Menteri No. 4 Tahun 2001 tentang Fundamental Technical Plan Nasional 2000, tahun 2001 Hamilton. Apriori Algorithm, http://www2.cs.uregina.ca/~hamilton, diakses terakhir tanggal 11 Oktober 2006. Larose, Daniel T. 2005. Discovering Knowledge in Data. An Introduction to Data Mining. John Wiley & Sons. New Jers 80