Model Klasifikasi Trafik Untuk Jaringan 3G Menggunakan Metode Discriminant Analysis Fitri Puspitasari Putri, Mieke Yuliana, ST.MT, Ronny Susetyoko Ssi.Msi Jurusan Teknik Telekomunikasi - Politeknik Elektronika Negeri Surabaya Institut Teknologi Sepuluh Nopember (ITS) Surabaya Kampus PENS-ITS, Keputih, Sukolilo, Surabaya. Telp : +62+031+5947280; Fax. +62+031+5946011 Email :
[email protected] layanan 3G adalah 3 Mbps. Dengan kecepatan tersebut, pelanggan bisa menikmati aneka layanan baru, seperti video klip, film hingga televisi di ponsel, akses internet berkecepatan sangat tinggi, atau konferensi video. Elemen network dari UTMS/3G ini terdiri dari 3 bagian penting, yaitu Node B atau pada GSM lebih dikenal dengan sebutan BTS (Base Transceiver), RNC (Radio Network Controller) atau dikenal dengan BSC dan CN (Core Network).[1] Dengan perkembangan yang sedemikian rupa, trafik komunikasi menjadi semakin padat, atau dengan kata lain kebutuhan akan komunikasi sudah menjadi salah satu kebutuhan primer bagi manusia. Sedangkan kebutuhan akan komunikasi masyarakat setiap daerah tidak sama. Ada daerah yang sering menggunakan komuikasi seperti video call dan ada juga yang haya menggunakan telepon. Ada 2 metode yang dapat digunakan dalam mengklasifikasikan tipe RNC untuk setiap daerah, yaitu Cluster Analysis dan Discriminant Analysis. Pada proyek akhir ini penulis memilih metode Discriminant Analysis untuk mengklasifikasikan tipe RNC yang akan digunakan di profinsi Jawa Timur, karena pada metode ini dapat dilihat sejauh mana daya pengelompokkan responden dari berbagai dimensi menggunakan nilai acuan Cutting Score (m). Sehingga dapat diklasifikasikan suatu observasi akan termasuk ke dalam kelompok yang mana. II. Dasar Teori II.1. 3G Berdasarkan definisi yang disebutkan oleh ITU (International Telecommunication Union), teknologi seluler generasi ketiga (3G) adalah sebuah solusi teknologi nirkabel yang dapat memberikan kecepatan akses sebagai berikut: 144 Kbps pada kondisi bergerak cepat (mobile) 384 Kbps pada kondisi berjalan kaki 2 Mbps pada saat kondisi static di suatu tempat (user berada dalam keadaan diam) Arsitektur jaringan 3G dapat dilihat pada gambar di bawah ini:[2]
Abstrak Seiring berkembangnya teknologi dan permintaan pelanggan, salah satu provider GSM di Surabaya menyediakan sebuah layanan di mana para pelanggan dapat merasakan era baru industry telekomunikasi, yaitu layanan 3G (third generation). Para pelanggan dapat menikmati beberapa layanan 3G antara lain layanan suara, data dan video call. Minat masyarakat terhadap kehadiran 3G sangat tinggi, tetapi tidak pada semua daerah di Jawa Timur. Terutama untuk layanan video call hanya beberapa kabupaten saja yang antusias untuk menggunakan layanan tersebut. Hal ini dikarenakan biaya yang cukup mahal serta jaringan yang kurang baik khususnya di daerah pedesaan. Pada tugas akhir ini akan dilakukan klasifikasi untuk layanan data, suara, dan video call pada jaringan 3G untuk setiap kabupaten di Jawa Timur. Untuk itu dilakukan pengklasifikasian data yang sudah ada dengan menggunakan metode Discriminant Analysis. Dimana dengan metode ini akan diperoleh beberapa fungsi /kelompok yang mana masingmasing fungsi tersebut terdiri dari beberapa kabupaten yang nantinya akan dirancang dan dilihat dari hasil perhitungan fungsi tersebut kelompok mana yang lebih membutuhkan RNC (Radio Network Controller) 3G. Dari hasil pengujian pengelompokkan (Clustering) yang telah dilakukan dengan pemodelan menggunakan K-Means clustering dan pengelompokkan menggunakan Discriminant Analysis terihat hampir 50% lebih kabupaten di Jawa timur masih sering meggunakan voice daripada video, hal ini ditunjukkan dengan dominannya kelompok pengguna voice hampir di semua kabupaten sedangkan pengguna video hanya terdapat pada beberapa kota besar di Jawa Timur. Kata kunci: 3G, Trafik, K-Means Clustering,Discriminant Analysis I. PENDAHULUAN Layanan 3G pada dasarnya adalah layanan seluler dengan transfer data berkecepatan sangat tinggi. Kecepatan transfer minimal
1
menyebabkan Java merupakan bahasa pemrograman yang fantastis untuk beberapa platform (Windows, Macs, Linux, dll). II.4 K-Means Clustering K-Means merupakan metode klasterisasi yang paling terkenal dan bayak digunakan di berbagai bidang karena sederhana, mudah di implementasikan, memiliki kemampuan mengkluster data yang besar, mampu menangani data outier dan kompleksitas waktunya linier O(nKT) dengan n adalah jumlah dokumen, K adalah jumlah kluster, dan T adalah jumlah iterasi. K-means adalah metode pengklusteran secara partitioning yang memisahkan data ke dalam kelompok yag berbeda. Dengan portioning secara iterative, K-Means mampu meminimalkan rata-rata jarak setiap data ke klasternya. Seperti yang kita ketahui bahwa metode K-Means ini menggunakan nilai ratarata yang diambil dari setiap kluster. Maka berikut adalah cara bagaimana K-Means menghitung rata-rata dari setiap kluster:[4] Ck = mean (Anggotak) Dimana: Ck = nilai rata-rata dari kluster K Anggotak = semua anggota dari kluster K II.5 Discriminant Analysis
Gambar 2.1 Arsitektur 3G II.2. Trafik Intensitas traffic menyatakan jumlah ratarata dari panggilan-panggilan yang terjadi secara bersama-sama selama selang waktu tertentu. Intensitas trafik dapat diperoleh dengan mengalikan jumlah panggilan per waktu pengamatan dengan rata-rata waktu pendudukan.[3] A = y x h….………….(1) Keterangan: • A adalah Intensitas traffic • Y adalah jumlah panggilan per satuan waktu pengamatan • h adalah mean holding time II.3. Java Java adalah suatu bahasa pemrograman komputer. Bahasa pemrograman yang berorientasi objek. Dikenal sebagai salah satu bahasa pemrograman tingkat tinggi yang dipopulerkan oleh Sun Microsystem pada tahun 1995 dan bisa diaplikasikan pada peralatan mobile untuk dapat berkomunikasi dengan peralatan mobile yang lain. Bahasa pemrograman Java dirancang agar seorang programmer komputer dapat mengimplementasikan program yang telah dibuat pada komputer lain meskipun kedua komputer tidak memiliki kesamaan. Dibandingkan dengan bahasa pemrograman lain, seperti C++, kode yang sama akan diartikan berbeda pada mesin yang lain. Program di Windows tidak akan bekerja pada Mac. Tapi hal ini tidak berlaku untuk pmerograman Java. Ini disebabkan Java disebut juga sebagai Java Virtual Machine. JVM seperti layaknya komputer virtual yang berjalan pada mesin. Ini bisa diartikan bahwa terdapat komputer yang berjalan dalam komputer yang digunakan untuk menjalankan program Java. Secara harfiah, JVM adalah komputer virtual yang dijalankan dengan menjalankan program Java. Karena mesin virtual ini sama dengan komputer yang telah terinstal Java, setiap program Java akan bekerja pada semua komputer tersebut. Ini
Apabila dari dua kelompok objek yang dapat disebut sebagai klas objek, misalnya 1 dan 2 dapat dilakukan pengukuran dengan mengambil p buah descriptor maka akan dimiliki p buah variable random yang dapat ditlis sebagai X=[X1, X2,…,Xp]. Nilai X hasil pengukuran akan berbeda untuk satu kelas dengan kelas yang lain, sehingga dapat dianggap bahwa hasil pengukuran dari kelas pertama sebagai x dari kelompok 1 dan hasil pengukuran dari kelas kedua sebagai x dari kelompok 2. Dengan demikian 2 populasi tersebut dapat di deskripsikan oleh dua fungsi probabiitas f1(x) dan f2(x). Untuk 2 populasi, metode Fisher untuk memisahkan 2 populasi tersebut adalah dengan transformasi observasi multivariate x ke univariate y sedemikian sehingga nilai-nilai y yang diturunkan dari populasi kelompok 1 akan terpisah dari nilai-nilai y yang diturunkan dari populasi kelompok 2. Jika dinotasikan µ 1Y sebagai mean dari Y yang berasal dari X terkait dengan kelompok 1 dan µ 2Y sebagai mean dari Y yang berasal dari X terkait dengan kelompok 2 dan didefinisikan: µ 1 : nilai rata-rata dari kelompok 1 µ 2 : nilai rata-rata dari kelompok 2 2
Gambar berikut merupakan flowchart dari pengklusteran kelompok.
dan dianggap bahwa matrik kovarian ( ∑ ) : 11 12 ∑= 21 22 Untuk mencari nilai 11, 12, 21, dan 22 dapat dihitung menggunakan rumus sebagai berikut:
START
Menentukan centroid awal
∑( µ ,)
= Dimana: merupakan standar deviasi. Selanjutnya sebagai alat klasifikasi dapat menggunakan rumus:
Hitung jarak centroid T
-1
Y=µ ∑ X
T
Dimana: Y = fungsi diskriminan µ T = rata-rata dari kelompok ∑-1 = invers dari nilai kovarian XT = hasil transpose dari data Persamaan diatas merupakan nilai fungsi diskriminan untuk observasi X dan untuk menghitung nilai rata dari data tersebut dapat menggunakan rumus:[5]
Menentukan cluster suatu data
Menentukan posisi baru berdasarkan rata-rata data
m = (1/n) (µ 1Y + µ 2Y) dimana: m = nilai tengah mean data, Setelah dihitung nilai m maka dapat ditentukan berdasarkan nilai m dengan ketentuan sebagai berikut: Y ≥ m atau Y < m Dengan kata lain X berasal dari populasi kelompok 1 jika Y lebih besar dari m dan dari kelompok 2 jika Y lebih kecil dari m. III.1 PERANCANGAN SISTEM Tahap-tahap dalam melakukan Discriminant Analysis 1. Kluster kelompok Langkah awal yang harus dilakukan sebelum melakukan analisis diskriminan adalah melakukan pengklusteran data yang telah ada menjadi 2 kelompok. Dimana untuk melakukan pengelompokkan tersebut menggunakan metod K-Means Clustering, dan berikut ini algoritma dari metode tersebut: 1. Tentukan nilai K centroid (titik pusat kluster) awal secara random. 2. Hitung jarak setiap data ke masingmasing centroid. 3. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya. 4. Tentukan posisi centroid baru dengan cara menghitung nilai rata-rata dari data-data yang memilih pada centroid yang sama. 5. Kembali ke langkah 2 jika posisi centroid baru dengan centroid yang lama tidak sama.
Apakah Posisi tidak sama dengan centroid
Y
T END
Gambar Flowchart Cluster kelompok Tahap-tahap dalam melakukan Discriminant Analysis Kluster kelompok Langkah awal yang harus dilakukan sebelum melakukan analisis diskriminan adalah melakukan pengklusteran data yang telah ada menjadi 2 kelompok. Dimana untuk melakukan pengelompokkan tersebut menggunakan metod K-Means Clustering, dan berikut ini algoritma dari metode tersebut: 1. Tentukan nilai K centroid (titik pusat kluster) awal secara random. 2. Hitung jarak setiap data ke masingmasing centroid. 3. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya. 4. Tentukan posisi centroid baru dengan cara menghitung nilai rata-rata dari 3
menjadi dua kelompok ini didapat dari hasil rata-rata pada tahun 2010. Tabel 4.1 Hasil perhitungan K-Means Clustering Tahun 2010
data-data yang memilih pada centroid yang sama. 5. Kembali ke langkah 2 jika posisi centroid baru dengan centroid yang lama tidak sama. Gambar berikut merupakan flowchart dari pengklusteran kelompok. START
Menentukan centroid awal
Hitung jarak centroid
Tabel 4.6 berikut ini merupakan hasil pengelompokkan pada bulan januari. Tabel 4.6 Hasil Pengklusteran Bulan Januari
Menentukan cluster suatu data
Menentukan posisi baru berdasarkan rata-rata data
Apakah Posisi tidak sama dengan centroid
Y
T Pada tabel diatas dapat dilihat bahwa nilai M yang diperoleh adalah -0.4326, dari nilai M tersebut dapat ditentukan kelompok untuk setiap kabupaten,dimana untuk kelompok satu diperoleh dengan nilai Y ≥ M dan diperoleh hasil jumlah kelompok satu adalah 10 kabupaten yaitu Bangkalan, Blitar, Bojonegoro, Jombang, Kota Mojokerto, Madiun, Magetan, Mojokerto, Pacitan, dan Pameksan dengan jumlah rata-rata untuk voice trafik sebesar 236,9282 dan jumlah rata-rata video trafik 14,4187. Sedangkan nilai Y ≤ M masuk kedalam kelompok dua dengan jumlah kabupaten sebesar 5 kabupaten yaitu Banyuwangi, gresik, Jember, Malang, dan Sidoarjo. Hasil rata-rata nilai voice trafik untuk kelompok dua adalah 1690.035 dan untuk video trafik adalah 75.0162. Dari hasil rata-rata tersebut maka dapat disimpulkan bahwa
END
Gambar 3.3 Flowchart Cluster kelompok IV. ANALISA IV.1. Analisa perhitungan menggunakan metode Discriminant Analysis Pengujan kali ini dilakukan pada kabupaten Bangkalan, Banyuwangi, Blitar, Bojonegoro, Gresik, Jember, Jombang, Kota Mojokerto, Madiun, Magetan, Malang, Mojokerto, Pacitan, Pamekasan, dan Sidoarjo. Sebelum melakukan pengklasifikasian kabupaten di tahun 2011 menggunakan metode Discriminant Analysis, terlebih dahulu melakukan pemodelan kluster menggunakan K-Means clustering. Untuk pemodelan KMeans sendiri menggunakan data pada tahun 2010, dimana data untuk mengelompokkan 4
kelompok dua nilai voice dan video lebih besar dibanding kelompok satu. Dan gambar dibawah ini merupakan grafik dari hasil pengelompokkan.
Dari hasil rata-rata tersebut maka dapat disimpulkan bahwa kelompok dua nilai voice dan video lebih besar dibanding kelompok satu. Dan gambar dibawah ini merupakan grafik dari hasil pengelompokkan.
Gambar 4.21 Grafik bulan januari
Gambar 4.21 Grafik bulan februari
Tabel 4.7 berikut ini merupakan hasil pengelompokkan pada bulan februari. Tabel 4.7 Hasil Pengklusteran Bulan Februari
V. PENUTUP 5.1 Kesimpulan Berdasarkan analisa dari beberapa pengujian yang diterangkan pada bab sebelumnya, maka dapat diperoleh kesimpulan bahwa terihat hampir 50% lebih kabupaten di Jawa timur masih sering meggunakan voice daripada video, hal ini ditunjukkan dengan dominannya kelompok pengguna voice hampir di semua kabupaten sedangkan pengguna video hanya terdapat pada beberapa kota besar di Jawa Timur. 5.2 Saran Beberapa saran yang dapat dipertimbangkan untuk pengembangan pada proyek akhir di masa mendatang: 1. Percobaan dapat dilakukan dengan menambah jumlah data untuk tahuntahun berikutnya agar dapat terlihat penggunaan voice dan video. 2. Untuk melakukan clustering bisa menggunakan beberapa metode untuk membandingkan antara metode lainnya.
Pada tabel diatas dapat dilihat bahwa nilai M yang diperoleh adalah -2.0294, dari nilai M tersebut dapat ditentukan kelompok untuk setiap kabupaten,dimana untuk kelompok satu diperoleh dengan nilai Y ≥ M dan diperoleh hasil jumlah kelompok satu adalah 7 kabupaten yaitu Banyuwangi, Bojonegoro, Gresik, Jember, Kota Mojokerto, Madiun,dan Mojokerto dengan jumlah ratarata untuk voice trafik sebesar 632.5464 dan jumlah rata-rata video trafik 26.32986. Sedangkan nilai Y ≤ M masuk kedalam kelompok dua dengan jumlah kabupaten sebesar 8 kabupaten yaitu Bangkalan, Blitar, Jombang, Magetan, Malang, Pacitan, Pamekasan, dan Sidoarjo. Hasil rata-rata nilai voice trafik untuk kelompok dua adalah 798.9538 dan untuk video trafik adalah 41.871.
VI. DAFTAR PUSTAKA [1] Zacharias JM, Arsitektur GSM, MobileIndonesia, 2005. [2] Mike Yuliana, “Responding User Input (Event Handling)”,Modul Ajar, PENSITS, 2007. [3] Mike Yuliana, “GUI dengan Netbeans”, Modul Ajar, PENSITS,2007. [4] Aang Kunaifi, “Klasifikasi Email Berbahasa Indonesia Menggunakan Text Mining Dan Algoritma K-Means”, Proyek Akhir, PENS-ITS, 2009. [5] Ali Ridho Barakbah, “Clustering”, Modul Ajar, PENS-ITS, 2006.
5
[6] Joko Prasetyo, “Clustering Fitur Suara Vokal Pada Bahasa Indonesia Menggunakan Metode K-Means”, Proyek Akhir PENS-ITS, 2009. [7] Johnson RA and Wichern DW, Applied Multivariate Statistical Analysis, third edition, Prentice Hall, 1992.
6
7