1
APLIKASI TEXT MINING PADA TROUBLE TICKET SYSTEM MENGGUNAKAN METODE KLASTERING (STUDI KASUS: PT. TELEKOMUNIKASI INDONESIA DIVISI CONSUMER SERVICE TIMUR UNIT PELANGGAN KONSUMER) Dedi Apriyanto dan Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri, Institut Teknologi Sepuluh Nopember (ITS) Jl. Raya ITS, Sukolilo, Surabaya 60111 E-mail:
[email protected],
[email protected]
Abstrak — Di dalam dunia industri saat ini, service penting dalam hubungan antara produsen dan customer, baik itu pada industri manufaktur dan terlebih pada industri jasa. “Speedy” sebagai salah satu penyedia produk layanan internet (produk setengah barang dan setengah jasa), harus memiliki service quality yang bagus untuk menjaga dan meningkatkan kepuasan pelanggan. Dengan kondisi dimana persaingan antar penyedia jasa layanan internet yang sangat ketat, proses pelayanan harus diatur dengan baik untuk meminimalkan keluhan pelanggan. Pada kenyataannya terdapat banyak variabel yang dapat memicu munculnya keluhan pelanggan seperti variasi produk, variasi fitur, luasnya coverage, kompleksitas konfigurasi, variasi media akses dan terminal, serta customer knowledge, sehingga kemampuan untuk menciptakan sebuah service system yang dapat memberikan feedback, dan penanganan terhadap keluhan customer akan sangat mempengaruhi loyalitas customer terhadap sebuah produk layanan internet yang ditawarkan. PT. Telekomunikasi Indonesia merespon kondisi ini dengan menyediakan suatu layanan Customer Care Center untuk mengantisipasi adanya customer churning dan menjaga customer satisfaction level dengan menyediakan sistem dimana pelanggan dapat dengan bebas menyampaikan keluhannya. Data keluhan dan gangguan tersebut akan disimpan dalam sebuah database yang memanfaatkan Trouble ticket System. Saat ini pemanfaatan data pada database Trouble ticket System menjadi kurang maksimal karena tidak semua data diproses untuk dijadikan sebuah informasi dalam pengambilan keputusan. Penelitian ini akan mengolah data tidak terstruktur (free text) yang tidak bisa diproses secara langsung menggunakan statistik deskriptif dengan menggunakan pendekatan Data Mining khususnya Text Mining dengan metode Clustering. Dengan Text Mining ini diharapkan seluruh informasi yang terdapat dalam database Trouble ticket System pada Telkom dapat digali untuk kemudian bisa dijadikan dasar pengambilan keputusan dalam menetapkan kebijakan pelayanan terhadapat pelanggan terutama untuk menanganan keluhan dan gangguan secara efektif dan efisien. Kata kunci: service quality, Customer Care Center, Trouble ticket System, Text Mining, Clustering
I. PENDAHULUAN
K
emampuan perusahaan di dalam marketing dan strategi
pelayanan yang diberikan akan sangat mempengaruhi pelanggan untuk berlangganan atau berhenti berlangganan dan memutuskan untuk memilih produk yang lain. BMC Churn Index Survey (2008) menunjukkan bahwa alasan utama pelanggan berganti provider 43% diakibatkan oleh tidak cukup baiknya tanggapan dalam pemecahan masalah atau dalam hal ini penanganan problem layanan. Kenyataannya terdapat terdapat banyak variabel yang dapat menyebabkan munculnya keluhan pelanggan seperti luasnya coverage, kompleksitas konfigurasi, variasi media akses dan terminal, serta customer knowledge. Sehingga kemampuan untuk menciptakan sebuah service system yang dapat memberikan feedback, dan penanganan terhadap keluhan customer akan sangat mempengaruhi loyalitas customer terhadap sebuah produk telekomunikasi. PT. Telekomunikasi Indonesia (Telkom) sangat mengerti pentingnya sebuah service system yang baik untuk di dalam penanganan keluhan customer. Hal ini diwujudkan dengan dibentuknya Divisi Consumer Service (DCS) yang menjadi wadah untuk menampung segalah keluhan pelanggan dan berfungsi sebagai Customer Care Service. Frontier (2007) menyatakan bahwa pada aspek Fault Handling pada Customer Care Center Telkom yang dinyatakan dalam 9 Quadrant Analysis, terdapat 3 kuadran kritis yang harus diperbaiki. Kuadran tersebut terletak pada tingkat kepentingan yang tinggi dan tingkat kepuasan yang rendah. Ketiga kuadrant tersebut adalah: 1. Kesesuaian lama penanganan gangguan dengan yang dijanjikan. 2. Penginformasian penyebab gangguan. 3. Setelah diperbaiki gangguan tidak terjadi berulang dengan penyebab yang sama. Di sisi lain banyak tools dan sistem yang dimanfaatkan sebagai sarana untuk meningkatkan kualitas penanganan keluhan, salah satunya adalah Trouble ticket System. Trouble ticket System merupakan sebuah sistem berbasis teknologi informasi yang membantu operator dalam penanganan keluhan/gangguan. Divisi Consumer Service telah menggunakan Trouble ticket System dengan mengoperasikan Telkom Trouble ticket Online (T3 Online). Namun saat ini
2 pihak manajemen belum memanfaatkan database ini dengan baik untuk mendapatkan suatu informasi yang bermanfaat untuk meningkatkan service quality. Salah satu pendekatan untuk mengatasi permasalahan analisa database T3 Online ini adalah dengan menggunakan teknik Data Mining terutama untuk data berupa teks atau yang biasa disebut dengan Text Mining. Data Mining, sering juga disebut Knowledge Discovery in Database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari Data Mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan (Santosa, 2007) II. METODE PENELITIAN A. Pengumpulan Data Tahap pengumpulan data dimulai dengan tahap collecting data actual dari PT. Telkom. Data diambil dari data historis Trouble ticket Telkom untuk “Speedy” bulan Mei 2013 dan didapatkan sebanyak 18.095 data dimana setiap data terdiri dari 20 field, mulai dari Nomor Ticket, Nomor Speedy, Headline, Divre, Datel, Open By, Open By UserID, Close By, Close By UserID, Segment Ggn, Sub Segment Ggn, Symton_Awal, Penyebab, Rekomendasi, TTR, Response Time, Jenis, Open Time, Close Time, dan Tiket. Deskripsi setiap field ditunjukkan pada Tabel 1. Proses selanjutnya adalah cleaning data. Ceaning data dilakukan untuk menghilangkan data yang tidak lengkap dalam suatu Trouble ticket. Selain itu cleaning juga dilakukan untuk menghilangkan ticket ganda yang memiliki isi yang sama. Proses cleaning ini dilakukan secara manual dengan bantuan Software Office Excel untuk menemukan indikasi data yang harus dihilangkan. Setelah itu dilakukan data preparation. Data preparation merupakan tahapan untuk mengolah data menjadi siap untuk digunakan. Dari 20 field yang ada hanya diambil beberapa field yang merepresentasikan sebuah Trouble ticket. Field tersebut adalah Headline, Segmentasi Gangguan, Sub Segmentasi Gangguan, Data Teknis Keluhan, Penyebab, dan Rekomendasi. Data Teknis Keluhan, Penyebab, dan Rekomendasi merupakaan data free text yang merupakan data utama pada penelitian ini B. Pemodelan Pemodelan dilakukan untuk mengubah data aktual berupa teks menjadi bentuk kuantitatif yang nantinya akan diproses menggunakan metode Klastering. Tahap pemodelan diawali dengan proses filtering yang terdiri dari 3 proses. 1) Proses stemming adalah proses mengurangi jumlah kata kunci dengan mengelompokkan pada akar kata yang ditentukan. Misalnya : “maintenance”, “maint”, “maintain”, “menten”, “pemeliharaan” menjadi ”pemeliharaan”. Stemmer pada umumnya menggunakan Porter’s Stemmer, namun saat ini telah ada stemmer bahasa Indonesia. Sesuai dengan kondisi saat penelitian maka proses stemming dilakukan secara
Tabel 1 - Deskripsi Field Data Historis T3 Online NO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
FIELD Nomor Ticket Nomor Speedy Headline Divre Datel Open By Open By UserID Close By Close By UserID Segment Ggn Sub Segment Ggn Symptom_Awal Penyebab Rekomendasi TTR Response Time Jenis Open Time Close Time Ticket
JENIS FIELD Fixed: Otomatis Fixed: Otomatis Free text Fixed: Drop Down Fixed: Drop Down Free text Free text Free text Free text Fixed: Drop Down Fixed: Drop Down Free text Free text Free text Fixed: Otomatis Fixed: Otomatis Fixed: Drop Down Fixed: Otomatis Fixed: Otomatis Fixed: Drop Down
KETERANGAN Nomor ticket, bersifat unique Nomor Speedy, bersifat unique Judul tiket, nomor speedy, segmen, identitas pelanggan Lokasi layanan/pelanggan (Divisi) Lokasi layanan/pelanggan (Daerah) Petugas yang mengisi open ticket ID Petugas yang mengisi open ticket Petugas yang mengisi close ticket ID Petugas yang mengisi close ticket Letak/penyebab gangguan Detil letak/penyebab gangguan Data keluhan yang dirasakan oleh pelanggan Data laporan penyebab gangguan Data rekomendasi perbaikan yang dilakukan Waktu rata-rata penyelesaian gangguan Waktu penyelesaian gangguan Kategori pelanggan Waktu entry data open ticket Waktu entry data close ticket Kategori ticket
Tabel 2 - Ilustrasi Hasil Filtering NO_TICKET
S.0514.10652
S.0513.06625
SUMMARY TICKET Speedy 152303233792 / LIEM ANDREAS ANDRIANTO [Ptgs-Roby / 03172021592] MODEM ZTE RUSAK / CEK DG MODEM TEST OK / / YBS AKAN GANTI SENDIRI MODEM / ONT MODEM / ONT RUSAK Tidak Bisa Browsing SIGNAL SWITCH Speedy 152301207490 / ARIANTO Gangguan [ptgs:Desna-reset dslam dan cek modem error reset modem speedy sdh ok -cp p antoni] DSLAM Tidak Bisa Connect SOFTWARE RUSAK MAINTENANCE
SUMMARY TICKET AFTER STEMMING Proses Modem Ont Modem Ont Rusak Tidak Bisa Browsing Signal Switch
Proses Jaringan Tidak Bisa Connect Software Rusak Maintenance
manual dengan membuka kemungkinan penggunaan kombinasi bahasa Indonesia dan bahasa Inggris sesuai dengan kebiasaaan dan kemudahan dalam penerimaan. 2) Removal of low frequence words, yaitu ticket dengan frekuensi kata yang sedikit akan dibuang karena tidak mewakili klasifikasi secara signifikan. 3) Removal of ir-relevant words, dimana dalam penelitian ini kata-kata yang tidak diperlukan atau yang tidak menjadi inti trouble ticket akan dihilangkan. Ilustrasi hasil filtering ditunjukkan pada Tabel 2. Selanjutnya tahap pemodelan akan membutuhkan sekumpulan kata kunci yang berfungsi sebagai atribut dan digunakan untuk merepresentasikan suatu trouble ticket. Kata kunci/keywords yang dipilih terkait dengan keluhan pelanggan, problem yang dirasakan, kejadian di lapangan, jenis-jenis bagian dalam layanan (infrastruktur) , kegiatan yang dilaksanakan dalam perbaikan di lapangan, lokasi gangguan, hasil perbaikan sesuai laporan petugas, dan kemungkinan analisa petugas Telkom. Keywords kemudian akan dipadukan dengan data trouble ticket menjadi sebuah matriks biner. Matriks biner merupakan matriks yang menunjukkan hubungan keterkaitan antara Trouble ticket dengan keywordss. Binary matriks ini terdiri dari baris yang menunjukkan jumlah Trouble ticket yang akan diwakili oleh variable Y serta kolom yang menunjukkan keywords yang diwakili oleh variable X. Angka 1 merepresentasikan bahwa keywords tersebut disebutkan atau ada di dalam Trouble ticket. Ilustrasi matriks biner ditunjukkan pada Tabel 3.
3
Pada penelitian ini akan dipakai pembobotan Document Frequency seperti yang dilakukan oleh Medem dkk. Pembobotan seperti ini merujuk pada ketentutan dimana 1 Trouble ticket mewakili keywords apa saja, sehingga nantinya pembobotan menunjukkan jumlah frekuensi dari keywords. Selain itu pada tahap ini juga dilakukan eliminasi keywords yang memiliki jumlah nilai 0 pada binary matriks, artinya keywords tidak dimiliki oleh trouble ticket. Dari tahap ini yang semula ada 121 keywords tereduksi menjadi hanya 99 keywords. Ilustrasi hasil binary matrix dan DF matrix ditunjukkan pada Tabel 3 dan 4.
Tabel 3 - Ilustrasi Hasil Binary Matrix
1
S.0524.12863
2
S.0523.14096
3 …
S.0523.07099
Gangguan Jaringan Lokal Dp Intermitten Putus-Putus Gangguan Network Ringan Restart Gangguan Jaringan Lokal Kabel Sekunder Petugas Diminta Datang Hardware Rusak Ganti Hardware Gangguan Policy Management Service Profile Pelanggan Captive Portal Server Down Sementara Reboot
Gangguan Bukis Isolir Isolir Tunggakan Tidak Bisa Browsing Crash Ganti
Website
2
120
121
Kabel
1
Online
SUMMARY TICKET
Power
NO_TICKET
Modem
Untuk membut perbedaan/dissimilarity antar setiap trouble ticket menjadi signifikan maka matrik kemudian dibobotkan. Medem dkk (2008) merujuk pada Salton dan Buckley (1998) yang memberikan 4 skema pembobotan untuk document clustering, yaitu : 1. Term Frequency (TF ): yaitu banyaknya kata kunci yang muncul dalam setiap Trouble ticket. 2. Document Frequency (DF): yaitu banyaknya Trouble ticket yang mengandung satu kata kunci 3. Inverse Document Frequency (IDF) 4. TF x IDF
3…
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
8,220
1,306
2,419
18067 S.0501.15152 18068 S.0501.14477
18069 S.0430.00712
Gangguan Cpe Restart Modem Tidak Bisa Connect Catu Daya Replace Gangguan Cpe Aplikasi Pc Pelanggan Captive Portal Aplikasi Down Maintenance Gangguan Cpe Restart Modem Tidak Bisa Browsing Gangguan Teknis Pusat Ganti
18070 S.0501.12037
D. Analisis dan Interpretasi Pada tahap analisis dan interpretasi ini akan dilakukan analisis terkait hasil dari pengolahan yang dilakukan. Analisis dilakukan untuk mengetahui hasil dari Clustering keluhan Speedy yang terjadi pada Telkom Regional V pada Mei 2013. Setelah selesai tahap analisis, akan dilakukan penarikan kesimpulan terkait hasil pengolahan data yang dilakukan. Setelah itu akan diberikan saran-saran yang dapat dijadikan sebagai rekomendasi untuk acuan penelitian selanjutnya E. Penarikan Kesimpulan Tahap penarikan kesimpulan merupakan tahapan terakhir dari penelitian tugas akhir yang dilakukan. Tahap penarikan kesimpulan berisi tentang kesimpulan yang didapatkan berdasarkan pengolahan data, analisis, dan interpretasi yang telah dilakukan, serta saran terkait hasil dari penelitian juga diberikan untuk memberikan rekomendasi perbaikan terhadap ruang lingkup penelitian yang dilakukan.
TOTAL
26
354
Tabel 4 - Ilustrasi Hasil DF Matrix KEYWORDS
Gangguan Jaringan Lokal Dp Intermitten PutusPutus Gangguan Network Ringan Restart
Website
SUMMARY TICKET Power
Online
NO_TICKET
Modem
C. Pengolahan Data Tahap pengolahan data dilakukan menggunakan Software Matlab R2010a. Pada tahap ini akan diaplikasikan teknik Clustering dalam mengekstrak informasi yang tersembunyi di dalam sebuah Trouble ticket. Selanjutnya hasil Clustering akan dilabelkan di setiap simpul dendogram untuk mendapatkan gambaran yang lebih baik. Setelah tahap Clustering, dilakukan tahap labeling dan pruning untuk mendapatkan kelompok klaster dengan label tertentu yang nantinya akan memberikan informasi secara langsung dan dapat dipakai untuk pengambilan keputusan.
1
2
98
99
0
0
…
0
0
0
0
0
0
0
0
0
0
8220
0
0
0
0
0
0
0
8220
0
0
0
0
0
0
0
8220
0
0
0
1 S.0524.12863 Gangguan Jaringan Lokal Kabel Sekunder Petugas Diminta Datang Hardware Rusak Ganti 2 S.0523.14096 Hardware Gangguan Policy Management Service Profile Pelanggan Captive Portal Server Down 3 S.0523.07099 Sementara Reboot … Gangguan Cpe Restart Modem Tidak Bisa 18066 S.0501.05815 Connect Hardware Rusak Maintenance Gangguan Bukis Isolir Isolir Tunggakan Tidak 18067 S.0501.15152 Bisa Browsing Crash Ganti Gangguan Cpe Restart Modem Tidak Bisa 18068 S.0501.14477 Connect Catu Daya Replace Gangguan Cpe Aplikasi Pc Pelanggan Captive Portal Aplikasi Down Maintenance 18069 S.0430.00712 Gangguan Cpe Restart Modem Tidak Bisa 18070 S.0501.12037 Browsing Gangguan Teknis Pusat Ganti
III. HASIL DAN DISKUSI Merujuk pada Medem (2008) yang menjelaskan algoritma Hierarchical Clustering adalah sebagai berikut: 1. Membuat sebuah N x N matriks similaritas, di mana elemen (i, j) adalah jarak (distance) antara Trouble ticket Ti dan Tj yaitu d(Ti,Tj). 2. Menetapkan setiap Trouble ticket, T, ke suatu cluster tertentu.
4 3. Menggabungkan setiap 2 cluster yang berdekatan atau paling dekat. 4. Menghitung similarity antara klaster baru dengan semua klaster yang telah ada. 5. Mengulangi langkah 3 dan 4 sampai seluruh Trouble Ticket masuk ke dalam satu klaster tunggal.
digunakan aturan Euclidean untuk mengukur similaritas antara trouble ticket karena aturan ini yang lebih sering digunakan dan juga lebih konsisten. Selanjutnya adalah dilakukan coding MATLAB sesuai dengan Gambar 1 berikut.
Berdasarkan algoritma di atas, langkah 1 dan 4 memberikan dampak yang besar terhadap klaster yang dihasilkan. Langkah pertama adalah menghitung similarity antara satu Trouble ticket dengan Trouble ticket yang lain. Beberapa ukuran untuk menghitung similarity adalah sebagai berikut: 1. Euclidean
2. Cosinus
3. Kovarian
Pada aturan Euclidean, semakin besar nilainya maka similaritasnya akan semakin kecil, tetapi pada aturan Cosinus dan Covarian semakin besar nilainya maka similaritasnya semakin besar. Langkah yang ke-4 adalah menghitung similarity (linkage) antara klaster. Beberapa referensi mendefinisikan linkage ini dengan dissimilarity. Menurut Santosa (2007) beberapa aturan linkage yang bisa digunakan dalam klastering adalah sebagai berikut: 1. Complete linkage clustering
Gambar 1 - Coding Matlab Setelah dilakukan running terhadap software MATLAB didapatkan hasil dendrogram yang ditunjukkan pada gambar 1.
2. Single linkage clustering
3. Average linkage clustering
4. Centroid linkage
Gambar 2 - Dendrogram Hasil Eksperimen Selanjutnya adalah mengukur kualitas BT yang dihasilkan, yaitu dengan mengukur seberapa dekat jarak antara trouble ticket dalam BT cocok dengan pair-wise distance trouble ticket dalam data set yang asli. Semakin dekat koefisien dengan 1 maka semakin baik binary tree tersebut merefleksikan struktur asli trouble ticket. Pengukuran ini bisa dilakukan dengan menggunakan rumus Cophenetic Correlation Coefficient yaitu:
5. Ward linkage
merupakan jarak klaster A dan B Dimana menggunakan centroid linkage. Algoritma Hierarchical Clustering menggunakan kombinasi antara similarity (Euclidean, Cosine, Covarian) dan dissimilarity (Single, Complete, Average, Centroid, dan Ward Linkage), dimana klastering yang dihasilkan akan berbentuk pohon biner (binary tree), BT. Pada penelitian ini akan
Dari perhitungan tersebut didapatkan hasil 0,9610. Nilai yang mendekati 1 memberikan indikasi hasil dendrogram sangat mirip data asli. Proses berikutnya adalah Labelling dan Pruning. Hal ini dilakukan untuk memberikan label pada hasil dendrogram sehingga didapatkan informasi yang lebih jelas tentang klaster data. Labelling dan Pruning dilakukan dengan membuat N-ary
5 tree. Medem (2008) menunjukkan algoritma untuk membuat N-Ary Tree dari sebuah Binary Tree. Algoritma : Transofrmasi Binary Tree menjadi N-ary Tree input : BT, pohon biner output : H, N-ary tree begin for each node u ϵ BT in breath-first order do if u.head is empty then add u to H; u.head ← u.id ; for each chiled v of u do if v.label ≠ u.label then v.parrent ← u.head ; else if v.label = u.label then v.parrent ← u.parrent ; v.head ← u.head ;
end
Gambar 3 - Algoritma N-Ary Tree Proses Labelling dan Pruning dilakukan secara manual menggunakan software Office Excel. Karena proses yang manual untuk meminimasi waktu perhitungan maka tidak semua data dihitung satu-persatu berdasarkan algoritma di atas. Dengan pertimbangan tersebut, maka cut off labelling dimulai dari klaster dengan jumlah setidaknya 4000 data. Nilai 4000 ini didasarkan pada diskusi dengan pihak eksternal dengan melihat bagan dendogram yang dihasilkan dimana nilai 4000 dianggap sudah mewakili klaster dengan prioritas utama untuk ditangani. Selanjutnya Gambar 4 menunjukkan hasil Labering dan Pruing.
Gambar 4 – Hasil Clustering, Labelling, Pruning . Restart (24%) CPE (76%)
Browsing (72%)
Putus-putus (69%)
PC (50%) Connect (28%) Mati (64%) Connect (79%) Proses ONT (21%)
Upgrade (74%) Virus (26%)
Perangkat (35%) ONT (65%)
Gangguan (79%)
IV. EKSPERIMEN DAN ANALISIS
Software (39%) Hardware (61%)
All Ticket (100%)
Hierarchical Clustering merupakan teknik yang dapat memberikan hasil yang sangat banyak. Hal ini akan ditentukan oleh preferensi peneliti. Apabila hanya diinginkan hanya terdapat 2 klaster saja maka kita bisa memotong dendogram pada ordinat dengan nilai lebih dari 13.000 maka akan didapatkan 2 klaster data. Apabila hanya ingin didapatkan 3 kelas makan kita dapat memotong pada ordinat 11.000, dan seterusnya. Nilai yang sangat banyak ini akan ditentukan oleh hasil yang diperoleh dari angka berapa kita memotong dendogram. Hasil yang didapat pada penelitian ini memang tidak sangat detail memotong data mulai dari 0 melainkan dari angka 4000. Pada kisaran angka ini saja peneliti merasa sudah memerlukan waktu yang sangat banyak untuk mengekstrak informasi dari Trouble ticket. Maka dari itu peneliti menyarankan untuk menggunakan teknik-teknik terbaru yang
Rusak (98%)
Modem (50%)
Crash (16%) Down (38%) Isolir (33%) Jaringan Lokal (13%)
Lambat (31% Perangkat (12%) Aplikasi (88%) Power (83%)
Rusak (86%) Putus (14%)
Kabel Sekunder (17%) Hang (35%) Change (1%) Modem (49%) DSLAM (51%)
Konfigurasi (100%)
Gambar 5 - Hasil Pohon Biner T3 Online lebih efisien dalam mengekstrak sebuah data yang nantinya akan digunakan untuk pengambilan keputusan Berdasarkan data di atas Trouble ticket terdiri dari 2 kelompok besar informasi, yaitu informasi terkait dengan gangguan serta informasi yang terkait dengan proses. Dari 18070 data yang masuk selama periode Mei 2013 untuk produk Speedy, 79% data merupakan informasi gangguan sedangkan sisanya 21% merupakan informasi berupa proses. Tiket yang memberikan informasi tentang gangguan berarti memang terjadi masalah terhadap pelanggan sehingga mengadukan hal ini kepada Telkom, sedangkan untuk ticket berupa proses biasanya merupakan ticket yang terjadi akibat adanya internalisasi sehingga dalam hal ini petugas membuat sebuah Trouble ticket yang merupakan respon terhadap kondisi yang ada. Sebagai contoh apabila terdapat program baru maka
6 beberapa Trouble ticket akan muncul untuk meminta informasi atas program baru tersebut Proses-proses yang merupakan gangguan terjadi pada 2 hal, yaitu modem dan juga PC sebagai device. Beberapa perangkat modem yang memberikan masalah adalah CPE. CPE atau Customer-Premise Equipment adalah terminal dan terkait peralatan yang terletak pada pelanggan lokasi pelanggan dan terhubung dengan carrier pada titik demarkasi. Demark merupakan titik didirikan di sebuah bangunan atau kompleks untuk peralatan pelanggan terpisah dari perusahaan telepon peralatan. Modem telepon akan mengalami down apabila terjadi gangguan terhadap CPE. Gangguan ini bisa berupa adanya kabel yang putus, tidak berfungsinya beberapa perangkat akibat daya listrik yang terlalu besar, power ataupun terkena listrik. CPE umumnya mengacu pada pelanggan yang dimiliki telepon , router , switch , atau set-top boxes untuk digunakan melalui jaringan Speedy. Pada CPE yang memiliki probabilitas tertinggi dalam menimbulakan keluhan adalah ONT atau Optical Network Nerminator V. KESIMPULAN/RINGKASAN Berdasarkan pengolahan data yang telah dilakukan pada bab sebelumnya di dapatkan hasil dendogram dari keseluruhan kesimpulan dari penelitian ini adalah sebagai berikut: 1. Data Mining merupakan teknik untuk mendapatkan informasi dari data yang berukuran sangat besar. 2. Text Mining dapat digunakan untuk menggali informasi yang tersembunyi dari sebuah data teks seperti pada T3 Online yang bisa dimanfaatkan untuk pendukung pengambilan keputusan. 3. Pengguanaan teknik Text Mining yang dibantu oleh software MATLAB dan Office Excel sangat membatu dalam
mengolah,
menggali,
dan
menjadikan
informasi dari data yang berukuran sangat besar. 4. Perlu adanya pengembangan model baru di dalam teknik Data Mining yang lebih efektif dan efisien untuk menjalankan tahapan Labelling dan Pruing. Selanjunya diharapkan untuk
memudahkan
proses
pengolahan data menggunakan text mining, Telkom dapat membangun suatu data base kata kunci yang harus disepakati menjadi acuan baku bagi para agen dalam berkomunikasi dengan pelanggan dan Trouble ticket system agar data base T3 Online dapat menjadi lebih terstruktur DAFTAR PUSTAKA Berry, M.J.A. dan Linoff G.S. (2004). Data Mining Techinique for Marketing, sales, Customer
Relationship Management. Second Edition, Wiley Publishing, Inc. BMC Churn Index Survey. (2008). Summary of Finding. BMC Software, p.1-17 Covaci, Stefan., Marchisio, Lucia., and Milham, David J. (1998). Trouble ticketing X interfaces international private leased data circuits and international freephone service. NOMS, p.342-353 Fayyad, U. M, 1996, Advances in Knowledge Discovery and Data Mining. Cambridge, MA: The MIT Press Frontier, H. (2007). 9 Quadrant Analysis Fault Handling Nasional. Nasional Survey, p.1-15 Gupta, Vishal., and Lehal, Gurpreet S. (2009). “A survey of Text Mining techniques and applications” in “Journal of emerging technologies in web intelligence, vol. 1, no.1 Johnson, D. (1992). “NOC Internal Integrated Trouble ticket System Functional Specification Wishlist.” RFC 1297 Jupiter Research. (2007). Knowledge-Driven Customer Service. Jupiter Research Corporation Larose D, T. (2006). Data Mining Methods and Models. Jhon Wiley & Sons, Inc. Hoboken New Jersey Lewis, L. and Dreo, G. (1993). “Extending Trouble ticket systems to fault diagnostics,” Network. IEEE Liddy, Elizabert D., Symonenko, S., and Rowe, S. (2006). Sublanguage Analysis Applied to Trouble tickets. FLAIRS Conference 2006: 752-757 Medem, Amelie., Akodjenou, Marc-Ismael., and Teixeira, Renata. (2008). TroubleMiner: Mining network Trouble tickets. LIP6 Laboratory, p.1-7 Ngai, E.W.T., Xiu, Li., and Chau, D.C.K. (2009). Application of data mining techniques in customer relationship management: A literature review and classification, p.1-11 Olshon, David., and Shi, Yong. (2007). Introduction to Business Data Mining. McGraw-Hill, New York Santosa, Budi. (2007). Data Mining. Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta, Graha Ilmu Thompson, Bob. (2005). The Loyalty Connection: Secrets To Customer Retention And Increased Profits. CRM Guru, p.1-16 Weiss, G. M. Eddy, J., and Weiss, S. (1998). Intelligent Telecommunication Technologies. In KnowledgeBased Intelligent Techniques in Industry. Chapter 8, L. C. Jain, editor, CRC Press