Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM, yaitu: 1. Memilih data yang akan di-cluster 2. Menetapkan parameter-parameter untuk: Jumlah cluster (n > c ≥ 2) Pangkat pembobot (w > 1) Maksimum iterasi (i) Kriteria penghentian (ɛ) 3. Menghitung pusat cluster, fungsi objektif, dan perubahan derajat keanggotaan pada matriks U. Tahap representasi pengetahuan dengan peta diimplementasikan menggunakan perangkat lunak Quantum GIS v.1.6.0.
HASIL DAN PEMBAHASAN Data Penelitian Data sumber yang digunakan pada penelitian ini adalah data pelanggan UPJ Bogor Timur pada bulan Desember 2009 dengan jumlah record sebanyak 104.773 baris dan 5 atribut. Atribut-atribut tersebut adalah nomor pelanggan, golongan, daya, lingkungan, dan KWH. Contoh sebagian data penelitian yang digunakan dapat dilihat pada Lampiran 1. Berikut penjelasan masing-masing atribut pada data sumber. Atribut nomor pelanggan adalah nomor unik yang dimiliki oleh setiap pelanggan. Setiap nomor pelanggan terdiri dari dua belas digit. Lima digit pertama merupakan inisialisasi daerah pelanggan. Dua digit pertama dari lima digit tersebut menunjukkan provinsi dan tiga digit selanjutnya menunjukkan pembagian daerah dari provinsi. Sebagai contoh, terdapat pelanggan yang memiliki lima digit pertama 53821. Dua digit pertama, yaitu 53 menunjukkan bahwa pelanggan berada di daerah Jawa Barat, sedangkan tiga digit selanjutnya 821 menunjukkan bahwa pelanggan berada di daerah Bogor Timur. Atribut golongan merupakan representasi dari penggolongan pelanggan berdasarkan jenis pelanggan dan tarif penggunaan per KWH. Setiap golongan memiliki tarif yang berbeda-beda untuk pembayaran listrik. Sebagai contoh, tarif penggunaan listrik per KWH golongan rumah tangga lebih murah
dibandingkan dengan golongan bisnis. Golongan-golongan yang terdapat pada data pelanggan UPJ Bogor Timur adalah bisnis (B), industri (I), pemerintah (P), rumah tangga (R), dan sosial (S). Golongan pelanggan juga dibagi menjadi beberapa bagian tergantung dari daya yang digunakan. Sebagai contoh, daya pelangggan golongan bisnis ada dua, yaitu B1 dan B2, sedangkan untuk rumah tangga dibagi menjadi tiga golongan pengguna daya, yaitu R1, R2, dan R3. Penggunaan daya setiap golongan dapat dilihat pada Tabel 4. Atribut daya adalah nilai daya tetap yang dipilih oleh pelanggan. Sebagai contoh, jika dalam suatu rumah memiliki barang elektronik yang membutuhkan daya 450 Watt, rumah tersebut harus memiliki daya sekitar 450 Watt atau lebih untuk menyalakan alat tersebut. Pada data sumber didapatkan sebanyak 49 jenis daya. Kisaran daya yang digunakan dimulai dari 160 – 197.000 Watt. Pada histrogram yang disajikan pada Lampiran 2 terlihat bahwa pengguna daya 450 Watt merupakan yang paling banyak jumlahnya, disusul dengan pengguna daya 770, 1.300, dan 2.200 Watt. Jumlah pengguna pada empat jenis daya tersebut memiliki lebih dari 2.000 pelanggan, sedangkan pengguna daya lainnya memiliki pelanggan di bawah 2.000 pelanggan. Tabel 4 Tabel penggunaan daya Daya (Watt) Golongan B1 B2 I1 I2 P1 P3 R1 R2 R3 S2
Terendah 450 2.560 1.300 16.500 450 160 450 3.500 7.700 450
Tertinggi 2.200 197.000 13.200 197.000 197.000 131.000 2.200 6.600 41.500 197.000
Atribut lingkungan adalah atribut yang berisi nama-nama daerah tempat pelanggan berada. Daerah-daerah yang terdapat pada atribut ini biasanya berupa nama kelurahan, walaupun terdapat beberapa nama daerah yang bukan merupakan nama kelurahan. Atribut KWH (Kilo Watt per Hour) adalah banyaknya daya yang digunakan oleh pelanggan dalam satu jam. Pada data penelitian, atribut ini berisi nilai penggunaan listrik dalam satuan KWH selama satu bulan.
9
Praproses Data Hasil dari penelitian akan ditampilkan dalam bentuk peta, untuk itu dibutuhkan titik koordinat (X & Y). Namun data yang digunakan pada penelitian ini tidak memiliki data koordinat (X & Y) dari setiap pelanggan. Oleh karena itu, dilakukan integrasi data dengan menambahkan data koordinat (X dan Y) yang dibuat secara random dengan bantuan perangkat lunak Quantum GIS v.1.6.0. Jumlah daerah (lingkungan) yang terdapat pada data sebanyak 45 daerah. Kemudian daerah-daerah tersebut dikelompokkan ke dalam kelurahan-kelurahan dengan total kelurahan yang didapat adalah sebanyak 39 kelurahan (dalam hal ini, daerah yang berada pada daerah Citeureup dijadikan satu kelurahan karena tidak dianggap sebagai daerah kota Bogor). Setelah data dikelompokkan ke dalam kelurahan, data disaring dengan memilih data pelanggan PLN UPJ Bogor Timur dengan memilih data pelanggan yang memiliki awalan 53821xxxxxxx pada kode pelanggan. Selain itu, penyaringan juga dilakukan berdasarkan kelurahan yang dimasukkan ke dalam kategori daerah kota Bogor. Sebanyak 23 kelurahan terpilih dari 39 kelurahan. Tahap penyaringan data selanjutnya adalah dengan memilih data pelanggan yang menggunakan KWH ≥ 150 jam. Setelah melalui proses integrasi dan penyaringan data, data yang digunakan pada penelitian menjadi sebanyak 39.822 record dan delapan field. Field-field yang terdapat pada data penelitian adalah: Koordinat_X, Koordinat_Y, No_Pelanggan, Golongan, Daya, Lingkungan, KWH, dan Jam. Pemilihan Atribut Untuk melakukan segmentasi, dilakukan pemilihan atribut yang sesuai untuk digunakan pada proses clustering. Pemilihan atribut yang digunakan adalah atribut-atribut yang relevan dalam hal penggunaan listrik. Atribut yang terpilih dalam penelitian ini adalah sebanyak dua atribut dari delapan atribut yang ada, yaitu daya dan KWH. Kedua atribut ini dianggap sebagai atribut yang paling merepresentasikan penggunaan listrik pelanggan. Normalisasi Data Proses normalisasi terhadap data dilakukan terlebih dahulu sebelum masuk ke tahap proses clustering, karena data yang digunakan memiliki rentang nilai yang sangat besar.
Rentang nilai yang sangat besar cukup mempengaruhi pada metode clustering yang berbasis jarak seperti FCM. Normalisasi pada umumnya digunakan untuk menyetarakan atribut agar atribut satu dengan lainnya memiliki ukuran yang sama. Normalisasi juga membuat rentang nilai menjadi jauh lebih kecil sehingga membantu perhitungan jarak menjadi lebih cepat dan efisien. Teknik normalisasi yang digunakan pada penelitian ini adalah z-score. Normalisasi zscore dipilih karena pada data penelitian outlier mendominasi pada daerah nilai minimum. Setelah data dinormalisasi dengan z-score, nilai rata-rata dari masing-masing atribut menjadi 0 dan standar deviasinya bernilai 1. Contoh sebagian data sebelum dan sesudah ditransformasi dengan normalisasi zscore dapat dilihat pada Lampiran 3. Segmentasi menggunakan Fuzzy C-Means Proses segmentasi yang dilakukan pada penelitian ini terdapat dua jenis, yaitu segmentasi berdasarkan pelanggan dan segmentasi berdasarkan daerah. Segmentasi berdasarkan pelanggan adalah segmentasi dengan menggunakan data pelanggan yang sebelumnya sudah mengalami tahap praproses, sedangkan untuk segmentasi berdasarkan daerah, menggunakan data yang sama namun data tersebut diperkecil dengan mengambil rata-rata daya, KWH per daerahnya. Nilai rata-rata yang diambil bukanlah nilai rata-rata data pelanggan yang sudah dinormalisasi. Karena itu data tersebut dinormalisasi setelah data rata-rata penggunaan listrik (daya dan KWH) dari setiap daerah didapatkan. Data yang digunakan untuk segmentasi berdasarkan daerah dapat dilihat pada Lampiran 4. Untuk mendapatkan hasil segmentasi penggunaan listrik, dilakukan penerapan teknik clustering pada data menggunakan algoritme Fuzzy C-Means (FCM). Proses clustering dilakukan dengan menggunakan program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Sebelum melakukan clustering dengan FCM, ditentukan terlebih dahulu parameterparameter FCM yang dibutuhkan seperti yang telah dibahas pada implementasi sistem. Segmentasi yang diinginkan pada penelitian ini adalah membagi penggunaan listrik menjadi empat kelas, yaitu kelas penggunaan listrik rendah, sedang, tinggi, dan sangat tinggi. Oleh karena itu, jumlah cluster
10
(c) yang digunakan pada penelitian ini adalah sebanyak empat cluster. Pembobot (w) merupakan parameter fuzzy (fuzzifier) yang digunakan dalam FCM. Nilai w tidak boleh 1, karena ketika w = 1 maka tidak akan terjadi proses fuzzy clustering, tetapi malah menjadi proses hard clustering. Hal ini dikarenakan algoritme FCM merupakan generalisasi dari algoritme pendahulunya, yaitu algoritme Hard CMeans. Nilai w = 1 akan menyebabkan pembagian dengan 0 pada persamaan nomor 8. Jadi, nilai pembobot (w) harus lebih besar dari 1 (Höppner et al. 1999). Jika w > 2, pembobot (w) akan mengurangi bobot yang ditetapkan untuk cluster yang dekat dengan titik. Terdapat beberapa pertimbangan untuk memlih w = 2, salah satunya adalah untuk menyederhanakan fungsi derajat keanggotaan (ik) pada persamaan nomor 6 (Tan et al. 2006). Jadi, nilai pembobot yang digunakan pada penelitian ini adalah 2. Iterasi maksimum yang ditentukan pada penelitian ini adalah sebanyak 100 iterasi, agar proses perulangan tidak terlalu banyak. Walaupun demikian, iterasi akan dihentikan apabila nilai pada persamaan nomor 9 sudah lebih kecil dari nilai kriteria penghentian (ɛ) yang ditentukan.
Gambar 7 merupakan window dari program yang telah dibuat untuk memilih data yang akan digunakan untuk proses clustering dengan FCM. Window tersebut juga merupakan tempat memasukkan parameterparameter FCM yang akan digunakan. Tombol Cluster merupakan tombol untuk melakukan proses clustering, tentunya setelah data dipilih dan parameter-parameternya telah dimasukkan. Setelah program melakukan proses clustering dengan teknik FCM, program akan memunculkan ringkasan statistik dari hasil proses clustering seperti yang dapat dilihat pada Gambar 8. Pada window tersebut menampilkan karakteristik dari data yang digunakan, parameter-paramater yang digunakan, jumlah anggota dari masingmasing cluster, dan log nilai fungsi objektif. Pada window tersebut juga terdapat beberapa tombol yang dapat digunakan untuk mendapatkan keterangan lebih lanjut dari hasil clustering seperti tombol untuk melihat tabel hasil clustering, tombol untuk melihat grafik cluster, tombol untuk melihat plot cluster dalam bentuk 2 dimensi, dan tombol untuk menyimpan hasil clustering.
Nilai kriteria penghentian (ɛ) yang ditentukan pada penelitian ini adalah 10-5. Nilai tersebut sudah dianggap sebagai nilai positif yang sangat kecil pada penelitian ini. Jadi, nilai-nilai parameter yang digunakan untuk melakukan clustering dengan menggunakan FCM pada penelitian ini adalah sebagai berikut:
Jumlah cluster (c) = 4 Pangkat pembobot (w) = 2 Maksimum iterasi (i) = 100 Kriteria penghentian/treshold (ɛ) = 10-5
Gambar 8 Ringkasan hasil clustering pada program FCM
Gambar 7 Pengaturan parameter pada program FCM
Pengguna program FCM dapat melihat grafik hasil clustering dalam bentuk bar. Sumbu x merepresentasikan cluster, dan sumbu y merepresentasikan jumlah anggota cluster. Setiap cluster juga dibedakan dari warna bar-nya. Pada setiap bar terdapat nilai yang menunjukkan jumlah anggota cluster.
11
Grafik hasil clustering dari segmentasi berdasarkan pelanggan dapat dilihat pada Gambar 9 dan grafik hasil clustering dari segmentasi berdasarkan daerah dapat dilihat pada Gambar 10. Pada kedua grafik tersebut, cluster 1 merupakan pengguna listrik kelas rendah, cluster 2 merupakan pengguna listrik kelas sedang, cluster 3 merupakan penggunaan listrik kelas tinggi, dan cluster 4 merupakan pengguna listrik kelas sangat tinggi. Terlihat pada kedua grafik tersebut bahwa cluster 1 (kelas rendah) memiliki anggota paling banyak dibandingkan dengan cluster yang lain, dan yang paling sedikit adalah cluster 4 (kelas sangat tinggi).
Pada clustering berdasarkan daerah, iterasi berhenti pada iterasi ke-11 dengan pusat vektor terakhir (matriks V) sebagai berikut:
Grafik dari fungsi objektif yang dihasilkan dari clustering berdasarkan pelanggan dapat dilihat pada Gambar 11. Pada grafik tersebut terlihat nilai fungsi objektif sudah mulai stabil pada iterasi ke-56, artinya cluster yang terbentuk pada iterasi tersebut sudah mulai optimal walaupun belum mencapai nilai kriteria penghentian (treshold). Grafik nilai fungsi objektif dari clustering berdasarkan daerah, dapat dilihat pada Gambar 12. Pada grafik tersebut nilai fungsi objektif sudah mulai stabil pada iterasi ke-7 dan iterasi berhenti pada iterasi ke-11 karena nilai treshold sudah terpenuhi. Grafik Nilai Fungsi Objektif Clustering Pelanggan
Gambar 9 Grafik hasil clustering pada segmentasi berdasarkan pelanggan
Nilai Fungsi Objektif
30000 25000 20000 15000 10000 5000
1 9 17 25 33 41 49 57 65 73 81 89 97
0 Iterasi ke-
Gambar 11 Grafik nilai fungsi objektif untuk clustering berdasarkan pelanggan
Gambar 10 Grafik hasil clustering pada segmentasi berdasarkan daerah Pada clustering berdasarkan pelanggan, proses clustering dengan FCM berhenti pada iterasi maksimum (iterasi ke-100) dengan pusat vektor terakhir (matriks V) sebagai berikut:
Nilai Ffungsi Objektif
Grafik Nilai Fungsi Objektif Clustering Wilayah 15 10 5 0 1
2
3
4
5 6 7 8 Iterasi ke-
9 10 11
Gambar 12 Grafik nilai fungsi objektif untuk clustering berdasarkan daerah Tabel hasil clustering berdasarkan pelanggan yang berisi data yang digunakan, nilai derajat keanggotaan dari setiap data, dan cluster yang ditentukan pada setiap data tidak ditampilkan seluruhnya karena ukuran dari tabel tersebut terlalu besar. Sebagian tabel
12
hasil clustering berdasarkan pelanggan dapat dilihat pada Lampiran 5. Hasil clustering berdasarkan pelanggan disajikan pada Lampiran 6. Persentase dan jumlah anggota masing-masing cluster disajikan pada Tabel 5. Tabel 5 Persentase dan jumlah anggota cluster pada clustering berdasarkan pelanggan Cluster C1 (rendah) C2 (sedang) C3 (tinggi) C4 (sangat tinggi)
Persentase (%) 99,16 0,69 0,11 0,04
Jumlah 39.489 275 43 15
Hasil clustering berdasarkan daerah secara lengkap disajikan pada Lampiran 7. Persentase dan jumlah anggota masingmasing cluster disajikan pada Tabel 6.
Gambar 13 Pesebaran spasial pengguna listrik kelas rendah
Tabel 6 Persentase dan jumlah anggota cluster pada clustering berdasarkan daerah Cluster C1 (rendah) C2 (sedang) C3 (tinggi) C4 (sangat tinggi)
Persentase (%) 73,91 17,39 4,35 4,35
Jumlah 17 4 1 1
Evaluasi Cluster Berdasarkan Pelanggan Hasil clustering terhadap pelanggan, menghasilkan karakteristik penggunaan listrik dari setiap segmen sebagai berikut: 1. Pengguna listrik kelas rendah Pengguna listrik kelas rendah diwakili oleh cluster 1 dengan karakteristik pengguna yang disajikan pada Tabel 7. Tabel 7 Karakteristik pengguna listrik kelas rendah (cluster 1) Daya KWH Jam
Terendah 160 60 150
Tertinggi 10.600 3.532 2.252
Rata-rata 932,86 243,39 277,88
Golongan pelanggan yang terdapat pada pengguna listrik kelas rendah adalah bisnis (B1 dan B2), industri (I1), pemerintah (P1 dan P3), rumah tangga (R1, R2, dan R3), dan sosial (S2) dengan persebaran di seluruh daerah. Daerah yang memiliki persebaran tertinggi pada cluster ini adalah Kedung Halang dengan jumlah pelanggan sebanyak 11.440 pelanggan. Pesebaran spasial pengguna listrik kelas rendah dapat dilihat pada Gambar 13.
Gambar 14 Pesebaran spasial pengguna listrik kelas sedang 2. Pengguna listrik kelas sedang Pengguna listrik kelas sedang diwakili oleh cluster 2 dengan karakteristik pengguna yang disajikan pada Tabel 8. Tabel 8 Karakteristik pengguna listrik kelas sedang (cluster 2) Daya KWH Jam
Terendah 2.200 1.702 150
Tertinggi 53.000 13.568 2.012
Rata-rata 19.197,65 4.308,88 253,11
Golongan pelanggan yang terdapat pada pengguna listrik kelas sedang adalah bisnis (B1 dan B2), industri (I2), pemerintah (P1 dan P3), rumah tangga (R2 dan R3), dan sosial (S2) dengan persebaran di daerah Babakan, Babakan Pasar, Bantarjati, Baranang Siang, Cibuluh, Cimahpar, Ciparigi, Katulampa, Kedung Badak, Kedung Halang, Sukaraja, Sukasari, Tanah
13
Baru, dan Tegal Lega. Daerah yang memiliki persebaran tertinggi pada cluster ini adalah Bantarjati dengan jumlah pelanggan sebanyak 59 pelanggan. Pesebaran spasial pengguna listrik kelas sedang dapat dilihat pada Gambar 14. 3. Pengguna listrik kelas tinggi Pengguna listrik kelas tinggi diwakili oleh cluster 3 dengan karakteristik pengguna yang disajikan pada Tabel 9. Tabel 9 Karakteristik pengguna listrik kelas tinggi (cluster 3)
Daya KWH Jam
Terendah 53.000 10.020 150
Tertinggi 147.000 32.320 448
Rata-rata 84.930,23 18.462,65 222,07
Gambar 15 Pesebaran spasial pengguna listrik kelas tinggi
Golongan pelanggan yang terdapat pada pengguna listrik kelas tinggi adalah bisnis (B2), industri (I2), pemerintah (P1), dan sosial (S2) dengan penyebaran di daerah Babakan, Bantarjati, Baranang Siang, Ciparigi, Kedung Halang, Sukaraja, Tanah Baru, dan Tanah Sareal. Daerah yang memiliki jumlah persebaran tertinggi pada cluster ini adalah Babakan dengan pelanggan sebanyak 13 pelanggan. Pesebaran spasial pengguna listrik kelas tinggi dapat dilihat pada Gambar 15. 4. Pengguna listrik kelas sangat tinggi Pengguna listrik kelas sangat tinggi diwakili oleh cluster 4 dengan karakteristik pengguna yang disajikan pada Tabel 10.
Gambar 16 Pesebaran spasial pengguna listrik kelas sangat tinggi
Tabel 10 Karakteristik pengguna listrik kelas sangat tinggi (cluster 4)
Daya KWH Jam
Terendah 105.000 36.004 194
Tertinggi 197.000 67.373 446
Rata-rata 175.466,67 49.990,63 291,34
Golongan pelanggan yang terdapat pada pengguna listrik kelas sangat tinggi adalah bisnis (B2), industri (I2), pemerintah (P3), dan sosial (S2) dengan persebaran di daerah Babakan, Bantarjati, Baranang Siang, Cibuluh, Katulampa, Kedung Halang, dan Tegal Lega. Daerah yang memiliki persebaran tertinggi pada cluster ini adalah daerah Kedung Halang dengan jumlah pelanggan sebanyak 7 pelanggan. Pesebaran spasial pengguna listrik kelas sangat tinggi dapat dilihat pada Gambar 16.
Gambar 17 Pesebaran spasial pengguna listrik semua kelas Pesebaran spasial dari keseluruhan kelas dapat dilihat pada Gambar 17. Pada gambar
14
tersebut terlihat pengguna listrik kelas rendah mendominasi di seluruh wilayah, bahkan ada beberapa daerah yang hanya terdapat pengguna listrik kelas rendah saja. Evaluasi Cluster Berdasarkan Daerah Segmentasi berdasarkan daerah, dilakukan berdasarkan rata-rata penggunaan listrik dari masing-masing daerah. Karakteristik penggunaan listrik dari setiap segmen pada clustering berdasarkan daerah dapat dilihat pada Tabel 11. Tabel 11 Karakteristik penggunaan listrik berdasarkan segmentasi daerah Cluster
Nilai Rata-rata
Daya C1 (rendah) 227,2 C2 (sedang) 518,6 C3 (tinggi) 6140,2 C4 (sangat tinggi) 3503,5
KWH 920,6 2084,8 14240,0 16725,0
Jam 258,7 268,3 263,2 241,0
1. Daerah penggunan listrik kelas rendah Daerah penggunaan listrik kelas rendah diwakili oleh cluster 1. Daerah-daerah yang termasuk pada kelas ini sebanyak 17 daerah, yaitu: Cibuluh, Cilebut, Ciluar, Cimahpar, Ciparigi, Katulampa, Kebon Pedes, Kedung Badak, Kedung Halang, Pakuan, Pasir Laja, Sempur, Sukaraja, Sukaresmi, Sukasari, Sukatani, dan Tanah Baru.
dimensi dengan mengombinasikan dua variabel (x dan y) dari data yang digunakan. Setiap cluster dibedakan dengan warna yang berbeda dan pusat cluster ditampilkan berbentuk kotak dengan ukuran yang lebih besar dari anggota cluster. Visualisasi hasil clustering berdasarkan pelanggan dengan plot 2 dimensi dapat dilihat pada Gambar 18. Inisalisasi warna yang digunakan sebagai pembeda cluster pada Gambar 18 adalah:
Cluster 1 (kelas rendah) warna biru Cluster 2 (kelas sedang) warna ungu Cluster 3 (kelas tinggi) warna magenta Cluster 4 (kelas sangat tinggi) warna cyan
Pada Gambar 18 cluster 1 terlihat sedikit, padahal sebenarnya terjadi penumpukan titik anggota cluster yang mengumpul pada cluster tersebut. Begitu pula untuk cluster 2, terjadi penumpukan titik anggota cluster pada cluster tersebut.
2. Daerah penggunaan listrik kelas sedang Daerah penggunaan listrik kelas sedang diwakili oleh cluster 2. Daerah-daerah yang termasuk pada kelas ini sebanyak 4 daerah, yaitu: Babakan, Bantarjati, Baranang Siang, dan Tegal Lega. 3. Daerah penggunaan listrik kelas tinggi Daerah penggunaan listrik kelas tinggi diwakili oleh cluster 3. Daerah yang termasuk pada kelas ini hanya satu daerah, yaitu Babakan Pasar. 4. Daerah penggunaan listrik sangat tinggi Daerah penggunaan listrik kelas sangat tinggi diwakili oleh cluster 4. Daerah yang termasuk pada kelas ini hanya satu daerah, yaitu Tanah Sareal. Visualisasi Clustering Visualisasi hasil clustering disajikan dalam bentuk plot 2 dimensi dan juga penyebaran titik pada peta untuk mempermudah analisis. Pada program clustering FCM yang telah dibuat terdapat fasilitas untuk visualisasi dalam bentuk plot 2
Gambar 18 Plot clustering berdasarkan pelanggan Visualisasi hasil clustering berdasarkan daerah dengan plot 2 dimensi dapat dilihat pada Gambar 19. Inisalisasi warna yang digunakan sebagai pembeda cluster pada Gambar 19 adalah:
Cluster 1 (kelas rendah) warna biru Cluster 2 (kelas sedang) warna ungu Cluster 3 (kelas tinggi) warna magenta Cluster 4 (kelas sangat tinggi) warna cyan
Sama halnya dengan hasil plot pada clustering beradasarkan pelanggan, pada Gambar 19 terjadi pengumpulan titik anggota cluster pada cluster 1 walaupun pada gambar tersebut anggota cluster terlihat sedikit. Pada
15
gambar tersebut juga terlihat dua titik yang berbentuk kotak dengan warna yang berbeda. Kedua titik tersebut merupakan cluster 3 dan cluster 4 dimana masing-masing anggota cluster tersebut berjumlah satu, sehingga anggota dari cluster tersebut juga merupakan pusat cluster-nya.
1. Mengintegrasikan hasil yang ditampilkan pada peta ke dalam program clustering 2. Selain menampilkan penyebaran pengguna listrik, juga ditampilkan penyebaran instalasi dari alat listrik.
DAFTAR PUSTAKA Abonyi J, Feil B. 2007. Cluster Analysis for Data Mining and System Identification. Berlin: Birkhauser Verlag AG. Cox, Earl. 2005. Fuzzy Modeling and Genetic Algorithms for Data Mining and Exploration. San Francisco: Elsevier Inc. Daulay A M. 2006. Segmentasi Pasar Produk Mie Cepat Saji Menggunakan Fuzzy CMeans [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Gulley N, Jang R. 2000. Fuzzy Logic Toolbox. USA: Mathwork, Inc.
Gambar 19 Plot clustering berdasarkan daerah
KESIMPULAN DAN SARAN Kesimpulan Proses segmentasi penggunaan listrik dapat dilakukan dengan menggunakan algoritme clustering Fuzzy C-Means. Setelah clustering dilakukan, didapatkan karakteristik dari setiap segmen penggunaan listrik. Pada segmentasi berdasarkan pelanggan, segmen pengguna listrik kelas rendah merupakan segmen yang paling banyak anggotanya, sedangkan yang paling sedikit adalah segmen pengguna listrik kelas sangat tinggi. Daerah yang memiliki persebaran dari semua segmentasi adalah Babakan, Bantarjati, Baranang Siang, dan Kedung Halang. Pihak PLN dapat memberikan perhatian yang lebih terhadap pelayanan di daerah-daerah tersebut, karena pada daerah-daerah tersebut terdapat semua segmen dan juga memiliki pengguna listrik kelas tinggi dan sangat tinggi yang lebih banyak dibandingkan dengan daerah lain.
Han J, Kamber M. 2006. Data Mining: Concept and Techniques. Ed ke-2. San Francisco: Morgan Kaufman Publisher. Höppner F, Klawonn F, Kruse R, Runkler T. 1999. Fuzzy Cluster Analysis Methods for Classification, Data Analysis and Image Recognition. Inggris: John Wiley & Sons Inc. Ross, Timothy J. 2005. Fuzzy Logic with Engineering Applications. Ed ke-2. Inggris: John Wiley & Sons Inc. Tan P, Steinbach M, Kumar V. 2006. Introduction to Data Mining. Boston: Pearson Education.
Saran Program yang dikembangkan dan data yang digunakan untuk melakukan clustering pada penelitian ini masih memiliki kekurangan. Saran untuk penelitian ini adalah:
16