PRESENTASI TUGAS AKHIR JUM’AT, 13 JUNI 2014
VISUALISASI KUALITAS UDARA UNTUK MENENTUKAN TITIK RAWAN POLUSI MENGGUNAKAN ALGORITMA SELF-ORGANIZING MAP DAN K-MEANS STUDI KASUS KOTA SURABAYA OLEH: REZA CLAUDIA ISTANTO 5210100103
OUTLINES ▪ Latar Belakang
▪ Rumusan Masalah ▪ Batasan Masalah ▪ Tujuan
▪ Manfaat ▪ Tinjauan Pustaka
▪ Metode Penelitian ▪ Pengolahan Data dan Implementasi ▪ Uji Coba dan Analisis Hasil
▪ Kesimpulan dan Saran
LATAR BELAKANG Polusi atau pencemaran udara menurut UU Republik Indonesia nomor 23 tahun 1997: Masuk atau di masukkannya zat, energi, makhluk hidup dan atau komponen lain kedalam suatu lingkungan yang dilakukan oleh manusia sehingga kualitas dari lingkungan tersebut turun sampai pada tingkat tertentu yang menyebabkan lingkungan tidak bisa digunakan sebagaimana mestinya.
Sumber Pencemaran Utama:
Polutan Pencemar Utama:
Perubahan komposisi dari zat udara sehingga kualitas dari zat tersebut menjadi berkurang atau tidak bisa lagi diperuntukkan sesuai fungsinya.
Pengendalian Pencemaran Utama: 1. Teknik dan pengukuran 2. Pengoptimalan atau pembatasan terhadap polutan 3. Pemodelan dengan pengklasteran daerah kedalam kelas tertentu
Metode pemodelan terhadap pengukuran kualitas udara. 1. Algoritma K-means 2. Self-Organizing Maps
Output Mempresentasikan kondisi polusi udara dan titik rawan polusi di wilayah kota Surabaya
RUMUSAN MASALAH Bagaimana membuat suatu clustering kualitas udara berdasarkan parameterparameter tertentu berdasarkan lokasi stasiun pemantau kualitas udara ambien, sehingga dapat diketahui lokasi titik rawan polusi di wilayah kota Surabaya.
BATASAN MASALAH 1. Data yang digunakan adalah data yang didapatkan dari Badan Lingkungan Hidup Kota Surabaya dan Unit Pelaksana Teknis Badan Laboratorium Lingkungan Hidup Surabaya 2. Sistem yang digunakan untuk menggunakan aplikasi Matlab 3. Keluaran yang dihasilkan pada visualisasi ini adalah pemodelan terhadap kualitas udara pada kota Surabaya
TUJUAN 1. Memperoleh hasil dan solusi dari analisis desain pemodelan terhadap kualitas udara yang ada daerah di kota Surabaya 2. Mengetahui tingkat akurasi algoritma dan clustering dalam desain pemodelan terhadap kualitas udara 3. Hasil visualisasi kualitas udara ini mampu menentukan titik rawan polusi di bagian wilayah kota Surabaya
MANFAAT Membantu Pemerintah Kota Surabaya khususnya lembaga Badan Lingkungan Hidup Surabaya dan Unit Pelaksana Teknis Badan Laboratorium Lingkungan Hidup Surabaya untuk melakukan evaluasi dalam rangka terciptanya udara yang bersih dan sehat yang memenuhi baku mutu kualitas udara
TINJAUAN PUSTAKA Visualisasi kualitas udara ▪ Visualisasi merupakan rekayasa dalam pembuatan gambar atau diagram untuk menampilkan suatu informasi ▪ Dalam penelitian ini, Kohonen’s SOFM merupakan tool atau alat untuk memvisualisasikan data dalam dimensional tinggi
Kohonen’s self-organizing feature maps (KSOFM) ▪ Kohonen’s self-organizing feature maps (KSOFM), merupakan salah satu model unsupervised neural network yang paling popular dimana nilai dari data space sekaligus melakukan topologi untuk mendapatkan proyeksi dari data space menjadi dua bentuk dimensi (Kohonen, 1997) ▪ Jaringan ini memiliki kemampuan visualisasi dalam memberikan gambar informatif data space dan dalam mengeksplorasi vektor data atau seluruh data set yang ada.
TINJAUAN PUSTAKA (CONT’D) Clustering Kualitas udara ▪ Proses mengelompokkan objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelas/cluster
K-Means Algorithm
TINJAUAN PUSTAKA (CONT’D) Air Quality Management Kota Surabaya ▪ Status kualitas udara saat ini telah disajikan di Indonesia khususnya di kota-kota tertentu yang tercakup dalam Air Quality Management System (AQMS) ▪ AQMS di Indonesia meliputi 10 kota di Indonesia, yaitu Jakarta, Bandung, Semarang, Surabaya, Denpasar, Medan, Pekanbaru, Palangka Raya, Jambi, dan Pontianak ▪ Setiap kota dilengkapi dengan stasiun tetap monitoring, stasiun pemantauan ponsel, pusat regional dan pusat kalibrasi regional
▪ Adapun stasiun pemantauan udara ambient secara permanen di Kota Surabaya diletakkan pada: 1. The Yard of Prestasi Park, Ketabang Kali Street (represents Urban Center area, Settlement area, Office areaCentral Surabaya) 2. The Yard of Sub-district Office of East Perak, Selangor Street (represents Office area, nearby Industry area, Warehousing area- North Surabaya)
3. The Yard of Mayor’s Assistant Office in West Surabaya, Sukomannungal Streets (represent Settlement area, Urban Periphery- West Surabaya) 4. The Yard of Gayungan District, Gayungan Street (represents Settlement area-nearby Surabaya-Gempol Toll-South Surabaya). 5. The Yard of Convention Hall, Arif Rahman Hakim Street (represents Settlement area, Campus area, Office areaEast Surabaya)
TINJAUAN PUSTAKA (CONT’D) Public Display Data ditempatkan di 1. Di depan Monumen Kapal Selam , Gubeng Pojok Jalan (Central Surabaya) 2. Di depan BAPPEDA Provinsi Jawa Timur , Jalan Pahlawan (Surabaya Utara) 3. Ring Road, Mayjend Sungkono Jalan (Surabaya Barat) 4. Perempatan Dharmawangsa Street dan Kertajaya Jalan (Surabaya Timur) 5. Di depan BNI Graha Pangeran , A. Yani (Surabaya Selatan) Parameter yang Diukur Parameter yang diukur dalam stasiun pemanatau kualitas udara di Kota Surabaya ada 16 (enam belas) parameter, yang terdiri dari:
No . 1
5 (lima) parameter kunci: PM10, SO2, O3, NO2, CO.
2
11 (sebelas) parameter pendukung dan meteorologi: NO, NOx, kecepatan angin (FF), kecepatan hembusan angina (FF Boe), arah angina (DD), arah hembusan angina (DD Boe), kelembaban udara ambien, kelembaban udara ambien, kelembaban udara container, suhu udara ambien, suhu container dan global radiasi
3 4 5
Parameter Partikulat (PM10)
Waktu Pengukuran
24 Jam (periode pengukuran rata) Sulfur Dioksida (SO2) 24 Jam (periode pengukuran rata) Carbon Monoksida 8 Jam (periode pengukuran (CO) rata) Ozon (O3) 1 Jam (periode pengukuran rata) Nitrogen Dioksida 1 Jam (periode pengukuran (NO2) rata)
rataratarataratarata-
TINJAUAN PUSTAKA (CONT’D) Verifikasi Sistem • Quantization Error
Quantization Error (QE) merupakan salah satu bentuk pengukuran untuk vektor kuantisasi dan clustering algorithms. Komputasi untuk QE ini adalah menentukan rata- rata jarak dari contoh vector pada cluster centroids yang merepresentasikan hasil clustering. Dengan cara melakukan perbandingan hasil QE dengan data set lainnya juga merupakan salah satu cara pengukuran. • Topography Error Topography Error merupakan metode pengukuran topology preservation yang cukup sederhana. Komputasi yang dilakukan adalah menentukan masing- masing nilai terbaik dan kedua terbaik pada matching units. Jika tidak berdekatan ataupun berbatasan pada map, maka dipertimbangkan sebagai sebuah kesalahan
TINJAUAN PUSTAKA (CONT’D) Validasi
• RMSSTD Root mean square standard deviation (RMSSTD) merupakan metode evaluasi yang digunakan untuk mengukur kualitas dari clustering algorithm. Semakin kecil nilai dari RMSSTD, maka semakin baik pembagian dari bentuk cluster. 𝑖=1..𝑘 𝑛𝑖𝑗 2 𝑗=1..𝑝 𝑎=1(𝑥𝑎 − 𝑥𝑖𝑗 ) 𝑅𝑀𝑆𝑆𝑇𝐷 = 𝑖=1..𝑘 𝑗=1..𝑝(𝑛𝑖𝑗 − 1) • R-Squared R-squared value (RS) digunakan untuk menentukan apakah terdapat perbedaan yang signifikan pada objek di grup yang berbeda dan pada objek di sama grup yang memiliki kesamaan yang tinggi Dengan kata lain, semakin besar nilai RS, maka diindikasi semakin bagus cluster yang dihasilkan. 𝑝 𝑛𝑗 𝑖=1..𝑘 𝑛𝑖𝑗 𝑆𝑆𝑡 − 𝑆𝑆𝑤 𝑅𝑆 = , 𝑆𝑆𝑡 = (𝑥𝑎 − 𝑥𝑗 )2 , 𝑆𝑆𝑤 = (𝑥𝑎 − 𝑥𝑖𝑗 )2 𝑆𝑆𝑡 𝑗=1 𝑎=1
𝑗=1 𝑎=1
TINJAUAN PUSTAKA (CONT’D) •
Entropy
Entropy adalah clustering validation berdasarkan kriteria eksternal untuk K-means clustering. Sebagai kriteria eksternal entropy menggunakan informasi eksternal yaitu class label. Semakin banyak jumlah clustering validation, maka nilai entropy semakin meningkat. Entropy sering disebut sebagai “biased effect” dari pengukuran entropy •
Davies Bouldin Index
Davies- Boulding Index (DBI) merupakan salah satu teknik mengukur tingkat validitas hasil klaster dengan cara membentuk matrix untuk mengevaluasi algoritma clustering. 1 𝐷𝐵 = 𝑛𝑐
𝑛𝑐
𝑚𝑎𝑥𝑙 ≠𝑚 𝑖=1
𝑆𝑐 𝑄𝑘 + 𝑆𝑐 𝑄𝑙 𝑆𝑐𝑐 𝑄𝑘 , 𝑄𝑙
METODE PENELITIAN Identifikasi permasalahan
• Wawancara untuk mengetahui bagaimana pengelolaan terhadap pencemaran udara • Melakukan Observasi dan pengamatan pada titik stasiun pemantauan udara untuk mengetahui kondisi udara.
Studi Literatur
• Pembelajaran literatur terkait dengan konsep serta metode yang digunakan untuk menyelesaikan permasalahan
Pengumpulan Data
• Instansi terkait: Badan Lingkungan Hidup dan Unit Pelaksana Teknis Badan Laboratorium Lingkungan Kota SUrabaya • Desain parameter
Praprocessing Data • Tujuan dari proses ini adalah menghilangkan noise, memperjelas fitur data, memperkecil/ memperbesar ukuran data, dan mengkonversi data asli agar diperoleh data yang sesuai kebutuhan
Tahap Pelaksanaan Algoritma Daily Reports terhadap Udara Surabaya
Pengambilan dan pembersihan Data TIDAK Self Organizing Maps (SOM) cluster
Hasil cluster yang didapat
Apakah hasil telah valid? YA
K-means cluster
Hasil cluster K-means
Clustering Validation
Melakukan uji verifikasi
Melakukan Analisa Data
Hasil Analisa
PENGOLAHAN DATA DAN IMPLEMENTASI Proses Penyeleksian dan Pembersihan Data
Pengumpulan Data
1. Identifikasi Atribut
1. Parameter yang diukur No. 1 2 3 4 5 6
Parameter Nilai ISPU Partikulat (PM10) Sulfur Dioksida (SO2) Carbon Monoksida (CO) Ozon (O3) Nitrogen Dioksida (NO2)
Equation
2. Pemantauan Kualitas Udara Otomatis Stasiu n SUF1 SUF2 SUF3 SUF4 SUF5
Lokasi Pemantauan
Wilayah
Halaman Taman Prestasi, Jl.Ketabang Kali Halaman Kantor Kelurahan Perak Timur, Jl.Selangor Halaman Kantor Pembantu Walikota Surabaya Barat, Jl.Sukomanunggal Halaman Kecamatan Gayungan, Jl.Gayungan Halaman Convention Hall, Jl.Arif Rahman Hakim
Surabaya Pusat Surabaya Utara
P
Surabaya Barat
Nama Atribut Nilai Konsentrasi
Surabaya Selatan Surabaya Timur
Stasiun Bulan
Penjelasan Stasiun yang dilakukan pemantauan pada waktu t Nilai parameter sampai urutan ke k pada waktu t Nilai j menunjukkan penempatan kelas berdasarkan nilai Pattern atau pola Keterangan Nilai konsentrasi yang didapatkan dengan cara pengukuran otomatis pada masing- masing unsur Lokasi pengukuran yang telah ditempatkan di bagian- bagian Kota Surabaya Pengukuran nilai konsentrasi berdasarkan waktu setiap bulannya
PENGOLAHAN DATA DAN IMPLEMENTASI Proses Penyeleksian dan Pembersihan Data (Lanjutan) 2. Merubah Nilai Atribut
3. Standarisasi Niai 𝑆 = 𝑆𝑇𝐴𝑁𝐷𝐴𝑅𝐷𝐼𝑍𝐸(𝑥; 𝑚𝑒𝑎𝑛; 𝑠𝑡𝑎𝑛𝑑𝑑𝑒𝑣 )
PENGOLAHAN DATA DAN IMPLEMENTASI Pengerjaan Algoritma 1. Inisialisasi Klaster Nama Klaster Kluster 1 Kluster 2 Kluster 3
Jumlah Klaster 2 klaster yang terbentuk 3 klaster yang terbentuk 4 klaster yang terbentuk
3. Validasi Algoritma SOM Inisialisasi Klaster a b Klaster c d e Klaster f g h i
2. Tahapan Algoritma SOM Memasukkan data hasil praprocessing
Validasi ini digunakan untuk membandingkan nilai klaster mana yang memiliki tingkat kesalahan paling kecil menggunakan metode Root Median Square Standart Deviation (RMSSTD) Klaster Klaster 1 Klaster 2 Klaster 3
Nama Klaster Klaster a b Klaster c d e Klaster f g h i
RMSSTD
Inisialisasi Weight
Kluster c
Penentuan klaster berdasarkan inputan dari data weight terakhir
Didapatkan weight dengan nilai paling optimal, dan didapatkan pula hasil klustering
Nilai RMSSTD 1.009044 1.00178 1.072923
Kluster d
1.1
1.072923305
1.05 1.009043919 1.001779758
1 0.95
Kluster e
PENGOLAHAN DATA DAN IMPLEMENTASI Pengerjaan Algoritma (Lanjutan) 4. Tahapan Algoritma SOM Menentukan koordinat titik tengah setiap kluster yang didapatkan dari hasil Algoritma SOM yang telah tervalidasi
Menentukan jarak setiap obyek terhadap koordinat titik tengah
Mengelompokkan obyek- obyek berdasarkan pada jarak minimumnya.
PENGOLAHAN DATA DAN IMPLEMENTASI Visualisasi Hasil 1. Matlab Network Clustering Tool
Mengetikkan fungsi nctool
Muncul jendela Neural Network Clustering Tool
Memasukkan data yang telah dibuat, dan dilakukan proses import data menjadi format yang ditentukan oleh matlab
Menentukan jumlah baris dan kolom dalam satu grid atau kotak. Untuk baris dan kolom terdapat sampai baris ke 10 (default dari matlab), sedangkan total neuron berjumlah 100.
Muncul jendela Train Network dan klik Train untuk mendapatkan hasil proses algoritma SOM
Proses run telah berjalan maksimal dengan dilakukan 200 iteration dan untuk mengetahui hasil klaster dapat mengklik Plot yang ada.
PENGOLAHAN DATA DAN IMPLEMENTASI Visualisasi Hasil (Lanjutan) 2. Matlab Somtoolbox a. Construction of data sets
b. Data preprocessing Tahap untuk melakukan transformasi atau normalisasi, pemilihan data untuk dihilangkan atau nilai mengandung kesalahan menggunakan fungsi sD = som_normalize(sD,'var'); c. Initialization and Training Fungsi som_make pada somtoolbox merupakan salah satu caar untuk melakukan inisialisasi dan training pada SOM. sM=som_make (sD);
Mengubah data dari Ms. excel agar sesuai dengan format Matlab untuk dilakukan fungsi menggunakan Somtoolbox
d. Visualization and analysis Dilakukan visualisasi terhadap hasil SOM menggunakan som_show pemetaan menggunakan som_show_add sM = som_autolabel(sM,sD, 'vote'); som_show(sM, 'umat','all','comp',1:5, 'empty','Labels','norm','d'); som_show_add('label',sM,'subplot',7);
PENGOLAHAN DATA DAN IMPLEMENTASI Visualisasi Hasil (Lanjutan) 3. Peltarion Synapse
Halaman awal Peltarion Synapse
Melakukan proses import data menggunakan CSV File.
Melakukan Browse filename yang digunakan untuk dilakukan pengolahan
Tampilan data dengan hanya dipisahkan oleh koma
Mengubah format file yang hanya dipisahkan oleh koma menjadi field untuk memudahkan pada langkah selanjutnya
Memilih SOMView untuk selanjutkan akan didapatkan hasil visualisasi SOM
PENGOLAHAN DATA DAN IMPLEMENTASI Visualisasi Hasil (Lanjutan) 4. StatPlanet a. Layer Peta Memasukan peta ke dalam peta template (map.fla) sesuai dengan peta yang telah dibuat
c. Membuat link peta pada StatPlanet Data Editor Pada StatPlanet_data_editor.xlsm, pertama masukan ‘nama asli’ peta regional, dan kemudian ‘instance name’ atau kode yang digunakan dalam file peta (map.fla) sesuai dengan nama wilayah yang ditentukan. Daftar kode yang digunakan adalah Surabaya Barat menjadi SB, Surabaya Timur menjadi ST, Surabaya Pusat menjadi SP, Surabaya Selatan menjadi SS, dan Surabaya Utara menjadi SU.
b. Layer Batas Memasukan batas peta ke dalam map.fla
d. Memasukkan data pada StatPlanet Data Editor Sheet ‘Import’ dan masukan data pada peta. Juga bisa dilakukan dengan menggunakan tombol ‘Import data’ untuk mengimpor data secara otomatis.
UJI COBA DAN ANALISIS HASIL Uji Verifikasi Sistem
Uji Verifikasi Kluster Uji verifikasi terhadap kluster yang dihasilkan dengan menggunakan som toolbox. Dimana memiliki kemampuan untuk mengukur kebenaran terhadap pemetaan data penelitian dengan proyeksi yang optimal yang termasuk didalamnya adalah rata- rata dari quantization errors (QE) dan beberapa topographic errors (TE) Algoritma SOM kombinasi K-Means SOM K-Means
Verifikasi sistem dilakukan dengan cara memasukkan data selain penelitian untuk menguji ketepatan sistem yang telah dibangun. Data yang digunakan merupakan data iris
QE 0.285 0.401 0.486
TE 0.016 0.042 0.068
Dari hasil perbandingan pada tabel diatas menunjukkan bahwa dengan menggunakan kombinasi metode SOM dan k-mean hasil klasifikasi yang didapatkan memiliki tingkat kesalahan lebih kecil dibandingkan dengan metode SOM saja Algoritma Iris Data analisis (nilai ISPU)
QE 0.418 0.285
TE 0.013 0.016
Membandingkan hasil dengan menggunakan data template yaitu data iris. Berdasarkan tabel yang didapatkan, perbedaan hasil yang didapatkan tidak memiliki nilai yang terlampau jauh dengan data Iris yang merupakan data telah teruji
UJI COBA DAN ANALISIS HASIL Uji Validasi
Metode Self Organizing Maps
Metode Validasi Pengukuran menggunakan RMSSTD, yang telah dijelaskan pada bab 4 K-means Pengukuran dilakukan dengan menggunakan nilai entropy dengan membandingkan jumlah klustering yang ditentukan yaitu klaster 1 sampai klaster 3 Self Organizing Maps kombinasi dengan K- Pengukuran validitas yang dilakukan dari means awal sampai akhir dari penelitian ini.
Dalam penelitian yang dilakukan uji validasi dalam menentukan apakah hasil klaster telah sesuai dan optimal. Hasil kluster akan diukur menggunakan beberapa teknik clustering validation. Pada tabel diatas, penulis akan memperlihatkan validasi untuk masing- masing metode clustering yang digunakan.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 1. Deskripsi Klasifikasi (Taxonomi Description) a. Penyederhanaan Data Menetapkan struktur sesuai dengan hasil observasi dan kemudian dikompokkan untuk analisis selanjutnya. Berikut ini adalah hasil penyederhanaan data Nama Tabel (Sebelum) Tanggal Bulan Tahun Minimum Stasiun Maksimum Stasiun Rata- rata
Nama Tabel (Sesudah) Nilai Konsentrasi Stasiun Bulan
b. Identifikasi Hubungan Hubungan antar atribut diidentifikasi secara empiris. Struktur analisis cluster yang sederhana mampu menggambarkan adanya hubungan atau kesamaan dan perbedaan sesuai dengan kebutuhan untuk memenuhi tujuan Nama Atribut/ Tabel Nilai Konsentrasi Stasiun
Bulan
Keterangan Nilai konsentrasi yang didapatkan dengan cara pengukuran otomatis pada masing- masing unsur Lokasi pengukuran yang telah ditempatkan di bagian- bagian Kota Surabaya Pengukuran nilai konsentrasi berdasarkan waktu setiap bulannya
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 2. Desain terhadap Penelitian dalam Analisis Cluster a. Standarisasi Data Standarisasi terhadap data dilakukan dengan melakukan substraksi nilai rata- rata dan membagi dengan standar deviasi masingmasing variabel
Unsur ISPU (Nilai Keseluruhan) CO
b. Mengukur Kesamaan Data Metode RMSSTD merupakan salah satu metode untuk mengukur kesamaan data atau proses evaluasi yang digunakan untuk mengukur kualitas dari clustering algorithm. Semakin kecil nilai dari RMSSTD, maka semakin baik pembagian dari bentuk cluster
NO2
O3 PM10 SO2
Nama Klaster Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i
Nilai RMSSTD 1.009043919 1.001779758 1.072923305 1.142621036 0.653672873 1.371552774 0.908545706 0.609021788 1.605771531 1.214145746 1.600474716 1.633340841 1.173978921 1.065903541 1.439794084 1.457786539 1.287995208 1.140740332
Berdasarkan nilai yang dihasilkan menggunakan metode RMSSTD didapatkan dua unsur yang nilainya berbeda dengan unsur lainnya yang diteliti yaitu Unsur O3 dan unsur SO2. Dengan nilai RMSSTD berada pada rekomendasi kedua yaitu dilakukan dengan dilakukan pembagian kluster sebanyak 4 untuk SO2 dan pembagian kluster sebanyak 2 untuk O3. Sedangkan unsur lainnya menunjukkan nilai RMSSTD dengan rekomendasi pertama yaitu pembagian kluster sebanyak 3. Adanya hasil yang menyimpang tersebut maka dilakukan dua tindakan yaitu menganalisis apakah dua unsur tersebut memiliki bobot yang berbeda dengan unsur- unsur yang lainnya ataukah bobot dari seluruh unsur yang ditetiti adalah setara. (Berdasarkan Laporan Pemeliharaan Stasiun Monitoring Udara Ambient Tahun 2008 ( Kep107/KABAPEDAL/11/1997))
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 2. Desain terhadap Penelitian dalam Analisis Cluster d. Mendeteksi outlier Outlier merupakan variabel yang memiliki nilai berbeda dengan nilai variabel yang lainnya atau nilai variabel yang menyimpang. Entropy merupakan salah satu teknik validitas proses clustering yang digunakan untuk mengukur biased effect yaitu tingkat penyimpangan hasil clustering yang dihasilkan
Unsur ISPU (Nilai Keseluruhan) CO
NO2
O3 PM10 SO2
Nama Klaster Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i Klaster a b Klaster c d e Klaster f g h i
Nilai Entropy 3.139779 2.802700 2.943659 2.931186773 2.850489174 2.955864321 2.891321871 2.767884304 2.800278179 2.261340741 2.5197744 2.583771184 2.808577447 2.448691154 2.805158311 2.033748463 2.033158459 2.574259793
Dengan hasil yang didapatkan berdasarkan tabel diatas maka untuk clustering dengan pembagian klaster sebanyak 3 memiliki nilai entropy terkecil dibandingkan jumlah klaster lainnya, namun terdapat satu unsur yang memiliki nilai entropy terbaik tidak pada pembagian klaster sebanyak 3 yaitu unsur O3. Namun perbedaan nilai entropy yang dihasilkan oleh unsur tersebut tidak terlalu jauh dibandingkan pembagian klaster sebanyak 3 (berada pada urutan kedua) sehingga dapat dilakukan kesimpulan untuk nilai entropy ini bahwa nilai entropy terbaik dihasilkan dari pembagian sebanyak 3 klaster.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 3. Proses Validasi dan Verifikasi Solusi Cluster Tiga metode yang dilakukan dalam melakukan proses validasi dan verifikasi adalah dengan Davies Bouldin Index (DBI), dan Quantization Error (QE) serta Topography Error (TE) Unsur
ISPU (Nilai Keseluruhan) CO
NO2 O3
PM10 SO2
Metode Klaster SOM Kombinasi SOM dan K-means SOM Kombinasi SOM dan K-means SOM Kombinasi SOM dan K-means SOM Kombinasi SOM dan K-means SOM Kombinasi SOM dan K-means SOM Kombinasi SOM dan K-means
Nilai DBI 2.463220372 1.853457002 3.636903914 2.561812478 2.110417482 0.885502047 2.135225472 0.831734887 3.502232842 0.623986571 3.143125006 0.551741086
Semakin rendah nilai dari DBI, maka semakin baik pembagian dari bentuk cluster. Sehingga dari tabel tersebut ditarik kesimpulan bahwa Kombinasi SOM dan Kmeans memiliki nilai DBI yang lebih rendah dibandingkan dengan hanya SOM saja, dengan begitu pengklasteran sebanyak 3 menunjukkan nilai paling optimal
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 4. Pembuatan Profil terhadap Solusi Cluster Proses ini merupakan proses untuk menggambarkan karakteristik tiap klsster yang dihasilkan. Pendeskripsian yang berbeda untuk tiap klaster dan memprediksi anggota dalam suatu klaster khusus Menggambarkan karakteristik tiap klaster yang dibentuk serta melakukan pendeskripsian terhadap atribut yang dianalisis. Berikut ini adalah karakteristik untuk kondisi kualitas udara Surabaya
Nilai ISPU (Keseluruhan) Klaster
Klaster c
Karakteristik Jumlah Anggota Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster d
Nilai Minimum Nilai Maksimum Rata- Rata Nilai
Stasiun Jumlah Anggota
Klaster e
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Hasil
Jumlah untuk kluster c adalah sebanyak 353 (32.2%) 7 96 Rata- rata nilai ISPU untuk kluster c adalah 51 Anggota lebih banyak dari stasiun 1, 4, dan 5 Jumlah untuk kluster d adalah sebanyak 334 (30.4%) 52 131 Rata- rata nilai ISPU untuk kluster 2 adalah 84 Anggota lebih banyak dari stasiun 3 dan 4 Jumlah untuk kluster e adalah sebanyak 409 (37.3%) 87 189 Rata- rata nilai ISPU untuk kluster e adalah 101 Anggota lebih banyak dari stasiun 1, 4, dan 5
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 4. Pembuatan Profil terhadap Solusi Cluster (lanjutan) Unsur CO Klaster
Klaster c
Karakteristik Jumlah Anggota
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster d
Nilai Minimum Nilai Maksimum Rata- Rata Nilai
Stasiun Jumlah Anggota
Klaster e
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Unsur NO2 Hasil
Jumlah untuk kluster c adalah sebanyak 288 (26.25%) 0,51 7,02 Rata- rata nilai CO untuk kluster c adalah 1,59 Anggota lebih banyak dari stasiun 5 Jumlah untuk kluster d adalah sebanyak 596 (54.3%) 0,34 8,61 Rata- rata nilai ISPU untuk kluster 2 adalah 1,83
Anggota lebih banyak dari stasiun 4 Jumlah untuk kluster e adalah sebanyak 18,5 (37.3%) 1,29 8,43 Rata- rata nilai ISPU untuk kluster e adalah 101 Anggota lebih banyak dari stasiun 4 dan 5
Klaster
Klaster c
Karakteristik Jumlah Anggota
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster d
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster e
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Hasil
Jumlah untuk kluster c adalah sebanyak 334 (30.4%) 0,094 212,14 Rata- rata nilai ISPU untuk kluster c adalah 48,2428 Anggota lebih banyak dari stasiun 4 Jumlah untuk kluster d adalah sebanyak 353 (32.2%) 0.01566 176,2 Rata- rata nilai ISPU untuk kluster 2 adalah 50.7345 Anggota lebih banyak dari stasiun 3 dan 4 Jumlah untuk kluster e adalah sebanyak 409 (37.1%) 0.01566 192,57 Rata- rata nilai ISPU untuk kluster e adalah 54,5822 Anggota lebih banyak dari stasiun 5
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 4. Pembuatan Profil terhadap Solusi Cluster (lanjutan) Unsur O3
Klaster
Klaster c
Karakteristik Jumlah Anggota Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Jumlah Anggota
Klaster d
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster e
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Unsur PM10 Hasil
Jumlah untuk kluster c adalah sebanyak 298 (27.1%) 43,757 694,34 Rata- rata nilai ISPU untuk kluster c adalah 124,383 Anggota lebih banyak dari stasiun 1 dan 5 Jumlah untuk kluster d adalah sebanyak 89 (8.1%) 21,446 176,07 Rata- rata nilai ISPU untuk kluster 2 adalah 129,297 Anggota lebih banyak dari stasiun 1 Jumlah untuk kluster e adalah sebanyak 709 (64.6%) 52,038 374,08 Rata- rata nilai ISPU untuk kluster e adalah 141 Anggota lebih banyak dari stasiun 1
Klaster
Klaster c
Karakteristik Jumlah Anggota Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster d
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster e
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Hasil
Jumlah untuk kluster c adalah sebanyak 353 (32.2%) 7 96 Rata- rata nilai ISPU untuk kluster c adalah 51 Anggota lebih banyak dari stasiun 1, 4, dan 5 Jumlah untuk kluster d adalah sebanyak 334 (30.4%) 52 131 Rata- rata nilai ISPU untuk kluster 2 adalah 84 Anggota lebih banyak dari stasiun 3 dan 4 Jumlah untuk kluster e adalah sebanyak 409 (37.3%) 87 189 Rata- rata nilai ISPU untuk kluster e adalah 101 Anggota lebih banyak dari stasiun 1, 4, dan 5
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 4. Pembuatan Profil terhadap Solusi Cluster (lanjutan) Unsur SO2 Klaster
Klaster c
Karakteristik Jumlah Anggota Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Jumlah Anggota
Klaster d
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun Jumlah Anggota
Klaster e
Nilai Minimum Nilai Maksimum Rata- Rata Nilai Stasiun
Hasil
Jumlah untuk kluster c adalah sebanyak 541 (49.3%) 72,727 1101 Rata- rata nilai ISPU untuk kluster c adalah 303,5597 Anggota lebih banyak dari stasiun 1, 4, dan 5 Jumlah untuk kluster d adalah sebanyak 331 (30.1%) 203 1393 Rata- rata nilai ISPU untuk kluster 2 adalah 622,0237 Anggota lebih banyak dari stasiun 1 dan 5 Jumlah untuk kluster e adalah sebanyak 224 (20.4%) 0,15283 2095,7 Rata- rata nilai ISPU untuk kluster e adalah 372,8715 Anggota lebih banyak dari stasiun 1, 2, dan 5
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 4. Pembuatan Profil terhadap Solusi Cluster (lanjutan) Mengelompokkan dengan menggunakan kategori yang menunjukkan kondisi kualitas udara yang ada di Surabaya berdasarkan hasil yang didapatkan. Dengan menggunakan beberapa asumsi dan berdasarkan Laporan Pemeliharaan Stasiun Monitoring Udara Ambient Tahun 2008 ( Kep107/KABAPEDAL/11/1997) (KABAPEDAL, 2008) maka penulis melakukan pembagian kategori dan pengaruhnya yang ditunjukkan pada tabel
Klaster Klaster c
Kategori
Index
Penjelasan
Baik
0 – 50
Klaster d
Sedang
51 – 100
Klaster e
Tidak Sehat
101 – 199
Tingkat kualitas udara yang tidak memberikan efek bagi kesehatan manusia atau hewan dan tidak berpengaruh pada tumbuhan, bangunan ataupun nilai estetika Tingkat kualitas udara yang tidak berpengaruh pada kesehatan manusia atau hewan dan tidak berpengaruh pada tumbuhan yang sensitif, dan nilai estetika Tingkat kualitas udara yang bersifat merugikan pada manusia ataupun kelompok hewan yang sensitif atau bisa menimbulkan kerusakan pada tumbuhan ataupun nilai estetika
Kategor i Baik
CO
NO2
Tidak ada efek
Sedikit berbau Luka pada beberapa spesies tumbuhan akibat kombinasi SO2 (selama 4 jam)
Sedang
Perubahan kimia Darah tetapi tidak terdeteksi Peningkatan pada kardiovaskular pada perokok yang sakit jantung
Berbau
Berbaudan kehilangan warna, peningkatan reaktivitas pembuluh tenggorokan pada penderita asma Meningkat sensitivitas pada pasien yang berpenyakit asma dan bronchitis
Tidak Sehat
Sangat Tidak Sehat
Berbaha ya
O3
SO2
PM10 Tidak ada efek
Luka pada beberapa spesies tumbuhan
Luka pada beberapa spisies tumbuhan akibat kombinasi O3 (selama 4 jam) Luka pada beberapa spesies tumbuhan
Penurunan kemampuan pada atlit yang berlatih keras
Berbau Meningkatnya kerusakan tanaman
Meningkat Olahraga Meningkat kardiovaskular ringan sensitivitas pada pada perokok mengakibatkan pasien yang yang sakit pengaruh berpenyakit jantung, dan pernapasan pada asma dan tampak pasien yang bronchitis beberapa berpenyakit parukelemahan paru kronis yang terlihat nyata Tingkat yang berbahaya bagi semua populasi yang terpapar
Terjadi penurunan pada jarak pandang Jarak pandang turun dan terjadi pengotoran oleh debu
Meningkat sensitivitas pada pasien yang berpenyakit asma dan bronchitis
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Data 5.Penentuan Titik Rawan Polusi Berikut ini adalah analisis untuk menentukan titik rawan polusi. Penulis mendeskripsikan bahwa rawan polusi dapat diketahui dari hasil clustering yang terbentuk pada cluster dengan predikat Sangat Tidak Sehat (Kluster 4) dan Berbahaya (Kluster 5).
LOKASI TITIK RAWAN POLUSI BERDASARKAN KONDISI UDARA TIDAK SEHAT 101
130
Lokasi
Tidak Sehat Setiap bulan pada tiga tahun penelitian SUF 1 (Surabaya Pusat) berjumlah 144 SUF 4 (Surabaya Selatan) berjumlah 130 SUF 5 (Surabaya Timur) berjumlah 101
178
Kondisi Bulan Terjadi
Jumlah Lokasi
Total TItik
Rawan Polusi
SURABAYA PUSAT
SURABAYA SELATAN
SURABAYA TIMUR
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool 1. Plot SOM Neighbor Distances Jenis Indikator -1 sampai 8 Indikator 0 sampai 10 Segienam biru Garis merah
Penjelasan Jumlah kolom Jumlah baris Mewakili neuron Menghubungkan antar neuron Warnawarna di Jarak antar neuron daerah yang berisi garis- garis merah Warna- warna gelap Menunjukkan jarak yang lebih besar, atau data yang memiliki perbedaan jauh Warna- warna cerah Menunjukkan jarak yang lebih dekat, atau data saling berkorelasi
2. Plot SOM Weight Planes Grafik ini menunjukkan weight plane untuk setiap elemen dari input vector (terdapat 5 input yang dilakukan oleh peneliti). Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Warna cerah mewakili lebih besar dan warna gelap mewakili lebih kecil bobot masing- masing
3. Plot SOM Sample Hits Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang cukup merata disetiap neuron.
4. Plot SOM Weight Positions Grafik yang ditunjukkan pada SOM Weight Planes digunakan untuk menunjukkan lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool (Lanjutan) 1. Plot SOM Neighbor Distances
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Nilai ISPU (Keseluruhan)
Plot SOM Neighbor Distances
ISPU Plot didominasi dengan warna cerah yaitu kuning dan oranye yang menunjukkan jarak yang lebih dekat dan data terlihat berkorelasi tinggi, namun hanya terlihat sedikit warna gelap. Sehingga konvergensi terhadap hasil clustering terlihat cukup tinggi
Plot SOM Weight Planes
Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Untuk Input 1 yang menunjukkan nilai ISPU, lebih didominasi dengan warna cerah dengan bobot lebih kecil, namun untuk input yang lainnya nilai cerah dan gelap cukup merata.
Plot SOM Sample Hits
Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang cukup merata disetiap neuron
Plot SOM Weight Positions
Lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool (Lanjutan) 1. Plot SOM Neighbor Distances
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Unsur CO Plot SOM Neighbor Distances
CO Plot didominasi dengan warna cerah yaitu kuning dan oranye yang menunjukkan jarak yang lebih dekat dan data terlihat berkorelasi tinggi, namun hanya terlihat sedikit warna gelap. Sehingga konvergensi terhadap hasil clustering terlihat cukup tinggi
Plot SOM Weight Planes
Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Untuk keseluruhan input menunjukkan weight dari nilai ISPU, lebih didominasi dengan warna gelap dengan bobot yang cukup besar.
Plot SOM Sample Hits
Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang merata dengan baik disetiap neuron
Plot SOM Weight Positions
Lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool (Lanjutan) 1. Plot SOM Neighbor Distances
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
4. Plot SOM Weight Positions
Unsur NO2 Plot SOM Neighbor Distances
NO2 Plot didominasi dengan warna cerah yaitu kuning dan oranye yang menunjukkan jarak yang lebih dekat dan data terlihat berkorelasi tinggi, namun hanya terlihat sedikit warna gelap. Sehingga konvergensi terhadap hasil clustering terlihat cukup tinggi
Plot SOM Weight Planes
Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Untuk keseluruhan input menunjukkan weight dari nilai ISPU, lebih didominasi dengan warna gelap dengan bobot yang cukup besar.
Plot SOM Sample Hits
Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang cukup merata disetiap neuron
Plot SOM Weight Positions Lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool (Lanjutan) 1. Plot SOM Neighbor Distances
2. Plot SOM Weight Planes
3. Plot SOM Sample Hits
Unsur O3 Plot SOM Neighbor Distances
O3 Plot didominasi dengan warna cerah yaitu kuning dan oranye yang menunjukkan jarak yang lebih dekat dan data terlihat berkorelasi tinggi, namun hanya terlihat sedikit warna gelap. Sehingga konvergensi terhadap hasil clustering terlihat cukup tinggi
Plot SOM Weight Planes
Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Untuk keseluruhan input menunjukkan weight dari nilai ISPU, lebih didominasi dengan warna gelap dengan bobot yang cukup besar.
Plot SOM Sample Hits
Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang cukup merata disetiap neuron
Plot SOM Weight Positions
Lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data. Terdapat nilai weight yang cukup jauh dengan yang lainnya karena terdapat data yang memiliki jarak cukup jauh
4. Plot SOM Weight Positions
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool (Lanjutan) 1. Plot SOM Neighbor Distances
3. Plot SOM Sample Hits
PM10 Plot SOM Neighbor Distances
Plot SOM Weight Planes
Plot SOM Sample Hits
2. Plot SOM Weight Planes
4. Plot SOM Weight Positions
Plot SOM Weight Positions
PM10 Plot didominasi dengan warna cerah yaitu kuning dan oranye yang menunjukkan jarak yang lebih dekat dan data terlihat berkorelasi tinggi, namun hanya terlihat sedikit warna gelap. Sehingga konvergensi terhadap hasil clustering terlihat cukup tinggi Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Untuk keseluruhan input menunjukkan weight dari nilai ISPU, lebih didominasi dengan warna gelap dengan bobot yang cukup besar. Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang merata dengan baik disetiap neuron Lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data.
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi 1. Matlab Network Clustering Tool (Lanjutan) 1. Plot SOM Neighbor Distances
3. Plot SOM Sample Hits
SO2 Plot SOM Neighbor Distances
SO2 Plot didominasi dengan warna cerah yaitu kuning dan oranye yang menunjukkan jarak yang lebih dekat dan data terlihat berkorelasi tinggi, namun hanya terlihat sedikit warna gelap. Sehingga konvergensi terhadap hasil clustering terlihat cukup tinggi
Plot SOM Weight Planes Grafik ini menunjukkan visualisasi dari weight setiap input pada masing- masing neuron. Untuk keseluruhan input menunjukkan weight dari nilai ISPU, lebih didominasi dengan warna gelap dengan bobot yang cukup besar.
2. Plot SOM Weight Planes
Plot SOM Sample Hits
Grafik ini menunjukkan berapa titik data yang terkait dengan setiap neuron. Data yang terbaik adalah jika grafik menunjukkan jumlah data yang cukup merata disetiap neuron
Plot SOM Weight Positions
Lokasi dari titik data dan weight vector (vector berat). Pada hasil yang ditunjukkan merupakan hasil dari 200 kali iterasi dari algoritma batch yang telah dilakukan pada keseluruhan data. Terdapat nilai weight yang cukup jauh dengan yang lainnya karena terdapat data yang memiliki jarak cukup jauh.
4. Plot SOM Weight Positions
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi Nilai ISPU (Keseluruhan)
Unsur SO2
Unsur PM10
2. Matlab Som Toolbox Berikut ini adalah hasil dari analisis yang dilakukan oleh penulis terhadap data yang telah diolah sehingga menghasilkan visualisasi yang ditampilkan untuk mengetahui hasil clustering terhadap lokasi pada map SOM dan porsinya. Keterangan mengenai kluster dijelaskan di bab Pembuatan Profil Terhadap Solusi Cluster pada tabel Pembagian kategori berdasarkan klaster yang terbentuk.
Unsur O3
Unsur NO2
Unsur CO
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Visualisasi Nilai ISPU (Keseluruhan)
Unsur SO2
3. Peltarion Synapse Nama
Bagian Cluster:
Penjelasan Menunjukkan jumlah klaster yang dibentuk
Unified distance matrix
Menunjukkan rata- rata jarak antar nodes pada SOM
Maplets lainnya
Merepresentasikan fitur- fitur yang ada pada data. Setiap fitur terdapat satu maplets.
Maplets
Unsur O3
Unsur PM10
Unsur NO2
Unsur CO
1. Nama Maplet
Maplet GUI interaction
2. SOM node (many data points) 3. SOM node no data points) 4. Maplet spectrum
Hasil dari analisis yang dilakukan oleh penulis terhadap data yang telah diolah menghasilkan visualisasi yang ditampilkan masingmasing sesuai dengan atribut (unsur) masing- masing sebagai berikut
PENGOLAHAN DATA DAN IMPLEMENTASI Analisis Interaksi terhadap Peta Berikut ini adalah hasil dari dari visualisasi menggunakan peta. Seperti telah dijelaskan diatas bahwa penulis juga melakukan analisis menggunakan peta menggunakan aplikasi bantuan Statsilk. Terlihat seperti dibawah ini
Dengan hasil pada gambar diatas, maka hasil cluster terlihat dari perbedaan warna yang didapatkan menunjukkan kondisi dari kualitas udara. Terdapat pilihan terhadap wilayah, terhadap waktu, dan pilihan berdasarkan parameter tertentu. Pilihan- pilihan tersebut akan mempengaruhi hasil peta yang ada ditengah- tengah visualisasi
KESIMPULAN ▪ Dalam proses clustering terhadap kualitas udara, diperlukan nilai ISPU, CO, NO2, O3, PM10, dan SO2 untuk dilakukan pengolahan menggunakan algoritma Self-Organizing Maps dan K-means ▪ Dimulai dari preprocessing data, pelaksanaan metode Self-Organizing Maps dan K-means yang dilanjutkan dengan proses validasi dan verifikasi dan proses visualisasi terhadap hasil jumlah dan bentuk klaster ▪ Berdasarkan data yang di praproses kemudian diklasterisasi dengan algoritma SOM yang telah tervalidasi sehingga didapatkan jumlah klaster sebanyak 3 dengan nama Klaster c, d, dan e yang merupakan bentuk clustering paling optimal. Dan dilanjutkan dengan K-means untuk mendapatkan hasil clustering yang presisi dan stabil.
▪ Tingkat akurasi terhadap hasil clustering menggunakan Davies Bouldin Index, Quantization Error dan Topography Error dengan hasil yang paling rendah. Hasil clustering yang didapat sudah sesuai karena nilai DBI terhadap clustering SOM dan Kmeans lebih rendah daripada menggunakan metode clustering k-means. Hasil DBI untuk SOM dan K-means adalah 1.853457 sedangkan SOM sebesar 2.46322. Hasil QE dan TE untuk SOM dan K-means adalah 0.285 dan 0.016 sedangkan SOM saja sebesar 0.401 dan 0.042 dan untuk K-means saja sebesar 0.486 dan 0.068. ▪ Pada pembentukan karakteristik yang didapatkan hasil dimana hasil clustering kualitas udara pada tahun 2010 sampai 2013 tersebut mampu mengetahui lokasi titik rawan polusi wilayah kota Surabaya. Stasiun pemantau yang menunjukkan nilai ISPU dengan Predikat Tidak Sehat yang sering terjadi pada Stasiun Pemantau 1 (Surabaya Pusat), 4 (Surabaya Selatan), dan 5 (Surabaya Timur). Kondisi rawan polusi dengan predikat Tidak Sehat sering terjadi disetiap bulannya pada tiga tahun penelitian.
SARAN ▪ Sebaiknya tujuan dari penelitian yang berhubungan dengan kualitas udara dapat dikembangkan lagi tidak hanya untuk Surabaya saja, namun untuk keseluruhan kota di Indonesia
▪ Sebaiknya atribut yang dilakukan penelitian tidak hanya atribut utama saja yaitu unsur atau substansi yang berbahaya, namun atribut yang berhubungan dengan meteorological juga turut disertakan dalam penelitian.
▪ Penelitian ini mempelajari tentang bagaimana memvisualisasikan kondisi kualitas udara di kota Surabaya dengan menggunakan data hasil monitoring yang dilakukan menggunakan data statis yaitu pada tahun 2010- 2012. Oleh karena itu untuk penelitian selanjutnya terdapat beberapa usulan yaitu ▪ Data yang digunakan bersifat dinamis dengan tidak hanya menggunakan data pada waktu tertentu ▪ Perlunya prediksi kedepan untuk visualisasi titik rawan polusi dengan memperhatikan faktor- faktor yang sudah ditentukan pada penelitian ini dan sebelumnya.
TERIMAKASIH