Pemetaan Prioritas Berbasis Penggalian Data Multidimensi Menggunakan WEBSOM (Priority Mapping Based on Multi-dimensional Data Mining Using WEBSOM)
ITS,08-07-2010
NINIK WIDAYATI
Latar Belakang Masalah • Pembuatan berbagai laporan pemerintah daerah Æ kerja tidak efisien. • Kelemahan pimpinan eksekutif (kepala daerah) dalam memformulasikan kebijakan karena kurangnya referensi global Æ sistem pendukung keputusan. • Konsep Pengembangan Inovasi Sektor PublikÆ Resource-Based dengan pengetahuan. • WebSOMÆ algoritma SOMÆdata ruang dimensi tinggiÆvektor 1 dimensi atau 2 dimensi PB
Rancangan Model Sistem Anggota Tim Penyusun: • BAPPEDA • Sekretariat Daerah: - Bagian Tata Pemerintahan - Bagian Humas - Bagian Organisasi
Laporan Seluruh SKPD: Dinas/Badan/Kantor/Kecamatan
Penggalian Data Multidimensi Dengan Metode WebSOM
Referensi Global Pendukung Keputusan (Kepala Daerah dan Bahan Quesioner)
Laporan Pemda: LAKIP, LKPJ, LPPD dan ILPPD PB
Tujuan Penelitian • Mengembangkan suatu penggalian data multidimensi yang dapat membantu pemerintah dan masyarakat untuk menentukan prioritas data dasar pembangunan daerah yang sesuai dengan kriteria utama tujuan bidangnya. • Menerapkan metode WEB Self Organizing Map (WEBSOM) sebagai salah satu metode pendukung pengambilan keputusan multidimensi dengan membuat rancangan sistemnya. PB
KOMPONEN DSS •
Secara alami informasi memuat berbagai hal (raw data) yang berasal dari berbagai sumber yang terpisah-pisah dan berada dalam berbagai macam format yang berbeda-beda.
•
Disatu sisi, eksekutif membutuhkan aplikasi yang sifatnya sudah jadi (sudah diolah sesuai kebutuhan), akurat, mudah didapat secara cepat dan siap pakai.
LS
LS
Hubungan Data Mining dengan ilmu lainnya
LS
Indikator Pemerataan Pendidikan sesuai UU No. 20 Tahun 2003 •
•
•
•
•
•
APK (Angka Partisipasi Kasar), dengan rumus: APK = Jumlah murid di tingkat pendidikan tertentu x 100 % Jumlah penduduk usia sekolah APM (Angka Partisipasi Murni), dengan rumus: APM = Jumlah murid usia kelompok di tingkat pendidikan tertentu x 100% Jumlah penduduk kelompok usia sekolah Rasio Guru-Murid, dengan rumus: Rasio Guru-Murid = Jumlah Guru di tingkat pendidikan tertentu Jumlah Murid di tingkat pendidikan tertentu Rasio Kelas-Murid, dengan rumus: Rasio Kelas-Murid = Jumlah Ruang Kelas di tingkat pendidikan tertentu Jumlah Murid di tingkat pendidikan tertentu Rasio Sekolah-Murid, dengan rumus: Rasio Sekolah-Murid = Jumlah Sekolah di tingkat pendidikan tertentu Jumlah Murid di tingkat pendidikan tertentu Angka Shift, dengan rumus: Angka Shift = Jumlah Ruang Kelas di tingkat pendidikan tertentu Jumlah Rombongan Belajar di tingkat pendidikan tertentu
Variabel untuk Data Input
Hasil Statistik Deskriptif
Hubungan nilai variabel indikator dan faktor pengaruh kebijakan Nama Variabel
No.
1.
2.
3.
4.
5.
6.
APK
APM
Rasio Guru-Murid
Rasio Kelas-Murid
Rasio Sekolah-Murid
Angka Shift (Rasio Rombongan Belajar - Kelas)
Kondisi
Dampak
Tinggi
Baik
Rendah
Buruk
Tinggi
Baik
Faktor Pengaruh Partisipasi pendidikan masyarakat meningkat. Angka partisipasi pendidikan rendah, tingkat partisipasi masyarakat untuk menyekolahkan anaknya pada pendidikan dasar / lanjut kurang baik. Partisipasi pendidikan masyarakat meningkat.
Rendah
Buruk
Angka partisipasi pendidikan rendah, tingkat partisipasi masyarakat untuk menyekolahkan anaknya pada pendidikan dasar / lanjut kurang baik..
Rendah
Buruk
Beban kerja / tingkat kesulitan guru meningkat, murid tidak mendapat perhatian penuh.
Tinggi
Baik
Beban kerja / tingkat kesulitan guru menurun, murid mendapat perhatian penuh.
Rendah
Buruk
Tinggi
Baik
Kelas kurang padat siswa mudah konsentrasi belajar.
Rendah
Buruk
Daya tampung untuk murid yang bersekolah banyak
Tinggi
Baik
Daya tampung untuk murid yang bersekolah sedikit.
Rendah
Buruk
Penyelenggaraan belajar mengajar tidak bisa dalam waktu yang bersamaan
Tinggi
Baik
Penyelenggaraan belajar mengajar bisa dalam waktu yang bersamaan.
Kelas padat siswa sulit konsentrasi belajar.
Klasifikasi variabel indikator pemerataan pendidikan
Kondisi Nilai Variabel dan Dampak
Perbedaan Variasi Warna
Kategori
Variabel Indikator yang berlaku
Sedang Ada Beda Rendah-Buruk
Cukup Kurang Tidak Ada Beda
APK APM
Kurang Sedang
Ada Beda Tinggi-Baik
Cukup baik Tidak Ada Beda
Baik Sedang
Ada Beda Cukup Baik
Tinggi-Baik Tidak Ada Beda
Baik Sedang
Ada Beda Cukup Kurang
Rendah-Buruk Tidak Ada Beda
APK APM
Kurang
Rasio Guru-Murid Rasio Kelas-Murid Rasio Sekolah-Murid Angka Shift Rasio Guru-Murid Rasio Kelas-Murid Rasio Sekolah-Murid Angka Shift
Arsitektur Dasar Metode WebSOM
LS
Perbedaan View Level WEBSOM
LS
Contoh Kategori Kata
LS
Hasil Pencarian Content
LS
Model Jaringan SOM & Skema Sistem Keseluruhan Klasterisasi
Batch Training Normalisasi Data Input
Map Visualization SOM Map
Classification Output Map Labelling Klasifikasi
Profil Data Pendidikan
Prapemrosesan Data Data Storage
Proses Kalsterisasi dan Proses Klasifikasi
Output klasifikasi
Kurang
Cukup Kurang
Sedang
Cukup Baik
Baik
Data Asli Jenjang Pendidikan SD
Data Asli Jenjang SLTP
Data Asli Jenjang SLTA
Normalisasi Data Metoda Softmax
X scale
X − mean ( X i ) = i std ( X i )
1 Xnew = 1 + expXscale
P a ra m a s a n
S im p a n g E m p a t
Sam bung M akm ur
Kecamatan A ra n io
A lu h A lu h G am but Sungai Tabuk M a rta p u ra T im u r A s ta m b u l
40.00
20.00
0.00
X4 X5 X6 X1 X2 X3
Variabel Indikator SD Kecamatan
X9 X10 X11 X12
60.00
X8
80.00
S im p a n g E m p a t X7
100.00
Sam bung M akm ur
120.00
P a ra m a s a n
140.00
A lu h A lu h G am but Sungai Tabuk M a rta p u r a T im u r A s ta m b u l A r a n io
X1 X2 X3 X4 X5 X6 S k a la N ila i V a r ia b e l In d ik a to r S D
X7 X8 X9 X10 X11 X12 200
150
100
50
0
Variabel Indikator
S k a la N ila i V a r ia b e l In d ik a t o r
Grafik Data Input & Normalisasi SD 160.00 300
250
50
0
Variabel Indikator Kecamatan
X9 X10 X11 X12
X8
S im p a n g E m p a t X7
100
Sam bung M akm ur
150
P a ra m a s a n
200 S k a la N ila i V a r ia b e l In d ik a t o r
250
A ra n io
X7 X8 X9 X10 X11 X12
A lu h A lu h G am but Sungai Tabuk M a rta p u ra T im u r A s ta m b u l
X9 X10 X11 X12
X8
S im p a n g E m p a t X7
Sam bung M akm ur
Kecamatan P a ra m a s a n
A lu h A lu h G am but Sungai Tabuk M a r ta p u r a T im u r A s ta m b u l A r a n io
300 X7 X8 X9 X10 X11 X12 0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
Variabel Indikator
S k a la N ila i V a r ia b e l In d ik a to r
Grafik Data Input & Normalisasi SLTP 1.00
0.90
0.80
Kecamatan X14 X15 X16 X17 X18
S im p a n g E m p a t X13
Sam bung M akm ur
P a ra m a s a n
A lu h A lu h G am but Sungai Tabuk M a r ta p u r a T im u r A s ta m b u l A r a n io
10.00
0.00
Variabel Indikator Kecamatan
X16 X17 X18
X15
30.00
X14
40.00
S im p a n g E m p a t X13
50.00
Sam bung M akm ur
60.00
A ra n io
70.00
P a ra m a s a n
80.00
A lu h A lu h G am but Sungai Tabuk M a rta p u ra T im u r A s ta m b u l
X13 X14 X15 X16 X17 X18 S k a la N ila i V a r ia b e l In d ik a to r
90.00 X13 X14 X15 X16 X17 X18 0.60
0.50
0.40
0.30
20.00 0.20
0.10
0.00
Variabel Indikator
S k a la N ila i V a ria b e l In d ik a to r
Grafik Data Input & Normalisasi SLTA 0.90
0.80
0.70
Mulai
Initialisasi α, R, Y, Wij
Algoritma SOM 1.
Inputkan Xi Untuk i = 1, 2,3,..n.
Hitung D (j)
2. 3. 4.
D( j ) = ∑i =1 (Wij − X i )
D(j) terkecil
Pilih indeks untuk D(j) terkecil
Hitung Bobot Wij
Inisialisasi bobot secara random, menentukan nilai maksimum untuk radius dan pembelajaran α. Kondisi akan berhenti jika bernilai false, jika tidak lakukan langkah 3 sampai 9. Setiap input vektor X, lakukan langkah 4 sampai 6. Untuk setiap keluaran, hitung jarak Euclidean dengan 2 rumus: n
5. Tentukan indeks j untuk D(j) yang paling kecil. 6. Perbaharui bobot untuk semua neighbourhood j dari semua input, dengan rumus: Wij (new) = Wij (old ) + α (t ) * (X i − Wij (old ) )
7.
Update α
Perbaharui nilai pembelajaran α. Nilai didapat dengan fungsi perkalian nilai learning rate terhadap nilai pengurangan learning rate. α (t ) = α (0) * nilai _ penurunan _ learning _ rate
Reduce R
8. 9.
Berhenti
Selesai
Mengurangi radius neighbourhood (R) pada waktuwaktu tertentu. Kondisi berhenti terpenuhi jika nilai α terkecil (mendekati nol) yang diinginkan telah terpenuhi. Jika nilai α menjadi sangat kecil maka pembacaan bobot juga akan sangat kecil sehingga proses training dapat dihentikan.
Peta U-matrik Jenjang SD U-matrix
U-matrix 0.286
0.174 0.0626 0.286 0.174 0.0626 0.286
0.174 0.174 0.0626 0.286 0.174 0.0626
SOM Tingkat SD
0.0626
SOM Tingkat SD
Peta U-matrik Variabel X1 - X6 X1
U-matrix
X2
0.286
132
98
0.174
116
91.1
0.0626
101
82.9
d
d
X4
X3
X5
0.0825
0.058
0.01
0.0672
0.0528
0.00905
0.0508 d
0.0477 d
X6 1.01 0.924 0.835 d
SOM Tingkat SD
0.00806 d
Peta U-matrik Jenjang SLTP U-matrix
U-matrix 0.319
0.319
0.182
0.0451
0.182 0.319
0.182
0.0451
0.0451
SOM Tingkat SLTP
SOM Tingkat SLTP
Peta U-matrik Variabel X7 - X12 X7
U-matrix
X8
0.319
99.2
79.3
0.182
73
55.4
0.0451
42.8
29
d
d
X10
X9
X11
0.293
0.0738
0.0213
0.173
0.0454
0.0109
0.0716 d
0.0202 d
X12 1.22 0.959 0.683 d
SOM Tingkat SLTP
0.00168 d
Peta U-matrik Jenjang SLTA U-matrix
U-matrix
0.513
0.0376 0.513 0.275 0.0376 0.513
0.275 0.275 0.0376 0.513 0.275 0.0376
SOM Tingkat SLTA
0.0376
SOM Tingkat SLTA
Peta U-matrik Variabel X13-X18 X13
U-matrix
X14
0.513
79.5
62.1
0.275
35.1
27.3
0.0376
2.4
1.52
d
d
X16
X15
X17
0.265
0.0566
0.0165
0.13
0.0288
0.00779
0.00589
0.00172
7.14e-005
d
d
X18 1.16 0.639 0.0524 d
SOM Tingkat SLTA
d
Representasi warna untuk tingkatan nilai indikator pemerataan pendidikan Warna
Tingkat nilai indikator
Symbol
Biru
Kurang
Kr
Cyan
Cukup Kurang
Ck
Hijau
Sedang
Sd
Kuning
Cukup Baik
Cb
Merah
Baik
Ba
Gambar
Hasil Cluster dan Klasifikasi Tingkat SD
Hasil PC Projection Tingkat SD
Hasil Cluster dan Klasifikasi Tingkat SLTP
Hasil PC Projection Tingkat SLTP
Hasil Cluster dan Klasifikasi Tingkat SLTA
Hasil PC Projection Tingkat SLTA
Kesimpulan •
Pemetaan Prioritas Perencanaan Pembangunan dapat dilakukan dengan menggunakan metode yang telah dikerjakan pada penelitian ini.
•
Dengan melihat gambar peta u-matrik dan proyeksi pie chart pada peta serta grafik PC Projection, dapat dilihat distribusi penyebaran data input pada neuron peta jaringan SOM. Grafik piechart juga menunjukkan komposisi jumlah kecamatan yang tergabung pada satu neuron dengan kecamatan lain.
•
Dari penelitian yang telah dilakukan didapatkan hasil untuk masingmasing tingkatan adalah sebagai berikut: – Tingkatan SD/Sederajat terdiri dari 3 kecamatan di tingkatan kurang, 8 cukup kurang, 3 sedang, 2 kecamatan cukup baik, dan 1 baik. – Tingkatan indikator pemerataan pendidikan jenjang SLTP/Sederajat terdiri dari 5 kecamatan di tingkatan kurang, 5 cukup kurang, 1 sedang, 5 cukup baik, dan 1 baik. – Tingkatan indikator pemerataan pendidikan jenjang SLTA/Sederajat terdiri dari 3 kecamatan di tingkatan kurang, 9 cukup kurang, 1 sedang, 3 cukup baik, dan 1 baik.