Modul Praktikum Spatial Data Mining
Laboratorium SIG Fakultas Geografi UGM
Acara IV
Praktikum Spatial Data Mining Local Entropy Map Pendekatan non-‐parametrik untuk mendeteksi variasi hubungan multivariate
Processing -‐ Local Entropy Map
•
39
Modul Praktikum Spatial Data Mining
Laboratorium SIG Fakultas Geografi UGM
Dasar Teori Local Entropy Map Hubungan di antara dua atau lebih variabel dapat berubah pada ruang geografis. Perubahan itu dapat terjadi pada nilai-‐nilai parameter (misalnya koefisien regresi) atau bahkan dalam bentuk-‐bentuk hubungan (misalnya linier, kuadrat, atau eksponensial). Metode analisis spasial lokal yang ada sering mengganggap suatu bentuk hubungan (misalnya model regresi linier) untuk semua daerah dan hanya fokus pada perubahan nilai parameter. Dengan metode ini tidak dapat menemukan hubungan-‐hubungan lokal yang berbeda bentuk secara bersamaan. Local Entropy Map menggunakan pendekatan non-‐parameterik, yang tidak perlu menetapkan asumsi bentuk-‐bentuk hubungan dan dapat mendeteksi adanya hubungan-‐hubungan multivariate dengan mengabaikan bentuk-‐bentuk hubungan mereka. Local Entropy Map menghitung perkiraan dari Rényi entropy untuk data multivariate di setiap wilayah lokal (dalam ruang geografis). Setiap nilai local entropy kemudian dikonversi ke nilai-‐p dengan membandingkan dengan distribusi permutasi nilai entropy untuk wilayah yang sama. Semua nilai-‐p (satu untuk masing-‐masing wilayah lokal) diproses dengan beberapa uji statistik untuk mengontrol multiple-‐testing problem. Hasil pengujian kemudian dipetakan sehingga memungkinkan bagi analis sercara interaktif mencari dan memeriksa hubungan lokal yang signifikan. Analisis spasial biasanya terkait dengan identifikasi hubungan antar variabel yang dapat bervariasi antar lokasi. Local Spatial Analysis dilakukan hanya pada data setiap lokasi tanpa mempertimbangkan pengaruh dari lokasi sekitar. Metode local spatial analysis dapat sekedar menggambarkan kebersamaan antara dua variabel untuk satu lokasi atau mengungkap bentuk hubungan antar variabel di suatu lokasi. Metode local spatial analysis yang ada memiliki kelemahan, yaitu analisisnya didasarkan pada asumsi bahwa bentuk hubungan antar variabel di seluruh lokasi adalah sama (misalnya diasumsikan hubungannya bersifat liner) sehingga hanya dapat melihat variasi dari parameter pembentuk model hubungan saja dan tidak dapat mengungkap bentuk hubungan yang lain dari variabel yang diuji. Jika ingin mengetahui bentuk hubungan yang sebenarnya dari variabel-‐variabel yang diuji maka perlu dibuat berbagai macam model hubungan (misalnya liner, kuadratik, kubik, eksponensial, dan sebagainya). Masing-‐masing model diuji secara statistik untuk menentukan model mana yang paling menggambarkan hubungan antar variabel. Semakin banyak model yang dibuat, maka akan semakin banyak pula pengujian yang harus dilakukan. Hal ini akan menimbulkan masalah tersendiri dalam analisis yang disebut dengan Multiple-‐Testing Problem. Ada dua cara untuk mengatasi multiple-‐testing problem, yaitu (1) mengontrol family-‐ wise error rate dan (2) mengontrol false-‐discovery rate. Nilai entropy merepresentasikan banyaknya ketidakpastian atau keacakan pada suatu sistem atau fenomena.
40
Modul Praktikum Spatial Data Mining
Laboratorium SIG Fakultas Geografi UGM
Untuk menghasilkan local entropy map diperlukan langkah-‐langkah sebagai berikut: 1. Menghitung nilai Rényi entropy untuk setiap lokasi. Untuk menghitung Rényi entropy diperlukan dua parameter yaitu k dan α, dimana k merupakan ukuran/ banyaknya local neighbourhood yang dipertimbangkan dalam melihat Rényi entropy suatu lokasi (termasuk lokasi itu sendiri). Nilai k harus cukup besar (sampai batas tertentu) sehingga hubungan antar variabel terwakili dengan baik, tapi harus sekecil mungkin untuk menghasilkan resolusi spasial yang enak dilihat. Nilai α merupakan peluang terjadinya kesalahan pembuatan kesimpulan pada suatu pengujian statistik. 2. Menghitung nilai-‐p sebagai ukuran baik tidaknya hubungan antar variabel dalam satu lokasi. Untuk menghasilkan nilai-‐p pada setiap lokasi dilakukan dengan membuat fungsi distribusi dari Rényi entropy dengan pendekatan permutasi untuk itu perlu menentukan nilai permutasi. 3. Menguji nilai-‐p untuk mengontrol multiple-‐testing problem. 4. Dihasilkan local entropy map dengan simbol warna yang berbeda untuk tiap lokasi tergantung nilai-‐p nya (tiap warna menggambarkan kisaran nilai-‐p tertentu)
Pada peta di atas semakin gelap simbol warna menunjukkan semakin kecil nilai-‐p sehingga dapat dikatakan hubungan antar variabel yang ada semakin dekat. Untuk melihat bentuk hubungan dapat dilakukan dengan memilih lokasi-‐lokasi yang ingin dianalisis bentuk hubungannya selanjutnya dilihat scatter plot (diagram pencar) seperti contoh berikut
41
Modul Praktikum Spatial Data Mining
Laboratorium SIG Fakultas Geografi UGM
Pada gambar di atas dapat dilihat ketika lokasi-‐lokasi yang berada pada Negara Bagian California dan Nevada (dimana mempunyai simbol hitam gelap yang menunjukkan eratnya hubungan dua variabel) dipilih maka akan muncul diagram pencar dengan bentuk hubungan
42
Modul Praktikum Spatial Data Mining
Laboratorium SIG Fakultas Geografi UGM
linier miring ke kiri yang menunjukkan hubungan negatif yaitu semakin besar pendapatan per kapita masyarakat maka pilihan kepada Bush semakin kecil. Tujuan 1. Memahami konsep Local Entropy Map 2. Menguji hubungan dua variabel Langkah Kerja Preprocessing 1. 2. 3. 4. 5.
Jalankan software Local Entropy Map Klik menu File – Load Shape file dan pilih shape file yang akan digunakan untuk analisis Isikan Dependent variabel : BUSH_PCT; Independent variables: PCINCOME Isikan nilai K: 35; alpha: 0.5 dan permutation: 500 Klik tombol Run dan tunggu beberapa saat sampai dihasilkan peta Local Entropy
6. Silahkan pilih suatu lokasi pada peta dan lihat diagaram pencarnya.
7. Diskusikan hasil yang diperoleh DAFTAR PUSTAKA
Guo, D (2010). "Local Entropy Map: A Non-‐Parametric Approach to Discover Spatially Varying Multivariate Relationships". International Journal of Geographical Information Science. (In Press)
43