BAB I PENDAHULUAN
I.1. Latar Belakang Pembangunan gedung dan infrastruktur di wilayah perkotaan saat ini berkembang secara global dan pesat. Salah satu penyebabnya adalah bertambahnya jumlah manusia. Wilayah perkotaan adalah wilayah yang berperan sebagai pusat kegiatan ekonomi, sehingga pembangunan berkembang lebih pesat dari pada wilayah perdesaan. Banyak sekali konstruksi bangunan yang dibangun, seperti rumah, toko, dan rumah makan. Dampak pembangunan ini adalah semakin bertambahnya objek di permukaan bumi. Setiap objek tentu memiliki deskripsi lokasi yang berguna sebagai kunci untuk merujuk lokasi tersebut. Informasi mengenai lokasi dikenal juga dengan istilah alamat. Alamat adalah sebuah deskripsi tesktual yang dapat menggambarkan suatu lokasi (Coetzee 2008). Definisi lain alamat adalah suatu sumber informasi yang sudah diberikan referensi sehingga alamat dapat merujuk kepada suatu koordinat atau sebaliknya (Davis dan Fonseca 2007). Hal ini merupakan konsep dasar geocoding. Geocoding merupakan proses untuk memberikan sepasang koordinat pada sebuah alamat. Menurut Murray (2014), untuk keperluan geocoding diperlukan data alamat dan data referensi. Data referensi merupakan kelas fitur yang digunakan untuk membuat address locator. Data referensi dapat mengandung beberapa komponen alamat seperti nama jalan, nama persimpangan, nama tempat, atau kode pos lokasi untuk membuat address locator. Aplikasi yang memanfaatkan geocoding adalah bidang yang melibatkan analisis, visualisasi, perencanaan dan eksplorasi data (Phutchard 2009). Bidang-bidang yang melibatkan analisis spasial mengandalkan hasil geocoding yang memiliki tingkat akurasi yang tinggi (Robinson dan Kaplan 2012), misalnya analisis kriminalitas (Ratcliffe 2004, Zandbergen dan Hart 2009), penelitian tentang kanker (Rushton et al. 2006), kesenjangan sosial (Krieger, et al. 2003), dan pemerintahan (Barreneche 2012). Geocoding dengan kualitas tinggi akan menghasilkan informasi dengan akurasi yang tinggi. Data referensi yang diperoleh dari hasil perekaman data yang baik dan
1
2
teliti akan berpengaruh terhadap kualitas geocoding. Kualitas data alamat juga sangat berpengaruh terhadap kualitas geocoding. Data alamat yang baik adalah data alamat yang telah divalidasi dan terstandardisasi (Robinson dan Kaplan 2012). Indonesia belum memiliki standar nasional yang mengatur tentang pemberian alamat. Standar alamat yang digunakan masih beragam. Perbedaan mencolok terlihat pada struktur alamat pada wilayah perkotaan dan perdesaan. Pemberian alamat di wilayah perdesaan biasanya menggunakan komponen-komponen alamat seperti nama desa, nama dusun, nomor RT dan nomor RW. Wilayah perkotaan biasanya menggunakan nama jalan dan nomor rumah sebagai komponen utama alamat. Menurut Coetzee (2008), standar alamat internasional yang ada saat ini memiliki banyak kesamaan sehingga dalam penetapan standar baru, sebaiknya mengacu pada standar internasional. Contoh standar alamat internasional adalah International postal address components and template yang diterbitkan oleh UPU. Standar dalam pemberian alamat bertujuan untuk menyatukan berbagai format alamat yang berbeda sehingga memudahkan dalam pengelolaan administrasi, komunikasi, respon terhadap keadaan darurat dan lain-lain (Federal Geographic Data Committee 2011). Selain itu, keperluan akan standar juga dibutuhkan dalam pelaksanaan geocoding alamat (Coetzee 2008). Perangkat lunak geocoding menyediakan beberapa standar yang mengacu pada standar internasional. Untuk melaksanakan geocoding di Indonesia diperlukan proses yang lebih panjang karena harus menyesuaikan model alamat yang ada dengan standar yang disediakan oleh perangkat lunak. Terdapat tiga buah metode yang dapat dilakukan dalam pelaksanaan geocoding, yaitu geocoding berbasis titik, garis dan area. Penelitian ini dilakukan untuk mengetahui karakteristik pemberian alamat di lokasi penelitian dan membandingkan persyaratan dan kualitas ketiga buah metode tersebut.
3
I.2. Rumusan Masalah Geocoding merupakan proses yang dapat berlangsung apabila terdapat data alamat, data referensi dan perangkat lunak. Data alamat yang digunakan harus disusun ke dalam suatu standar tertentu agar dapat dapat dilakukan geocoding. Indonesia belum memiliki standar dalam pemberian alamat, sehingga terdapat banyak format pemberian alamat yang berbeda-beda. Perbedaan ini terlihat jelas pada struktur pemberian alamat yang ada di wilayah perkotaan dan wilayah perdesaan. Alamat dalam format yang digunakan saat ini belum mengandung koordinat. Akibatnya alamat tersebut belum dapat merujuk kepada satu lokasi tertentu. Alamat akan dapat merujuk kepada satu lokasi dengan melakukan geocoding. Model data referensi yang digunakan dalam melakukan geocoding adalah data berbasis titik, garis dan area. Ketiga model data membedakan tiga jenis metode geocoding. Perbedaan ketiga metode ini menghasilkan kualitas hasil geocoding yang berbeda.
I.3. Pertanyaan Penelitian Berdasarkan rumusan penelitian pada subbab I.2 maka dapat dirumuskan pertanyaan β pertanyaan penelitian sebagai berikut : 1. Bagaimana perbandingan metode geocoding berbasis titik, garis dan area untuk wilayah jalan perkotaan? 2. Bagaimana karakteristik format pemberian alamat yang saat ini digunakan di wilayah jalan perkotaan? 3. Apa saja persyaratan yang diperlukan dalam melakukan geocoding untuk wilayah jalan perkotaan?
I.4. Batasan Penelitian Cakupan penelitian ini adalah sebagai berikut: 1. Lokasi penelitian adalah wilayah Jalan Kaliurang (dari Selokan Mataram sampai dengan Perempatan Kentungan), Kabupaten Sleman, Provinsi Daerah Istimewa Yogyakarta.
4
2. Metode geocoding yang digunakan adalah metode geocoding berbasis titik, metode geocoding berbasis garis dan metode geocoding berbasis area. 3. Perangkat lunak yang digunakan adalah ArcGIS 10.
I.5. Tujuan Tujuan utama penelitian ini adalah untuk mengetahui perbandingan metode geocoding berbasis titik, garis dan area untuk wilayah jalan perkotaan. Untuk mencapai tujuan utama tersebut, beberapa tujuan spesifik telah disusun sebagai berikut : 1. Untuk mengidentifikasi format pemberian alamat yang ada untuk wilayah jalan perkotaan. 2. Untuk mengetahui persyaratan yang diperlukan dalam melakukan geocoding untuk wilayah jalan perkotaan
I.6. Manfaat Manfaat penelitian ini adalah sebagai data pertimbangan bagi peneliti maupun masyarakat dalam melakukan geocoding untuk wilayah jalan perkotaan. Data hasil geocoding juga dapat digunakan untuk menunjang proses analisis spasial. Untuk pemerintah, hasil penelitian ini dapat digunakan sebagai salah satu data penunjang dalam pembuatan standar alamat di Indonesia.
I.7. Tinjauan Pustaka Standar dalam pemberian alamat memiliki banyak manfaat. Salah satu manfaat yang diberikan adalah mendukung peningkatan kualitas proses geocoding (Coetzee dan Cooper 2007). Tiga tahap utama dalam pelaksanaan geocoding adalah penguraian, pencocokan dan peletakan (Davis dan Fonseca 2007). Menurut Coetzee dan Cooper (2007), dengan adanya standar alamat internasional, tahap pertama dalam pelaksanaan geocoding dapat dilewati. Tahap pertama adalah menyusun alamat menjadi
5
komponen-komponen alamat. Apabila alamat sudah disusun berdasarkan sebuah standar maka tahap ini tidak perlu dilakukan. Standar alamat secara internasional sedang dikembangkan oleh beberapa negara dan organisasi internasional seperti UPU, ISO dan OASIS. Saat ini sudah ada beberapa standar alamat nasional dan internasional yang digunakan. Contoh standar alamat nasional adalah seperti yang digunakan oleh negara Australia (Geographic Information β Rural and urban addressing), Denmark (OIOXML Adresseguide dan OIOXML Adresseguide), Afrika Selatan (Geographic Information - Address standard), Inggris (Spatial datasets for geographical referencing), dan Amerika Serikat (Draft Street Address Data Standard). Contoh standar internasional terkait alamat yang telah ada adalah Postal Addressing (ISO 11180); Geographic Information - Spatial Referencing by Geographic Identifiers (ISO 19112); Geographic Information - Location Based Services - Tracking and Navigation (ISO 19133); Name (xNL), Address (xAL), Name and Address (xNAL) and Party (xPIL) (OASIS); dan International Postal Address Components and Template (UPU). Ciri umum dari standar alamat nasional maupun internasional yang telah ada adalah data sudah memiliki referensi geografis, mendeskripsikan berbagai jenis alamat, menyediakan model data, menggunakan UML untuk mendeskripsikan model data, menggunakan XML untuk format encoding (Coetzee, Towards an International Address Standard 2008). Selain standar alamat nasional dan internasional terdapat standar yang mengatur alamat untuk negara-negara di Eropa yang dikeluarkan oleh INSPIRE Thematic Working Group Addresses pada tahun 2009 yang berjudul Data Specification on AddressesβGuidelines (INSPIRE Thematic Working Group Addresses 2009). Isi dari dokumen ini adalah mengenai fitur alamat, posisi geografis, locator, komponenkomponen alamat, dan isu-isu lain seperti kualitas data dan metadata. Ada tiga metode dalam melakukan geocoding. Setiap metode menggunakan model data yang berbeda dalam pelaksanaan geocoding (Zandbergen 2008). Davis dan Fonseca (2007) menyatakan bahwa metode pertama adalah penentuan koordinat sebuah objek berupa titik. Metode kedua adalah melakukan interpolasi koordinat
6
sebuah objek berupa garis. Metode ketiga adalah menentukan koordinat yang berada di dalam sebuah objek berupa area. Zandbergen (2008) membandingkan tingkat kecocokan tiga buah model data yang berbeda yaitu titik, persil dan jaringan jalan. Lokasi penelitian adalah di Florida. Data yang digunakan adalah data titik, persil and jaringan jalan di 3 wilayah (kabupaten) yang ada di Florida yaitu Bay, Collier dan Seminole. Hasil penelitian ini menunjukkan bahwa geocoding menggunakan model data titik menghasilkan tingkat kecocokan yang hampir sama dengan model data jaringan jalan. Geocoding dengan menggunakan model data persil menghasilkan tingkat kecocokan lebih rendah dibandingkan model data titik dan jaringan jalan. Davis (2007) menyatakan bahwa menentukan koordinat dengan masukan berupa model data titik menghasilkan hasil geocoding yang paling akurat. Kualitas hasil geocoding bukan hanya dipengaruhi oleh model data masukan. Kualitas data referensi juga mempengaruhi kualitas hasil geocoding. Zandbergen (2011) membuktikan bahwa kualitas data referensi berpengaruh terhadap kualitas hasil geocoding (Zandbergen 2011). Tingkat kecocokan yang dihasilkan adalah paling tinggi dengan menggunakan data referensi yang berasal dari instansi lokal, kedua adalah dari StreetMap USA 2005 dan terakhir adalah data TIGER 2000. Ketelitian posisi tertinggi dapat diperoleh dengan menggunakan data jaringan jalan dari instansi lokal, sedangkan untuk data referensi berupa StreetMap USA 2005 dan TIGER akurasi posisinya mirip. Format pemberian alamat di wilayah perdesaan menghasilkan tingkat akurasi yang lebih rendah daripada format pemberian alamat di wilayah perkotaan (Ward et al. 2005). Dalam pelaksanaan geocoding diperlukan suatu skenario. Ada dua jenis skenario dalam proses geocoding (Christen, Churches dan Willmore 2004). Mereka menyatakan bahwa skenario pertama adalah suatu perangkat lunak akan melakukan geocoding satu set alamat secara otomatis. Sistem geocoding tersebut akan menemukan pasangan yang paling cocok untuk setiap record tanpa campur tangan manusia. Skenario kedua adalah pengguna akan melakukan geocoding satu persatu alamat yang belum lengkap, salah atau tidak sesuai dengan format alamat yang disediakan oleh perangkat lunak.
7
Perangkat lunak yang digunakan dalam geocoding ada bermacam-macam. Hasil penggunaan perangkat lunak yang berbeda menghasilkan ketelitian dan tingkat kecocokan yang berbeda. Hal ini diungkapkan dalam penelitian mengenai tingkat kecocokan dan akurasi posisi hasil geocoding dengan menggunakan dua buah perangkat lunak yaitu alat geocoding yang ada pada ArcGIS 9.1 dan Centrus GeoCoder untuk ArcGIS (Zhan, et al. 2006). Tingkat kecocokan yang diperoleh dengan menggunakan Centrus GeoCoder adalah 10% lebih tinggi daripada geocoding menggunakan alat geocoding yang ada pada ArcGIS 9.1. Akurasi posisi yang diperoleh dengan menggunakan Centrus GeoCoder adalah jauh lebih rendah daripada menggunakan alat geocoding yang ada pada ArcGIS 9.1.
I.8. Landasan Teori I.8.1. Alamat Alamat adalah data tekstual yang dapat menggambarkan suatu lokasi. Gambaran dibentuk berdasarkan pengetahuan pencetus. Gambaran tersebut biasanya merujuk kepada konteks tertentu (Davis dan Fonseca 2007). Alamat merupakan objek spasial yang dapat dipahami oleh manusia untuk mengidentifikasi lokasi yang tetap dari sebuah properti (Tang dan Clark 2003). Terdapat dua jenis alamat yaitu alamat yang langsung dan tidak langsung merujuk kepada satu lokasi (Davis dan Fonseca 2007). Alamat yang langsung memiliki struktur yang merupakan deskripsi, seperti nama tempat. Contoh alamat yang tidak langsung merujuk ke satu tempat adalah kode area dan kode kadaster. Menurut Davis dan Fonseca (2007), alamat yang dapat merujuk langsung ke satu lokasi dapat bersifat absolut dan relatif. Absolut artinya satu alamat menunjukkan satu tempat yang pasti, contohnya adalah alamat surat dan nama tempat. Relatif artinya satu alamat diindikasikan dengan menggunakan posisi satu tempat yang lain sebagai referensi lokasi. Menurut Kellison (2012), alamat secara umum berhubungan dengan bangunan, seperti rumah, kantor, atau kantor pemerintah. Fasilitas taman, tempat parkir, dan infrastruktur lain juga perlu memiliki alamat. Alamat secara fisik dapat diartikan sebagai elemen-elemen geografis yang digunakan untuk mengidentifikasi dan mendeskripsikan suatu lokasi tertentu (UPU
8
2011). Objek geografis dapat dianggap sebagai sebuah alamat karena objek tersebut dapat mengidentifikasi suatu lokasi tertentu. Tetapi penggunaan objek sebagai alamat tidak akan efisien untuk kawasan pemukiman. Alamat merupakan salah satu landasan untuk menyelenggarakan komunikasi berupa pertukaran pesan atau barang pada level nasional maupun internasional. Oleh karena itu alamat menjadi suatu hal yang penting. Selain sebagai sarana komunikasi, alamat juga bermanfaat untuk untuk memperlancar pelayanan pemerintah atau pemilihan umum, pengiriman, navigasi, pelayanan keuangan, bisnis, analisis, identitas bagi masyarakat dan lain-lain (ISO 2011). Contoh manfaat alamat bagi pemerintah dalam memberikan layanan bagi masyarakat adalah memungkinkan pelayanan gawat darurat untuk menemukan lokasi dengan cepat dan tepat sehingga pelayanan menjadi lebih efektif (INSPIRE Thematic Working Group Addresses 2009). Ada beberapa konsep dalam pemberian alamat yaitu thoroughfare, thoroughfare name, crossing, building number, city sector, neighborhood, city, state, postal code, dan landmark (Davis dan Fonseca 2007). Thoroughfare adalah ruang umum yang telah diberi nama contohnya jalan, jalan raya, alun-alun, gang, jalan desa dan boulevard. Nama ruang umum tersebut biasanya sesuai dengan karakteristik tempat tersebut. Crossing adalah daerah persimpangan, misalnya perpotongan antara dua buah jalan. Contoh building number adalah nomor apartemen, nomor rumah, nomor kantor dan lain-lain. Contoh City sector adalah nama kotamadya, subdivisi, kabupaten dan kecamatan. Neighborhood adalah lingkungan pemukiman di kotamadya. City adalah daerah perkotaan, state adalah daerah dari suatu negara yang utama dalam sistem federal atau dikenal dengan negara bagian, biasanya diperintah oleh pemerintah daerah. Postal code adalah kode yang digunakan oleh petugas pos untuk melakukan distribusi barang. Landmark adalah tempat yang dikenal namanya oleh penduduk. Landmark dapat berupa buatan manusia seperti nama stadion dan monumen atau alami seperti air terjun. Kesimpulan dari beberapa konsep di atas yaitu alamat adalah deskripsi termasuk nama yang memungkinkan orang untuk mengidentifikasi suatu tempat secara unik.
9
I.8.2. Data referensi Data referensi adalah data geografis yang mengandung fitur-fitur geografis yang akan diproses oleh geocoder menjadi data keluaran (Goldberg 2008). Ada tiga tipe data referensi yaitu data linear atau garis, area dan titik. Ketiga tipe data ini merupakan data yang paling sering digunakan dalam proses geocoding. I.8.2.1. Data referensi berbasis garis Data referensi berbasis garis merupakan data referensi yang disusun oleh data garis yang dapat berupa line atau polyline. Sistem referensi garis merupakan sistem referensi yang mengacu pada segmen fitur geografis garis dan jarak sepanjang segmen dari titik tertentu untuk mengidentifikasi lokasi (ISO 2014). Tipe garis yang digunakan menentukan kualitas data tersebut. Biasanya data yang berupa vektor polyline memiliki ketelitian yang lebih tinggi daripada line. Hal ini terkait dengan jarak antara dua buah titik. Sebuah line hanya terdiri dari dua buah titik, sedangkan polyline terdiri dari lebih dari dua buah titik. Akibatnya polyline dapat menggambarkan keadaan dunia nyata lebih baik daripada line (Goldberg 2008). Untuk menggunakan data referensi berupa data linear maka diperlukan ketersediaan data atribut pada data referensi tersebut. Untuk keperluan geocoding, data atribut yang diperlukan harus mengikuti format standar yang disediakan oleh geocoder. Data referensi akan berfungsi dalam pembuatan address locator, sehingga untuk keberhasilan dalam pembuatan address locator, data atribut dalam data referensi harus mengikuti format yang disediakan oleh perangkat lunak. Data referensi berupa data berbasis garis contohnya adalah garis tengah jalan. Inti pelaksanaan geocoding adalah memberikan suatu koordinat pada sebuah alamat. Untuk wilayah yang terletak di pinggir jalan, alamat yang digunakan biasanya terkait dengan jalan tersebut. Ada beberapa data atribut yang secara umum dibutuhkan dalam data referensi sehingga dapat dilakukan proses geocoding. Data atribut tersebut disajikan pada Tabel I.1.
10
Tabel I. 1 Data atribut untuk data referensi berbasis linear Sumber : Goldberg (2008, hal 58) No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Data Atribut Alamat pertama yang berada pada sisi kiri segmen jalan. Alamat pertama yang berada pada sisi kanan segmen jalan. Alamat terakhir yang berada pada sisi kiri segmen jalan. Alamat terakhir yang berada pada sisi kanan segmen jalan. Prefix arah jalan. Suffix arah jalan. Nama jalan. Tipe jalan. Kode pos untuk alamat yang berada di sisi kanan jalan. Kode pos untuk alamat yang berada di sisi kiri jalan. Kode yang mewakili kabupaten untuk sisi kanan jalan. Kode yang mewakili kabupaten untuk sisi kiri jalan. Kode yang mewakili provinsi untuk sisi kanan jalan. Kode yang mewakili provinsi untuk sisi kiri jalan. Kode yang mewakili kelas fitur.
I.8.2.2. Data referensi berbasis area atau poligon Data referensi berbasis area merupakan data referensi yang tersusun oleh data berbasis poligon. Data referensi ini merupakan data yang menarik karena data ini dapat merepresentasikan data yang paling teliti atau sebaliknya. Data akan memiliki ketelitian yang tinggi jika data merupakan representasi bangunan yang diperoleh melalui survei. Apabila data diperoleh merupakan hasil foto, maka ketelitiannya lebih rendah atau tidak diketahui. Data atribut untuk data referensi berbasis poligon ditunjukkan pada tabel I.2 : Tabel I. 2 Data atribut untuk data referensi berbasis poligon Sumber : Goldberg (2008, hal 63) Atribut Nama Koordinat poligon Kode indeks (identifier)
Penjelasan Nama fitur. Koordinat poligon dalam sistem koordinat tertentu. Kode untuk mengidentifikasi poligon dalam sistem data referensi.
Sama seperti data referensi berbasis titik, data referensi berbasis poligon atau persil bersifat diskrit artinya ketika melakukan pencocokan fitur, kemungkinan dihasilkan dua kondisi yaitu tepat sekali atau tidak cocok sama sekali.
11
I.8.2.3. Data referensi berbasis titik Data referensi berbasis titik adalah data referensi yang tersusun oleh data berbasis titik. Data referensi berbasis titik ini memiliki sifat diskrit, tidak dapat dilakukan interpolasi, karena titik merupakan representasi terkecil kompleksitas geografis. Biaya dan ketelitian data ini bisa sangat tinggi apabila dilakukan survei GNSS. Biaya dan ketelitian bisa saja sangat rendah jika yang digunakan adalah data hasil geocoding sebelumnya. Adapun atribut data referensi berbasis titik dapat ditunjukkan pada tabel I.3. Tabel I. 3 Data atribut untuk data referensi berbasis titik Sumber : Goldberg (2008, hal 65) Atribut Nama Koordinat titik
Penjelasan Nama masing-masing fitur. Sepasang koordinat sebuah titik dalam sistem koordinat tertentu.
I.8.3. Geocoding Geocoding adalah proses untuk memberikan satu koordinat pada alamat, sehingga alamat tersebut dapat disajikan dalam bentuk titik dalam peta, seperti meletakkan sebuah pin pada peta kertas, dan menggunakannya untuk melakukan analisis dengan data spasial yang lain (TuftsOpenCourseWare 2008). Geocoding juga dikenal sebagai proses pencocokan alamat. Saat ini telah ada berbagai pengertian geocoding, dalam Goldberg (2008) menyebutkan beberapa pengertian geocoding yaitu (1) Environmental Sciences Research Institute (1999), menyatakan geocoding adalah proses mencocokkan data tabuler yang mengandung informasi lokasi seperti alamat jalan dengan koordinat dari dunia nyata; (2) Harvard University (2008), geocoding adalah proses penetapan kode numerik sebagai lokasi geografis; (3) Statistics Canada (2008), menyatakan bahwa proses menetapkan pengidentifikasi kode geografis pada peta fitur adalah proses geocoding; (4) U.S. Environmental Protection Agency (2008) menyatakan definisi yang mirip dengan Environmental Sciences Research Institut yaitu tindakan untuk mengubah data lokasi spasial dalam bentuk teks seperti alamat jalan, kota, atau kode pos menjadi sebuah representasi spasial yang valid menggunakan proses yang telah ditetapkan.
12
Goldberd (2008) data masukan untuk proses geocoding tidak terbatas pada data alamat jalan atau kota saja. Pelaksanaan geocoding memungkinkan data masukan yang komposit misalnya penggunaan data alamat jalan dan nama bangunan untuk memperoleh hasil yang lebih akurat. Selain data geocoding yang komposit, penggunaan jenis algoritma yang kompsit juga mungkin dilakukan dalam geocoding. Terdapat dua macam proses geocoding yaitu geocoding tingkat tinggi dan geocoding berbasis perangkat lunak (Goldberg 2008). Tiga buah komponen dalam geocoding tingkat tinggi adalah data masukan berupa data deskripsi lokasi atau alamat, geocoder dan keluaran data spasial.
Gambar I. 1 Konsep geocoding tingkat tinggi Sumber : Golberg (2008, hal 26) Gambar I.1 menggambarkan konsep proses geocoding tingkat tinggi. Data deskripsi lokasi bervariasi tergantung penggunaannya, misalnya data alamat jalan. Data keluaran berupa fitur spasial dengan koordinat. Geocoder berfungsi untuk melakukan konversi data masukan menjadi data keluaran.
Gambar I. 2 Konsep geocoding berbasis perangkat lunak Sumber : Goldberg (2008, hal 26)
13
Geocoding berbasis perangkat lunak memerlukan dua komponen fundamental dalam melaksanakan geocoding yaitu data referensi dan algoritma. Data referensi adalah data berupa geographic base files (GBFs) (Crosier 2004). Data referensi dapat diperoleh dari instansi pemerintah maupun swasta. Data non spasial bervariasi tergantung penggunaannya, misalnya data alamat jalan. Geocoder dapat berupa perangkat lunak yang dapat memfasilitasi pelaksanaan geocoding, contohnya ArcGIS dan QGIS. Hubungan antara data non spasial, geocoder, data referensi dan data keluaran adalah ditunjukkan pada gambar I.2. I.8.4. Metode geocoding Tiga metode yang dapat digunakan dalam proses geocoding adalah jaringan jalan, titik dan persil (Zandbergen 2008). Ketiga metode ini dibedakan berdasarkan model data yang digunakan. Model data tersebut memiliki tipe geometri yang berbeda dan perbedaan format dalam penulisan alamat. Ketiga model data referensi tersebut memiliki kriteria masing-masing seperti pada penjelasan data referensi. Data jaringan jalan memuat alamat jalan, alamat ini biasanya berasosiasi dengan bangunan seperti rumah, kantor swasta, maupun kantor pemerintah. Geocoding dengan menggunakan data referensi berbasis garis adalah metode geocoding yang masih tradisional, tetapi merupakan metode yang paling populer. Konsep ini pertama kali diperkenalkan oleh TIGER yang dikembangkan oleh Biro Sensus di Amerika Serikat (Klosterman dan Lew 1992). Geocoding dengan menggunakan model data ini bergantung pada rentang nomor jalan yang diasosiasikan dengan segmen garis tengah jalan (Kellison 2012). Contohnya adalah sebuah segmen garis tengah jalan memiliki rentang nomor antara 1 sampai 20, dengan dilakukan geocoding maka geocoder akan secara otomatis menentukan lokasi jalan dengan nomor 10 tepat berada di tengah segmen tersebut. Metode berbasis titik atau yang dikenal dengan point-address memerlukan data referensi berupa fitur titik. Data referensi titik dapat diperoleh melalui badan survei nasional, selain itu data referensi titik dapat dikonstruksi dari data persil atau bangunan. Fitur titik yang diperoleh melalui proses konstruksi adalah sentroid bangunan atau persil. Geocoding menggunakan metode ini sering digunakan untuk keperluan industri seperti pemetaan berbasis internet, asuransi, telekomunikasi, dan infrastruktur (Harte-Hanks Trillium Software 2009).
14
Metode berbasis area atau dikenal dengan geocoding persil adalah meletakkan satu alamat pada area satu poligon. Hasil suatu geocoding berbasis area adalah fitur titik yang merupakan hasil interpolasi. Fitur keluaran memiliki posisi pada sentroid poligon atau pada area suatu poligon, hasil ini dipengaruhi oleh bentuk dari suatu poligon. Semakin besar dan tidak teratur bentuk dari suatu poligon, maka semakin tidak tepat hasil interpolasi.
I.8.5. Perangkat geocoding Ada beberapa perangkat yang dapat digunakan dalam melakukan geocoding, baik perangkat lunak berbayar, open source, maupun web geocoder. Contoh perangkat lunak berbayar adalah Centrus US Street Point Database, Geolytics GeocodeDVD, ESRI Address Locator, contoh dari perangkat lunak berbasis web adalah Geocoder.us, Google Earth, Google Maps API, dan Yahoo API, dan perangkat lunak open source seperti USC Geocoding Platform (Swift, Goldberg dan Wilson 2008). Aplikasi dalam ESRI Address Locator yang digunakan untuk geocoding adalah ArcMap dan ArcCatalog (Crosier 2004). Crosier menjelaskan bahwa ArcCatalog berfungsi untuk menyusun data referensi, membuat address locator, geocoding alamat dan publikasi address locator untuk berbagi dengan pengguna yang lain. ArcMap digunakan untuk menampilkan hasil geocoding, melakukan geocoding secara interaktif alamat tunggal, melakukan tinjauan data hasil geocoding secara interaktif, menyediakan toolboxes, menyelaraskan data referensi dengan address locator, dan menganalisis hasil geocoding. Kelebihan dari ESRI Address Locator adalah adanya kontrol terhadap data referensi, memungkinkan offset dalam interpolasi, mendukung pencocokan fitur probabilistik, dan antar muka yang ramah pengguna.
I.8.6. Algoritma geocoding Algoritma dalam melakukan geocoding menyangkut dua proses dasar yaitu pencocokan fitur dan interpolasi fitur (Goldberg 2008). Pencocokan fitur adalah proses identifikasi sebuah fitur geografis pada set data referensi sesuai dengan data masukan yang akan digunakan untuk menghasilkan hasil akhir geocoding berupa data keluaran geocoding. Interpolasi fitur adalah proses memperoleh atau mengambil data keluaran
15
berupa data geografis yang berasa dari data fitur referensi yang dipilih atau diperoleh saat proses pencocokan fitur. Dua jenis algoritma dalam pencocokan fitur yaitu algoritma pencocokan tidak interaktif dan algoritma pencocokan interaktif (Goldberg 2008). Algoritma pencocokan tidak interaktif adalah proses pencocokan yang dilakukan secara otomatis tanpa menyertakan peran pengguna secara langsung sedangkan algoritma pencocokan interaktif merupakan proses pencocokan fitur yang interaktif, ketika proses pencocokan fitur secara otomatis gagal, pengguna dapat ikut serta memperbaiki data masukan. Terdapat dua kategori pencocokan fitur, yaitu deterministik dan probabilistik (Goldberg 2008). Metode pencocokan fitur deterministik adalah didasarkan pada serangkaian aturan yang diproses dalam urutan tertentu. Metode ini dapat dianggap sebagai operasi biner, apakah fitur cocok atau tidak. Sebaliknya, metode pencocokan fitur probabilistik menggunakan skema komputasi untuk menentukan probabilitas fitur keluaran pada data referensi. Dua jenis probabilitas adalah probabilitas m dan probabilitas u. Probabilitas m adalah probabilitas dari kecocokan sepasang atribut. Probabilitas u adalah probabilitas ketidakcocokan antara dua buah atribut. Interpolasi fitur adalah proses menghasilkan sebuah fitur geografis dari fitur referensi, contohnya menghasilkan sebuah titik untuk sebuah alamat yang berada di sepanjang jalan atau sentroid persil atau bangunan. Terdapat dua jenis interpolasi fitur yaitu interpolasi fitur linier dan interpolasi fitur poligon. Interpolasi fitur linier beroperasi pada segmen garis (atau polylines, yang merupakan rangkaian garis terhubung) dan menghasilkan estimasi fitur keluaran menggunakan proses komputasi pada geometri garis (Goldberg 2008). Inti interpolasi jenis ini adalah melalukan estimasi letak fitur keluaran (dalam hal ini berupa titik) akan diletakkan. Hasil interpolasi diperoleh menggunakan nomor atribut pada data masukan berupa data alamat untuk melakukan identifikasi berapa jarak dari total panjang fitur referensi untuk meletakkan fitur keluaran. Data atribut dalam data referensi yang digunakan adalah rentang alamat yang mendeskripsikan rentang yang valid dari alamat pada jalan (segmen garis), nomor mulai dan nomor berakhir alamat pada segmen garis tersebut.
16
Hubungan jarak antara titik awal segmen garis sampai dengan lokasi fitur keluaran (π), jarak total segmen garis (π), jumlah data alamat (π), dan rentang alamat (π) ditunjukkan dengan persamaan I.1 (Goldberg 2008). π
π = π (π ) .................................................................................................................(I.1) Niai π diperoleh dengan menggunakan rumus (I.2). π=
π΄ππ (ππ βππ ) 2
............................................................................................................(I.2)
dengan ππ adalah alamat awal dan ππ adalah alamat akhir. Interpolasi fitur poligon atau berbasis area adalah sebuah proses komputasi untuk menentukan sebuah hasil untuk menentukan keluaran yang sesuai dengan geometri spasial fitur referensi berbasis poligon. Perhitungan sentroid adalah interpolasi yang biasa dilakukan pada fitur referensi berbasis area. Ada tiga buah metode yang dapat digunakan dalam menentukan sentroid dari sebuah poligon yaitu bounding box centroid, geometric centroid, dan weighted centroid (Goldberg dan Cockburn 2012). Metode pertama adalah metode bounding box centroid, metode ini dikenal juga dengan nama minimum bounding rectangle (MBR). Penentuan sentroid dilakukan dengan menggunakan persegi terkecil yang melingkupi objek, persegi tersebut digunakan untuk menghitung nilai tengah antara bagian atas, bawah, kiri, dan kanan poligon. Metode ini merupakan metode yang paling mudah dan dapat dilakukan dengan cepat. Metode kedua adalah geometric centroid yang dikenal dengan Centre of Mass (CoM). Penentuan sentroid dilakukan dengan menggunakan perhitungan fisika, dalam hal ini sentroid merupakan titik keseimbangan dari suatu objek. Metode ketiga adalah weighted centroid, posisi sentroid ditentukan berdasarkan konsentrasi dari parameter tertentu, misalnya kepadatan penduduk. Ukuran dari poligon mempengaruhi hasil interpolasi fitur. Ukuran persil di wilayah perkotaan biasanya memiliki ukuran yang kecil sehingga menghasilkan hasil yang akurat, sedangkan di wilayah perdesaan ukuran persil yang besar sehingga perhitungan sentroid akan menghasilkan hasil yang kurang atau tidak tepat (Durr dan Froggatt 2002). Untuk kondisi seperti ini, metode weighted centroid tepat untuk diterapkan.
17
I.8.7. Address locator Address locator adalah alat utama yang digunakan untuk melakukan geocoding (Crosier 2004). Tujuan dari address locator adalah memungkinkan pengguna untuk membedakan sebuah alamat dengan alamat disekitarnya. Sebuah alamat minimal harus memiliki sebuah locator, misalnya berupa nomor rumah (INSPIRE Thematic Working Group Addresses 2009). Jenis address locator yang digunakan adalah tergantung tipe geometri data referensi masukan yang akan digunakan (Esri 2010). Sebuah address locator memiliki tiga buah atribut yaitu penanda, nama dan level (INSPIRE Thematic Working Group Addresses 2009). Level sebuah address locator mengklasifikasikan tingkat kelengkapan dalam suatu address locator. Ada tiga buah atribut yang digunakan untuk menunjukkan tingkat kelengkapan address locator yaitu nama unit administrasi, nama area administrasi dan thoroughfares. Pada INSPIRE Spesification of Address (2009) ada enam tingkatan nama unit administrasi dan tiga tingkatan nama area administrasi. Contoh penanda yang digunakan dalam address locator adalah nomor rumah dan nomor lantai suatu gedung. Contoh nama yang digunakan dalam address locator adalah nama tempat seperti nama perumahan, properti, gedung, dan nama geografis. Untuk perangkat lunak ArcGIS 10 menyediakan beberapa tipe standar untuk address locator, antara lain address locator tipe US Address Dual Ranges adalah format address locator yang digunakan untuk sebagian besar alamat jalan di Amerika Serikat, tipe General Single Field adalah format yang digunakan untuk menemukan fitur yang dapat diidentifikasi dengan nama atau kode. Pemilihan tipe address locator yang akan digunakan disesuaikan dengan data referensi dan data alamat yang dimiliki. Kedua tipe tersebut memerlukan data referensi yang berbeda, untuk address locator tipe US Address Dual Ranges, data referensi yang diperlukan adalah fitur berupa garis tengah jalan. Sedangkan untuk tipe General Single Field, data referensi yang diperlukan adalah berupa fitur titik atau fitur poligon (Esri 2010). Selain kedua tipe tersebut, tipe-tipe address locator yang disediakan oleh ArcGIS ditunjukkan pada tabel I.4.
18
Tabel I. 4 Karakteristik dasar masing-masing tipe address locator disediakan oleh ArcGIS Sumber: ESRI (2010) Tipe
US AddressDual Ranges
US AddressOne Range
US AddressSingle House
Tipe geometri data referensi
Garis
Garis
Titik atau poligon
Representasi data referensi Rentang alamat untuk dua sisi segmen jalan
Rentang alamat untuk satu sisi segmen jalan
Setiap fitur merepresentasikan alamat.
Contoh 320 Madison St. a County Rd. 105-30 Union St. 2 Summit Rd. N5200 County Rd PP 115-19 Post St. 71 Cherry Ln. W1700 Rock Rd. 38-76 Carson Rd.
Aplikasi Mencari bangunan pada sisi tertentu jalan.
Mencari bangunan pada satu sisi dari segmen jalan.
Menemukan persil, bangunan atau titik alamat.
US AddressZIP 5 Digit
Titik atau poligon
Kode pos wilayah atau titik pusat
22066
Menemukan lokasi kode pos tertentu
US AddressZIP+4
Titik atau poligon
Kode pos+4 wilayah atau titik pusat
96822-2323
Menemukan lokasi kode pos +4
US AddressZIP+4 Range
Titik atau poligon
Setiap fitur 63703-0078 mewakili kode pos
Menemukan lokasi kode pos +4
General-City State Country
Titik atau poligon
Kota dalam negara Rice, WA, USA atau negara bagian
Menemukan kota tertentu dalam sebuah negara bagian atau negara
GeneralGazetteer
Titik atau poligon
Setiap fitur mewakili nama tempat geografis tertentu
GeneralSingle Field
Titik atau poligon
Setiap fitur yang diidentifikasi oleh string teks, nama, atau kode
Menemukan lokasi Leeds Castle, England geografis tertentu atau nama di suatu Sapporo, Japan area
Cafe Cabrillo N1N115
Menemukan fitur yang diidentifikasi dengan nama atau kode
Sebuah address locator terdiri dari tiga buah file yaitu file .loc; .loc.xml; dan .lox. File .loc berisi informasi umum tentang address locator; file .loc.xml mengandung metadata, sintaks penguraian, dan parameter-parameter untuk properti
19
khusus dari sebuah locator; file .lox adalah file yang mengandung atribut dan indeks dari data referensi (ESRI 2013). Isi dari file.loc adalah informasi umum pada address locator seperti jenis address locator dan properti geocoding. Properti geocoding adalah sebagai berikut : 1. IntersectionConnectors tanda atau kata yang digunakan untuk daerah persimpangan. 2. MinimumMatchScore skor minimum dalam pencocokan fitur. 3. MinimumCandidateScore skor minimum suatu alamat masuk sebagai calon yang cocok. 4. SpellingSensitivity tingkat sensitivitas penulisan alamat. Jika nilainya kecil maka memungkinkan hasil pencocokan alamat sesuai walaupun penulisan salah. 5. MatchIfScoresTie skor jika terdapat dua calon alamat yang memiliki skor yang sama. 6. WriteXYCoordFields adalah kondisi perlu atau tidak membentuk kolom baru (kolom koordinat fitur keluaran) setelah proses geocoding. 7. WriteStandardizedAddressField adalah suatu kondisi perlu atau tidaknya pembentukan kolom baru yang berisi alamat yang sudah distandardisasi. 8. WriteReferenceIDField adalah suatu kondisi perlu atau tidaknya pembentukan kolom baru yang berisi ID data referensi. 9. WritePercentAlongField adalah suatu kondisi perlu atau tidaknya pembentukan kolom baru yang berisi 10. ProgID adalah ID address locator. 11. Path adalah lokasi penyimpanan address locator. 12. MaxCandidates adalah jumlah maksimal calon alamat yang cocok. 13. MaxPerfectCandidates adalah jumlah maksimal calon alamat yang cocok sempurna. 14. RebuildStartTime adalah waktu pembuatan address locator. 15. RebuildStartTimeAscii waktu pembuatan address locator dalam ASCII. 16. RuntimeMemoryLimit adalah batas memori yang diperlukan untuk melakukan geocoding. 17. SafeLocatorName adalah nama address locator.
20
18. SearchTimeout adalah batas waktu pencarian alamat. 19. ShowElapsedTime adalah waktu yang diperlukan untuk melakukan geocoding setiap record pada tabel alamat. 20. StoreStandardizedRefData 21. WriteAdditionalOutputFields adalah suatu kondisi perlu atau tidaknya pembentukan kolom tambahan. 22. reportScorePerComponent adalah skor setiap elemen alamat .
File.loc.xml mengandung aturan-aturan yang mengatur mengenai nama kolom masukan dan tata bahasa yang digunakan, alias dari nama negara, nama jalan, tipe jalan, prefix, suffix, level alamat, tata bahasa untuk persimpangan, aturan pencocokan fitur dan aturan peletakan fitur keluaran. File .lox mengandung informasi mengenai atribut dan indeks data referensi. I.8.8. Kerangka geocoding pada ArcGIS Untuk memahami pelaksanaan geocoding pada ArcGIS ada tiga hal yang perlu diperhatikan. Ketiga hal tersebut menyusun suatu kerangka geocoding, yaitu geocoding user interface, address locator dan rule base for matching. Hubungan ketiga hal tersebut ditunjukkan pada gambar I.3.
Gambar I. 3 Kerangka geocoding pada ArcGIS Sumber : Crosier (2004, hal 36)
21
Menurut Crosier (2004) Geocoding user interface (1) adalah komponen geocoding yang paling populer. Komponen ini menyediakan antarmuka bagi pengguna dalam melakukan geocoding. ArcGIS menyediakan dua aplikasi utama yang berfungsi sebagai antarmuka yaitu ArcMap dan ArcCatalog. Pengguna dapat secara interaktif menggunakan dua aplikasi ini untuk melakukan geocoding. Address locator (2) merupakan gabungan atas data referensi suatu lokasi dengan tipe address locator yang dipilih. Pembuatan address locator menggunakan geocoding user interface ArcGIS. Rule base (3) adalah kumpulan file yang digunakan untuk menerjemahkan data alamat menjadi keluaran yang diinginkan. Rule base adalah kumpulan file-file yang berfungsi mengarahan perangkat geocoding untuk melakukan standardisasi atau StanRules dan pencocokan alamat dengan data referensi atau MatchRules (Tang dan Clark 2003). Hubungan antara StanRules dan MatchRules ditunjukkan pada gambar I.4.
Gambar I. 4 Hubungan StanRules dan MatchRules Sumber: Tang dan Clark (2003, hal 10)
22
Menurut Tang dan Clark (2003), standardisasi adalah proses penguraian alamat menjadi elemen-elemen alamat yang akan dicocokkan dengan data referensi. StanRules mengandung perintah standardisasi, kamus kunci pencocokan, tabel klasifikasi, dan file pola untuk melakukan standardisasi alamat. File perintah standardisasi menentukan ukuran masukan, mode debug, nama keluaran dan nama proses. Kamus kunci pencocokan menentukan tipe data, panjang kolom, dan kode untuk nilai yang hilang. Tabel klasifikasi menafsirkan berbagai elemen alamat dalam bentuk singkatan dan menyediakan sebuah standar untuk setiap singkatan alamat. File pola menentukan aturan pola dan aksi dalam standardisasi data masukan menjadi kolom kunci pencocokan. MatchRules menetapkan kolom-kolom alamat dari data referensi yang digunakan untuk pencocokan. MatchRules juga menentukan metode-metode perbandingan data alamat dengan data referensi dan bobot dalam pencocokan sebuah elemen alamat. MatchRules didefinisikan dalam beberapa perintah. Pertama, perintah VAR untuk menentukan variabel nama, posisi kolom, panjang kolom dan kode nilai yang hilang untuk data alamat terkait dengan data referensi. Perintah MATCH tersedia untuk menentukan perbandingan tipe, kolom kunci pencocokan, nama variabel, probabilitas pencocokan dan parameter tambahan. MatchRules juga menentukan probabilitas m dan u untuk perbandingan nilai. Selain perintah VAR dan MATCH, ada perintah spesial yang disebut VARTYPE. Perintah ini memastikan tidak ada analisis frekuensi yang dilakukan. Setelah melakukan estimasi nilai probabilitas m dan u, maka dapat dilakukan perhitungan bobot setiap elemen alamat. Jika terjadi kecocokan maka bobotnya adalah sebesar log 2 π/π’, sedangkan jika tidak cocok maka nilai bobotnya adalah sebesar log 2 (1 β π)/(1 β π’). Bobot komposit dapat dihitung dengan menjumlahkan bobot dari elemen-eleman alamat dalam sebuah alamat.
I.8.9. Kualitas geocoding Kualitas hasil geocoding ditunjukkan oleh tiga buah indikator yaitu kelengkapan (completeness), akurasi posisi (posisional accuracy) dan pengulangan (repeatability) (Hart dan Zandbergen 2013). Kelengkapan hasil geocoding ditentukan oleh tingkat
23
kecocokan secara keseluruhan. Kelengkapan mengacu pada persentase data yang dipercaya bisa di-geocoding, tingkat kelengkapan sering disebut sebagai tingkat kecocokan (Zandbergen 2009). Akurasi posisi mengacu pada seberapa dekat setiap titik hasil geocoding dengan lokasi sebenarnya dari alamat itu. Pengulangan menunjukkan seberapa sensitif hasil geocoding terhadap variasi alamat masukan, data referensi, algoritma pencocokan perangkat lunak, kemampuan dan interpretasi analis. Kualitas ditentukan oleh kualitas data referensi dan data masukan alamat (Hart dan Zandbergen 2013, Zandbergen 2009). Kualitas geocoding juga dipengaruhi oleh jenis interpolasi fitur yang digunakan, ukuran fitur referensi, akurasi fitur referensi, algoritma pencocokan fitur yang digunakan (Goldberg 2008). Untuk geocoding berbasis garis jenis, proses interpolasi akan memberikan akurasi posisi yang tinggi apabila ukuran bidang tanah seragam. Pada geocoding berbasis area, metode interpolasi yang menghasilkan akurasi posisi tertinggi adalah metode weighted centroid sedangkat akurasi terendah dihasilkan oleh metode bounding box centroid. Menurut Godlberg (2008) ada lima jenis tingkat kecocokan hasil geocoding yaitu cocok sempurna, tidak cocok sempurna, cocok-ambigu, tidak cocok-ambigu, dan tidak cocok. Cocok sempurna adalah setiap atribut dalam data referensi cocok dengan data alamat. Cocok tidak sempurna adalah tidak semua atribut pada data referensi cocok dengan data alamat. Cocok-ambigu adalah data alamat cocok dengan beberapa fitur data referensi. Tidak cocok-ambigu adalah tidak semua data alamat cocok dengan beberapa fitur data referensi. Tidak cocok adalah tidak ada atribut dalam data referensi yang cocok dengan data alamat. Jenis kecocokan yang baik untuk digunakan adalah cocok sempurna dan tidak cocok sempurna. Hasil pencocokan yang ambigu atau tidak cocok lebih baik untuk dicek, diperbaiki dan diproses kembali.
I.9. Hipotesis Karakteristik umum pemberian alamat di jalan perkotaan adalah menggunakan nama jalan dan nomor jalan. Nama jalan yang digunakan disertai dengan nilai kilometer jalan. Penomoran jalan yang digunakan tidak berurutan. Sesuai karakteristik umum jalan perkotaan di Indonesia, maka kualitas metode geocoding berbasis titik
24
lebih tinggi daripada metode geocoding berbasis garis dan area. Selain itu, jenis address locator yang cocok digunakan adalah tipe General Single Field dan US Address Single House.