Membangun Relasi Antar Dataset Dalam Pengorganisasian Koleksi Data Spasial
R.V. Hari Ginardi Jurusan Teknik Informatika, Fakultas Teknologi Informasi, ITS – Surabaya Abstrak: Berbagai pendekatan telah dilakukan intuk mengorganisasikan koleksi data spasial baik yang berupa dataset bertipe vektor maupun raster. Dengan semakin pesatnya penggunaan citra dari penginderaan jauh (remote sensing), serta metoda-metoda pengolahan citra digital untuk mendukung proses-proses pemetaan maupun analisa spasial, jumlah dan volume data spasial pada institusi-institusi yang menyimpan koleksi data spasial bertumbuh dengan cepat. Pengorganisasian data spasial yang ada saat ini mengandalkan fungsi-fungsi yang memungkinkan pemakai mencari dataset yang memenuhi kriteria yang diberikan melalui user query. Cara ini cukup memadai untuk lembaga penyedia data spasial yang homogen, seperti pada instansi yang menyediakan citra satelit atau foto udara. Pada instansi yang mengolah data-data spasial, seperti pada lembaga-lembaga riset atau lembaga yang mengkordinasikan proses-proses pemetaan, koleksi data spasial yang dikelola berkembang menjadi heterogen dengan banyaknya dataset-dataset yang merupakan hasil sementara atau hasil proses lanjutan dataset awal. Paper ini akan memberikan pemikiran baru dalam mengorganisasikan koleksi data spasial dengan membangun relasi antar dataset sehingga pemakai dapat melacak proses-proses yang telah berlangsung dalam pengolahan data spasial. Manfaat penting lainnya dari metoda ini adalah dimungkinkannya dilakukan evaluasi kualitas maupun produktifitas koleksi data spasial yang dimiliki. Dengan merekonstruksi histori pembuatan data spasial dengan menggunakan model data unweighteddirected-acyclic-graph (unweighted-DAG), dapat dibangun topologi koleksi data spasial berdasarkan proses pembuatannya, sehingga dapat diamati berbagai parameter dan indikator relasi antar dataset. Angka-angka parameter dan indikator relasi ini dapat dimanfaatkan untuk mengevaluasi penggunaan suatu dataset dalam koleksi data spasial, mengelompokkan data spasial secara otomatis, sebagai masukan untuk quality assurance, serta membantu dalam pembaruan (updating) data spasial. Metoda rekonstruksi serta evaluasi relasi data spasial yang diusulkan ini menggunakan metadata baku ISO dan FGDC sebagai data primernya sehingga tidak bergantung pada format dan tipe data spasial yang diorganisasikan. Kata kunci: Katalog data spasial, Rekonstruksi histori, Organisasi data spasial
1.
Pendahuluan
Pencarian data pada clearinghouse data spasial umumnya dilakukan dengan melakukan pencarian berdasarkan kata kunci dan beberapa option pilihan tipe data seperti citra satelit, foto udara, peta dasar, dan semacamnya. Penyimpanan dan pengak-sesan data spasial pada clearinghouse ditingkatkan efisiensinya dengan mengapli-kasikan metadata sebagai basis data untuk query. Pencarian dengan cara di atas akan menghasilkan output pilihan dataset yang memenuhi kriteria pencarian yang diberikan. Dalam realitasnya, pemakai clearinghouse ingin tahu juga datasetdataset yang berkaitan dengan dataset yang ditampilkan oleh query. Pertanyaan dari pemakai yang ingin dijawab oleh query misalnya: “dataset mana saja yang dihasilkan oleh dataset ini?”, atau “dataset mana saja yang digunakan untuk menghasilkan dataset ini?” Riset ini beranjak dari situasi di atas dan hasil riset ini diharapkan dapat digunakan atau dalam clearinghouse data spasial di Indonesia 2.
Pengorganisasian data raster
Remote sensing berperan penting dalam proses pemetaan dan sistem informasi geografis dengan kemampuannya untuk meng-akuisisi informasi yang berkaitan dengan bumi menggunakan berbagai metoda penginderaan, baik yang menggunakan sensor aktif maupun pasif. Untuk penyimpanan dan pendistribusian data raster dari remote sensing, Badan Kordinasi Survey dan Pemetaan Nasional (Bakosurtanal) mengadopsi standard metadata dari Federal Geographic Data Committee (FGDC) serta ISO, dan membangun interoperabilitas data geospasial di dalam Infrastruktur Data Spasial Nasional, IDSN (Puntodewo and Nataprawira, 2004). Permasalahan yang kemudian timbul adalah pengorganisasian arsip data remote sensing. Integrasi data spasial vektor ke dalam atribut basis data telah lebih siap diaplikasikan dengan telah tersedianya “spatially-enabled database system”, sementara pengintegrasian citra remote sensing ke dalam database atau sistem katalog masih sangat terbatas. VI-109
Sejumlah metoda dalam automasi pemrosesan maupun analisis citra telah dikembangkan oleh para periset untuk meningkatkan produktifitas citra remote sensing. Pengembangan tersebut umumnya dilakukan terhadap koleksi citra yang homogen, misalnya koleksi dataset citra NOAA, koleksi dataset citra Landsat-TM, SAR, atau IKONOS. Dalam realisasinya, dalam suatu koleksi terdapat pula dataset-dataset citra yang merupakan hasil pengolahan dari citra remote sensing. Dataset-dataset ini mempunyai tingkat informasi yang lebih tinggi dibandingkan citra yang digunakan sebagai inputnya. Pada lembaga yang menjadi pusat arsip data remote sensing atau pengelola katalog data remote sensing seperti Bakosurtanal, raster data yang ada telah berkembang dan dari koleksi data awal telah dihasilkan beberapa level data hasil pengolahan citra / raster untuk berbagai keperluan analisis maupun presentasi. Koleksi yang sudah menjadi multi-level ini membutuhkan metoda pengorganisasian yang berbeda dibandingkan dengan koleksi data yang levelnya homogen. Amhar (2001) mengorganisasikan koleksi data spasial yang multi-level dengan memperkenalkan pengelompokan data spasial berdasarkan status pemrosesan data tersebut. Pengelompokan ini memberikan pijakan untuk mengorganisasi data raster, yang telah dimulai dengan menggunakan kodifikasi kode level dalam perencanaan pemberian nama yang unik pada setiap data spasial dalam suatu koleksi data spasial. Tabel 1 berikut menunjukkan pengelompokan data raster berdasarkan level pemrosesannya. Tabel 1 Pengorganisasian Data Raster seperti yang Diusulkan Amhar (2001) Kelompok DB0-R DB1-R DB1-ZR DB2-GR DB3-GR
Keterangan Data raster awal (raw) Data raster ter-rektifikasi DEM Hasil analisis / klasifikasi Peta hasil / presentasi
Dengan mengorganisasikan koleksi raster data berdasarkan relasi proses pembuatannya, diharapkan ada perbaikan pada layanan infrastruktur data spasial, sebagai contoh semakin berkembangnya alteratif query pada sistem katalog data spasial. 3.
Metadata Citra Remote Sensing
Pengorganisasian citra remote sensing dan data raster lainnya dalam suatu sistem katalog data spasial akan lebih efisien jika didukung dengan deskripsi informasi tentang data raster tersebut. Dengan deskripsi tentang data yang disebut metadata ini, akses langsung ke data raster yang umumnya berukuran besar dapat diminimalisir. Metadata umumnya berupa daftar informasi yang dapat diinterpretasikan oleh kompujter maupun manusia (human readable dan machine readable). Clearinghouse data spasial menyediakan fasilitas untuk pencarian data yang umumnya mengandalkan pencarian teks kata kunci tertentu dan menampilkan daftar dataset-dataset dalam koleksi yang memiliki atribut atau informasi sesuai dengan kata kunci yang diberikan. Hasil querynya umumnya disajikan dalam bentuk daftar dataset citra serta deskripsi pokok tentang dataset tersebut termasuk link ke metadatanya. Dengan membuka metadata tersebut, akan diperoleh info lebih detail tentang penyedia data tersebut serta informasi lainnya. Bakosurtanal mengadopsi standard metadata dari FGDC dan ISO untuk clearinghouse data spasial Indonesia (Sukmayadi et al., 2004). Metadata standard tersebut telah menggunakan basis XML seperti yang ditetapkan dalam standard FGDC Remote Sensing Extension Version 2, dan ISO 19139 (implementasi XML untuk ISO 19115). ISO 19115 serta implementasinya tidak sepenuhnya mendukung elemen informasi yang dibutuhkan untuk mendeskripsikan citra remote sensing atau data spasial berformat raster lainnya. Untuk itu, beberapa standard lanjutan telah didefinisikan. FGDC telah memiliki extension untuk metadata remote sensing, FGDS-STD-012-2002 (FGDC, 2002), sementara ISO telah memiliki ISO 19115-2 untuk metadata informasi geografis, serta ISO 19130 untuk informasi sensor dan data model untuk citra serta data grid. Standard-standard ini bersifat kompatibel dengan standard yang telah didefinisikan sebelumnya. 4.
Rekonstruksi Proses Pembuatan Data Raster
Pengorganisasian data spasial berikut ini didesain dengan acuan data raster sesuai dengan ketersediaan data. Metoda pengorganisasian ini penggunaannya tidak terbatas hanya pada data VI-110
raster, prinsip yang ditawarkan ini memungkinkan untuk diaplikasikan pada tipe data spasial secara umum. Sejumlah karakteristik dari data raster yang tersedia telah diidentifikasi yang meliputi: -
-
-
Setiap data raster atau citra remote sensing beserta metadatanya diidentifikasikan sebagai sebuah dataset Koleksi data adalah kumpulan semua dataset yang diorganisasikan dalam suatu system katalog Setiap dataset memiliki identifikasi yang unik. Identitas yang unik ini biasanya diimplementasikan dengan pemberian nama file yang unik, sehingga aturan penamaan file sangat penting. File-file metadata disimpan secara local pada tempat yang sama dengan server system katalog, sementara data rasternya dapat tersimpan di media penyimpanan di mana saja. Metadata menyimpan link yang akan menghubungkan metadata dengan lokasi penyimpanan data rasternya. Sistem katalog data spasial dapat berisi dataset-dataset dengan berbagai jenis sensor serta beragam level pemrosesan. Terminologi data spasial heterogen digunakan untuk koleksi seperti ini.
Proses rekonstruksi keterkaitan antar dataset berdasarkan proses pembuatannya hanya dimungkinkan jika langkah-langkah proses pembuatan tiap dataset tercatat / terekam. Pencatatan tersebut dapat dilakukan dalam file terpisah atau di dalam dataset masing-masing. Metoda yang dibahas di sini mengasumsikan bahwa informasi proses pembuatan tercatat di setiap metadata dataset. Informasi proses pembuatan mencatat antara lain nama-nama dataset yang digunakan secara langsung dalam pembuatan dataset itu yang selanjutnya disebut “dataset sumber”. Walaupun dalam metadata hanya ada daftar dataset sumber yang digunakan secara langsung dalam pembuatan suatu dataset, proses rekonstruksi yang diusulkan ini akan mampu menampilkan daftar lengkap semua dataset sumber yang telah digunakan, baik langsung maupun tidak langsung. 4.1 Parameter pada katalog data spasial Beberapa parameter yang digunakan selama ini dalam katalog-katalog data spasial telah memberikan peluang untuk membantu pemakai dalam memilih sejumlah dataset yang memenuhi kriteria-kriteria tertentu. Hasil pemilihan dengan parameter-parameter tersebut tidak dapat menunjukkan atau mengukur apakah ada keterkaitan antara satu dengan lainnya ditinjau dari proses pembuatannya. Parameter-parameter yang dimaksud di sini adalah: a. Batas spasial (kata kunci: di mana?). Parameter ini umumnya dinyatakan dengan batasbatas kordinat, atau pemilihan batas luar polygon (bounding box) jika pemilihan dilakukan melalui antar muka grafis. Walaupun kriteria ini membantu pemakai dalam membatasi lingkup kawasan yang akan dipilih dan menghasilkan hanya dataset-dataset yang sesuai dengan area yang diinginkan, daftar dataset yang dihasilkan tidak mencerminkan apakah ada relasi di antara dataset-dataset tersebut. b. Batas temporal atau rentang waktu (kata kunci: kapan?). Jika hasil pemilihan dengan batas spasial saja menghasikan terlalu banyak dataset, penyaringan lebih lanjut dapat dilakukan dengan membatasi pilihan dataset berdasarkan rentang waktu. Informasi yang digunakan untuk data temporal ini adalah waktu pembuatan dataset atau waktu akuisisi citra satelit. Dataset-dataset foto udara yang merupakan satu seri pemotretan dapat dihasilkan dengan kombinasi parameter spasial dan temporal. c. Kategori analisis atau tema tertentu (katakunci: jenis aplikasi). Dari metadata, seringkali kita dapat memperoleh informasi tentang isi dataset sesuai hasil analisis yang telah dibuat atau dapat dibuat dengan dataset tersebut, misalnya kata-kata kunci: pertanian, kehutanan, geologi, meteorologi, perkotaan, dan sebagainya. d. Batasan spektral (kata kunci: spectral band). Penggunaan kriteria ini jarang ditemukan dalam katalog yang ada saat ini, namun informasi ini dapat bermanfaat bagi pemakai yang sudah mengetahui batasan informasi spektral yang dibutuhkan untuk analisis tertentu yang ingin dilakukan, misalnya keberadaan band spektrum warna merah dan Near Infrared untuk analisa yang berkaitan dengan vegetasi. Sistem-sistem katalog data spasial yang ada umumnya menggunakan parameter-parameter di atas, yang sering juga diwakili dengan kata kunci "apa", "kapan" dan "di mana". Masing-masing VI-111
dataset output yang dihasilkan dari pemilihan data (query) dengan parameter-parameter di atas adalah dataset yang independen, dalam artian terpilihnya dataset tersebut sepenuhnya karena informasi yang ada dalam dataset itu memenuhi kriteria pencarian yang diberikan. Sistem pencarian seperti ini sudah mencukupi untuk instansi yang memproduksi citra remote sensing, terutama data awal (citra yang belum diolah), namun kurang dapt mendukung kebutuhan instansi yang mempunyai fngsi kordinasi data spasial seperti Bakosurtanal, di mana proses perjalanan dataset mulai dari data awal hingga hasil-hasil pengolahannya perlu diinventarisir atau diorganisasikan. 4.2 Hubungan antar dataset berdasarkan level pemrosesannya Untuk menghasilkan suatu produk akhir pemetaan dari sejumlah citra awal (raw dataset), dibutuhkan beberapa langkah pemrosesan. Pada setiap langkahnya, suatu dataset baru akan terbentuk dengan menggunakan algoritma tertentu. Dataset-dataset yang digunakan sebagai dataset awal, dataset-dataset hasil tiap pemrosesan hingga dataset hasil akhir pemetaan tersebut dapat dikelompokkan berdasarkan level pemrosesannya. Dataset yang berasal dari sensor remote sensing (misalnya foto udara atau citra satelit) dapat dikategorikan sebagai dataset dengan level terendah (level-0) sedangkan dataset yang merupakan hasil akhir pemetaan dapat dikategorikan sebagai level tertinggi. Berdasarkan level pemrosesan ini, pendekatan untuk menentukan jumlah level dan jenis levelnya dapat menggunakan konsep pengelompokan data spasial yang diperkenalkan oleh Amhar (2001), yang dapat dilihat pada Tabel 1. Selanjutnya, kodifikasi level pemrosesan akan menggunakan ketentuan sebagai berikut: raw dataset diklasifikasikan sebagai level-0; hasil rektifikasinya diklasifikasikan sebagai level-1; citra hasil analisis atau tematik diklasifikasikan sebagai level-2; dan citra hasil akhir pemetaan atau presentasi diklasifikasikan sebagai level-4. Gambar 1 berikut ini menunjukkan skema pemrosesan citra digital dalam pembuatan peta.
Gambar 1
Klasifikasi Level Data Berdasarkan Level Pemrosesan
Arah panah pada diagram dalam Gambar 1 di atas menunjukkan arah pemrosesan data. Dalam prakteknya, hanya proses yang telah dilewati oleh dataset yang dapat dicatat atau direkam dalam tiap dataset. Histori pemrosesan dataset hanya dapat mencatat sumber langsung yang digunakan pada setiap dataset. Pada setiap dataset dapat tercatat satu atau lebih dataset yang digunakannya sebagai dataset sumber (source dataset). Mengacu pada Gambar 1 di atas, daftar dataset sumber yang dapat dicatat pada setiap dataset adalah sebagai berikut: Tabel 2 Link antar Dataset Dataset DB0-IKO1 DB0-IKO2 DB0-IKO3 DB1-IKO1 DB1-IKO2
VI-112
Dataset sumber (none) (none) (none) DB0-IKO1 DB0-IKO2
Keterangan Raw dataset Raw dataset Raw dataset 1:1 geo-rectification 1:1 geo-rectification
DB1-IKO3 DB2-city1
DB2-veg1
DB2-them1 DB3-citybelt
DB0-IKO3 DB1-IKO1, DB1-IKO2, DB1-IKO3 DB1-IKO1, DB1-IKO2, DB1-IKO3 DB2-veg1 DB2-them1
1:1 geo-rectification contoh mosaicking
contoh analisis NDVI
contoh hasil GIS contoh peta hasil
Dengan menggunakan informasi yang diekstraksi dari seluruh dataset sesuai Tabel 2 di atas, dapat ditelusuri histori masing-masing dataset. Untuk dataset DB3-citybelt misalnya, dapat dilakukan penelusuran sebagai berikut: DB3-citybelt dibuat menggunakan DB2-them1, yang menggunakan DB2-veg1, yang menggunakan (DB1-IKO1, DB1-IKO2, dan DB1-IKO3), yang menggunakan (DB0-IKO1, DB0-IKO2, dan DB0-IKO3). Penelusuran ini menunjukkan bahwa histori lengkap proses pembuatan suatu dataset dapat direkonstruksi tanpa memerlukan struktur yang kompleks. Setiap dataset hanya perlu mencatat dataset-dataset yang digunakan secara langsung sebagai dataset sumbernya dalam metadatanya. Link ke dataset sumber tersebut hanya perlu dicatat satu kali saat pembentukan metadata suatu dataset. 4.3 Struktur Data DAG untuk Pemodelan Histori Untuk pengorganisasian histori proses pembuatan, diperlukan struktur data yang mendukung karakteristik proses pengolahan data spasial seperti yang digambarkan dalam Gambar 1 dan Tabel 2. Dengan mengamati karakteristik proses yang biasanya merupakan alur sekuensial dan mendukung multi-input, struktur data yang paling mendekati representasi model data yang diolah adalah Directed Acyclic Graph (DAG). Dengan representasi graph ini, setiap dataset dinyatakan sebagai node, dan setiap relasi ke dataset sumbernya dinyatakan sebagai vertex. Gambar 2 berikut ini menunjukkan representasi graph pengorganisasian histori proses pembuatan dataset DB3-citybelt yang digunakan sebagai contoh dalam Gambar 1 dan Tabel 2.
Gambar 2
Representasi Proses Pembuatan Dataset dengan Graph
Koleksi data spasial dapat terpartisi menjadi sejumlah grup jika terdapat proses pembuatan yang terpisah. Proses yang terpisah ini umumnya terjadi karena perbedaan coverage spasial atau VI-113
coverage temporal. Pemisahan menjadi grup-grup ini membentuk struktur disjoint graph. Datasetdataset yang sama sekali tidak digunakan oleh dataset lainnya dalam suatu koleksi juga akan membentuk suatu disjoint graph. Dengan terbangunnya graph histori pemrosesan data spasial ini, terbuka jalan untuk melakukan sejumlah analisis yang mengacu pada struktur DAG. Beberapa contoh pengolahan atau analisis lebih lanjut yang akan diamati adalah: a. Untuk masing-masing node (dataset), dapat ditelusuri seluruh node yang merupakan dataset sumber dalam pembuatan dataset tersebut, baik sumber langsung maupun tidak langsung b. Untuk masing-masing node (dataset), dapat ditelusuri seluruh node yang merupakan produk dataset tersebut baik secara langsung maupun tidak langsung c. Untuk masing-masing dataset, dapat dievaluasi berapa banyak dataset yang telah memanfaatkannya sebagai dataset sumber, baik secara langsung maupun tidak langsung, demikian juga sebaliknya, dapat diketahui dataset mana yang tidak pernah digunakan sama sekali d. Untuk setiap pasangan node, dapat ditelusuri apakah ada keterkaitan di antaranya e. Struktur graph yang terbentuk akan mempermudah rekonstruksi proses pembuatan suatu dataset dapat dilakukan jika ada pembaruan data sumber (updating) f. Dengan mengamati pengelompokan disjoint graph histori dataset, dapat diamati pengelompokan dan ketergantungan dataset dalam suatu koleksi data spasial. 4.4 Membangun dan mengukur relasi antar dataset Dengan menggunakan model data DAG seperti yang telah dibahas pada sub-bab sebelumnya, secara visual tampak bahwa dalam satu kumpulan dataset tergambar adanya semacam topology yang menggambarkan seberapa dekat atau jauh satu dataset terhadap dataset lain yang berelasi dengannya. Jika besaran relasi antara dua dataset dapat diukur atau ditentukan, peluang untuk melakukan evaluasi-evaluasi terhadap koleksi data spasial menjadi lebih terbuka. Untuk menentukan seberapa kuat relasi antara satu dataset dengan dataset lainnya, kandidat-kandidat parameter berikut ini dapat dipertimbangkan: a. Jarak. Jarak antara dua dataset adalah jarak terpendek yang menghubungkan dua dataset tersebut, baik secara langsung ataupun melalui dataset lainnya. Dalam perencanaan ini, tidak dilakukan pembobotan terhadap nilai tiap edge, dengan kata lain semua proses dianggap sama pentingnya jika dikaitkan dengan relasi antar dataset. Dengan asumsi ini, model struktur data yang digunakan adalah unweighted-directacyclic-graph (unweighted-DAG). Semakin besar nilai jarak, nilai relasi semakin rendah (berbanding terbalik) b. Jumlah dataset sumber yang digunakan (total sources). Dari penelusuran histori, dapat diketahui jumlah keseluruhan dataset yang digunakan baik secara langsung maupun tidak langsung untuk menghasilkan dataset pertama dan dataset kedua. c. Jumlah dataset sumber bersama (common sources). Dari jumlah seluruh dataset sumber yang digunakan, dapat diamati jumlah dataset sumber yang digunakan sebagai dataset sumber oleh dataset yang pertama dan juga oleh dataset yang kedua. Semakin besar jumlah dataset sumber bersama, dapat diasumsikan bahwa kedua dataset mempunyai kemiripan proses dan kemiripan konten yang juga tinggi. d. Jumlah dataset hasil keseluruhan (total target). Dari penelusuran histori, dapat diketahui jumlah keseluruhan dataset baik secara langsung maupun tak langsung oleh dataset pertama dan kedua. e. Jumlah dataset target bersama (common target). Dari jumlah seluruh dataset target yang dihasilkan, dapat diamati jumlah dataset target yang merupakan output bersama kedua dataset. Semakin besar jumlah dataset target bersama, semakin tinggi pula kemiripan konten kedua dataset. Dari kelima kandidat parameter di atas, hanya tiga kandidat pertama (butir a, b dan c) yang stabil sejak suatu dataset dihasilkan, tidak bergantung pada proses-proses pengolahan data selanjutnya. Kandidat butir d dan e dapat digunakan jika pengukuran relasi ingin dilakukan dengan juga memperhitungkan adanya output bersama. Dengan demikian, ada tiga kemungkinan perhitungan nilai relasi yang dapat dipertimbangkan, yaitu:
VI-114
Relasi antara dua dataset berdasarkan relasi inputnya: (1)...........................Я = 100 (ΣC/ΣS)/Δ Relasi antara dua dataset berdasarkan relasi outputnya: (2)................... Я1 = 100 (ΣR/ΣT)/Δ Relasi antara dua dataset berdasarkan relasi input dan outputnya: (3) ...................Я2 = Я + Я1 dimana: Δ = Jarak antar dataset; ΣC = Jumlah dataset sumber bersama; ΣS = Jumlah dataset sumber yang digunakan; ΣR = Jumlah dataset output bersama; ΣT = Jumlah dataset output yang dihasilkan.
Dengan pertimbangan akan kestabilan nilai yang diperoleh, nilai relasi yang direkomendasikan untuk digunakan adalah relasi antara dua dataset berdasarkan relasi inputnya saja (Я). Sub-bab berikut akan menunjukkan ujicoba perhitungan relasi ini pada suatu contoh skema pemrosesan data spasial. 4.5 Evaluasi Struktur graph pada Gambar 3 berikut ini menggambarkan rekonstruksi aliran proses pembuatan dataset / peta dalam suatu koleksi data spasial. Arah panah dalam gambar ini menunjukkan arah proses (dari sumber menunjuk ke hasil). Penelusuran histori pembuatan suatu dataset dapat dilakukan dengan melakukan penelusuran pada arah kebalikannya. Sebagai contoh, dataset R21 dibuat dengan menggunakan dataset R11, R12 dan R13 sebagai inputnya.
Gambar 3
Contoh Skema Aliran Proses Pembuatan Dataset Hasil Rekonstruksi
Berdasarkan Gambar 3 ini, akan dihitung nilai relasi antara pasangan-pasangan dataset dengan menggunakan rumus (1) di atas. Hasil perhitungan untuk pasangan-pasangan dataset yang dipilih disajikan dalam Tabel 4. Dengan memperhatikan nilai relasi () yang diperoleh dan dibandingkan dengan posisi node-node yang mewakili dataset tersebut dalam graph, dapat disimpulkan bahwa nilai relasi yang diperoleh dengan metode ini dapat digunakan sebagai besaran untuk pengukuran relasi antar dataset dilihat dari histori pembuatannya. Jika relasi antara dua dataset bernilai nol, dapat disimpulkan bawah kedua dataset itu tidak mempunyai keterkaitan dalam proses pembuatannya, dengan demikian kedua dataset tersebut merupakan bagian dari struktur graph yang terpisah, atau kedua dataset merupakan data awal (raw dataset). Jika relasi antara dua dataset bernilai 100, maka salah satu dataset dipastikan merupakan dataset sumber satu-satunya bagi dataset pasangannya, Sebagai dataset input satu-satunya, diasumsikan bahwa isi dataset hasil hanya bergantung pada isi dataset sumber satu-satunya tersebut sehingga nilai relasinya sangat tinggi. Contoh relasi yang bernilai 100 adalah hubungan antara raw dataset dengan dataset hasil rektifikasinya (misalnya R01 dengan R11).
VI-115
Tabel 4.3
Contoh Perhitungan Rrelasi dengan Acuan Kode Node di Gambar 3.
Dataset pertama
Dataset kedua
Jarak terdekat (Δ)
Total sumber digunakan (ΣS)
Total sumber bersama (ΣC)
digunakan oleh dataset pasangan?
Relasi
R01
R11
1
1
1
ya
100
R21
R22
2
8
2
tidak
12,5
R21
R23
n/a
10
0
tidak
0
R21
R31
1
7
7
ya
100
R21
R01
2
6
1
ya
8,33
R01
R02
n/a
0
0
tidak
0
R11
R12
n/a
2
0
tidak
0
R22
R31
3
9
2
tidak
7,41
R22
R23
n/a
8
0
tidak
0
5. Kesimpulan dan tindak lanjut Penelitian ini memberikan suatu alternatif baru dalam mengorganisasikan data spasial dalam suatu katalog sistem yang menggunakan metadata yang mengacu pada standar ISO maupun FGDC sebagai data primernya. Dari penjabaran pada sub-bab sub-bab sebelumnya, dapat diperoleh kesimpulan sebagai berikut: Relasi antar dataset dalam koleksi dapat direkonstruksi dengan acuan proses pembuatannya. Hasil rekonstruksi ini sangat bermanfaat bagi lembaga-lembaga yang mengoleksi data spasial karena rekonstruksi ini memungkinkan evaluasi lebih lanjut atas kualitas maupun produktifitas data spasial yang dimiliki Dengan adanya mekanisme untuk mengukur nilai relasi antara dua dataset, dapat diamati seberepa independen suatu dataset terhadap dataset lainnya. Perhitungan ini juga dapat digunakan lebih lanjut untuk proses pengelompokan atau klasterisasi dataset secara otomatis. Metoda yang digunakan dalam riset ini menggunakan metadata yang baku, sehingga implementasinya tidak bergantung pada perangkat lunak tertentu atau platform tertentu. Walaupun pembahasan dalam paper ini difokuskan pada citra remote sensing karena titik awal ide pengorganisasiannya adalah untuk data raster, namun metoda ini dapat diterapkan untuk data spasial tipe apa saja sejauh metadatanya menggunakan metadata baku untuk data spasial Riset ini juga membuka peluang-peluang untuk topik-topik riset lanjutan, antara lain meliputi: Indikator relasi yang disajikan dalam paper ini bersifat stabil, nilainya tidak berubah meskipun ada penambahan dataset ke dalam koleksi atau adanya proses-proses pembuatan dataset baru dengan menggunakan dataset yang ada. Walaupun konsep ini dirasa cukup baik, indikator relasi yang dihasilkan mengabaikan adanya kemungkinan adanya dataset output bersama yang mungkin memberikan pengaruh pada penilaiaan indikator relasi Relasi yang diperhatikan dalam riset ini hanya mengacu pada histori pembuatan suatu dataset, dalam artian, hanya daftar dataset-dataset yang digunakan sebagai input yang diperhatikan dan dimasukkan dalam proses perhitungan indikator relasi. Pada penelitian selanjutnya ada kemungkinan untuk melibatkan parameter-parameter lain yang dapat dihasilkan dari analisis tertentu, misalnya kemiripan isi (content similarity) atau keseragaman waktu akuisisi (time-series images) Referensi: Amhar, F. (2001): Konsep Terpadu Sistem Basis Data Untuk Infrastruktur Data Spasial Nasional, Forum Nasional Tata Ruang 2001 (Integrated Concept of Database System for National Spatial Data Infrastructure, National Forum of Spatial Planning). Bakosurtanal internal report BAKOSURTANAL (2005). Panduan Pembangunan Metadata Data Spasial (Spatial Data Metadata Development Guideline). Technical Working Group Clearinghouse, Marine and Coastal Resource Management, Bakosurtanal, Cibinong – Indonesia. Bakosurtanal Internal Report. Bang-Jensen, J., Gutin, G.Z. (2008). Digraphs: Theory, Algorithms and Applications. Springer Monographs in Mathematics (2nd ed.), Springer-Verlag, London
VI-116
Bose, R., Frew, J. (2004). Composing Lineage Metadata with XML for Custom Satellite-Derived Products. Proceedings of the IEEE 16th International Conference on Scientific and Statistical Database Management (SSDBM’04), pp. 275-284 Li Q., Wang S., Chen B. (2005). Remote Sensing Image Distribute System Supported by Metadata. Proceedings of IGARSS 2005, Volume 2, 25-29 July 2005, pp. 791-794, Matindas, R W., Puntodewo, Purnawan, B. (2004). Development of National Spatial Data Infrastructure in Indonesia. FIG Working Week 2004, Athens – Greece. http://www.fig.net/pub/athens/papers/ts02/ts02_1_matindas_et_al.pdf , diakses 30 Jan 2009 Puntodewo, Nataprawira R. (2004). Indonesian Geospatial Data Clearinghouse. 3rd FIG Regional Conference for Asia and the Pacific, Jakarta 2004, http://www.fig.net/pub/jakarta/papers/ts_02/ ts_02_2_puntodewo_nataprawira.pdf , diakses 30 Jan 2009 Ruan, N.; Huang, N.; Hong, W. (2006). Semantic-Based Image Retrieval in Remote Sensing Archive: An Ontology Approach. Proceedings of IGARSS 2006, pp. 2903 - 2906 Sukmayadi D., Amhar F., Adhibroto A., Prijanto A. (2004). Geo-Spatial Database Design and Implementation at the Mapping Center for Topographic & Spatial Arrangement (PDRTR) of BAKOSURTANAL, 3rd FIG Regional Conference, http://www.fig.net/ pub/jakarta/papers/ts_02/ts_02_3_sukmayadi_etal.pdf, diakses 30 Jan 2009
VI-117