Development of Application Spatial Data Mining Using Spatial Autoregressive (SAR and Expansion SAR(E-SAR) for Mapping a Quality Education at East Java Province Atje Setiawan Abdullah 1 and Rudi Rosadi2 1,2
Department of Mathematics Faculty of Mathematics and Natural Sciences Universitas Padjadjaran Jl. Raya Bandung-Sumedang Km. 21 Jatinangor Sumedang 45363 e-mail:
[email protected]
Abstract Research on spatial data mining of quality education in Indonesia is still restricted, focused on result of final examination (UAN) and analyzed in descriptive sense. Indonesia is a very large area and has many social and culture, so the quality education in Indonesia at districts, cities and province in Indonesia has many problem and its interested to be studied using spatial data mining. Data mining process has three stages: preprocessing, data mining and post processing. In this paper, we develop an application of spatial data mining for classification and prediction of quality education at several stages at school using Spatial Autoregressive (SAR) and Expansion SAR (E-SAR) models. For case study we use the SDPN2003 data from Balitbang Depdiknas, and spatial data is described by coordinate of districts as a least unit sample. Development of application spatial data mining using SAR and E-SAR models follows an analysis step, design and implementation. Analysis includes identification of research variable and spatial data mining process. Design includes context diagram, data flow diagram, table structure, entity relational diagram, SAR and E-SAR algorithms and design user interface. Implementation has process: development program of application using MatLab software, so the application which we build is user friendly. The result of development application of SAR and E-SAR model in East Java Province gave a model for description and prediction of quality education of elementary school at the cities using equation of quality education, mapping of quality education, graphic of relationship between indicators of quality toward distance from center government (province) and graphic of fitted prediction model and actual data.
Keywords: Development of application SAR, Spatial data mining, SDPN2003
1. PENDAHULUAN Spasial data mining merupakan penambangan pengetahuan dari data spasial dalam jumlah besar, merupakan bidang yang menarik untuk diteliti.
Data yang
dikumpulkan dalam jumlah besar tersebut memerlukan kemampuan untuk mengolahnya, sehingga bermanfaat untuk berbagai aspek kehidupan. Kajian data mining saat ini telah berkembang dari kajian database relasional dan transaksional menjadi database spasial. Pengetahuan yang ditemukan dalam data spasial mempunyai berbagai bentuk, dapat didasarkan pada aturan pengelompokan atau diskriminan, ekstraksi dan deskripsi dari struktur cluster, asosiasi spasial, dan lain-lain.
Metode spasial data mining dapat
diterapkan dalam pemetaan mutu pendidikan, mengingat Indonesia memiliki sebaran lokasi yang luas, terdiri dari : provinsi, kabupaten /kota, kecamatan, dan desa. Pembangunan pendidikan nasional merujuk pada empat aspek sebagai tema pokok, yaitu: pemerataan kesempatan belajar, peningkatan mutu, peningkatan efisiensi pelaksanaan pendidikan, dan relevansi pendidikan dengan pembangunan. Salah satu upaya yang dilakukan pemerintah dalam mendukung pembangunan pendidikan nasional melalui Balitbang Diknas dalam membangun database pendidikan adalah melakukan Survei Dasar Pendidikan Nasional tahun 2003 (SDPN2003).
Hasil SDPN 2003,
khususnya untuk persekolahan secara nasional terjaring 203.590 record dengan 569 indikator, meliputi SD 158.590 record dengan 122 indikator, SMP 28.949 record dengan 138 indikator, SMA 10.810 record dengan 142 indikator, serta SMK 5.156 record dengan 167 indikator (Balitbang Diknas, 2003). 1.1 Tujuan Penelitian Tujuan penelitian ini adalah: 1). Mengembangkan dan penerapan spasial data mining melalui aplikasi Spatial Autoregresive (SAR) dan Spatial Autoregresive Expansion (E-SAR), meliputi analisis, disain dan implementasi sistem. 2). Implementasi model SAR dan E-SAR untuk deskripsi dan prediksi mutu pendidikan kabupaten/kota di Provinsi Jawa Timur.
1.2 Batasan Masalah 1). Database yang digunakan merupakan hasil Survei Dasar Pendidikan Nasional 2003, sedangkan data spasial merupakan koordinat kecamatan-kecamatan di kabupaten/kota di provinsi Jawa Timur. 2). Unit analisis terkecil merupakan mutu pendidikan pada jenjang sekolah dasar (SD) di kecamatan-kecamatan pada kabupaten/kota di provinsi Jawa Timur.
2. TINJAUAN LITERATUR DAN METODE 2.1 Proses Data Mining Tiga fase metodologi visualisasi data mining, terdiri dari, fase perencanaan projek, fase penyiapan data dan fase analisis data. Ketiga fase dirinci menjadi delapan langkah metodologi visualisasi data mining, meliputi: penilaian dan perencanaan projek, identifikasi permasalahan bisnis, pemilihan kumpulan data, transformasi kumpulan data, verifikasi kumpulan data, pemilihan alat visualisasi atau alat penambangan, analisis model visualisasi dan model penambangan, serta verifikasi dan presentasi visualisasi dan model penambangan (Tom Soukup dan Davidson Ian, 2002), diperlihatkan gambar 2.1
Gambar 2.1 Delapan Langkah Metodologi Visualisasi Data Mining 2.2 Variabel yang Digunakan dalam Analisis Variabel yang digunakan, yaitu variabel dasar dan variabel indikator. Variabel dasar adalah semua variabel yang terdapat didalam “raw data individual sekolah”. Sedangkan
variabel indikator adalah variabel yang diperoleh berdasarkan variabel -variabel dasar (Balitbang Depdiknas, 2003 ). Variabel dasar dan variabel indikator yang digunakan dalam analisis berhubungan dengan; identitas sekolah, siswa, guru, sarana/prasarana dan UAN. Dari variabel dan indikator di atas, kemudian dibangun model input output pendidikan. Dalam model input output pendidikan, input terdiri dari indikator siswa, proses terdiri indikator sarana/prasarana dan indikator guru, sedangkan output terdiri dari indikator jumlah nilai UAN dan rata-rata tingkat kelulusan siswa. Seleksi indikator dilakukan menggunakan analisis faktor dan analisis Struktural Equation Model (SEM). Model Spasial Autoregressive (SAR) Model spasial autoregressive secara umum dirumus kan (LeSage, 1999) sebagai berikut: y = ρ W1y + Xβ + u u = λ W2u + ε
(2.1)
y vektor n × 1 dari variabel dependen, X matriks variabel bebas n × k . W matriks bobot
spasial n × n , berisi relasi contiguity atau fungsi jarak. Jika X = 0 dan W2 = 0 untuk model spasial autoregressive, disebut model spasial autoregressive order pertama dinyatakan: y = ρ Wy + ε
(2.2)
Matriks W perlu dibakukan sehingga jumlah unsur setiap baris dari matriks satu dan vektor y unsurnya merupakan penyimpangan dari rata-ratanya.
Untuk keperluan
pengujian hipotesis perlu diasumsikan bahwa ε N (0, σ 2 I n ) . Taksiran kuadrat terkecil (ols) ρ diberikan (Anselin, 1988 & LeSage, 1999): ρˆ = ( y'W'Wy ) y'W'y −1
(2.3)
Model Ekspansi SAR (E-SAR) Model ekspansi SAR diperkenalkan Casetti (1972) dalam Anselin (1988) dan LeSage (1999) sebagai perluasan dari model SAR, dengan tujuan agar dapat digambarkan heterogenitas spasial.
Heterogenitas dalam model ekspansi SAR digunakan untuk
menggambarkan nilai-nilai parameter yang berbeda untuk setiap observasi spasial
melalui jarak dari titik pusat ke lokasi-lokasi lain di sekitarnya, Jarak antara dua lokasi diukur dengan jarak Euclidean yang melibatkan koordinat lokasi, disingkat koordinat. Secara umum model ekspansi SAR dari Casetti dalam LeSage (1999) dirumuskan dengan pendekatan model regresi linier sebagai berikut: y = Xβ + ε β = ZJβ 0
(2.4)
dengan y vektor variabel dependen bersesuaian dengan observasi spasial ukuran (nx1) X matriks ukuran (nxnk) berisi bentuk x(si) sebagai vektor variabel independen (kx1) β matriks parameter ukuran (nkx1) berisi taksiran parameter untuk k variabel independen pada setiap observasi β0 vektor parameter ukuran (2x1) berisi 2k parameter yang akan ditaksir Z matriks informasi lokasi yang mempunyai elemen perluasan Zxi dan Zyi menyatakan koordinat latitude (garis lintang) dan longitude (garis bujur) untuk setiap lokasi i iid
asumsi yang digunakan adalah ε ~ N ( 0 , σ 2 I n ) . Model ekspansi SAR di atas menyatakan bahwa parameter β x dan β y .berubah-ubah, karena merupakan fungsi dari koordinat latitude dan longitude. Parameter model sebanyak 2k ditaksir dengan menggunakan metode kuadrat terkecil. Berdasarkan taksiran-taksiran parameter tersebut, taksirantaksiran lainnya untuk titik-titik dalam ruang ditaksir menggunakan persamaan kedua dari (3.33). Proses ini merupakan proses ekspansi. Untuk menggambarkan proses ekspansi tersebut, substitusikan persamaan kedua pada (3.33) ke persamaan pertama: y = XZJβ 0 + ε
(2.5)
Dari persamaan di atas tampak jelas bahwa matriks X, Z, dan J diperoleh sebagai data observasi dan hanya vektor β0 merupakan parameter yang perlu ditaksir. Alternatif lain dalam mengimplementasikan model ekspansi SAR didasarkan kepada vektor jarak. Jarak dari koordinat observasi (misal kab/kota) dirumuskan sebagai : d (si ) =
(Z xi − Z xc )2 + (Z yi − Z yc )2
di mana, Z xi , Z yi menyatakan koordinat observasi ke-i
(2.6)
dalam posisi latitude dan
longitude dari pusat lokasi (misal ibukota provinsi yang diwakili oleh pusat
pemerintahan) serta Z xc , Z yc merupakan koordinat latitude dan longitude untuk observasi lokasi i dari data sampel.
Pendekatan ini memberikan bobot spasial yang berbeda
untuk observasi didasarkan pada jarak dari lokasi observasi ke pusat lokasi. Persamaan (3.33) dalam ekspansi jarak dapat dituliskan: y = Xβ + ε β = DJβ 0
(2.7)
dengan D=diag(d(s1), d(s2),..., d(sn)), menyatakan jarak dari setiap lokasi observasi si ke pusat lokasi dan β0 merupakan vektor parameter ukuran (kx1) dari pusat lokasi dan J=(Ik,Ik, …,Ik)’ matriks ukuran (nxk). Anselin (1988) menyatakan bahwa Persamaan (3.36) dapat diimple-mentasikan pada MATLAB dengan fungsi casetti, secara matematis ditulis sebagai berikut: y = α + Xβ + XZ x β x + XZ y β y + ε
(2.8)
Dengan menggunakan matriks jarak D model pada Persamaan (2.8) dapat dinyatakan: y = α + Xβ + XDβ 0 + ε
(2.9)
Pada model ekspansi SAR dengan melibatkan jarak, dapat dipilah pengaruh non spasial dan pengaruh spasial: y = α + Xβ + XDβ 0 + ε 123 123 non − spasial
spasial
Taksiran parameter β dan β0 dapat digunakan untuk mendeskripsikan analisis pengaruh marjinal yang didekomposisikan ke dalam pengaruh non spasial dan pengaruh spasial. Untuk menggambarkan pengaruh variabel independen terhadap variabel dependen secara individu dapat digunakan grafik melalui persamaan berikut: δ xi = β i + Z x β xi δ yi = β i + Z y β yi δ di = β i + Dβ 0 i Persamaan
(3.39)
menunjukkan
koefisien
(2.10)
dari
variabel
individual,
yang
menggambarkan pengaruh total terhadap variabel dependen. δx dan δy di-plot untuk ekspansi x-y, dan δd diplot untuk perluasan jarak. Grafik tersebut memberikan informasi pengaruh total (pengaruh non spasial dan spasial) variabel independen ke-i terhadap
variabel dependen. Jika grafik tersebut menunjukkan kecenderungan turun, maka dapat diinterpretasikan semakin jauh dari koordinat pusat, semakin kecil pengaruh suatu variabel independen terhadap variabel dependen. Sebaliknya, Jika grafik tersebut menunjukkan kecenderungan naik, maka dapat diinterpretasikan semakin jauh dari koordinat pusat, semakin besar pengaruh suatu variabel independen terhadap variabel dependen. 3. HASIL DAN PEMBAHASAN 3.1
Desain Aplikasi SAR dan E-SAR Aplikasi SAR dan E-SAR, mengikuti metodologi penambangan data, terdiri dari 3
tahap. Pertama preprocessing, meliputi seleksi data, data cleaning, dan transformasi data. Hasil dari data preprocessing berupa data aggregat dalam bentuk rasio merupakan gabungan dari indikator penelitian, diturunkan dari indikator siswa, sarana, guru dan mutu pendidikan melalui analisis faktor dan structural equation model, serta data koordinat kecamatan-kecamatan sebagai unit analisis terkecil. Kedua, proses data mining, meliputi pemilihan dan penggunaan algoritma model-model untuk pengolahahan data hasil preprocessing, algoritma model-model yang digunakan antara lain model EkspansiSAR. Ketiga, Postprocessing merupakan interpretasi hasil proses data mining menggunakan model-model. Output yang dihasilkan berbentuk, persamaan model perluasan SAR, untuk melihat pengaruh data spasial dan non spasial terhadap mutu pendidikan dengan melibatkan unsur jarak setiap lokasil. Output dapat dimanfaatkan oleh user sebagai bahan untuk menetapkan kebijakan. Diagram konteks dari aplikasi SARKriging dapat dilihat pada Gambar 3.1.
Gambar 3.1 Diagram Konteks Aplikasi SAR DAN E-SAR
Pada diagram konteks sebagai input adalah data preprocessing atau penyiapan data, yang menghasilkan data rasio indikator mutu pendidikan yang diperoleh sebagai hasil seleksi variable menggunakan model analisis faktor dan structural equation model, serta data koordinat setiap lokasi kecamatan dan peta spasial sebagai input untuk proses data mining. Pada proses, dilakukan pengolahan data menggunakan model SAR, dan E-SAR. Output dari aplikasi spatial data mining, meliputi model persamaan SAR, plot Moran, grafik Moran, dan model persaman Ekspansi-SAR beserta grafiknya. Hasil output menghasilkan knowledge, dapat digunakan user sebagai bahan pendukung keputusan. Data Flow Diagram aplikasi Spatial Data Mining, dapat dilihat pada Gambar 3.2.
Gambar 3.2 Data Flow Diagram Level-1 Aplikasi SAR dan E-SAR Gambar 3.2 Data Flow diagram SAR-Kriging. Terdiri dari 6 sub proses, meliputi : 1. Sub proses pemilihan provinsi/kabupaten/kota dan jenjang pendidikan (1.0), untuk memilih provinsi/kab/kota. Input subproses ini data rasio mutu pendidikan, peta spasial, dan data koordinat tiap kecamatan, sedangkan output, merupakan perhitungan Ekspansi-SAR dan pembuatan grafik Ekspansi-SAR. 2. Sub proses perhitungan model SAR (2.0), menghitung persamaan SAR digunakan untuk melihat pengaruh spasial dan non spasial terhadap
variable tertentu dan
menghitung koefisien determinasi model spasial variable tertentu dan unsur error. Input sub proses ini, data rasio pendidikan, sedangkan outputnya, berupa persamaan model SAR untuk lokasi tertentu. 3. Sub proses perhitungan indeks Moran (3.0), untuk klasifikasi variable dalam suatu peta, melalui otokorelasi spasial, jika koefisien MC mendekati 1 artinya nilai
pengamatan similar mengelompok dalam suatu peta dan hubungan kuat, jika MC mendekati -1 artinya hubungan lemah. Input dari sub proses ini, data rasio mutu pendidikan, sedangkan output, indeks Moran masing-masing indikator. 4. Sub proses pembuatan plot Moran dan grafiknya (4.0), untuk mengklasifikasikan pengamatan dalam empat kuadran. Koefisien kemiringan ρ , mendekati satu tingkat otokorelasi spasial positif, plot Moran terdapat pengamatan dominan nilai tinggi berada di kuadran I, kuadran III pengamatan dominan nilai rendah. Scatter plot pola acak, tidak ada ketergantungan antara pengamatan, Nilai negatif ρ di kuadran II, dan IV. Input sub proses, peta spasial dan data klasifikasi hasil indeks Moran. Output, klasifikasi mutu dengan plot Moran dan peta spasial. 5. Sub proses perhitungan model Ekspansi-SAR (5.0) , menghitung model spatial linier secara lokal dalam mengukur heterogenitas di dasarkan pada koordinat lokasi spasial. Persamaam dihasilkan menunjukkan koefisien variabel individual, menggambarkan pengaruh total terhadap variabel dependen karena variabel bebas. Input adalah data rasio mutu dan koordinat lokasi spasial. Output persamaan Ekspansi-SAR. 6. Sub proses pembuatan grafik Ekspansi-SAR (6.0), memberikan informasi pengaruh total variabel bebas ke-i terhadap variabel dependen. Jika grafik kecenderungan turun, diinterpretasikan semakin jauh dari koordinat pusat, semakin kecil pengaruh suatu variabel independen terhadap variabel dependen. Jika grafik kecenderungan naik, diinterpretasikan semakin jauh dari pusat, semakin besar pengaruh suatu variabel independen terhadap variabel dependen. Input adalah persamaan ekspansi spasial dan output adalah grafik hasil ekspansi spasial.
3.2 Relasi Antar Tabel Relasi antar tabel dalam suatu database menunjukkan jaringan data yang ada untuk suatu sistem yang diberikan, dibutuhkan pada proses preparation dalam data mining. Relasi antar tabel dapat dilihat pada Gambar 3.3.
Gambar 3.3 Relasi Antar Tabel Aturan bisnis dari relasi antar tabel di atas adalah sebagai berikut: 1. Tabel SD_SISWA, SD_SARANA, SD GURU, SD_NILAI, SD_ID, menpunyai nomor identitas sekolah (id) yang unik dan dijadikan sebagai prymary key. 2. Tabel SMP_SISWA, SMP_SARANA, SMP GURU, SMP_NILAI, SMP_ID, menpunyai nomor identitas sekolah (id) unik dan dijadikan sebagai prymary key. 3. Tabel SMA_SISWA, SMA_SARANA, SMA GURU, SMA_NILAI, SMA_ID, menpunyai nomor identitas sekolah (id) unik dan dijadikan sebagai prymary key. 4. Tabel KEC, KAB, PROP, KEC_LINE_CAPITAL, menpunyai masing Kode yang unik dan dijadikan sebagai prymary key. 5. Satu identitas sekolah pada tabel SD_ID hanya ada satu identitas sekolah pada tabel SD_SISWA, SD_SARANA, SD GURU, SD_NILAI. 6. Satu identitas sekolah pada tabel SMP_ID hanya ada satu identitas sekolah pada tabel SMP_SISWA, SMP_SARANA, SMP GURU, SMP_NILAI. 7. Satu identitas sekolah pada tabel SMA_ID hanya ada satu identitas sekolah pada tabel SMA_SISWA, SMA_SARANA, SMA GURU, SMA_NILAI. 8. Satu kecamatan terdiri dari beberapa sekolah SD, SMP dan SMA. 9. Satu kecamatan mempunyai satu koordinat spatial. 10. Satu Kabupaten Terdiri dari banyak Kecamatan 11. Satu Provinsi terdiri dari banyak Kabupaten Contoh teks file hasil transformasi untuk jenjang SD ditunjukkan pada Gambar 3.4
Gambar 3.4 Teks File Hasil Preparation Jenjang SD
3.3
Desain User Interface SAR dan E-SAR Disain user interfase aplikasi spasial data mining (E-SAR), meliputi menu utama
spasial data mining, terdiri dari tiga pilihan, menu penyiapan data, menu pemilihan model dan menu perbandingan model. Data yang digunakan merupakan data hasil preprocessing, mulai dari seleksi variabel, cleaning data, dan transformasi data ke dalam bentuk rasio, serta penggabungan dengan data spasial. Sedangkan model-model yang digunakan merupakan hasil pemilihan model spasial yang akan digunakan pada proses pengolahan data. Model-model yang digunakan terdiri dari model SAR, dan model Ekspansi-SAR. Disain user interface yang akan digunakan dapat dilihat pada Gambar 3.7.
Gambar 3.5 Disain User Interface Aplikasi SAR-Kriging Menu penyiapan data untuk menyiapkan data yang akan diolah oleh model. Menu penyiapan data terdiri dari 2 bagian, sub menu pemilihan lokasi dengan pilihan provinsi dan kabupaten/kota, dan sub menu pemilihan jenjang dengan pilihan SD, SMP dan SMA. Kemudian lakukan loading data, dapat dilihat data beserta indikator yang digunakan.
Menu pemilihan model terdiri dari dua sub menu, yaitu sub menu model SAR, dan sub menu model Ekspansi-SAR. Submenu model SAR meliputi perhitungan persamaan SAR, perhitungan indeks Moran, dan pembuatan plot Moran, digunakan untuk deskripsi dan klasifikasi mutu pendidikan di berbagai lokasi. Setelah perhitungan selesai dapat dilihat persamaan SAR untuk lokasi tersebut. Submenu perluasan model SAR, meliputi perhitungan model persamaan EkspansiSAR, dan grafik untuk menggambarkan pengaruh indikator non spasial dan spasial tertentu terhadap mutu pendidikan, melihat pengaruh mutu di berbagai lokasi dari satu titik pusat yang ditentukan, dengan melibatkan jarak dua lokasi. Setelah perhitungan selesai dapat dilihat persamaan Ekspansi-SAR untuk lokasi tersebut.
3.4 Aplikasi SAR dan Ekspansi SAR Implementasi aplikasi E-SAR dibuat menggunakan Matlab 7, database dalam akses, sedangkan untuk pembuatan peta digunakan ArtView. Hasil implementasi aplikasi spasial data mining menggunakan E-SAR, sebagai berikut.
Gambar 3.6 Aplikasi SAR dan E-SAR
3.5 Implementasi SAR dan E-SAR di provinsi Jawa Timur Tabel 5.1 Hasil pengolahan data menggunakan SAR jenjang SD NO
INDIKATOR
R SQUARE
KOEFISIEN RHO
MODEL SAR
RELASI
SEDANG
1
RSTRB
0.62
0.83
Y=0.83WY
2
RSB
0.71
0.87
Y=0.87WY
KUAT
3
RSBR7
0.38
0.67
Y=0.67WY
SEDANG
4
RSRB
0.38
0.68
Y=0.68WY
SEDANG
5
RSGLTG
0.58
0.82
Y=0.82WY
SEDANG
6
TOTAL UAN
0.45
0.73
Y=0.73WY
SEDANG
a. Rasio Siswa Baru Asal TK Terhadap Siswa Baru (RSB) Hasil SAR, koefisien regresi 0,87. Persamaan SAR
y = 0,87 Wy . Pengaruh
spasial terhadap RSB tinggi (p < 10%). Pergeseran wilayah setiap satu satuan akan meningkatkan RSB sebesar 0,87. Koefisien determinasi kuat, 71% model spasial RSB dipengaruhi spasial, sisanya 29% unsur error.
b. Moran scatterplot dan peta nilai total UAN
Gambar 3.7 Moran scatterplot dan peta RSRB Dari peta dapat dilihat bahwa untuk sekolah yang berada di kecamatan-kecamatan wilayah Jatim Barat, nilai total UAN relatif tinggi (warna merah). Hal ini menunjukkan bahwa rata-rata nilai total UAN relatif baik .Sebaliknya untuk sekolah yang berada di kecamatan-kecamatan wilayah Jatim Timur, rasio nilai UAN terhadap peserta ujian rendah(warna biru). Ini berarti bahwa rata-rata di wilayah tersebut nilai UAN nya relatif rendah. c. Hasil ekspansi SAR RSGLTG Gambar 3.8 menjelaskan bahwa semakin jauh dari pusat pemerintahan, pengaruh rasio guru layak semakin kecil terhadap mutu pendidikan. Sebaliknya semakin dekat dengan pusat kota atau perkotaan peranan guru layak semakin besar, mengingat kesadaran masyarakat perkotaan untuk mendukung pendidikan cukup besar, peran orang tua sangat besar dalam mendukung pendidikan.
Gambar 3.8 Hasil ekspansi SAR RSGLTG
d. Perbandingan prediksi dan aktual SD
Gambar 3.9 Perbandingan nilai prediksi dan data aktual
Pola data aktual mirip dengan pola model prediksi, berarti model ekspansi SAR dari Casetti menggambarkan keadaan sebenarnya. Pola residual memperlihatkan pola sama. Artinya model ekspansi SAR cocok digunakan menganalisis indikator mutu SD.
4. KESIMPULAN Hasil pengembangan aplikasi SAR dan E-SAR serta penerapannya di provinsi Jawa Timur menunjukkan, untuk deskripsi dan prediksi mutu pendidikan di lokasi tersampel pada jenjang SD menghasilkan knowledge, berikut : 1.
Aplikasi SAR dan E-SAR yang dihasilkan memiliki menu-menu, seleksi data kabupaten/kota, dan pemilihan model terdiri model SAR dan E-SAR. Model SAR dapat digunakan untuk prediksi mutu pendidikan dan deskripsi mutu pendidikan di provinsi Jatim. Model E-SAR dapat digunakan untuk deskripsi dan prediksi mutu pendidikan berkaitan dengan jarak suatu kabupaten/kota ke ibu kota provinsi.
2. Implementasi aplikasi SAR dan E-SAR di provinsi Jawa Timur, menghasilkan model deskripsi dan prediksi mutu pendidikan di kabupaten/kota, yang berbentuk persamaan mutu pendidikan, peta mutu pendidikan, grafik keterkaitan mutu indikator tertentu terhadap jarak dari pusat provinsi dan grafik yang menggambarkan kesesuaian model prediksi dan actual.
DAFTAR PUSTAKA Anselin, L. 1988, “Spatial Econometrics : Method and Models”, Kluwer Academic Publisher, the Netherlands. Balitbang Depdiknas., 2003, “Survei Dasar Pendidikan Nasional Tahun 2003”, Jakarta. Bachrudin, A. dan Tobing, H. L. , 2003, ”Analisis Data Untuk Penelitian Survai : Lisrel 8”, Jurusan Statistika FMIPA Unpad, Bandung. Hair, J.F., Black W.C., Babin B.J., Anderson R. E., and Tatham R.L., 2006., “Multivariate Data Analysis Sixth Edition”., Prentice Hall, New Jersey. Han, J., and Kamber, M., 2006, “Data Mining, Concept and Techniques”, Academic Press, USA. LeSage, J. P., 1998, “Spatial Econometrics”, Department of Economics University Toledo. LeSage P.J., 1999, “The Theory and practice of Spatial Econometrics” , Departemen of Economics, University Toledo. LeSage, J. P. and Pace, R. K. , 2004, “ Arc.Mat, a Matlab toolbox for using ArcView Shape files for Spatial Econometrics and Statistics”, Department of Economics University Toledo. Koperski, K., Han, J., and Adhikary, J., 1997, “Spatial Data Mining: Progress and Challenges”, School of CS, Canada. Nababan, H., 2003, “Indikator Mutu Pendidikan di Lingkungan Pendidikan”, Balitbang Depdiknas, Jakarta. Sekhar, S., Kazar, B. M. and Lilja, D. J., 2003, “ AHPCRC Spatial Data Mining Tutorial on Scalable Parallel Formulations of Spatial Autoregression (SAR) Models for Mining Regular Grid Geospatial Data” , EECS Departement, Univercity Minnesota. Sihombing, U., 2002, “Pengkajian 13 Indikator Pendidikan”, Pusat Data dan Informasi Balitbang Depdiknas, Jakarta. Soukup, T., and Davidson, I., 2002, “Visual Data Mining, Techniques and Tools for Data Visualization and Minning”. John Willey & Sons, Inc., Canada. Tan P.,Steinbach M., and Kumar V. 2006, ”Introduction to Data Mining”, Pearson Education, Inc. Boston.