GEOSTATISTIK I PENDAHULUAN Statistik secara umum Arti statistik ♣ Kata statistik berasal dari bahasa latin “status” atau bahasa Italia “statista” yang berarti “fakta kenegaraan”. Pada mulanya statistik dipakai untuk urusan kenegaraan, kenegaraan karena pemerintah memerlukan informasi khusus untuk mengambil keputusan perencanaan dan pengaturan (misal pajak) yang efektif dan efesien. ♣
Sekarang k statistik k tidak d k hanya h bermanfaat b f untuk k urusan kenegakenega k raan saja, tapi juga sangat berguna bagi ahli ekonomi, ilmuwan, peneliti, pedagang, perbankan, asuransi, dsb, sehingga kegunaan statistik menjadi sangat universal.
♣
Kata statistik kemudian ditafsirkan mempunyai 2 arti: yang pertapertama sebagai g ilmu pengetahuan p g (ilmu ( statistik)) dan yang y g kedua sebasebagai fakta atau gambaran yang berupa data numerik (misalnya statisstatistik kependudukan, pendapatan nasional, pengangguran, dsb).
Arti statistik ♣
Sebagai ilmu pengetahuan: Statistik adalah kombinasi prinsip (konsep) dan teknik (metode) yang dipakai untuk mengumpulkan, mempresenta mempresenta-sikan,, menganalisis, g , dan menginterpretasi g p data numerik/kuantitatif yang bersifat variatif dan mengandung ketidak pastian.
♣
Sebagai fakta atau gambaran: Statistik adalah data numerik parameparameter--parameter tertentu. Misal Statistik kependudukan, parameternya ter dapat berupa: jumlah penduduk per desa (kecamatan, kabupaten), umur jenis kelamin, status perkawinan, pendapatan perorangan, dsb.
♣
Statistik kemudian juga dapat dianggap sebagai satu seni, yaitu seni mengambil bil keputusan k t s berdasarkan b d s k ketidak k tid k pastian. sti Di sinilah si il h letak l t k keunggulan statistik yang dapat dipergunakan untuk mengambil kepukeputusan berdasarkan informasi yang tidak lengkap.
Arti statistik ♣
Dalam perkembangannya telah dikenal 2 macam statistik, yaitu statistik deskriptif (descriptive statistics) dan statistik inferensial (inferential statistics).
♣
2 Statistik deskriptif p adalah statistik yang y g berhubungan g dengan g parameter p yang dapat diturunkan dari data statistik misal: probability (kebolehjadian /peluang), mean (nilai rerata), median (nilai tengah), mode, deviasi, range, variance,, covariance,, semivariance,, dsb serta penampilannya p p y dalam bentuk diagram2 khusus, misalnya: histogram (berkaitan dg distribusi frekuensi), bargraph, lineline-graph, variogram, dsb. Statistik deskriptif ini banyak sekali dipakai p di dalam Geostatistik.
♣
Statistik inferensial adalah statistik yang digunakan untuk mengambil keputusan berdasarkan fakata fakata--fakta yang terbatas, misal di bidang pemasaran untuk mengetahui apakah yang dilakukan cukup efektif atau tidak, tidak di bidang farmasi obat baru lebih baik dari pada yang lama, dsb. Statistik inferial mulai banyak dipakai di bidangbidang-bidang geologi/geofisika (geostatistik) psikologi, (geostatistik), psikologi sosiologi, sosiologi meteorologi (prediksi cuaca) cuaca), dsb. dsb
GEOSTATISTIK Pengertian geostatistik ng r n g ♣ Geostatistik tidaklah sekedar menggunakan statistik untuk untuk menangani data geologi/geofisika, karena metode statistik yang umum tidak menampung masalahmasalah-masalah variasi spasial yang banyak dijumpai dalam geologi dan geofisika. ♣ Isacks dan Srivastava (1989): geostatistik adalah statistik ditambah d dengan iinformasi f i spasial. i l Deutsch dan Journel (1992): geostatistik adalah statistik untuk g data yang y g berfluktuasi dalam ruang g maupun p waktu. menangani Datta dan Gupta (dlm Yuwono, 2003): geostatistik adalah statistik yang diterapkan pada geodata yang menerus dalam ruang maupun waktu. ♣ Krige Krige, RG, RG seorang ahli geomatematik Perancis memperkenalkan suatu cara statistik untuk menangani variable teregionalisasi. Cara khusus ini kemudian dinamakan “Kriging” ♣ Setelah S t l hk kriging i i muncull k konsep-konsep konsepk geostatistik t ti tik b baru yang llebih bih canggih, seperti Simulated Annealing, Sequential Gaussian Simulation, Bayesian Simulation, dan sebagainya.
HA L
Variabel teregionalisasi ♣ Menurut Deutsch (2002), Variabel teregionalisasi (regionalized variable) adalah variable yang dapat mempunyai nilai yang berbeda (bervariasi / berfluktuasi) dengan berubahnya lokasi / tempat, misalnya lithofasies, porositas, permeabilitas, dsb. porositas permeabilitas dsb ♣ Menurut Matheron (1963), Variabel teregionalisasi adalah suatu fungsi numerik dalam ruang yang berubah dari satu tempat ketempat yang lain dengan kontinuitas semu semu, yang variasinya tidak dapat dinyatakan dengan fungsi--fungsi matematik biasa (variasinya sukar ditebak, tapi kalau dikatafungsi dikatakan random atau acak juga tidak), sehingga variable ini menampilkan f fenomena dan d watak t k yang khusus. kh ♣ Variabel teregionalisasi berbeda dengan variabel random, karena variable ini mempunyai karakter deterministik pada kontinuitas spasialnya. Sebagai contoh: topografi permukaan tanah, ukuran bijih mineral, porositas, permepermeabilitas, dsb. p p polanya y tidak betul betul--betul random/acak,, variable terigionalisasi g ♣ Walaupun Z(x) tetap direalisasikan sebagai fungsi random, tetapi dengan anggapan tetap mengikuti derajad kestasioneran tertentu (yang umumnya lemah).
Variabel random stasioner
Tidak ada trend
Variabel random non stasioner
Ada trend
♣ Variabel / Fungsi random dikatakan stasioner bila; 1. Fungsi densitas kebolehjadian (Probability Density Fuction, PDF) nya pada sembarang titik invariant terhadap pergeseran serempak titik2 yang ada. ada 2. Kovarian antara 2 titik x1 dan x2 tidak tergantung pada x1 dan x2 , tetapi pada vektor x1− x2 ♣ Hipotesa Hi t intrinsik i t i ik untuk t kf fungsii random d Z Z: 1. Untuk suatu vektor h, maka Z(x + h) − Z(x) mempunyai nilai harapan (ekspektasi) = 0. 2. Untuk vektor h tersebut, nilai varians-nya tidak bergantung pada titik x. Catatan: Kebolehjadian (probability) = peluang (lebih umum dipakai)
Untuk menangani variabel teregionalisasi, diperlukan pengetahuan awal tentang: Fungsi densitas peluang (Probability Density Function, PDF). Fungsi densitas komulatif (Comulative Density Function, CDF), yaitu suatu fungsi yang diturunkan dari PDF. PDF Varians, Semivarians, dan Covarians Variabel-variabel y Variabelyang g ada pada p statistik deskritif seperti: p peluang, p g mean, median, mode, deviasi, range, dsb. Catatan Dalam ilmu kebumian, CDF dan PDF mempunyai arti penting untuk keperluan: 1. Pemodelan (modeling), misal model perubahan lithologi pada reservoir 2. Perkiraan (estimasi), misal perkiraan tentang nilai parameter porositas pada suatu reservoir. 3. 3 Diagnosa Diagnosa, parameter reservoir dapat diuji CDF/PDF nya dengan CDF/PDF teoritis atau referensi.
II POPULASI, SAMPEL, PARAMETER, DATA ♣ Populasi adalah himpunan keseluruhan obyek yang diselidiki diselidiki, misalnya “mahasiswa FMIPA FMIPA--UGM”. ♣ Sampel adalah himpunan bagian dari populasi, misalnya: “mahasiswa Program Studi Geofisika, Geofisika FMIPA FMIPA--UGM UGM” ♣ Parameter adalah karakter atau konstanta dari suatu populasi atau sampel, misalnya: lama studi, indeks prestasi, nilai ujian UMPTN mahasiswa program studi Geofisika, Geofisika FMIPAFMIPA-UGM ♣ Data adalah informasi yang dikumpulkan untuk statistik, misalnya: nama, umur, alamat, gol darah, dsb MHS PS Geofisika FMIPA FMIPA--UGM ♣ Statistik adalah suatu harga yang dihitung dari suatu parameter, parameter misalnya “statistik lama studi (rerata dari tahun ke tahun) mahasiswa program studi Geofisika FMIPAFMIPA-UGM” C t h lain Contoh l i ♣ Populasi: Gempabumi di Indonesia ♣ Sampel: 1. Gempabumi di Jawa, 2. Gempabumi di Banda. Gempa di Jawa dan Banda mempunyai karakter yang sedikit berbeda
♣ Parameter: Waktu kejadian, posisi, kedalaman, kekuatan gempa, dsb
Sampel S l hendaknya h d k di ilih yang representatif t tif ((mewakili) kili) agar Sampel dipilih statistik yang dihitung darinya memberikan gambaran yang benar dari populasinya. populasinya Karena sering dijumpai keadaan yang berbeda dalam suatu p p g p yang y g berbeda pula p populasi, maka harus digunakan sampel jenisnya. Untuk populasi yang tidak terlalu heterogen, sampel random ( b d l d d satu sama llain)) adalah d l h (observasi dalam sampell independen yang paling representatif. Sampel random adalah sampel yang pengambilannya sedemikian sehingga setiap elemen populasinya mempunyai yang kemungkinan g y g sama untuk terambil.
Cara pengambilan sampel Prosedur pengambilan sampel adalah sangat penting dalam statistik karena hal ini akan menentukan apakah sampel yang diambil dapat memberikan gambaran yang tepat dari karakter populasi ybs. Jenis sampel yang biasa digunakan oleh peneliti statistik adalah: sampel random, sample sistematik, dan sampel kelompok (cluster sampel). ♣ Sampel random sederhana: sampel yang pengambilannya sedemikian, shg p elemen populasinya p p y mempunyai p y kemungkinan g yang y g sama untuk tertersetiap ambil (dengan bantuan tabel bilangan random). ♣ Sampel sistematis: sampel yang pemilihannya dilakukan secara sistemasistemasekali tis dari populasinya populasinya, misal memilih produk barang setiap 1 jam sekali, memilih mahasiswa yang NIM nya ganjil, dsb ♣ Sampel kelompok: sampling random sederhana dengan sampling unitnya berupa kumpulan Proses pemilihannya dilakukan b k l atau t kelompok k l k elemen. l P ilih dil k k secara random terhadap kelompokkelompok-kelompok tsb. Sebagai contoh: dalam penelitian memperkirakan pendapatan rumah tangga di suatu kota, k l k di i d b k l b bl k ((misalnya i l kelompoknya terdiri darii b beberapa keluarga yang di disebut blok RT), kemudian dipilih secara random blok (RT), baru kemudian dilakukan pendataan rumah tangga pada RT yang terpilih.
Data jenis yaitu data kualitatif dan kuantitatif. kuantitatif Data ada 2 jenis, ♣ Data kualitatif adalah data yang berbentuk bukan angka numerik, misalnya nama, gol darah, agama, pekerjaan, status perkawinan, dsb ♣ Data kuantitatif adalah data yang berbentuk angka nu merik misalnya umur, merik, umur pendapatan pendapatan, jumlah keluarga keluarga, dsb dsb. Data dapat p diukur secara langsung g g (misal ( gol g darah,, umur,, dsb) dan secara tidak langsung (misal status sosial ekonomi). Data yang tidak dapat diukur secara langsung harus dibuat sedemikian rupa sehingga secara operasional dapat diukur, dengan menguraikan data tsb dalam sejumlah data lain, misalnya i l status t t sosial i l ekonomi k id dapatt di digantikan tik d dengan pekerjaan, gaji, pajak, dsb.
Skala pengukuran ♣ Skala nominal (klasifikasi): mengelompokkan g p data/obyek, y misalnya y status pendidikan dikelompokkan menjadi sekolah dan tidak sekolah. Jenis kelamin dikelompokkan menjadi lelaki atau wanita, dsb. ♣ Skala ordinal (rangking): mengelompokkan data/obyek ke dalam kelas kelas-kelas yang memp urutan tertentu, misalnya lebih baik, lebih tinggi, dsb. Tingkat pendidikan dapat dikelompokkan menurut jenjangnya menjadi kelompok S3, S3 S2, S2 S1, S1 dsb. dsb Dalam hal ini jejang S3 lebih tinggi dari pada S2, jenjang S2 lebih tinggi dari pada S1, dst. ♣ Skala interval: yaitu skala pengukuran yang mengelompokkan data/ obyek k d l kedalam k kelas kelasl s-kelas k l s yang mempunyaii hubungan h b urutan t dan d perbeperbe b daan dalam jarak atau interval tertentu, misal nilai UMPTN dapat dikelompokkan menjadi kelompok nilai antara 100100-200, 200200-300, 300--400, 300 400 d dst. t ♣ Skala rasio: yaitu skala pengukuran yang mengelompokkan data/obyek ke dalam kelaskelas-kelas yang mempunyai hubungan urutan, dan berbeda dalam obyek antara yang satu dengan yang lain. Contoh skala rasio adalah skala untuk mengukur panjang, luas, berat, dsb.
Peluang atau Kebolehjadian (Probability) Peluang merupakan dasar logika proses pengambilan inferensi statistik t t t populasi l id li i d t sampel. l tentang suatu dengan analisis data Peluang menunjukkan seberapa besar kemungkinan yang dapat terjadi dari suatu peristiwa. KataKata fifty dapatt K t -kata: k t : mungkin ki ssekali, k li mungkin, ki tidak tid k mungkin, ki fiftyfift -fifty, fift dsb d dipakai untuk menunjukkan besarnya peluang tersebut. Secara eksak, peluang adalah nilai/angka yang menunjukkan seberapa besar kemungkinannya suatu peristiwa dapat terjadi. terjadi Nilai peluang berberkisar antara 0 dan 1 Contoh 1 Koin yang bergambar Kepala dan Ekor dilempar keatas lantai. Kalau koin tsb dilemparkan 2 kali, maka kemungkinannya akan dihasilkan gambar kepala 1 kali dan gambar ekor 1 kali. Ini berarti bahwa peluang untuk mendapatkan kepala dan ekor adalah sama, dan nilainya p1 = 0,5 (1 kali dalam 2 lemparan) Mungkin saja koin yang dilempar 2 kali akan mendapatkan kepala kemudian kepala atau mendapatkan ekor kemudian ekor. Dengan demikian peluang untuk menda menda--patkan gambar yang sama dalam 2 kali lemparan berturut berturut--turut adalah p2 = 0,25 (1 kali dalam 4 percobaan). p2 = p1 × p1 = 0,5 × 0,5 = 0,25
Contoh 2 Nilai ujian mahasiswa untuk mata kuliah g geostastistik adalah sebagai j g berikut: Nilai A: 5 mhs, B: 25 mhs, C: 15 mhs, D: 4 mhs, dan E: 1 mhs Jumlah mhs adalah: 5 + 25 + 15 + 4 + 1 = 50 ♦ peluang seorang mhs mendapatkan nilai A, pA = 5 / 50 = 0,1 ♦ peluang seorang mhs mendapatkan nilai B, pB = 25/50 = 0,5 ♦ peluang seorang mhs mendapatkan nilai C, pC = 15/50 = 0,3 ♦ peluang seorang mhs mendapatkan nilai D, pD = 4 / 50 = 0,08 ♦ peluang seorang mhs mendapatkan nilai E, E pE = 1 / 50 = 0,02 0 02 Di sini terlihat bahwa keboleh jadian seorang mhs akan memperoleh nilai tertentu tersebar atau terdistribusi secara tidak merata dan mengikuti pola tertentu. Kalau jumlah mhs nya cukup banyak, soal ujiannya cukup baik, mhs tidak turunan, maka polanya akan mengikuti pola distribusi normal, dengan peluang terbesar pada nilai C (distribusi frekuensi)