BAB 1 PENDAHULUAN
1.1 Latar Belakang Inferensi adalah adalah suatu proses untuk menghasilkan informasi dari fakta yang diketahui. Inferensi juga dikatakan suatu konklusi logis atau implikasi berdasarkan informasi yang tersedia. Istilah inferensi digunakan untuk menunjukkan dari hal yang khusus menuju ke hal yang umum. (Sarwoko, 2002). Inferensi statistik merupakan salah satu bidang statistik yang berhubungan dengan analisis data sampai pada peramalan dan penarikan kesimpulan mengenai suatu populasi. Pada umumnya Inferensi Statisitik sepenuhnya menggunakan data yang diperoleh dari penelitian saat ini, akan tetapi dalam kasus penelitian yang jarang terjadi misalnya penyakit kanker, aids atau flu burung atau untuk kasus penelitian yang membutuhkan jangka waktu panjang seperti misalnya peluruhan radio aktif, inferensi dari data sampel saja tidak cukup karena akan membutuhkan waktu yang lama untuk dapat menganalisis kasus tersebut. Inferensi dalam kasus seperti di atas menggunakan metode klasik (frequentist) yang didasarkan sepenuhnya pada informasi yang diperoleh melalui sampel, ini dapat menghasilkan error yang besar karena data sampel yang diambil terlalu sedikit, akibatya nanti inferensi yang dihasilkan nantinya kurang baik. Untuk mendapatkan inferensi yang lebih baik akan lebih tepat jika data yang digunakan adalah data gabungan antara data sampel saat ini dengan data penelitian sebelumnya (data prior). Penggabungan data dilakukan dengan tujuan untuk meminimalkan tingkat kesalahan sehingga inferensi yang dihasilkan mendekati sempurna. Metode inferensi yang menggunakan data sampel dan data prior inilah yang disebut dengan metode Bayes. Tujuan dari inferensi statistik adalah untuk menarik kesimpulan dari data sampel yang diketahui tentang populasi yang tidak ada datanya. Sebagai contoh, dari 55 persen sampel cenderung untuk memilih pilihan A, tapi sebenarnya berapa banyak pemilih secara keseluruhan yang cenderung memilih A? 1 Universitas Sumatera Utara
2 Saat ini, terdapat dua pendekatan filosofis utama dalam statistik inferens, yang pertama disebut sebagai pendekatan frequentist atau kadang-kadang disebut sebagai pendekatan klasik (karena berkembang lebih dulu). Dalam pendekatan ini, prosedur dikembangkan hanya dengan melihat performa seluruh kemungkinan sampel acak (all possible random sample) saat ini. Informasi sampel acak yang diperoleh sebelumnya (pada percobaan/observasi lain di masa lalu) diabaikan. Kemudian pendekatan kedua, dikenal sebagai Bayesian, yang akan dibahas selanjutnya. Adapun Pendekatan frequentist berlandaskan pada ide-ide : 1. Parameter, yaitu karakteristik dari populasi, adalah konstan namun tidak diketahui. 2. Probabilitas selalu diinterpretasikan sebagai frekuensi relatif jangka panjang, tak peduli datanya. 3. Prosedur statistik dinilai dengan seberapa baik prosedur itu dalam jangka panjang dengan mengulang-ulang percobaan sampai tak hingga. Karena dalam pendekatan ini parameter adalah tetap, maka tidak bisa membuat pernyataan tentang peluang dari nilai parameter tersebut (bagaimana dinyatakannya dalam peluang jika nilai parameter adalah tetap dengan kata lain pasti). Interval kepercayaan tidak memiliki arti peluang akan nilai parameter, namun hanya digunakan untuk uji hipotesis apakah nilai penduga parameter bisa diterima atau tidak. Sifat Optimal yang dimiliki Inferensi Relatif Surprise memiliki interpretasi langsung dalam hal meminimalkan kemungkinan nilai nilai palsu sebelumnya dan ini adalah cara yang tepat untuk menilai ulang sifat sampling prior sebelumnya. Daerah Relatif Surprise, probabilitas prior nilai nilai salah sebelumnya selalu dibatasi oleh probabilitas prior nilai nilai benar. Keduanya dalam satu himpunan, bersifat umum pada batas tertentu dan tidak bias. Misal diperoleh P (a < θ ≤ b) = 0.95, tidak bisa mengatakan peluang θ diantara [a, b] adalah 95 persen karena jika dikatakan demikian berarti θ adalah suatu
Universitas Sumatera Utara
3 nilai acak. Karena itu dalam frequentist interval itu selalu diartikan begini: dari 100 percobaan dengan random sampel iid maka 95 percobaan akan mendapatkan nilai penduga parameter θˆ berada pada interval [a, b]. Misalkan ada suatu data yang akan dianalisis dengan tepat oleh analisis Bayesian.Akan diamati data x dari model statistik {fθ : θ ∈ Θ} dimana fθ adalah suatu populasi yang mendukung nilai nilai µ dari sampel space X dan φ adalah populasi prior dari θ yang berkaitan dengan nilai dari Θ. Dari unsur unsur yang ada sini dapat di buat suatu distribusi untuk mengobservasi nilai x dari (θ, X) yaitu : (θ, X) = fθ (x)φ(θ) = ×µ Andaikan sebelumnya dianggap prior dari sampel space X adalah M (B) = EΠ (Pθ (B)) dan posterior dari θ adalah Π(A | x) maka banyaknya τ = Υ(θ) menjadi bagian T dan selanjutnya jika batasan posterior dan prior Υ berturut-turut adalah ΠΥ (. | x) dan ΠΥ maka dari hubungan ΠΥ (. | x) dan ΠΥ akan didapat nilai
T
dari
T. Bayesian adalah suatu pendekatan statistik yang berlandaskan pada ide-ide berikut: 1. Sejak orang tak pernah yakin akan nilai sebenarnya dari parameter, maka parameter dianggap sebagai suatu random variabel. 2. Aturan probabilitas digunakan secara langsung untuk melakukan inferens tentang parameter. 3. Pernyataan probabilitas tentang parameter diinterpretasikan sebagai derajat kepercayaan. Distribusi prior adalah subyektif. Setiap orang bisa memilih priornya sendiri, yang mengandung bobot relatif yang diberikannya pada parameter tersebut, yang mengukur bagaimana sejauh mana bisa diterima / dipercaya setiap parameter tersebut sebelum percobaan. 4. Setelah itu menyesuaikan kepercayaan/penerimaan kita pada parameter tersebut setelah memperoleh data dengan menggunakan teorema Bayes, sehingga
Universitas Sumatera Utara
4 akan menghasilkan distribusi posterior, yang memberikan bobot relatif tiap parameter setelah data dianalisis. Distribusi posterior diperoleh dari dua sumber, yaitu : distribusi prior dan data pengamatan. Dengan pendekatan Bayesian ini bisa membuat pernyataan probabilitas dari parameter karena memang parameter adalah random variabel. P (a < θ ≤ b) = 0.95 memang berarti peluang nilai parameter θ berada pada interval [a, b] dengan syarat data seperti pada data observasi adalah 95 persen. Hanya dengan teorema Bayes bisa secara konsisten memperbaiki kepercayaan pada parameter berdasarkan data yang benar-benar terjadi! Selain itu pendekatan Bayesian sangat bermanfaat dalam menangani parameter pengganggu (nuisance parameter). Parameter pengganggu adalah suatu parameter yang tidak tertarik untuk melakukan inferens atasnya, tapi tidak ingin parameter tersebut mempengaruhi inferens tentang parameter utama (tidak bahas dalam artikel ini). Teorema bayes adalah atau prinsip probabilitas bersyarat menyatakan bahwa setiap pernyataan probabilitas tentang θ yang tidak diketahui setelah mengamati x haruslah berdasarkan posterior Π(· | x). Akan tetapi unsur unsur pokok ini sendiri tidak menetapkan apakah daerah kredibel Bγ(x) ⊂ T pasti berasal dari τ = Υ(θ) karena dari sini biasanya banyak subset dari T yang mengandung γ sehingga dibutuhkan suatu ukuran untuk memilih diantaranya. Tampak jelas bahwa Teorema Bayes hanya mengatakan setiap pernyataan probabilitas yang dibuat tentang θ haruslah dihitung dengan menggunakan distribusi posterior. Sebagai contoh misalnya jika akan menyebutkan berapa banyak himpunan C ⊂ yang mempunyai probabilitas 0,95 mengandung τ yang sebenarnya maka Teorema Bayes tidak dapat menyatakan bagaimana untuk memperoleh himR punan C tetapi hanya dinyatakan C harus memenuhi C πΥ (τ |x0 ) vT (dτ ) = 0, 95. Dalam (Evans, 1997) dikatakan bahwa ada suatu pendekatan khusus untuk menaksir sebuah hipotesis H0 : τ = τ0 dengan menghitung Observed Relatif Surprise (ORS). Dikatakan bahwa Inferensi Relatif Suprise memiliki sifat optimal dalam Teorema Bayes.
Universitas Sumatera Utara
5 1.2
Rumusan Masalah Dari latar belakang yang telah diuraikan maka rumusan masalahnya adalah
bagaimana memperoleh inferensi relatif surprise sehingga Teorema Bayes menjadi optimal.
1.3 Tujuan Penelitian Adapun tujuan penelitian ini adalah diperolehnya Inferensi Relatif Surprise dengan Teorema Bayes yang optimal.
1.4
Manfaat Penelitian Hasil penelitian ini diharapkan dapat memberikan konstribusi bagi sejumlah
individual ataupun kelompok yang menggunakan Inferensi Relatif Surprise dalam pendekatan Bayes.
1.5 Metode Penelitian Metode Penelitian yang digunakan adalah tinjauan literatur dan tahapan penelitian yang dilakukan adalah menentukan latar belakang pemilihan judul, kemudian melakukan studi literatur, selanjutnya merumuskan masalah, tujuan dan manfaat penelitian, setelah itu membuat tinjauan pustaka dari Inferensi Relatif Surprise, kemudian menjelaskan tentang Inferensi Relatif Surprise, membahasnya dan terakhir membuat kesimpulan dan saran dari pembahasan yang sudah dilakukan.
Universitas Sumatera Utara