TINJAUAN PUSTAKA
Penduga Titik dan Selang Kepercayaan Penduga bagi parameter populasi ada dua jenis, yaitu penduga titik dan penduga selang atau disebut sebagai selang kepercayaan. Penduga titik dari suatu parameter
adalah bilangan tunggal yang dapat dianggap sebagai nilai yang
paling dekat dengan
Penduga titik diperoleh dengan cara memilih statistik yang
sesuai dan menghitung nilai statistik tersebut dari data contoh yang diberikan. Statistik yang terpilih disebut sebagai penduga titik dari
(Devore 2004).
Statistik adalah suatu fungsi peubah acak tergantung pada
yang tidak
(Casella & Berger 2001). Standar deviasi dari suatu penduga
(statistik) dinamakan galat baku statistik, yang dinotasikan dengan (Johnson & Bhattacharyya 1992).
Jika galat baku dari statistik melibatkan
parameter yang tidak diketahui, maka nilai dari galat baku dapat diduga. Dengan mensubstitusikan nilai dugaan parameter ini ke
maka dihasilkan dugaan galat
baku statistik (Devore 2004). Galat baku dari statistik ini yang dijadikan sebagai dasar dalam menentukan selang kepercayaan. Selang kepercayaan merupakan penduga parameter yang berupa kisaran nilai. Sebuah selang kepercayaan dengan tingkat kepercayaan sebesar C bagi parameter adalah selang yang dihitung dari data contoh dengan suatu metode tertentu yang memiliki peluang sebesar C untuk menghasilkan selang yang mengandung nilai parameter sesungguhnya (Moore & McCabe 1998). Secara matematis, Casella & Berger (2001) mendefinisikan selang dugaan tertutup bagi parameter
yaitu selang tertutup yang ujung bawah dan ujung atasnya masing-
masing
dan anggota ruang sampel X. Jika
secara acak, maka . Jika
untuk
atau
adalah sampel yang terambil disebut selang dugaan acak bagi
adalah sampel acak, maka
selang penduga (acak) bagi
disebut
. Sedangkan, peluang dari selang penduga bagi untuk
mencakup
pencakupan” dituliskan sebagai berikut :
nilai
disebut
“peluang
4
Jika besarnya peluang pencakupan adalah kepercayaan
bagi
, maka selang ini disebut selang
. Misalnya, untuk
maka diperoleh
selang kepercayaan 95% bagi . Bentuk umum dari selang kepercayaan adalah (Moore & McCabe 1998) :
Dugaan titik adalah perkiraan untuk parameter yang tidak diketahui. Batas kesalahan (margin of error) menunjukkan seberapa akurat nilai dugaan tersebut dapat dipercaya, berdasarkan variasi dugaan yang diperoleh. Selanjutnya, Levy & Lemeshow (1999) memaknai selang kepercayaan 95% sebagai berikut : jika kita lakukan pengambilan sampel berukuran
dari
sebuah populasi yang sama berulangkali, dan untuk setiap sampel dilakukan perhitungan selang kepercayaan, maka 95% dari selang kepercayaan tersebut akan mencakup nilai parameter populasi yang sesungguhnya. Penentuan selang kepercayaan bagi parameter populasi dapat dilakukan dengan pembalikan statistik uji, menggunakan besaran pivot, pivoting fungsi sebaran kumulatif, dan metode bayes. Baik buruknya selang kepercayaan dugaan yang diperoleh dari berbagai metode tersebut, dapat dievaluasi dengan melihat dua aspek, yaitu lebar selang dan peluang pencakupan. Lebar selang didefinisikan sebagai selisih antara batas atas dan batas bawah selang kepercayaan (Casella & Berger 2001).
Data Sirkular Data sirkular merupakan salah satu jenis data berarah (directional data). Secara umum, data berarah dibagi menjadi dua, yaitu data berarah dua dimensi dan tiga dimensi. Untuk data berarah dua dimensi disebut data sirkular (circular data) dan untuk tiga dimensi disebut data bola (spherical data) (Jammalamadaka & SenGupta 2001). Banyak cara memperoleh data sirkular, namun yang utama, data sirkular diperoleh dari dua instrumen pengukuran yaitu kompas dan jam. Hasil pengukuran menggunakan kompas adalah data bersatuan arah (derajat/radian) sedangkan hasil pengukuran menggunakan jam adalah waktu (dalam hal ini bisa
5
berupa jam/hari/bulan/tahun) (Mardia & Jupp 2000). Contoh pengamatan yang diukur menggunakan kompas adalah arah angin dan arah migrasi binatang. Sedangkan, contoh pengamatan yang diukur menggunakan jam adalah waktu terjadinya kecelakaan lalu lintas. Pengamatan sirkular dapat dianggap sebagai titik pada lingkaran dengan satu unit jari-jari, atau satu unit vektor pada garis (Mardia & Jupp 2000). Representasi numerik dari data sirkular adalah sudut yang diukur berdasarkan pemilihan titik awal (starting point)
dan arah positif rotasinya yaitu searah atau
berlawanan arah dengan jarum jam. Pemilihan titik awal
ini bersifat sembarang
sehingga besarnya sudut untuk sebuah pengamatan bisa berbeda-beda. Meskipun titik awal
dan arah rotasinya bersifat sembarang, analisis statistika sirkular tetap
memberikan hasil yang sama. Namun, penentuan titik awal
yang bersifat
sembarang ini, membuat data sirkular tidak dapat dianalisis menggunakan prosedur analisis statistika untuk data linier karena akan memberikan kesimpulan yang tidak tepat (Jammalamadaka & SenGupta 2001). Khusus data sirkular bersatuan waktu, harus dikonversikan menjadi data sirkular bersatuan derajat arah. Misalkan, x adalah data hasil pengamatan bersatuan waktu dan
adalah nilai maksimumnya. Rumus konversi data sirkular
bersatuan waktu menjadi bersatuan derajat arah adalah :
Untuk menganalisis data sirkular ada dua fungsi trigonometri yang digunakan sebagai dasar, yaitu sinus dan cosinus. Kedua fungsi dasar trigonometri ini digunakan untuk membantu menentukan posisi suatu data dan untuk menyelaraskan dua sistem koordinat, yaitu sistem koordinat kartesius (X,Y) dengan titik pusat 0 dan sumbu tegak lurus X dan Y yang melalui pusat, dan sistem koordinat polar (r α) dengan r adalah jarak titik pusat ke keliling lingkaran dan α adalah sudutnya. Misal titik P dengan koordinat polar (r α). Maka koordinat kartesius titik P adalah :
, dan
. Hal ini
diilustrasikan pada Gambar 1. Pada statistika sirkular yang diperhatikan adalah arah, bukan besarnya vektor, sehingga untuk kemudahan diambil vektor-vektor ini menjadi vektor unit
6
yaitu vektor yang mempunyai panjang satu, atau r = 1. Setiap arah berhubungan dengan sebuah titik P dalam keliling suatu lingkaran. Kebalikannya, titik ini dalam suatu lingkaran dapat dinyatakan sebagai sudut. Jika titik P terletak dalam keliling lingkaran, perubahan koordinat polar dan koordinat kartesius adalah (1)
Gambar 1. Hubungan antara koordinat kartesius dan koordinat polar
Ukuran Pemusatan Data Sirkular (Preferred Direction) Ukuran pemusatan data sirkular yang dikaji dalam penelitian ini adalah arah rata-rata dan arah median. Penjelasannya adalah sebagai berikut. a. Arah rata-rata (mean direction) Perhitungan rata-rata yang tepat untuk data sirkular diperoleh dengan memperlakukan data sebagai vektor-vektor unit, kemudian arah rata-rata adalah arah dari vektor resultannya. Misalkan pengamatan sirkular dengan Misalkan dari
dan
adalah pengamatan-
sebagai vektor-vektor unit yang berkaitan.
adalah komponen-komponen kartesius dari
. Vektor resultan
didapatkan dari penjumlahan komponen-komponen vector
.
Dengan menggunakan persamaan (1), vektor resultan dari menjadi : (2) dan arah rata-rata sirkularnya (
dengan
dan
adalah
.
Untuk berbagai kemungkinan nilai C dan S, arah rata-rata akan bernilai : 1. 2.
jika , jika
7
3. 4.
jika jika
5. tidak terdefinisi, jika
.
(Fisher 1995; Jammalamadaka & SenGupta 2001; Mardia & Jupp 2000). b. Arah Median (Median Direction) Arah median contoh
diperkenalkan oleh Mardia pada tahun 1972 dan
dikenal dengan Mardia median. Untuk sekumpulan sudut atau titik data arah median didefinisikan sebagai sebuah sudut
,
(atau titik tengah dari dua sudut
yang berdekatan jika ukuran contohnya genap) yang memenuhi : (i) setengah dari titik-titik data terletak pada busur
dan (ii) mayoritas dari titik-titik data
tersebut lebih dekat ke
. (iii) Simpangan rata-rata sirkular
daripada
dari , yaitu adalah minimum (Mardia & Jupp 2000; Fisher 1995; Ratanaruamkarn 2009).
Ukuran Konsentrasi dan Penyebaran Ukuran konsentrasi data dapat dilihat dari panjang rata-rata resultan dan ukuran penyebaran data dapat dilihat dari ragam sirkular. Dari persamaan (2) dapat dihitung panjang dari vektor resultan, yaitu : ; dan panjang rata-rata resultan (mean resultant length), yaitu :
Jika data cenderung mengumpul disekitar rata-ratanya, maka
akan bernilai 1.
Namun, jika data cenderung menyebar di sekeliling lingkaran maka
bernilai 0.
Untuk keperluan deskriptif dan inferensia, penggunaan panjang rata-rata resultan lebih baik dari pada ukuran penyebaran data. Namun, untuk tujuan pembandingan dengan data pada garis, terkadang lebih baik menggunakan ragam sirkular sebagai ukuran penyebaran data (Mardia & Jupp 2000), yaitu :
8
Titik sudut dalam arah yang sama mengindikasikan pemusatan yang besar, nilai R dapat sebesar n. Sebaliknya data yang menyebar merata pada sekeliling lingkaran mengindikasikan tidak adanya pemusatan, R dapat mendekati nilai 0. Artinya, semakin besar ragam sirkular maka semakin besar pula sebaran data dan semakin kecil konsentrasi data terhadap arah rata-ratanya (Jammalamadaka & SenGupta 2001).
Sebaran von Mises dan Parameter Konsentrasi Sebaran von Mises diperkenalkan oleh von Mises pada Tahun 1918. Parameter pada sebaran ini adalah arah rata-rata ( ) dan parameter konsentrasi ( ). Fungsi kepekatan peluang dari sebaran von Mises adalah :
dengan
yang merupakan fungsi
Bessel orde nol. Parameter konsentrasi menunjukkan seberapa besar data menuju suatu arah tertentu. Parameter konsentrasi dilambangkan dengan . Pendugaan
pada
sebaran von Mises dilakukan menggunakan metode kemungkinan maksimum. Hasil dugaannya adalah (Fisher 1995) : untuk .
.
.
untuk untuk
Jika
berarti sebaran data mendekati sebaran seragam dan jika
berarti
sebaran data terkonsentrasi pada arah rata-ratanya.
Metode Bootstrap Bootstrap adalah prosedur statistika berbasis komputer menggunakan teknik pengambilan contoh ulang dengan pengembalian (resampling with replacement). Metode yang diperkenalkan oleh Efron (1979) ini merupakan salah
9
satu alternatif metode untuk menduga sebaran statistik, galat baku statistik, bias, selang kepercayaan, dan beberapa parameter lain selain rata-rata (Efron 1981; Efron & Tibsirani 1993). Efron memberikan dua pendekatan bootstrap, yaitu bootstrap non parametrik dan bootstrap parametrik. Berikut akan dijelaskan bagaimana konsep kedua pendekatan ini dan kapan pendekatan tersebut cocok digunakan. a. Bootstrap non parametrik Pada pendekatan bootstrap non parametrik, sebaran peluang populasi tidak diketahui. Metode ini bertujuan untuk memperoleh dugaan parameter dan sebaran populasi. Asumsikan
adalah contoh acak dari sebaran peluang
populasi F yang tidak diketahui dan
adalah parameter yang ingin diduga.
Prinsip pembangkitan contoh bootstrap adalah sebagai berikut. Ambil contoh berukuran n secara acak dengan pengembalian dari fungsi sebaran empiris adalah sebaran diskret yang menentukan peluang
.
untuk stiap pengamatan
,
untuk
. Lakukan sebanyak B kali. Untuk setiap contoh bootstrap
dihitung dugaan
, sehingga diperoleh gugus data
. Sebaran dari B
buah
dapat digunakan untuk menduga sebaran dari . Nilai rata rata dari B
buah
adalah penduga bootstrap. Pada umumnya, ukuran B antara 50–200 untuk
menduga galat baku , dan paling sedikit 500 untuk menduga selang kepercayaan (Efron & Tibsirani 1993). b. Bootstrap Parametrik Pada bootstrap parametrik, sebaran populasi data asli diketahui, tetapi sebaran statistiknya tidak diketahui (Otieno 2002). Pendekatan bootstrap parametrik membangkitan contoh bootstrap dengan sebaran parametrik (Amiri et al. 2008). Berikut adalah prosedur dari pendekatan ini. Misalkan adalah contoh dari pengamatan yang berasal dari populasi dengan fungsi sebaran
.
adalah parameter yang tidak diketahui. Dari data
tersebut, dihitung dugaan . Ambil contoh bootstrap,
, berukuran n dari sebaran
. Hitung penduga dari setiap contoh bootstrap, sebanyak B kali, sehingga diperoleh
. Ulangi proses ini
. Sebaran penarikan contoh dari
10
dapat didekati dengan frekuensi sebaran dari
. (Benton & Krishnamoorthy
2002). Efron (1993) memberikan ilustrasi bootstrap parametrik untuk menghitung galat baku dari koefisien korelasi. Bootstrap parametrik cenderung memberikan dugaan yang lebih halus mengenai sebaran dari data dengan ukuran contoh kecil dan untuk parameter yang hanya melibatkan sedikit nilai numerik dari data contoh, misalnya median, nilai minimum, dan nilai maksimum (Otieno 2002).
Selang Kepercayaan Boostrap untuk Data Sirkular Metode pendugaan selang kepercayaan bootstrap untuk data sirkular pertama kali diusulkan oleh Ducharme (1985) menggunakan metode busur simetri (syimmetric arc). Kemudian, Fisher & Hall (1989) mengembangkannya menjadi tiga metode, yaitu metode busur ekor sama (equal-tailed arc), metode busur simetri (syimmetric arc) dan metode busur berbasis kemungkinan (likelihood based arc). a. Busur Ekor Sama (Equal-Tailed Arc) Metode busur ekor sama menggunakan dugaan titik dari ukuran pemusatan (Preferred Direction, PD) sebagai pengamatan tengah. Titik ujung selang kepercayaan didefinisikan sebagai lokasi dimana
dari nilai bootstrap
terletak antara ujung selang dan PD. Ilustrasi mengenai metode ini dapat dilihat pada Gambar 2a. Metode ini cukup baik untuk mengatasi sebaran miring. Fisher (1995) menyebut metode ini sebagai metode dasar. Prosedur penentuan selang kepercayaan
100% bagi ukuran pemusatan populasi adalah menghitung
perbedaan antara ukuran pemusatan dari data asli dan ukuran pemusatan dari contoh bootstrap ke-b, yaitu :
adalah ukuran pemusatan contoh bootstrap ke-b. Kemudian, nilai-nilai diurutkan dari yang terkecil hingga terbesar. Misalkan, terbesar yang lebih kecil atau sama dengan kepercayaan
adalah bilangan bulat dan
. Selang
100% bagi ukuran pemusatan populasi adalah
11
, dengan adalah nilai
adalah nilai
pada posisi ke-
dan
pada posisi ke- .
b. Metode Busur Simetri (Symmetric-Arc Method) Metode busur simetri menggunakan dugaan titik dari ukuran pemusatan sebagai titik tengah interval dan memilih sudut D*, sedemikian rupa sehingga dari nilai-nilai
terletak dalam selang. Besar D* di atas dan bawah
dugaan titik adalah sama. Ilustrasi untuk metode ini dapat dilihat pada Gambar 2b. Metode ini dirancang untuk menduga selang dengan asumsi sebaran simetri. Fisher (1995) menyebut metode ini sebagai metode sebaran simetris. Prosedur penentuan selang kepercayaan
100% bagi ukuran pemusatan populasi
adalah menghitung perbedaan mutlak antara ukuran pemusatan data asli dan contoh bootstrap ke-b, yaitu : , b = 1, .., B Kemudian, nilai-nilai
diurutkan dari yang terkecil hingga terbesar. Misalkan
adalah bilangan bulat yang lebih kecil atau sama dengan Selang kepercayaan
100% untuk
dan
.
ukuran pemusatan populasi adalah
. c. Busur Berbasis Kemungkinan (Likelihood Based Arc) Metode busur berbasis kemungkinan adalah metode yang paling fleksibel. Melalui metode ini, dimungkinkan untuk menemukan selang sempit yang memenuhi persyaratan dari selang kepercayaan dengan memilih busur terpendek yang mengandung
100%. Caranya adalah dari nilai-nilai
.
D** adalah lebar selang kepercayaan. Gambaran mengenai metode ini diilustrasikan pada Gambar 2c.
(a)
(b)
(c)
Gambar 2. Selang kepercayaan busur ekor sama, busur simetri, dan busur berbasis kemungkinan