TINJAUAN PUSTAKA. (statistik) dinamakan galat baku statistik, yang dinotasikan dengan

TINJAUAN PUSTAKA

Penduga Titik dan Selang Kepercayaan Penduga bagi parameter populasi ada dua jenis, yaitu penduga titik dan penduga selang atau disebut sebagai selang kepercayaan. Penduga titik dari suatu parameter

adalah bilangan tunggal yang dapat dianggap sebagai nilai yang

paling dekat dengan

Penduga titik diperoleh dengan cara memilih statistik yang

sesuai dan menghitung nilai statistik tersebut dari data contoh yang diberikan. Statistik yang terpilih disebut sebagai penduga titik dari

(Devore 2004).

Statistik adalah suatu fungsi peubah acak tergantung pada

yang tidak

(Casella & Berger 2001). Standar deviasi dari suatu penduga

(statistik) dinamakan galat baku statistik, yang dinotasikan dengan (Johnson & Bhattacharyya 1992).

Jika galat baku dari statistik melibatkan

parameter yang tidak diketahui, maka nilai dari galat baku dapat diduga. Dengan mensubstitusikan nilai dugaan parameter ini ke

maka dihasilkan dugaan galat

baku statistik (Devore 2004). Galat baku dari statistik ini yang dijadikan sebagai dasar dalam menentukan selang kepercayaan. Selang kepercayaan merupakan penduga parameter yang berupa kisaran nilai. Sebuah selang kepercayaan dengan tingkat kepercayaan sebesar C bagi parameter adalah selang yang dihitung dari data contoh dengan suatu metode tertentu yang memiliki peluang sebesar C untuk menghasilkan selang yang mengandung nilai parameter sesungguhnya (Moore & McCabe 1998). Secara matematis, Casella & Berger (2001) mendefinisikan selang dugaan tertutup bagi parameter

yaitu selang tertutup yang ujung bawah dan ujung atasnya masing-

masing

dan anggota ruang sampel X. Jika

secara acak, maka . Jika

untuk

atau

adalah sampel yang terambil disebut selang dugaan acak bagi

adalah sampel acak, maka

selang penduga (acak) bagi

disebut

. Sedangkan, peluang dari selang penduga bagi untuk

mencakup

pencakupan” dituliskan sebagai berikut :

nilai

disebut

“peluang

4

Jika besarnya peluang pencakupan adalah kepercayaan

bagi

, maka selang ini disebut selang

. Misalnya, untuk

maka diperoleh

selang kepercayaan 95% bagi . Bentuk umum dari selang kepercayaan adalah (Moore & McCabe 1998) :

Dugaan titik adalah perkiraan untuk parameter yang tidak diketahui. Batas kesalahan (margin of error) menunjukkan seberapa akurat nilai dugaan tersebut dapat dipercaya, berdasarkan variasi dugaan yang diperoleh. Selanjutnya, Levy & Lemeshow (1999) memaknai selang kepercayaan 95% sebagai berikut : jika kita lakukan pengambilan sampel berukuran

dari

sebuah populasi yang sama berulangkali, dan untuk setiap sampel dilakukan perhitungan selang kepercayaan, maka 95% dari selang kepercayaan tersebut akan mencakup nilai parameter populasi yang sesungguhnya. Penentuan selang kepercayaan bagi parameter populasi dapat dilakukan dengan pembalikan statistik uji, menggunakan besaran pivot, pivoting fungsi sebaran kumulatif, dan metode bayes. Baik buruknya selang kepercayaan dugaan yang diperoleh dari berbagai metode tersebut, dapat dievaluasi dengan melihat dua aspek, yaitu lebar selang dan peluang pencakupan. Lebar selang didefinisikan sebagai selisih antara batas atas dan batas bawah selang kepercayaan (Casella & Berger 2001).

Data Sirkular Data sirkular merupakan salah satu jenis data berarah (directional data). Secara umum, data berarah dibagi menjadi dua, yaitu data berarah dua dimensi dan tiga dimensi. Untuk data berarah dua dimensi disebut data sirkular (circular data) dan untuk tiga dimensi disebut data bola (spherical data) (Jammalamadaka & SenGupta 2001). Banyak cara memperoleh data sirkular, namun yang utama, data sirkular diperoleh dari dua instrumen pengukuran yaitu kompas dan jam. Hasil pengukuran menggunakan kompas adalah data bersatuan arah (derajat/radian) sedangkan hasil pengukuran menggunakan jam adalah waktu (dalam hal ini bisa

5

berupa jam/hari/bulan/tahun) (Mardia & Jupp 2000). Contoh pengamatan yang diukur menggunakan kompas adalah arah angin dan arah migrasi binatang. Sedangkan, contoh pengamatan yang diukur menggunakan jam adalah waktu terjadinya kecelakaan lalu lintas. Pengamatan sirkular dapat dianggap sebagai titik pada lingkaran dengan satu unit jari-jari, atau satu unit vektor pada garis (Mardia & Jupp 2000). Representasi numerik dari data sirkular adalah sudut yang diukur berdasarkan pemilihan titik awal (starting point)

dan arah positif rotasinya yaitu searah atau

berlawanan arah dengan jarum jam. Pemilihan titik awal

ini bersifat sembarang

sehingga besarnya sudut untuk sebuah pengamatan bisa berbeda-beda. Meskipun titik awal

dan arah rotasinya bersifat sembarang, analisis statistika sirkular tetap

memberikan hasil yang sama. Namun, penentuan titik awal

yang bersifat

sembarang ini, membuat data sirkular tidak dapat dianalisis menggunakan prosedur analisis statistika untuk data linier karena akan memberikan kesimpulan yang tidak tepat (Jammalamadaka & SenGupta 2001). Khusus data sirkular bersatuan waktu, harus dikonversikan menjadi data sirkular bersatuan derajat arah. Misalkan, x adalah data hasil pengamatan bersatuan waktu dan

adalah nilai maksimumnya. Rumus konversi data sirkular

bersatuan waktu menjadi bersatuan derajat arah adalah :

Untuk menganalisis data sirkular ada dua fungsi trigonometri yang digunakan sebagai dasar, yaitu sinus dan cosinus. Kedua fungsi dasar trigonometri ini digunakan untuk membantu menentukan posisi suatu data dan untuk menyelaraskan dua sistem koordinat, yaitu sistem koordinat kartesius (X,Y) dengan titik pusat 0 dan sumbu tegak lurus X dan Y yang melalui pusat, dan sistem koordinat polar (r α) dengan r adalah jarak titik pusat ke keliling lingkaran dan α adalah sudutnya. Misal titik P dengan koordinat polar (r α). Maka koordinat kartesius titik P adalah :

, dan

. Hal ini

diilustrasikan pada Gambar 1. Pada statistika sirkular yang diperhatikan adalah arah, bukan besarnya vektor, sehingga untuk kemudahan diambil vektor-vektor ini menjadi vektor unit

6

yaitu vektor yang mempunyai panjang satu, atau r = 1. Setiap arah berhubungan dengan sebuah titik P dalam keliling suatu lingkaran. Kebalikannya, titik ini dalam suatu lingkaran dapat dinyatakan sebagai sudut. Jika titik P terletak dalam keliling lingkaran, perubahan koordinat polar dan koordinat kartesius adalah (1)

Gambar 1. Hubungan antara koordinat kartesius dan koordinat polar

Ukuran Pemusatan Data Sirkular (Preferred Direction) Ukuran pemusatan data sirkular yang dikaji dalam penelitian ini adalah arah rata-rata dan arah median. Penjelasannya adalah sebagai berikut. a. Arah rata-rata (mean direction) Perhitungan rata-rata yang tepat untuk data sirkular diperoleh dengan memperlakukan data sebagai vektor-vektor unit, kemudian arah rata-rata adalah arah dari vektor resultannya. Misalkan pengamatan sirkular dengan Misalkan dari

dan

adalah pengamatan-

sebagai vektor-vektor unit yang berkaitan.

adalah komponen-komponen kartesius dari

. Vektor resultan

didapatkan dari penjumlahan komponen-komponen vector

.

Dengan menggunakan persamaan (1), vektor resultan dari menjadi : (2) dan arah rata-rata sirkularnya (

dengan

dan

adalah

.

Untuk berbagai kemungkinan nilai C dan S, arah rata-rata akan bernilai : 1. 2.

jika , jika

7

3. 4.

jika jika

5. tidak terdefinisi, jika

.

(Fisher 1995; Jammalamadaka & SenGupta 2001; Mardia & Jupp 2000). b. Arah Median (Median Direction) Arah median contoh

diperkenalkan oleh Mardia pada tahun 1972 dan

dikenal dengan Mardia median. Untuk sekumpulan sudut atau titik data arah median didefinisikan sebagai sebuah sudut

,

(atau titik tengah dari dua sudut

yang berdekatan jika ukuran contohnya genap) yang memenuhi : (i) setengah dari titik-titik data terletak pada busur

dan (ii) mayoritas dari titik-titik data

tersebut lebih dekat ke

. (iii) Simpangan rata-rata sirkular

daripada

dari , yaitu adalah minimum (Mardia & Jupp 2000; Fisher 1995; Ratanaruamkarn 2009).

Ukuran Konsentrasi dan Penyebaran Ukuran konsentrasi data dapat dilihat dari panjang rata-rata resultan dan ukuran penyebaran data dapat dilihat dari ragam sirkular. Dari persamaan (2) dapat dihitung panjang dari vektor resultan, yaitu : ; dan panjang rata-rata resultan (mean resultant length), yaitu :

Jika data cenderung mengumpul disekitar rata-ratanya, maka

akan bernilai 1.

Namun, jika data cenderung menyebar di sekeliling lingkaran maka

bernilai 0.

Untuk keperluan deskriptif dan inferensia, penggunaan panjang rata-rata resultan lebih baik dari pada ukuran penyebaran data. Namun, untuk tujuan pembandingan dengan data pada garis, terkadang lebih baik menggunakan ragam sirkular sebagai ukuran penyebaran data (Mardia & Jupp 2000), yaitu :

8

Titik sudut dalam arah yang sama mengindikasikan pemusatan yang besar, nilai R dapat sebesar n. Sebaliknya data yang menyebar merata pada sekeliling lingkaran mengindikasikan tidak adanya pemusatan, R dapat mendekati nilai 0. Artinya, semakin besar ragam sirkular maka semakin besar pula sebaran data dan semakin kecil konsentrasi data terhadap arah rata-ratanya (Jammalamadaka & SenGupta 2001).

Sebaran von Mises dan Parameter Konsentrasi Sebaran von Mises diperkenalkan oleh von Mises pada Tahun 1918. Parameter pada sebaran ini adalah arah rata-rata ( ) dan parameter konsentrasi ( ). Fungsi kepekatan peluang dari sebaran von Mises adalah :

dengan

yang merupakan fungsi

Bessel orde nol. Parameter konsentrasi menunjukkan seberapa besar data menuju suatu arah tertentu. Parameter konsentrasi dilambangkan dengan . Pendugaan

pada

sebaran von Mises dilakukan menggunakan metode kemungkinan maksimum. Hasil dugaannya adalah (Fisher 1995) : untuk .

.

.

untuk untuk

Jika

berarti sebaran data mendekati sebaran seragam dan jika

berarti

sebaran data terkonsentrasi pada arah rata-ratanya.

Metode Bootstrap Bootstrap adalah prosedur statistika berbasis komputer menggunakan teknik pengambilan contoh ulang dengan pengembalian (resampling with replacement). Metode yang diperkenalkan oleh Efron (1979) ini merupakan salah

9

satu alternatif metode untuk menduga sebaran statistik, galat baku statistik, bias, selang kepercayaan, dan beberapa parameter lain selain rata-rata (Efron 1981; Efron & Tibsirani 1993). Efron memberikan dua pendekatan bootstrap, yaitu bootstrap non parametrik dan bootstrap parametrik. Berikut akan dijelaskan bagaimana konsep kedua pendekatan ini dan kapan pendekatan tersebut cocok digunakan. a. Bootstrap non parametrik Pada pendekatan bootstrap non parametrik, sebaran peluang populasi tidak diketahui. Metode ini bertujuan untuk memperoleh dugaan parameter dan sebaran populasi. Asumsikan

adalah contoh acak dari sebaran peluang

populasi F yang tidak diketahui dan

adalah parameter yang ingin diduga.

Prinsip pembangkitan contoh bootstrap adalah sebagai berikut. Ambil contoh berukuran n secara acak dengan pengembalian dari fungsi sebaran empiris adalah sebaran diskret yang menentukan peluang

.

untuk stiap pengamatan

,

untuk

. Lakukan sebanyak B kali. Untuk setiap contoh bootstrap

dihitung dugaan

, sehingga diperoleh gugus data

. Sebaran dari B

buah

dapat digunakan untuk menduga sebaran dari . Nilai rata rata dari B

buah

adalah penduga bootstrap. Pada umumnya, ukuran B antara 50–200 untuk

menduga galat baku , dan paling sedikit 500 untuk menduga selang kepercayaan (Efron & Tibsirani 1993). b. Bootstrap Parametrik Pada bootstrap parametrik, sebaran populasi data asli diketahui, tetapi sebaran statistiknya tidak diketahui (Otieno 2002). Pendekatan bootstrap parametrik membangkitan contoh bootstrap dengan sebaran parametrik (Amiri et al. 2008). Berikut adalah prosedur dari pendekatan ini. Misalkan adalah contoh dari pengamatan yang berasal dari populasi dengan fungsi sebaran

.

adalah parameter yang tidak diketahui. Dari data

tersebut, dihitung dugaan . Ambil contoh bootstrap,

, berukuran n dari sebaran

. Hitung penduga dari setiap contoh bootstrap, sebanyak B kali, sehingga diperoleh

. Ulangi proses ini

. Sebaran penarikan contoh dari

10

dapat didekati dengan frekuensi sebaran dari

. (Benton & Krishnamoorthy

2002). Efron (1993) memberikan ilustrasi bootstrap parametrik untuk menghitung galat baku dari koefisien korelasi. Bootstrap parametrik cenderung memberikan dugaan yang lebih halus mengenai sebaran dari data dengan ukuran contoh kecil dan untuk parameter yang hanya melibatkan sedikit nilai numerik dari data contoh, misalnya median, nilai minimum, dan nilai maksimum (Otieno 2002).

Selang Kepercayaan Boostrap untuk Data Sirkular Metode pendugaan selang kepercayaan bootstrap untuk data sirkular pertama kali diusulkan oleh Ducharme (1985) menggunakan metode busur simetri (syimmetric arc). Kemudian, Fisher & Hall (1989) mengembangkannya menjadi tiga metode, yaitu metode busur ekor sama (equal-tailed arc), metode busur simetri (syimmetric arc) dan metode busur berbasis kemungkinan (likelihood based arc). a. Busur Ekor Sama (Equal-Tailed Arc) Metode busur ekor sama menggunakan dugaan titik dari ukuran pemusatan (Preferred Direction, PD) sebagai pengamatan tengah. Titik ujung selang kepercayaan didefinisikan sebagai lokasi dimana

dari nilai bootstrap

terletak antara ujung selang dan PD. Ilustrasi mengenai metode ini dapat dilihat pada Gambar 2a. Metode ini cukup baik untuk mengatasi sebaran miring. Fisher (1995) menyebut metode ini sebagai metode dasar. Prosedur penentuan selang kepercayaan

100% bagi ukuran pemusatan populasi adalah menghitung

perbedaan antara ukuran pemusatan dari data asli dan ukuran pemusatan dari contoh bootstrap ke-b, yaitu :

adalah ukuran pemusatan contoh bootstrap ke-b. Kemudian, nilai-nilai diurutkan dari yang terkecil hingga terbesar. Misalkan, terbesar yang lebih kecil atau sama dengan kepercayaan

adalah bilangan bulat dan

. Selang

100% bagi ukuran pemusatan populasi adalah

11

, dengan adalah nilai

adalah nilai

pada posisi ke-

dan

pada posisi ke- .

b. Metode Busur Simetri (Symmetric-Arc Method) Metode busur simetri menggunakan dugaan titik dari ukuran pemusatan sebagai titik tengah interval dan memilih sudut D*, sedemikian rupa sehingga dari nilai-nilai

terletak dalam selang. Besar D* di atas dan bawah

dugaan titik adalah sama. Ilustrasi untuk metode ini dapat dilihat pada Gambar 2b. Metode ini dirancang untuk menduga selang dengan asumsi sebaran simetri. Fisher (1995) menyebut metode ini sebagai metode sebaran simetris. Prosedur penentuan selang kepercayaan

100% bagi ukuran pemusatan populasi

adalah menghitung perbedaan mutlak antara ukuran pemusatan data asli dan contoh bootstrap ke-b, yaitu : , b = 1, .., B Kemudian, nilai-nilai

diurutkan dari yang terkecil hingga terbesar. Misalkan

adalah bilangan bulat yang lebih kecil atau sama dengan Selang kepercayaan

100% untuk

dan

.

ukuran pemusatan populasi adalah

. c. Busur Berbasis Kemungkinan (Likelihood Based Arc) Metode busur berbasis kemungkinan adalah metode yang paling fleksibel. Melalui metode ini, dimungkinkan untuk menemukan selang sempit yang memenuhi persyaratan dari selang kepercayaan dengan memilih busur terpendek yang mengandung

100%. Caranya adalah dari nilai-nilai

.

D** adalah lebar selang kepercayaan. Gambaran mengenai metode ini diilustrasikan pada Gambar 2c.

(a)

(b)

(c)

Gambar 2. Selang kepercayaan busur ekor sama, busur simetri, dan busur berbasis kemungkinan

TINJAUAN PUSTAKA. (statistik) dinamakan galat baku statistik, yang dinotasikan dengan

Recommend Documents