BAB II LANDASAN TEORI Bab ini terdiri dari dua bagian. Pada bagian pertama berisi tinjauan pustaka dari penelitian-penelitian sebelumnya dan beberapa teori penunjang berisi definisi-definisi yang digunakan dalam pembahasan. Pada bagian kedua berisi kerangka pemikiran yang menjelaskan alur pikir dalam pembuatan skripsi. 2.1 Tinjauan Pustaka Cochran [5] menjelaskan penduga rasio klasik untuk rata-rata populasi variabel penelitian pada pengambilan sampel acak sederhana. Penduga rasio klasik tersebut memanfaatkan korelasi positif antara variabel bantu dan variabel penelitian. Kadilar dan Cingi [8] menemukan penduga rasio yang lebih baik dibandingkan penduga rasio klasik, menggunakan koefisien kurtosis variabel bantu dan regresi. Penduga rasio tersebut adalah gabungan penduga rasio Ray dan Singh serta Singh dan Kakran. Penduga rasio Ray dan Singh merupakan penduga rasio menggunakan koefisien regresi, dengan memanfaatkan informasi variansi dan kovariansi sampel. Koefisien regresi diperoleh melalui metode kuadrat terkecil. Sedangkan penduga rasio Singh dan Kakran merupakan penduga rasio menggunakan koefisien kurtosis variabel bantu. Koefisien kurtosis merupakan ukuran keruncingan suatu distribusi. Kemudian Kadilar et al. [9] menemukan penduga rasio yang dapat mengurangi dampak negatif dari pencilan pada data, yaitu menggunakan regresi robust estimasi-M. Penduga rasio Kadilar et al. [9] lebih baik daripada penduga rasio Kadilar dan Cingi [8] jika terdapat korelasi positif antara variabel bantu ( ) dan variabel penelitian ( ) serta terdapat pencilan pada data, karena penduga rasio Kadilar et al. [9] memiliki rata-rata kuadrat sesatan terkecil. Selanjutnya diberikan beberapa teori yang melandasi penyelesaian rumusan masalah. Teori tersebut meliputi pengambilan sampel acak sederhana, nilai harapan matematis, variansi dan kovariansi, model regresi linier sederhana, koefisien korelasi, koefisien kurtosis, median absolute deviation (MAD), estimasiM, deret Taylor, rata-rata kuadrat sesatan, penduga rasio, outlier.
5
2.1.1
Pengambilan Sampel Acak Sederhana
Sampel adalah bagian populasi yang akan diteliti. Pengambilan sampel acak sederhana didefinisikan sebagai prosedur pemilihan sampel dimana setiap sampel mempunyai peluang yang sama untuk terpilih (Yamane [20]). Jika sampel acak yang sudah terpilih tidak dikembalikan, maka disebut pemilihan sampel acak tanpa pengembalian. Jika sampel acak yang terpilih dikembalikan, maka disebut pemilihan sampel acak sederhana dengan pengembalian. Menurut Cochran [5] pengambilan sampel acak sederhana adalah sebuah metode untuk memilih sampel dari
populasi sehingga setiap
sampel mempunyai kesempatan yang
sama untuk terpilih. Observasi dalam populasi diberi nomor 1 sampai
. Nomor-
nomor tersebut dipilih, dengan cara mencari nilai pada tabel bilangan acak atau dengan menempatkan nomor itu pada sebuah wadah dan mengundinya. Kelebihan dari pengambilan sampel acak sederhana adalah mudah dipelajari dan lebih efisien waktu, biaya serta tenaga. Pengambilan sampel acak sederhana dapat dilakukan dengan dua cara, yaitu mengundi dan menggunakan tabel bilangan acak. Pengambilan sampel dengan cara
mengundi
dilakukan
apabila
jumlah
populasi
sedikit.
Sedangkan
pengambilan sampel dengan tabel bilangan acak dilakukan apabila populasinya besar. Pada pengambilan sampel terdapat empat karakteristik dari populasi yang biasa dihitung, yaitu rata-rata populasi, total populasi, rasio dan proporsi. populasi dari variabel ditulis
ditulis
. Sedangkan n sampel dari variabel
. Rata-rata populasi variabel ̅
dirumuskan
∑
sedangkan rata-rata sampelnya dirumuskan ̅
∑
Ukuran sampel pada pengambilan sampel acak sederhana untuk penduga rasio menurut Yamane [20] adalah ⁄
6
(
)
dengan ̂ ̅ dengan
∑
̂
adalah ukuran populasi,
(
adalah ukuran sampel tanpa pengembalian,
adalah ukuran sampel dengan pengembalian,
adalah ukuran sampel awal,
adalah nilai ke- populasi variabel penelitian dan variabel penelitian, variansi dari
dan
)
. adalah nilai ke- sampel
adalah ketelitian, dan ̂
adalah reliabilitas,
adalah
adalah rasio sampel.
2.1.2
Nilai Harapan Matematis
Nilai harapan adalah rata-rata dari variabel acak (Johnson dan Bhattacaryya [7]). Dimisalkan
adalah variabel acak, maka rata-rata dari
harapan dan dinotasikan dengan ( ). Jika dan probabilitas
adalah ( )
, ∑
dengan n adalah banyaknya nilai ,
2.1.3
mempunyai nilai
-, maka
( )
( ) adalah probabilitas terjadinya
disebut nilai
( )
adalah nilai ke- dari variabel acak
dan
.
Variansi dan Kovariansi
Yamane [20] menyatakan variansi ̅ , variansi ̅ dan kovariansi antara ̅ dan ̅ pada pengambilan sampel acak sederhana tanpa pengembalian dirumuskan
dengan
̅
(
)
̅
(
)
̅̅
(
)
adalah fraksi pengambilan sampel,
adalah banyaknya populasi,
adalah banyaknya sampel,
adalah variansi populasi variabel
7
,
adalah
variansi populasi variabel
dan
adalah kovariansi populasi antara variabel
dan . 2.1.4
Model Regresi Linier Sederhana
Menurut Sembiring [13] model regresi linier yang paling sederhana adalah garis lurus. Garis lurus pada diagram pencar disebut garis regresi atau garis perkiraan. Model regresi linier sederhana untuk populasi dapat dirumuskan sebagai berikut
dan
adalah parameter dan
(
). Nilai
dan
adalah kesalahan acak yang diasumsikan
merupakan parameter yang nilainya tidak diketahui
dan harus diduga. Penduga dari
dan
adalah
dan , sehingga penduga model
regresi linier sederhananya adalah ̂ Salah satu metode yang dapat digunakan untuk menduga parameter regresi adalah metode kuadrat terkecil. Metode kuadrat terkecil adalah metode untuk menghitung
dan
sebagai penduga
dan , sedemikian rupa sehingga jumlah
kuadrat sesatan memiliki nilai terkecil (Supranto [17]). Jumlah kuadrat sesatan ( ) ini dinamakan fungsi kuadrat terkecil dan dirumuskan dengan ∑ Penduga ∑
dan terhadap
menurunkan ∑
∑(
̂)
)
∑(
diperoleh dengan cara meminimumkan fungsi kuadrat terkecil dan
. Langkah pertama yang harus dilakukan adalah
terhadap
dan menyamakannya dengan nol, sehingga
diperoleh ∑
)
∑(
)
∑(
∑
∑
∑
8
∑
∑
∑
∑
∑
∑
∑
∑
̅ Langkah selanjutnya menurunkan ∑
̅
terhadap
dan menyamakannya
dengan nol, sehingga diperoleh ∑
)
∑( )
∑(
∑
∑
∑
∑
(∑
∑
∑
∑
(̅
∑
̅∑
̅∑
∑
∑
̅∑
(∑
̅∑
∑
̅∑
̅∑
)
∑ (∑
9
̅) ∑
̅∑ ̅∑
∑
)
)
∑
∑ .∑ ∑
∑
∑
∑
∑
/
/
∑ ∑
2.1.5
∑
∑
.∑
∑ ∑
∑
̅
∑ ̅)
( ̅)
(
̅)
(
Koefisien Korelasi
Interpretasi koefisien korelasi menurut Supranto [17] adalah nilai untuk mengukur kuatnya hubungan antara dua variabel. Pada analisis regresi, koefisien korelasi digunakan untuk mengukur ketepatan garis regresi sebagai pendekatan data hasil observasi. Koefisien korelasi dinotasikan dengan korelasi berkisar pada interval
. Nilai koefisien
. Apabila nilai koefisien korelasi
positif, maka hubungan antar variabel juga positif atau searah. Namun apabila nilai koefisien korelasi negatif, maka hubungan antar variabel juga negatif atau berlainan arah. Apabila nilai koefisien korelasi nol, maka hubungan antar variabel sangat lemah dan dianggap tidak ada. Rumus untuk koefisien korelasi yaitu ∑ √ ∑ dengan
∑ (∑
) √ ∑
∑ (∑
)
adalah ukuran populasi.
2.1.6
Koefisien Kurtosis
Koefisien kurtosis adalah ukuran keruncingan atau kepuncakan suatu distribusi (Supranto [17]). Distribusi yang mempunyai puncak relatif tinggi dinamakan leptokurtik. Distribusi yang mempunyai puncak mendatar dinamakan
10
platikurtik. Sedangkan sebuah distribusi normal yang puncaknya tidak terlalu tinggi ataupun tidak mendatar dinamakan mesokurtik. Menurut Subramani [15], koefisien kurtosis dinotasikan dengan
( ) dan
dirumuskan sebagai berikut ( ) dengan
)∑
( (
)(
( (
)
) )(
)
adalah observasi ke-i populasi variabel , ̅
adalah ukuran populasi,
adalah rata-rata populasi variabel
2.1.7
̅)
( )(
dan
adalah simpangan baku.
Median Absolute Deviation (MAD)
Sampel acak yang berasal dari populasi berdistribusi tertentu dimisalkan sebagai
( ) didefinisikan
, maka ( )
(
)
*| dengan
( )|+
(median) adalah ukuran pemusatan data yang robust terhadap
pengaruh outlier. Jika
( )
simetris maka
( )
, sehingga
*|
|+ dan
berlaku persamaan *| Karena | |
|
( )+
(
, maka persamaan (
sama dengan
menjadi * , ,
( )
( )+
( )
( ) ( )
( )
,
( )
-
-
-
( )
11
)
) berubah
Jadi, penduga standar deviasi yang robust terhadap outlier adalah ( )
̂
2.1.8
(
)
Estimasi-M
Pada tahun 1973 Huber memperkenalkan metode estimasi-M. M pada estimasi-M adalah maximum likelihood. Jadi metode estimasi-M merupakan perluasan dari maximum likelihood estimation (MLE). Menurut Chen [4] metode estimasi-M dipilih karena metode ini robust terhadap outlier. Sesatan persamaan regresi diasumsikan saling independen, ( ). Penduga maximum likelihood dari ( ∏
)
(
adalah
( ) dengan
)
yang
memaksimalkan
. Perkalian fungsi sesatan diubah menjadi
penjumlahan logaritma fungsi sesatan agar perhitungan menjadi lebih sederhana. Memaksimalkan ∏
( ) sama dengan memaksimalkan ∑ maka memaksimalkan ∑
Misal fungsi dengan meminimalkan ∑
( )
( ) ( ) sama
Fungsi dari sesatan diduga
dengan ( ) adalah dengan cara meminimalkan ∑
Untuk memperoleh penduga
( )
yang dirumuskan sebagai ∑ ( )
∑ (
Nilai ̂ terdapat pada persamaan (
) . Turunan parsial dari
disamakan dengan nol untuk meminimalkan ∑ ∑ Penduga
Turunan parsial dari (
.
̂
( terhadap
̂
/
dimisalkan sebagai
12
(
)
(
)
)
)
) dapat dituliskan
terhadap
( ), sehingga
merupakan penyelesaian persamaan ( ∑
)
̂
, maka persamaan
∑
(
)
̂
(
Pada umumnya penyelesaian eksak dari persamaan (
)
) sulit untuk diperoleh.
Oleh karena itu dibutuhkan penyelesaian numerik. Beaton dan Tukey (Draper dan Smith [6]) memberikan penyelesaian dengan mendefinisikan fungsi pembobot .
/
̂
(
)
(
)
̂
Berdasarkan fungsi pembobot ( ∑
(
∑ Persamaan (
), persamaan (
) dapat dituliskan
)
̂ (
)
∑
) jika dituliskan dalam notasi matriks menjadi .
Penyelesaian iteratif untuk (
Iterasi berhenti jika
dirumuskan
)
(
(
)
( ) ( )
( )
)
cukup kecil, misalnya
terkecil (MKT) digunakan untuk memperoleh nilai
( )
yang diduga. Fungsi objektif ( ) dan fungsi pembobot
. Metode kuadrat dari koefisien regresi pada tiap interval
didefinisikan oleh Huber seperti pada Tabel 2.1. Tabel 2.1. Fungsi objektif dan pembobot ( )
Interval
⁄ ⁄| |
| |
atau
Menurut Draper dan Smith [6] langkah-langkah yang dilakukan untuk menduga parameter menggunakan regresi robust estimasi-M adalah 1. menghitung
( )
dengan metode kuadrat terkecil,
2. menghitung nilai sesatan (ei), 13
3. menghitung median dari sesatan, 4. menghitung MAD = median |ei -median(ei)|, 5. menghitung nilai ̂ ̂,
6. menghitung nilai
7. melakukan pembobotan dengan rumus
atau ⁄| |
atau
8. menduga koefisien regresi robust dengan pemberian bobot 9. mengulangi tahap 2-8 sehingga diperoleh
2.1.9
( )
,
yang konvergen.
Deret Taylor
Deret Taylor adalah pendekatan yang paling umum digunakan untuk mengevaluasi fungsi. Hal ini karena deret Taylor memiliki tingkat keakuratan yang lebih tinggi dibandingkan dengan metode numerik yang lain (Mathews [10]). Menurut Atkinson [1] jika f adalah fungsi dari x dan terdapat titik sekitar x, maka pendekatan deret Taylor untuk satu variabel ( )
( )
(
)
(
( )
)
( )
di
dirumuskan dengan
(
)
( )
Sedangkan menurut Weisstein [19] pendekatan deret Taylor untuk dua variabel dinyatakan dengan (
)
(
)
(
* (
*
)
(
)
(
)
+
)
(
)
+
dengan pendekatan pada orde pertama deret Taylor dituliskan ( (
)
(
)
*
)
(
)
*
14
(
)
(
)
(
)
(
)
+ +
(
)
2.1.10 Rata-rata Kuadrat Sesatan Rata-rata kuadrat sesatan (RKS) dapat digunakan untuk membandingkan penduga bias dan tak bias, atau dua penduga yang mempunyai nilai bias berbeda. Jika memiliki rata-rata kuadrat sesatan yang lebih kecil. maka suatu penduga dikatakan lebih baik daripada penduga yang lain. Misalkan penduga parameter tertentu ( ), bias dengan variansi
adalah penduga tak bias dan
lebih kecil dari . Walaupun
adalah penduga bias, belum tentu Karena jika bias
kecil, maka
dan
adalah
adalah penduga
adalah penduga tak bias dan
adalah penduga yang lebih baik daripada .
adalah penduga yang lebih baik daripada . Jadi
penduga bias dapat lebih baik daripada penduga tak bias. Hal tersebut tergantung dari besarnya variansi dan bias (Yamane [20]). Misalkan ̂ merupakan penduga parameter , maka rata-rata kuadrat sesatan dirumuskan sebagai ( ̂) Maka rata-rata kuadrat sesatan untuk
̂]
[ dan
dapat dirumuskan dengan
( )
,
-
( )
,
-
dan
Variansi
dan
dirumuskan dengan , ( )
-
, ( )
-
dan
Jika
adalah penduga tak bias untuk , maka ( ) ( )
,
sehingga
-
, ( )
-
Sehingga rata-rata kuadrat sesatan penduga tak bias sama dengan variansinya. Jika adalah penduga bias untuk , maka ( ) ( )
,
-
,
( )
( )
15
-
sehingga
,*
( )+
* ( )
+-
* ( )
+
*
( )+
* ( )
+
*
( )+
* ( )
+*
( )+
Sehingga rata-rata kuadrat sesatan penduga bias sama dengan penjumlahan variansi dan kuadrat biasnya. Sesatan dari penduga rasio dapat dihitung menggunakan persamaan (
).
Rasio dan penduga rasio adalah perbandingan dari dua variabel yaitu ̅ dan ̅ serta ̅ dan ̅. Selisih dari rasio dengan penduganya merupakan sesatan penduga rasio. Sesatan penduga rasio dirumuskan ( ̅ ̅) dengan ( ̅ ̅ )
( ̅ ̅) ( ̅ ̅) (̅ ( ̅ ̅) ̅) ( ) ̅ ̅ adalah rasio populasi dan ( ̅ ̅) ̂ adalah penduga rasio ( ̅ ̅)
populasi.
2.1.11 Penduga Rasio Penduga rasio klasik untuk menduga rata-rata populasi dari variabel penelitian dirumuskan dengan ̅
̅ ̅ ̅
̂̅
(
)
dengan ̅ adalah penduga rasio klasik, ̅ adalah rata-rata sampel dari variabel penelitian, ̅ adalah rata-rata sampel dari variabel bantu, ̅ adalah rata-rata populasi dari variabel bantu dan ̂ Berdasarkan persamaan ( (̅ ) dengan
adalah jumlah sampel,
populasi, variabel ,
̅ ̅
adalah penduga rasio populasi.
), rata-rata kuadrat sesatan dari ̅ adalah (
)
adalah jumlah populasi,
adalah variansi populasi variabel
,
̅
adalah rasio
adalah variansi populasi
adalah kovariansi populasi antara variabel
16
̅
dan .
Ray dan Singh mengembangkan penduga rasio dengan menambahkan koefisien regresi pada penduga rasio klasik, sehingga diperoleh penduga rasio baru
dengan ̅
(̅ ̅
̅
̅
̅ )
̅
adalah modifikasi penduga rasio oleh Ray dan Singh,
adalah
koefisien regresi sampel. Singh dan Kakran memodifikasi penduga rasio menggunakan koefisien kurtosis variabel bantu ̅ dengan ̅
̅
̅
( ) ( )
̅
̅
̂
̅
(
( ), ̅
̅
̅
( ), ̂ ̅
Berdasarkan persamaan (
. Dari persamaan (
), ̅
̅
.
), rata-rata kuadrat sesatan dari ̅ ̅ ,
(̅ )
adalah koefisien korelasi antara variabel
adalah koefisien variasi dari variabel
dan
adalah
)-
(
( ̅ ) adalah rata-rata kuadrat sesatan dari ̅ ,
) ( )
adalah modifikasi penduga rasio oleh Singh dan Kakran,
adalah koefisien kurtosis dari variabel
dengan
̅
̅
,
̅ ̅
( )
dan variabel
dan ,
adalah koefisien variasi dari
variabel . Penduga rasio Kadilar dan Cingi [8] menggunakan koefisien kurtosis variabel bantu dan regresi yang merupakan gabungan penduga rasio Ray dan Singh serta Singh Kakran ̅ dengan ̅
(̅
̅ ̅
̅) ( )
,̅
( )-
̂
̅
adalah modifikasi penduga rasio oleh Kadilar dan Cingi,
koefisien regresi sampel,
adalah kovariansi sampel variabel
variansi sampel variabel , dan ̂
(̅
̅ ̅
17
̅) . ( )
dan ,
adalah
Penduga rasio untuk ̅ menggunakan koefisien kurtosis variabel bantu dan regresi robust yang ditemukan oleh Kadilar et al. [9] dirumuskan sebagai ̅ dengan ̅
̅ ̅
(̅ ̅) ,̅ ( )
̂
( )-
̅
adalah modifikasi penduga rasio oleh Kadilar et al.,
rasio tersebut, penggunaan
(̅
̅
penduga koefisien regresi robust estimasi-M dan ̂
̅
( )
adalah
̅)
. Pada penduga
dimaksudkan untuk mengurangi pengaruh pencilan
pada estimasi parameter regresi. Penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi robust lebih baik daripada penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi jika memenuhi kondisi tertentu. Untuk membuktikannya maka rata-rata kuadrat sesatan kedua penduga dibandingkan.
2.1.12 Outlier Outlier atau pencilan adalah suatu data yang jauh berbeda dibandingkan dengan keseluruhan data (Soemartini [14]). Adanya outlier menyebabkan estimasi koefisien regresi menjadi kurang tepat. Hal-hal yang diakibatkan karena adanya outlier adalah 1. sesatan dari model regresi menjadi besar, 2. variansi dari penduga koefisien regresi menjadi besar, 3. taksiran interval memiliki rentang lebar. Menurut Montgomery dan Peck [11], salah satu metode yang dapat digunakan untuk mengidentifikasi outlier yang berpengaruh terhadap koefisien regresi adalah DFFITS (Difference fitted values fits). Perhitungan DFFITS dirumuskan ̂ √ dengan
( )(
̂( ) )
adalah difference fitted values fits observasi ke-i,
()
adalah
variansi sampel dari sesatan jika observasi ke-i dikeluarkan dari penelitian dan
18
adalah leverage dari observasi ke-i. Pada model regresi linear
dirumuskan
sebagai (
̅)
dan ∑ dengan p adalah banyaknya parameter model regresi. Suatu observasi dikatakan outlier jika memenuhi kondisi |
|
√
2.2 Kerangka Pemikiran Penduga rasio memberikan hasil pendugaan yang lebih baik dari penduga yang lain dan meningkatkan ketelitian (Cochran [5]). Penduga rasio memanfaatkan korelasi antara variabel bantu ( ) dan variabel penelitian ( ). Jika variabel bantu berkorelasi positif dengan variabel penelitian, maka penduga rasio baik digunakan untuk menduga rata-rata populasi. Koefisien kurtosis dan regresi digunakan untuk meningkatkan ketelitian dari penduga rasio. Namun, adanya pencilan dalam data umumnya mengurangi ketelitian karena penduga rasio klasik sensitif terhadap nilai-nilai ekstrim (Chatterjee dan Price [3]). Oleh karena itu, digunakan regresi robust estimasi-M pada penduga rasio untuk mengurangi dampak negatif dari masalah pencilan data. Selain itu, akan dibuktikan bahwa penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi robust lebih baik daripada penduga rasio menggunakan koefisien kurtosis variabel bantu dan regresi. Caranya adalah dengan membandingkan rata-rata kuadrat sesatan penduga rasio Kadilar et al. [9] dengan penduga rasio Kadilar dan Cingi [8]. Selanjutnya, menerapkan kedua penduga tersebut dan menginterpretasikannya.
19