BAB II Tinjauan Pustaka
2.1. Pendahuluan Dalam bab ini dibahas berbagai metode terkait dengan metode pendugaan area kecil, dimulai dengan pembahasan model dasar pendugaan area kecil meliputi metode pendugaan parameter dan pendugaan Kuadrat Tengah Galat (KTG), baik menggunakan cara klasik maupun melalui pendekatan Bayes. Kajian pustaka selanjutnya adalah tentang pengembangan pendugaan SAE yang memperhitungkan proses pengambilan contoh khususnya untuk pengambilan contoh yang berpeluang tidak sama. Karena model SAE yang dibahas dalam penelitian ini diaplikasikan untuk menghitung Indeks Pendidikan yang merupakan salah satu komponen dari Indeks Pembangunan Manusia, sehingga pada bab ini juga akan dijelaskan cara dan dasar perhitungan IPM khususnya untuk Indeks Pendidikan. Data yang digunakan adalah data Susenas untuk Provinsi Jawa Timur tahun 2010 dan data Sensus Penduduk tahun 2010 khususnya di Kabupaten Sumenep dan Pasuruan. Oleh karena itu juga dibahas metode penarikan contoh Susenas dan cara pembobotan untuk pendugaan parameter berbasis data Susenas. 2.2.
Model Dasar Pendugaan Area Kecil Berbagai survei umumnya dirancang untuk menduga parameter populasi
untuk wilayah atau area yang besar, misalnya untuk wilayah nasional/ regional (provinsi/kabupaten/kota) dan pendugaan parameternya didasarkan pada rancangan. Karena itu untuk area kecil umumnya jumlah contoh menjadi kurang mencukupi terutama jika ingin digunakan pendugaan berdasarkan rancangan. Oleh karena itu beberapa peneliti statistik telah mengembangkan Pendugaan Area Kecil atau
Metode
Small Area Estimation (SAE) untuk pendugaan
parameter di suatu area dimana jumlah contohnya berukuran kecil. Metode SAE ini pertama kali diperkenalkan oleh Fay & Heriot (1979), merupakan pendugaan tidak langsung atau berdasarkan model (model based
11
estimation). Oleh karena itu untuk membangun model SAE dibutuhkan informasi tambahan dari peubah yang memiliki hubungan dengan peubah yang sedang diamati yang disebut sebagai peubah penyerta (auxiliary variable). Peubah penyerta ini dapat diukur dari survai yang lain atau dalam catatan administrasi dan diharapkan memiliki korelasi dengan peubah yang diamati. Dengan metode SAE diharapkan adanya perbaikan efisiensi dari pendugaan parameter dalam area kecil jika peubah penyerta tersedia. Model SAE memperkenalkan model campuran yang menyertakan pengaruh area spesifik yang memperhitungkan variasi antar area diluar yang dapat dijelaskan oleh peubah penyerta yang ada di dalam model. Ketersediaan data dari peubah penyerta akan sangat menentukan kesuksesan dalam pembuatan model SAE. Rao (2003) menyatakan bahwa penggunaan model SAE ini memberikan beberapa keuntungan yaitu: 1) Diagnostik model dapat digunakan untuk mendeteksi kecocokan dengan data, misalkan menggunakan analisis sisaan 2) Pengukuran presisi area-spesifik dapat diasosiasikan dengan setiap pendugaan setiap area kecil, 3) Model linier campuran seperti model regresi logistik dengan pengaruh acak area–spesifik tetap dapat dilakukan, demikian juga untuk struktur data yang cukup kompleks misalkan struktur data time series atau spasial; 4) pengembangan metode untuk model pengaruh acak dapat dimanfaatkan untuk mencapai akurasi dalam area kecil. 2.2.1. Pendugaan Area Kecil Berbasis Area Misalkan terdapat M area kecil di dalam populasi, maka untuk kepentingan pendugaan area kecil hanya diambil contoh sebanyak m area. Diasumsikan bahwa parameter yang diperhatikan dalam area kecil ke-i, misalkan θ i dapat dinyatakan sebagai sebuah fungsi yang menghubungkan parameter tersebut dengan peubah pembantu yang diukur dari area kecil yaitu z i = (z1i ,z 2i ,.....,z pi )T . Rao (2003) mengatakan bahwa model linier yang menjelaskan hubungan tersebut adalah:
θ = zT β + b υ i=1,2,........m, i i i i
(2.1)
12
dimana b i adalah konstanta positif yang diketahui dan β = (β1 , β 2 ,......., β P )
T
adalah vektor koefisien regresi berukuran p x 1. Selanjutnya υi adalah pengaruh acak area spesifik diasumsikan memiliki sebaran υi ~ (0,σ υ2 ) Jika penduga langsung θˆi diketahui, maka θˆi dapat dinyatakan sebagai :
θˆi = θi + ei , untuk i=1,2,........m,
(2.2)
dimana :
E p (ei θi ) = 0,
V p (ei θi ) = ψ i .
(2.3)
Rao (2003) menjelaskan bahwa model SAE untuk tingkat area, terdiri dari dua komponen model yaitu komponen model pendugaan langsung dan pendugaan tak langsung. Kombinasi model pendugaan langsung (2.2) dan tak langsung (2.1) dikenal sebagai
Model Campuran Linier Terampat/MCLT
(Generalized Linear Mixed Model:GLMM) sebagai berikut:
θˆi = ziT β + biυi + ei .
(2.4)
Model area kecil seperti yang dijelaskan pada persamaan (2.4) di atas dikenal sebagai model Fay-Heriot, dimana keragaman peubah respon di dalam area kecil diasumsikan dapat diterangkan oleh hubungan peubah respon dengan informasi tambahan yang disebut
sebagai model pengaruh tetap. Selain itu
terdapat komponen keragaman spesifik area kecil yang tidak dapat diterangkan oleh informasi tambahan dan disebut sebagai komponen pengaruh acak area kecil.
Gabungan dari dua asumsi tersebut membentuk model pengaruh
campuran. 2.2.2. Pendugaan Area Kecil Berbasis Unit Pendugaan area kecil berbasis unit mengasumsikan bahwa data dari peubah penyerta level unit x ij =(x ij1 ,......x ijp )T tersedia untuk setiap elemen ke j pada area ke-i. Peubah yang diperhatikan adalah y ij yang diasumsikan memiliki hubungan dengan x ij melalui model: yij = xijT β + υi + eij , j=1,......,n i , i=1,........m.
(2.5)
Pengaruh acak area υi diasumsikan merupakan peubah acak yang bersifat iid sedangkan eij = kij e~ij dengan k ij adalah konstata dan e~ij adalah peubah acak
13
yang bersifat iid dan bebas terhadap υi dimana E m (e~ij ) = 0 e2 dan V em (e~ij ) = σ e2 . Seringkali υi dan e ij diasumsikan memiliki sebaran peluang normal. Dengan mengasumsikan bahwa percontohan s i berukuran n i diambil dari populasi di area ke-i berukuran N i (i=1,2...m) dan penarikan contoh dalam setiap area diambil secara acak sederhana, sehingga model (2.5) dapat dinyatakan dalam bentuk matriks: 1i ei yi X i y i = * = * β + υi * + * 1i ei yi X i
(2.6)
yi* menyatakan unit-unit yang tidak terambil dalam percontohan. Jika Yi adalah rata-rata populasi di area ke-i, maka Yi dapat ditulis sebagai: Yi = f i yi + (1 − f i )Yi *
(2.7)
dimana f i = ni / N i dan yi adalah rata-rata dari seluruh contoh di area ke-i dan
Yi * menyatakan rata-rata elemen populasi dari bagian yang tidak terambil sebagai contoh. Oleh karena itu untuk model SAE berbasis unit, pendugaan parameter area kecil Yi sama dengan menduga Yi * jika data percontohan {y i } dan {Xi } tersedia.
2.3.
Pendugaan Parameter Model SAE
2.3.1. Metode Prediksi Tak-bias Linier Terbaik (PTLT) dan Prediksi Takbias Linier Terbaik Empirik (PTLTE) Parameter di area kecil, misalkan rataan atau tolal, dapat dinyatakan sebagai kombinasi linier dari efek tetap dan efek acak seperti dinyatakan pada persamaan (2.1) untuk model berbasis area dan persamaan (2.5) untuk model berbasis unit. Melalui pendekatan klasik, pendugaan parameter model SAE umumnya mengaplikasikan metode PTLT dengan meminimumkan Kuadrat Tengah Galat (KTG). Metode PTLT ini tidak tergantung pada kenormalan dari efek acak tetapi tergantung pada ragam atau koragam dari efek acak. Untuk menduga komponen ragam dan koragam umumnya digunakan metode ML atau REML dengan mengasumsikan kenormalan. Dengan cara tersebut pendugaan dilakukan melalui proses dua tahap yang dikenal sebagai PTLTE.
14
Misalkan data percontohan memenuhi model linier campuran terampat berikut:
y = Xβ + Zv + e
(2.8)
dimana: y adalah vektor data observasi berukuran n x 1 X dan Z adalah matriks berukuran n x p dan n x h yang diketahui v dan e adalah berdistribusi saling bebas dengan rataan 0 dan ragam G dan R yang tergantung pada parameter δ = (δ 1 ,.....δ q )T , diasumsikan bahwa δ adalah himpunan bagian dari ruang Euclidean sedemikian hingga Var ( y ) = V = V (δ ) = R + ZGZT adalah non singular untuk semua δ yang terdapat dalam himpunan bagian tersebut, dimana Var (y) adalah matrik ragam-koragam dari y. Parameter yang akan diduga merupakan kombinasi linier: µ = 1T β + m T v (Rao 2003). Penduga dari µ adalah µˆ = a T β + b untuk a dan b diketahui dan merupakan penduga tak bias jika E ( µˆ ) = E ( µ ) . Selanjutnya Kuadrat Tengah Galat (KTG) didefinisikan sebagai KTG ( µˆ ) = E ( µ − µ ) 2 dan jika µ adalah
penduga tak bias dari µ, maka KTG ( µˆ ) = Var ( µ − µ ) . Pada Rao (2003), penduga PTLT µ
yang meminimumkan KTG
dinyatakan dalam formula: ~ ~ ~ H = t(δ(y) = 1T ~ μ β + mT~ v = 1T β + m T GZ T V −1 (y − Xβ ),
(2.9)
dimana: ~ ~ β = β (δ) = (X T V −1 X)−1 X T V −1 y
(2.10)
adalah penduga tak bias linier terbaik (Best Linear Estimator: BLUE) dari β dan ~ ~ v=~ v(δ) = GZ T V −1 (y − Xβ ) .
(2.11)
Penduga PTLT tergantung pada ragam δ yang biasanya tidak diketahui. Jika δ diduga dengan δˆ = δˆ ( y ) , maka akan diperoleh Prediksi Tak-bias Linier Terbaik Empirik
(PTLTE) yang tetap merupakan penduga tak bias bagi µ.
Penduga δ diperoleh melalui metode ML atau REML. Untuk model berbasis unit, dimana rataan area kecil ke-i dinyatakan oleh ~ ~ fungsi: µ i = X Ti β + υ i . Untuk model percontohan y ij = X ijT β + υ i + e ij , j=1,..n i ; i=1,....,m dapat ditulis dalam bentuk matriks sebagai berikut:
15
y i = X i β + υ i 1ni + ei .
Model
(2.12)
SAE yang dinyatakan oleh (2.12) merupakan bentuk khusus dari
persamaan (2.8), dimana Gi = σ υ2 , dan Ri + σ e2 diag1≤ j ≤ni (k ij2 ) sehingga:
Vi −1 =
γ 1 T diag j (aij ) − i ai ai . 2 ai σe
(2.13)
Dengan mengambil (σ υ2 / σ e2 ) /(1 − γ i ) = γ i / ai dimana ai = ∑ aij , ai = (ai1 ,...., aini )T j
maka penduga PTLT dari µ i adalah (Rao 2003): ~ ~
~
µ~iH = XTi β + γ i ( yia − xiaT β )
(2.14)
dimana yia dan xia adalah rataan terbobot:
yia = ∑ aij yij / ai.,
xia = ∑ aij xij / ai.,
j
j
~
β adalah penduga tak bias linier terbaik bagi β ~
β = (∑ X iT Vi −1 X i ) −1 (∑ X iT Vi −1 yi )
(2.15)
X iT Vi −1 X i = Ai = σ e−2 (∑ aij xij xijT − γ i ai. xia xiaT )
(2.16)
X iT Vi −1 yi = σ e−2 (∑ aij xij yij − γ i ai. xia yij ) .
(2.17)
i
i
j
j
Penduga tak bias linier terbaik (2.14) dapat dinyatakan sebagai rata-rata terbobot dari penduga regresi berikut:
[
~ yia + ( X i − xia )T β ~
]
dan penduga regresi sintetik ~
µ~iH = γ i yia + ( X i − xia )T β + (1 − γ i ) X iT β .
~ X iT β
(2.19)
Bobot γ i (0 ≤ γ i ≤ 1) mengukur ragam model ( σ υ2 ), relatif terhadap ragam total
σ υ2 + σ e2 / ai . Jika ragam model relatif kecil maka γ i akan kecil dan bobotnya akan lebih besar di komponen sintetik.
2.3.2. Pendugaan Parameter Model SAE Melalui Pendekatan Bayes Melalui pendekatan Bayes, pendugaan parameter di area kecil dapat dilakukan dengan 2 cara yaitu pendugaan Bayes Empirik/BE (Empirical Bayes: EB) dan Bayes Berhirarki /BH (Hierarchical Bayes:HB). Untuk pendekatan Bayes Empirik, pendugaan didasarkan pada sebaran posterior yang diduga dari data, sedangkan pada pendekatan Bayes berhirarki parameter model yang tidak diketahui
diperlakukan sebagai komponen acak yang memiliki sebaran prior
16
tertentu. Model pendugaan area kecil menggunakan Bayes telah dikembangkan oleh beberapa peneliti diantaranya Gosh dan Rao (1994), You dan Rao (2000). Pendekatan Bayes, baik Bayes Empirik maupun Bayes Berhirarki merupakan metode yang dapat diaplikasikan secara lebih umum sehingga banyak digunakan untuk data diskrit, misalkan untuk data biner dan data cacahan. Untuk peubah respons dengan sebaran normal, model dasar area dapat dinyatakan sebagai model Bayes berhirarki dua tahap yaitu: ind
1) θˆi / θ i ~ N (θ i ,ψ i ) , i: 1,2,3,……,m
(2.20)
ind
2) θ i ~ N ( ziT β , bi2σ υ2 ) , i: 1,2,3,……,m
(2.21)
Dimana β adalah vektor parameter regresi berukuran p x 1. Dalam pendekatan Bayes, parameter model β dan σ υ2 adalah peubah acak, dan model hirarki dua tahap disebut model hirarki bebas bersyarat (conditionally independent
(
)
hierarchical model : CIHM) karena pasangan θˆi ,θ i adalah bebas di antara area i, untuk β dan σ υ2 tertentu. Penduga optimum dari θ i merupakan nilai harapan bersyarat dari θ i jika diberikan θˆi , β dan σ υ2 :
E (θi θˆi , β ,σ υ2 ) = θˆiB = γ iθˆi + (1 − γ i ) ziT β
(2.22)
bi2σ υ2 dimana γ i = 2 2 . Nilai harapan dari θ i merupakan nilai harapan dari bi σ υ + ψ i
(
)
sebaran posterior (atau bersyarat) dari θ i jika diberikan θˆi , β dan σ υ2 :
θi θˆi , β ,σ υ2 ~ N (θˆiB , g1i (σ υ2 ) = γ iψ i ) .
(2.23)
Penduga θˆiB = θˆiB ( β ,σ υ2 ) adalah penduga Bayes dibawah squared error loss dan merupakan nilai optimum dari KTG, dimana KTG (θˆiB ) = E (θˆiB − θ i ) 2 , selalu lebih kecil dibandingkan dengan θ dan linier atau non linier dalam θˆi . Jiang et al. (2002) menyatakan bahwa θˆiB disebut
prediksi terbaik (Best
Prediction: BP) dari penduga θ i karena diperoleh dengan tanpa mengasumsikan parameter model.
17
Penduga Bayes θˆiB tergantung pada parameter model β dan σ υ2 yang diduga dengan menggunakan metode ML atau REML dari sebaran marjinal : ind
(
)
θˆi ~ N ziT β , bi2σ υ2 + ψ i . .
(2.24)
Penduga parameter dinotasikan dengan βˆ dan σˆ υ2 , sehingga dengan menggantikan βˆ untuk β dan σˆ υ2 untuk σ υ2 , maka Penduga Bayes Empirik (Empirical Bayes Prediction: EBP) untuk θ i adalah:
(
)
θˆiEB = θˆiB βˆ , σˆυ2 = γˆiθˆi + (1 − γˆi ) ziT βˆ .
(2.25)
Penduga BE, θˆiEB adalah identik dengan penduga PTLTE yang dinotasikan dengan θˆiH
(
juga merupakan rataan dari estimasi densitas posterior ,
)
(
)
f θ i θˆ, βˆ , σˆ υ2 dari θ i , yaitu N θˆiEB , γˆiψ i .
2.4. Peluang Penarikan Contoh Metode pengambilan contoh berbasis peluang telah banyak dibahas oleh beberapa peneliti. Metode pengambilan contoh berbasis peluang yang banyak dibahas dan sering diaplikasikan adalah metode pengambilan contoh acak sederhana (simple random sampling), metode pengambilan contoh berstrata (stratified sampling), metode pengambilan contoh bergerombol (cluster sampling) dan metode pengambilan contoh sistematik (systematic sampling). Masingmasing metode pengambilan contoh memiliki konsekuensi terhadap perhitungan pendugaan parameter. Dalam rangka mendapatkan penduga yang tak berbias maka bobot peluang tersebut harus diperhitungkan dalam pendugaan parameter. Misalkan akan diduga parameter total Y = ∑U y j atau rataan Y = Y / N , dengan menggunakan contoh s yang diambil dari populasi U dengan peluang p(s), maka dengan mengasumsikan semua elemen j ∈ s dapat diobservasi, maka Yˆ adalah penduga berbasis rancangan dari Y dan dikatakan tak bias jika: E p (Yˆ ) = ∑ p ( s )Yˆs = Y .
(2.26)
18
[
]
2 Ragam untuk Yˆ adalah V p (Yˆ ) = E p Yˆ − E p (Yˆ ) dan penduga untuk V p (Yˆ )
yang
dinotasikan
dengan
v p (Yˆ ) = s 2 (Yˆ )
dikatakan
tak
berbias
jika
E p = [ S 2 (Yˆ )] = V p (Yˆ ) .
Untuk pengambilan contoh yang dirancang dengan bobot w j , dimana w j merupakan jumlah elemen-elemen dalam populasi yang direpresentasikan oleh contoh j sehingga, jika π j adalah peluang terambilnya contoh ke j maka
w j = 1 / π j . Bobot w j tergantung pada s dan elemen j (j ∈ s), sehingga
π j = ∑{s , j∈s} p( s) , j=1,2,....,N dan {s: j ∈ s} menyatakan jumlah dari semua contoh s yang memuat elemen j. Oleh karena itu penduga Y dapat ditulis sebagai: Yˆ = ∑ s w y j j
(2.27)
dimana Σ s menyatakan jumlah j ∈ s. Besarnya bobot w j ditentukan oleh metode penarikan contoh yang diterapkan. Misalkan untuk pengambilan contoh acak sederhana
setiap unit
percobaan memiliki bobot yang sama untuk terambil sebagai contoh yaitu 1/N dimana N adalah jumlah unit percobaan dalam populasi yang diteliti. Sedangkan metode penarikan contoh berbasis peluang yang lain akan memiliki bobot yang berbeda tergantung kepada metode penarikan contoh yang digunakan. Pada Cochran (1977) dan Shao J (1999) telah dibahas cara perhitungan bobot untuk masing-masing metode penarikan contoh. Metode
pendugaan
parameter
secara
langsung
dengan
memperhitungankan bobot percontohan dikenal sebagai Horvitz-Thompson Estimator untuk berbagai cara penarikan contoh (Shao 1999). Jika w i adalah adalah bobot untuk contoh ke-i, maka untuk berbagai metode penarikan contoh perhitungan bobot w i sebagai berikut: 1. Penarikan Contoh Acak Sederhana (PCAS) wi = n / N .
2. Penarikan Contoh Berstrata (PCB) Jika i dalam stratum h, maka : wi = nh / N h .
3. Penarikan Contoh Gerombol (PCG)
19
yi ∈ P
Misalkan
adalah sebuah kelompok (cluster) dan yi = yi1 ,..... yiN
i
dimana M i adalah ukuran dari cluster ke-i, i=1,2.....N. Jumlah unit dalam P M
adalah N = ∑ N i . i =1
Penarikan Contoh Gerombol Satu Tahap Penarikan contoh dilakukan dengan cara memilih y i dengan mengobservasi semua y ij . Oleh karena itu jika digunakan cara PCAS dengan w i =k/N maka total contoh k
adalah n = ∑ N i dan i =1
Ni M M Yˆs = ∑ ∑ yij = ∑ Yi k i∈S1 j =1 k i∈S1
(2.28)
dimana ragam penduganya adalah: Var (Yˆs ) =
N2 k M Y 1 − ∑ Yi − k ( M − 1) M i =1 M
2
(2.29)
S 1 adalah penarikan contoh tahap pertama. Jika pemilihan contoh proposional terhadap ukuran populasi (propotional to size: pps) maka w i =kN i /N. Sehingga Horvitz-Thompson estimator: Y N N 1 Ni Yˆpps = ∑ ∑ yij = ∑ i. k i∈S1 N i j =1 k i∈S1 N i
(2.30)
Penarikan contoh bergerombol dua tahap Untuk pemilihan secara acak sederhana (PCAS) pada tahap pertama dan pada tahap kedua dipilih m i contoh dari setiap cluster y i, wi = kmi /( MN i ) maka penduga Horvitz-Thompson adalah N M Yˆs = ∑ i ∑ yij k i∈S1 ni j∈S2 i
dimana S 2i
(2.31)
menyatakan perontohan gerombol pada tahap ke dua. Untuk
pemilihan secara pps pada tahap pertama dan n i adalah contoh dari y i yang dipilih pada tahap ke dua, maka: (2.32)
N 1 Yˆpps = ∑ ∑ yij . k i∈S1 ni j∈S2 i
20
4. Penarikan contoh Sistematik P={y 1 ,.....y N } adalah populasi dengan ukuran N=nk. Untuk memilih contoh berukuran n maka pada pemilihan pertahap diambil contoh j secara acak dari {1,.....k} sehingga contoh yang terambil adalah: { y j , y j+k, , ..,y j+(n-1)k ), maka w i =k-1. Penduga Horvitz-Thompson adalah n
Yˆ sy= k ∑ y j +(t −1) k
(2.33)
t =1
dimana
E (Yˆsy ) = Y .
2.5. Model SAE dengan Memperhitungkan Peluang Penarikan Contoh. Pfefferman et al (1998) memperhitungkan peluang penarikan contoh dalam pengembangan model SAE berdasarkan penarikan contoh dua tahap. Didefinisikan peubah indikator I i dan I ij dimana I i =1 jika area ke i terambil sebagai contoh dan I ij =1 jika unit ke j diambil sebagai contoh dari area ke i yang sudah terambil sebagai contoh atau i ∈ s . Dengan membagi U ke dalam M area M
dengan N i adalah banyaknya unit
di area ke-i, sehingga
∑N i =1
i
= N , maka
penarikan contoh dua tahap pada polulasi U tersebut adalah sebagai berikut: 1) Tahap pertama memilih m area dengan peluang 2) Tahap ke dua diambil n i unit dengan peluang
π i = P(i ∈ s ) .
π j / i = P ( j ∈ si | i ∈ s )
dari area yang telah terambil sebagai contoh pada tahap pertama, maka bobot penarikan contoh tahap satu adalah wi = 1 / π i dan untuk tahap ke dua adalah w j / i = 1 / π j / i .
Pada tahap pertama, fungsi kepadatan peluang (probablity density function: pdf) untuk pengaruh u i dibedakan atas area yang terambil dan tidak terambil sebagai contoh: Pada area yang terambil sebagai contoh ( i ∈ s ): def
bayes
f s (ui ) = f (ui | I i = 1) =
P( I i = 1 | ui ) f p (ui ) P( I i = 1)
(2.34)
Pada area yang tidak terambil sebagai contoh ( i ∉ s ) : def
bayes
f c (ui ) = f (ui | I i = 0) =
P( I i = 0 | ui ) f p (ui ) P( I i = 0)
21
(2.35)
Pada tahap ke dua, fungsi kepadatan peluang percontohan (sample pdf) dan fungsi kepadatan peluang komplemen percontohan (sample-complement pdf) dari y ij didefinisikan serupa dengan (2.34) dan (2.35), yaitu : Untuk unit yang terambil sebagai contoh adalah def
f s ( yij | xij , ui ) = f ( yij | xij , ui , I ij = 1) =
P( I ij = 1 | yij , x ij , ui ) f p ( yij | xij , ui ) P( I ij = 1 | yij , ui )
(2.36)
Untuk unit yang tidak terambil sebagai contoh def
f c ( y ij | xij , u i ) = f ( y ij | xij , u i , I ij = 0) =
P ( I ij = 1 | y ij , x ij , u i ) f p ( y ij | xij , u i ) P( I ij = 0 | y ij , u i )
(2.37)
Jika (υ1 ,υ 2 ) diukur pada elemen-elemen i ∈ U dan (π i , wi ) menyatakan peluang contoh (sample inclusion probabilities) dan bobot percontohan (sampling weight), dengan mendefinisikan Ep adalah nilai harapan dibawah populasi, Es adalah nilai harapan
dibawah percontohan dan Ec adalah nilai harapan
dibawah komplemen contoh, maka fungsi kepadatan peluang dari (υ1 ,υ 2 ) adalah: Untuk area yang terambil sebagai contoh:
f s (υ1i | υ 2i ) = f (υ1i | υ 2i , i ∈ s ) =
E p (π i | υ1i ,υ 2i ) f p (υ1i | υ 2i ) E p (π i | υ 2i )
(2.38)
sehingga: E p (υ1i | υ 2i ) =
Es ( wiυ1i | υ 2i ) Es ( wi | υ 2i )
(2.39)
1 Es ( wi | υ 2i )
(2.40)
dimana: E p (π i | υ 2i ) =
Untuk area yang tidak terambil sebagai contoh adalah: f c (υ1i | υ 2i ) = f (υ1i | υ 2i , i ∉ s ) =
E p [(1 − π i ) | υ1i ,υ 2i ] f p (υ1i | υ 2i ) E p [(1 − π i | υ 2i ]
E [( wi − 1) | υ1i ,υ 2i ] f s (υ1i | υ 2i ) = s E s [( wi − 1 | υ 2i ]
22
(2.41)
Oleh karena itu nilai harapan dari komplemen contoh adalah: Ec (υ1i | υ 2i ) =
E p [(1 − π i )υ1i | υ 2i ] E p [(1 − π i | υ 2i )
(2.42)
E [( w − 1) | υ1i ,υ 2i ] = s i Es [( wi − 1 | υ 2i ]
2.6. Indeks Pembangunan Manusia (IPM) Indeks Pembangunan Manusia (IPM) / Human Development Index (HDI) adalah pengukuran perbandingan dari tingkat pendidikan, kesehatan dan standar hidup layak untuk semua negara seluruh dunia. IPM digunakan untuk mengklasifikasikan apakah sebuah wilayah/negara adalah wilayah/negara maju, berkembang atau terbelakang dan juga untuk mengukur pengaruh dari kebijaksanaan ekonomi terhadap kualitas hidup. Indeks ini pada tahun 1990 dikembangkan oleh pemenang nobel India Amartya Sen dan Mahbub ul Haq seorang ekonom Pakistan dibantu oleh Gustav Ranis dari Yale University dan Lord Meghnad Desai dari London School of Economics dan sejak itu dipakai oleh Program pembangunan PBB dan dipublikasikan dalam laporan IPM tahunan . Komponen pembentuk IPM yaitu komponen kesehatan, pendidikan dan standar hidup layak , masing masing diukur dengan Indeks Kesehatan, Indeks Pendidikan dan Indeks Standar Hidup Layak. Indeks Kesehatan dihitung berdasarkan jumlah anak lahir hidup dari wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun (children surviving : CS). Indeks Pendidikan diukur berdasarkan angka melek huruf dan rata – rata lama sekolah penduduk usia 10 tahun ke atas, sedangkan Indeks Standar Hidup Layak diukur dengan rata-rata pengeluaran konsumsi riil per kapita pertahun Di Indonesia, pengukuran IPM dilakukan oleh Badan Pusat Statistik (BPS). Perhitungan dan publikasi
IPM dilakukan oleh BPS tiap tahun untuk tingkat
propinsi (yang membandingkan tingkat keberhasilan pembangunan antar propinsi),
dan
tingkat
kabupaten/kota
kabupaten/kota).
23
(membandingkan
IPM
antar
2.6.1. Cara Perhitungan IPM Data dasar yang digunakan dalam pendugaan IPM pada umumnya adalah data hasil survei Susenas yang diselenggarakan oleh BPS tiap tahun. BPS dan UNFPA (1998) menjelaskan tentang cara penghitungan IPM dimana komponen yang akan dihitung berdasarkan data survey adalah Indeks Kesehatan (yang diduga berdasarkan angka harapan hidup dan angka kematian bayi), Indeks Pendidikan (yang diduga dari rata-rata lama sekolah dan angka melek huruf) serta Daya Beli (rasio antara penghasilan dan harga di wilayah tertentu) seperti yang ditunjukkan oleh Tabel 2.1. Tabel 2.1. Peubah dan sumber data dari masing-masing komponen IPM
Komponen IPM
Peubah
Sumber data
Susenas (BPS) • Angka melek huruf • Rata-rata lama sekolah Kesehatan Susenas (BPS • Jumlah anak lahir hidup dari Profil Kesehatan wanita usia 15-49 tahun (Kemenkes) (Children Even Born: CEB) • Jumlah anak masih hidup dari wanita berusia 15-49 tahun (Children Surviving: CS) Standar hidup layak Susenas (BPS) • Pengeluaran konsumsi riil per kapita per tahun *) Berdasarkan UNDP patokan usia penduduk 15 tahun ke atas, namun BPS Pendidikan/pengetahuan*)
menggunakan patokan usia di atas 10 tahun
Keterangan: a. Indeks Pendidikan diukur dengan dua indikator yaitu Angka Melek Huruf /AMH (literacy rate) dan Rata-rata Lama Sekolah/RLS (Mean Years of Schooling: MYS). Angka melek huruf diolah dari peubah kemampuan membaca dan menulis, sedangkan rata-rata lama sekolah dihitung menggunakan tiga variabel secara simultan yaitu partisipasi sekolah, tingkat/kelas yang sedang/ pernah dijalani, dan jenjang pendidikan tertinggi yang ditamatkan b. Indeks Kesehatan dihitung berdasarkan
jumlah anak lahir hidup dari
wanita usia 15 – 49 tahun (Children even born: CEB) dan jumlah anak masih hidup dari wanita usia 15 – 49 tahun (children surviving: CS).Usia Hidup yang diukur dengan angka harapan hidup waktu lahir (e 0 ). Metode
24
ini menggunakan dua macam data dasar yaitu rata-rata anak yang dilahirkan hidup (live - births) dan rata-rata anak yang masih hidup (still living) per wanita usia 15 – 49 tahun menurut kelompok umur lima tahunan. c. Indeks Kesejahteraan (Standar Hidup Layak) diukur dengan rata-rata pengeluaran konsumsi riil per kapita pertahun. Standar Hidup Layak, seringkali dihitung dengan menggunakan rata-rata pengeluaran per kapita riil yang disesuaikan (adjusted real per capita expenditure). Perhitungan indeks masing-masing komponen IPM dihitung dengan formula sebagai berikut : Indeks (X i ) : = (X i – X min )/(X max – X min )
(2.43)
dimana : X i : Indikator komponen pembangunan manusia ke – i (i = 1,2,3). X min : Nilai minimum X i (lihat Tabel 2.2) X max : Nilai maksimum X i (lihat Tabel 2.2) Nilai minimal Indeks (Xi) adalah 0 dan maksimum 1, namun untuk mempermudah cara membaca skala dinyatakan dalam 100 (persamaan 2.43) dikalikan 100, sehingga 0 < Indeks (X i ) <100). Angka IPM adalah dihitung dengan rumus rata-rata sederhana dari masing-masing Indeks X i yaitu : IPM = 1 / 3[ X (1) + X (2) + X (3)]
(2.44)
dimana : X(1) : Indeks Kesehatan. X(2) : Indeks Pendidikan = 2/3 (Indeks Melek Huruf) + 1/3 ( Indeks rata-rata lama sekolah). X(3) :
Indeks standar hidup layak (sering diukur dengan konsumsi per kapita yang disesuaikan.
Tabel 2.2 Nilai Maksimum dan Nilai Minimum Indikator Komponen IPM Indikator
Nilai Maksimum
Nilai minimum
Catatan
Angka Harapan Hidup
85
25
Standar UNDP
Angka Melek Huruf
100
0
Standar UNDP
Rata-rata lama sekolah
15
Konsumsi per kapita yang disesuaikan
0 (a)
737.720
300.000 (1996) 360.000 (b) (1999)
25
UNDP menggunakan GNP per capita riil yang disesuaikan
Keterangan a) Proyeksi konsumsi per kapita yang disesuaikan untuk Jakarta tahun 2018 setelah disesuaikan dengan rumus Atkinson. Proyeksi ini berdasarkan asumsi pertumbuhan konsumsi per kapita 6,5 % selama periode 19932018. b) Setara dengan dua kali garis kemiskinan Propinsi Sulawesi Selatan daerah pedesaan tahun 1990. Untuk tahun 1999 nilai minimum yang disesuaikan adalah 360.000 (penyesuaian adanya krisis ekonomi). 2.6.2. Indikator Pendidikan/ Pengetahuan Indikator pendidikan dihitung berdasarkan angka melek huruf dan rata-rata lama sekolah. Angka melek huruf diduga berdasarkan proporsi jumlah penduduk umur 10 tahun keatas yang mampu membaca dan menulis baik untuk huruf latin maupun huruf lainnya. Sedangkan rata-rata lama sekolah dihitung berdasarkan data yang didapat dari pertanyaan tentang jenjang dan jenis pendidikan tertinggi yang pernah diduduki. Konversi tahun untuk tingkat pendidikan yang ditamatkan dapat dilihat pada Tabel 2.3. Rumus yang digunakan untuk menghitung Ratarata Lama Sekolah (RLS) adalah: RLS =
dimana : f i wi
∑ f i wi
(2.45)
∑ fi
= jumlah penduduk menurut jenjang pendidikan = penimbang setiap jenjang pendidikan.
Tabel 2.3. Konversi tahun untuk tingkat/kelas pendidikan yang ditamatkan No 1 2 3 4 5 6 7 8 9 10
Tingkat pendidikan Tidak pernah sekolah SD SLTP SLTA D1 D2 D3/akademi D4/Sarjana S2 /Master S3/Doktor
Konversi 0 6 9 12 13 14 15 16 18 21
26
Sumber : UNDP dan BPS (2001) Catatan : Bila seseorang drops out kelas dua SLTA, maka konversi tahun lama pendidikannya adalah = 9 + 2 – 1 = 10 tahun
2.7. Survei Sosial Ekonomi Nasional (Susenas) Susenas adalah survai yang diselenggarakan BPS tiap tahun, ditujukan untuk memonitor perubahan tingkat kesejahteraan masyarakat Indonesia. Jumlah contoh dalam Susenas 2010 mencakup sekitar 304.369 rumahtangga di 497 kabupaten/kota seluruh Indonesia, sehingga estimasi bisa dilakukan sampai dengan tingkat kabupaten/kota (BPS 2010). Di Jawa Timur, Susenas dilaksanakan dengan mengambil jumlah contoh sekitar 29.000 responden untuk 38 Kabupaten/kota atau 639 kecamatan. 2.7.1. Kerangka Percontohan dan Metode Penarikan Contoh Kerangka percontohan untuk Susenas tahun 2010 berdasarkan listing rumahtangga hasil listing Sensus Penduduk (SP) tahun 2010. Penarikan contoh dalam survai Susenas menggunakan rancangan percontohan dua tahap untuk daerah perkotaan dan tiga tahap untuk daerah pedesaan (BPS 2010). Kerangka percontohan pemilihan tahap pertama adalah master sampel blok sensus (BS) biasa kondisi 5 Mei 2010. Master BS tersebut disertai dengan informasi banyaknya rumah tangga hasil listing SP2010, muatan blok sensus dominan (pemukiman biasa, pemukiman mewah, pemukiman kumuh), informasi daerah sulit/tidak sulit, dan klasifikasi desa/kelurahan (rural/urban). Kerangka percontohan pemilihan tahap kedua adalah daftar rumah tangga biasa hasil listing SP2010 dalam blok sensus. Metode penarikan contoh yang digunakan yaitu penarikan contoh dua tahap berstrata. Tahapan dari metode ini diuraikan sebagai berikut: •
Tahap pertama, memilih
blok sensus dari
secara pps (Probability
Proportional to Size) dengan size banyaknya rumah tangga hasil listing SP2010 (M i ). •
Tahap kedua, dari setiap blok sensus terpilih dipilih sejumlah rumah tangga biasa (n=16) secara sistematik berdasarkan hasil listing SP2010. Jumlah contoh blok sensus untuk penduga kabupaten/kota merupakan
jumlah contoh minimum untuk pendugaan di tingkat kabupaten/kota. Contoh blok sensus dibedakan atas daerah perkotaan dan perdesaan yang diidentifikasi berdasarkan daerah sulit atau tidak sulit. Alokasi jumlah contoh menurut daerah perkotaan
dan
perdesaan
di
setiap
27
kabupaten/kota
dilakukan
secara
proporsional terhadap proporsi akar jumlah rumah tangga dalam RBL1 dengan akar biaya per unit.
Nh mh =
ch Nh ∑ h =1
ch
H
×n
(2.46)
dengan: mh
: Jumlah contoh blok sensus dalam strata h
Nh
: Jumlah rumah tangga biasa dalam strata h
ch
: Biaya per unit dalam strata h
m
: Jumlah target contoh.
Kerangka contoh yang digunakan untuk pemilihan rumah tangga adalah daftar rumah tangga biasa hasil listing SP2010. Pemilihan contoh rumah tangga secara sistematik sampling dengan ukuran sampel rumah tangga yang harus dipilih di setiap blok sensus adalah 16 rumah tangga. Nomor urut rumah tangga yang terpilih sebagai contoh sudah ditetapkan dari BPS-RI.
2.7.2.Penentuan Bobot Bobot penarikan contoh diperhitungkan dalam rangka mendapatkan pendugaan tak bias untuk parameter di tiap Kabupaten/Kota. Misalkan pada suatu kabupaten/kota target contoh blok sensus pada strata ke-h adalah n h yang dipilih secara pps dengan size banyaknya rumah tangga hasil listing SP 2010 ( M hi ), maka peluang contoh blok sensus ke-i terpilih sebagai contoh menurut BPS (2010) adalah Phi =
N hi Mh
=
∑ N hi
N hi , N oh
(2.47)
i
sehingga fraksi penarikan contoh tahap pertamanya adalah N m × N hi f hi = m h × M hi = h h N oh ∑ N hi
.
(2.48)
i
Bila pada setiap blok sensus ditarik sejumlah rumah tangga (fixed size: m) dengan equal probability, peluang bersyarat terpilihnya rumah tangga ke-j blok
28
sensus ke-i dalam strata h, dan diketahui dari blok sensus ke-i Phj|i =
adalah:
1 n , maka fraksi penarikan contoh tahap kedua adalah: f hj|i = . Oleh N hi N hi
karena itu overall sampling fraction adalah: f hij = f hi × f hj|i =
mh × N hi m ×n n × = h = f konstan. N oh N hi N oh
(2.49)
Overall sampling fraction f konstan untuk setiap blok sensus terpilih, maka rancangan penarikan sampel tersebut dinamakan self-weighting design. Dengan demikian design weight dapat dirumuskan sebagai berikut: Whij =
N oh mh × n
dimana:
Whij
: bobot rumah tangga ke-j, blok sensus ke-i dalam strata h
N oh
: banyaknya populasi rumah tangga biasa hasil listing SP2010 dalam strata h
mh
: banyaknya contoh blok sensus dalam strata h
n
: banyaknya contoh rumah tangga di blok sensus ke-i.
29