ANALISIS PENAKSIRAN REGRESI LINIER PADA SAMPLING KELOMPOK ARTIKEL
Oleh ISWAHYUDI JOKO S, S.Si, M.Pd
PROGRAM STUDI PENDIDIKAN MATEMATIKA FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS MUHAMMADIYANEGERI SEMARANG 2012
2
ANALISIS PENAKSIRAN REGRESI LINIER PADA SAMPLING KELOMPOK Iswahyudi Joko Suprayitno Abstrak
2.
Analisis penaksiran regresi linier merupakan salah satu cara estimasi untuk meningkatkan ketelitian penaksiran dengan memanfaatkan hubungan antara variabel x dan y agar kedua variabel tersebut mendekati linier. Dalam skripsi ini akan dibicarakan analisis penaksiran regresi linier pada sampling kelompok. Permasalahan dalam penelitian ini adalah: 1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok? Berapakah besarnya bias dari penaksir regresi linier sederhana? 3. Apakah regresi linier sederhana lebih efisien bila dibandingkan dengan sampling kelompok ( cluster sampling )? Tujuan penelitian ini adalah untuk mengetahui besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok, mengetahui besarnya bias dari penaksir regresi linier sederhana dan menunjukkan secara teoritis bahwa penaksir regresi linier sederhana sebagai penaksir yang efisien pada kondisi tertentu. Penelitian ini meliputi ruang lingkup yaitu regresi linier sederhana dan sampling kelompok. Objek penelitiannya adalah perbedaan antara penaksiran regresi linier sederhana dengan penaksiran pada sampling kelompok. Variabel/fokus pembicaraan dari penelitian ini yaitu penaksiran variabel dependen pada regresi linier sederhana, penaksiran variabel dependen pada rata-rata sampel, penaksiran bias pada regresi linier, penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi linier sederhana. Teknik dan olah data dengan menggunakan studi pustaka, perumusan masalah, pengumpulan data dan penyelesaian masalah.
ρ =0
1− Nf − nE1e− (f x − NX− n) V (Vymilr)n= yˆ( lr) S= y2(1− iρ 2)〈 SViy22y(1)( =− ρ 2)S y2 n Nn n Sx Nn
Simpulan dari penelitian ini yaitu besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok . Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias ini akan menjadi kecil jika hubungan antara xi dan yi mendekati linier. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok karena kecuali . Kata kunci: Pembelajaran matematika realistik, turnamen belajar, LKS, ekspositori, dan ketuntasan belajar siswa. PENDAHULUAN Sampel adalah sebagian anggota dari populasi yang dipilih dengan menggunakan prosedur tertentu sehingga diharapkan dapat mewakili populasinya. Banyak anggota sutau sampel disebut ukuran sampel, sedangkan suatu nilai yang menggambarkan ciri sampel disebut statistik. Selain itu statistik juga berarti data yang berupa angka hasil pencatatan atas suatu kejadian.
3
Dalam mengolah data peneliti akan selalu berkepentingan untuk menentukan hubungan antara dua atau lebih peubah. Hubungan tersebut mungkin renggang atau mungkin pula erat. Pada satu pihak, dua peubah mungkin bebas satu sama lain. Dalam keadaan seperti itu, korelasinya nol. Pada ekstrim yang lain, kedua peubah bergantung sepenuhnya pada yang lain. Bila kedua peubah tersebut linier keduanya disebut kolinear, maka harga mutlak korelasinya satu. Dalam suatu keadaan model dapat menolong peneliti dalam menentukan hubungan kausal antara dua atau lebih peubah. Hubungan kausal tentu saja merupakan perhatian yang besar bagi tiap peneliti. Ada tidaknya hubungan kausal antara peubah tidak dapat diputuskan dengan hanya menggunakan data statistik. Secara umum, model merupakan penyederhanaan dan abstraksi dari keadaan alam yang sesungguhnya. Keadaan alam yang ingin diteliti biasanya amat rumit dan kemampuan menelitinya secara keseluruhan amat terbatas, karena itu kita perlu menyederhanakannya, sesuai dengan kemampuan akal kita menghadapinya. Dari pengalaman dimasa lalu atau dari dugaan mengenai hubungan antara peubah dalam sistem yang diteliti, dirumuskan perkiraan kelakuan sistem tersebut dalam berbagai situasi. Peneliti mengharapkan bahwa model tersebut merupakan teori tentang cara kerja sistem yang dia teliti. Rumusan hubungan tersebut yang selanjutnya dinyatakan dalam bentuk hipotesis seterusnya diuji berdasarkan data statistik yang kemudian dikumpulkan. Pendekatan seperti ini sering disebut bersifat induksi, sebagai lawan dari yang bersifat aksioma (deduksi). Model yang dibicarakan disini akan selalu berbentuk fungsi dan regresi merupakan alat yang ampuh dalam pembentukannya. Data yang dipakai mungkin berasal dari percobaan dalam laboratorium (ada kontrol) ataupun dari lapangan (survei). Kedua jenis data karena tidak lagi menggambarkan keadaan yang alamiah tapi dimanipulasikan sesuai dengan tujuan pencoba. Peubah yang mengganggu dibuat tidak berubah sehingga tidak berpengaruh. Jadi pengaruh peubah yang ingin diselidiki lebih bersih dapat dipisahkan. Data survei menggambarkan keadaan yang alamiah dan mengandung pengaruh banyak peubah yang bekerjasama secara amat rumit. Kesimpulan yang dapat diperoleh daripadanya sering bersifat sementara, sampai ada petunjuk lain yang lebih meyakinkan.
4
Teori statistika inferensi dapat didefinisikan sebagai metode untuk menarik inferensi atau keputusan mengenai populasi. Salah satu masalah penting statistika inferensi yang sering dijumpai dalam pengolahan data dari suatu percobaan atau penelitian adalah penaksiran parameter populasinya. Pada umumnya parameter populasi ini tidak diketahui. Penaksiran parameter bertujuan untuk memberikan taksiran dari parameter yang didasarkan pada sampel. Sebagai contoh, sebuah penelitian yang ingin mengetahui rata-rata berat badan anak-anak balita di Indonesia, maka untuk menjawab dengan tepat hal di atas harus dilakukan penimbangan berat badan terhadap seluruh anak-anak balita di Indonesia. Cara seperti ini dinamakan sensus. Dengan cara sensus memang dapat diperoleh data statistik yang tepat, tetapi biasanya sulit untuk dilakukan. Hal ini dikarenakan biaya yang terlalu mahal, waktu yang relatif lama dan memerlukan tenaga yang banyak, sehingga cara ini dianggap kurang ekonomis. Berdasarkan hal di atas, maka dalam praktek sering digunakan sampel. Hasil perhitungan sampel disebut statistik. Dari statistik ini diharapkan dapat memberikan penaksiran yang baik dari parameternya, artinya nilai statistiknya tidak jauh menyimpang dari parameternya. Dalam pengambilan sampel terdapat beberapa metode antara lain; Sampling acak sederhana, sampling acak berlapis, sampling kelompok dan lain-lain. Pada penulisan skripsi ini akan dibahas tentang penaksiran, khususnya metode penaksiran regresi linier sederhana. Dalam pembahasannya dibatasi pada sampling kelompok.
Alasan menggunakan metode penaksiran regresi linier ini karena metode ini akan memberikan ketelitian penaksiran yang lebih baik dibandingkan dengan menggunakan rata-rata sampel pada sampling kelompok. Penaksiran regresi linier dapat dibuat untuk meningkatkan ketelitian dengan menggunakan variabel tambahan xi yang berhubungan dengan yi, sedangkan lambang atau simbol yang digunakan pada penulisan ini adalah huruf kapital untuk karakteristik populasi dan huruf kecil untuk sampel. Notasi “ ^ ” ( topi ) adalah notasi taksiran karakteristik populasi yang diperoleh dari sampel dan “” ( bar ) adalah notasi untuk rata-rata.
5
Dengan berdasarkan pada latar belakang di atas, maka perumusan masalah yang diambil sebagai berikut; 1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok? 2. Berapakah besarnya bias dari penaksir regresi linier sederhana? 3. Apakah penaksir regresi linier sederhana lebih efisien bila dibandingkan dengan sampling kelompok ( cluster sampling )? Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut. 1. Mengetahui besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok. 2. Mengetahui besarnya bias dari penaksir regresi linier sederhana. 3. Menunjukkan secara teoritis bahwa penaksir regresi linier sebagai penaksir yang efisien pada kondisi tertentu. Teori – teori pembelajaran yang terkait dengan perangkat pembelajaran yang dikembangkan dalam penelitian ini. Teori Penaksiran Pengambilan sampel dari suatu populasi digunakan untuk menaksir parameter yang tidak diketahui. Penaksir tersebut antara lain: rata-rata populasi, variansi populasi, rasio populasi, dan total populasi, tetapi nilai statistik dari sampel tidaklah tepat sama dengan parameternya. Meskipun demikian diharapkan bahwa statistik ini dapat memberikan penaksiran terhadap parameter tersebut secara baik, artinya nilai taksirannya tidak terlalu jauh menyimpang dari parameter yang sebenarnya. Statistik yang digunakan untuk mendapat taksiran disebut sebagai penaksir. Jadi tidak dapat diharapkan suatu penaksir akan menaksir parameter populasi tanpa kesalahan.
µµ~ xˆ Obj116 Obj115 Obj114 Obj113 Obj112 Obj111 Obj110
Tidak beralasan mengharapkan rata-rata sampel dapat menaksir rata-rata populasi dengan tepat, tetapi tentunya diharapkan bahwa taksiran itu tidak terlalu jauh menyimpang. Untuk suatu sampel tertentu, mungkin saja diperoleh taksiran rata-rata populasi lebih dekat dengan mengambil median sampel sebagai penaksir. Sebagai contoh, sampel yang terdiri atas nilai 2, 7, dan 9 yang diambil dari suatu
6
populasi. Dimisalkan rata-ratanya tidak diketahui. Rata-rata populasi akan ditaksir dengan = 6 bila menggunakan rata-rata sampel sebagai penaksir, atau
bila
menggunakan median sampel sebagai penaksir. Dalam hal ini median sampel menghasilkan taksiran yang lebih dekat ke parameter sesungguhnya daripada ratarata sampel . Sebaliknya bila sampel acaknya terdiri atas nilai 3, 6, dan 9, maka = 6 dan = 6, sehingga rata-rata samplesekarang menjadi penaksir yang lebih baik. Penaksir berarti penduga suatu parameter dari populasi yang tidak diketahui. Pada umumnya suatu penaksir dikatakan baik apabila memenuhi kriteria seperti: tak bias, efisien dan konsisten. a) Ketakbiasan
Obj134 Obj133 Obj132 Obj131 Obj130 Obj129 Obj128 Obj127 Obj126 Obj125 Obj124 Obj123 Obj122 Obj121 Obj120 Obj119 Obj118 Obj117
Misalkan suatu parameter dari populasi akan ditaksir dengan statistik . Tentunya diinginkan distribusi sampel
mempunyai
ekspektasi yang sama
dengan yang ditaksir. Penaksir yang mempunyai sifat ini disebut penaksir tak bias. Menurut definisi: Statistik dikatakan penaksir tak bias dari parameter yang tidak diketahui bila E()=, sebaliknya statistik dikatakan bias dari parameter bila E(). Selanjutnya E()= menyatakan besarnya bias. Statistik dikatakan bias positif bila E() > dan bias negatif bila E() <. Contoh :
Obj138 Obj137 Obj136 Obj135
a.1
Misalkan Y adalah suatu variabel random dengan rata-rata dan variansi 2.
Misalkan Y1, Y2, …, Yn adalah variabel random yang besarnya n dari Y, maka rata-rata sampel adalah penaksir yang tak bias dari . Hal ini karena:
Obj139
Obj140
Karena , untuk semua i =1, 2, 3, …, n
7
Obj141
Maka
Obj143 Obj142
a.2
Andaikan X1 , X2 , … , Xn variable random bebas, masing-masing
berdistribusi keduanya tidak diketahui. Carilah penaksir takbias untuk !
Obj148 Obj147 Obj146 Obj145 Obj144
Penyelesaian: untuk.. Karena itu suatu penaksir takbias untuk . b) Keefisienan Sifat tak bias saja belum cukup selama variansi sebagai ukuran penyebaran dari suatu penaksir tidak diketahui. Ini berarti diperlukan sifat penaksir dengan variansi terkecil yang dinamakan sifat penaksir efisien.
Obj155 Obj154 Obj153 Obj152 Obj151 Obj150 Obj149
Menurut definisi: Misalkan
1
dan 2 dua penaksir tak bias dari parameter
populasi yang sama. Bila variansi dari
1
lebih kecil daripada variansi
2
maka
dikatakan bahwa 1 penaksir yang lebih efisien daripada2. Contoh :
Obj160 Obj159 Obj158 Obj157 Obj156
Misalkan Y1, Y2, …, Yn adalah variabel random yang saling bebas dan masing-masing mempunyai distribusi normal . Penaksir tak bias dari adalah yaitu rata-rata dari sampel. Penaksir tak bias lainnya adalah yi untuk suatu indeks i, yaitu sebuah observasi tunggal dari sampel tersebut. Tetapi adalah penaksir dari yang lebih efisien daripada yi , karena:
Obj161
. c) Kekonsistenan
8
Obj163 Obj162
Pada umumnya taksiran dari parameter yang dihitung dari sampel akan berbeda dengan nilai parameter sebenarnya, akan tetapi diharapkan perbedaan itu sangat kecil bila ukuran sampel diperbesar menjadi tak terbatas, dimana nilai peluang dari penaksir akan menuju kesatu.
Obj166 Obj165 Obj164
Menurut Definisi: Misalkan suatu penaksir dari populasi penaksir konsisten apabila:
dikatakan
( Walpole, R.E )
Biasanya sukar untuk membuktikan bahwa sebuah penaksir adalah konsisten dengan menggunakan definisi diatas. Tetapi jika suatu penaksir adalah tak bias dan mempunyai variansi yang cenderung menuju nol dengan sampel yang besarnya mendekati tak terbatas adalah konsisten. Contoh:
Obj170 Obj169 Obj168 Obj167
Misalkan Y1, Y2,…,, Yn adalah variabel random dimana saling bebas dan masing-masing berdistribusi normal, makasebuah penaksir yang konsisten pada rata-rata sebuah distribusi normal, karena adalah tak bias, maka Untuk menaksir suatu parameter populasi yang tidak diketahui dapat dilakukan dengan dua cara, yaitu: 1. Menaksir parameter populasi dengan satu nilai tertentu, ini disebut sebagai penaksiran titik dan hasil penaksirannya dinamakan dengan taksiran titik. 2. Menaksir parameter dengan suatu interval tertentu, ini disebut dengan penaksiran interval dan hasil penaksirannya disebut dengan taksiran interval.
Obj204 Obj203 Obj202 Obj201 Obj200 Obj199 Obj198 Obj197 Obj196 Obj195 Obj194 Obj193 Obj192 Obj191 Obj190 Obj189 Obj188 Obj187 Obj186 Obj185 Obj184 Obj183 Obj182 Obj181 Obj180 Obj179 Obj178 Obj177 Obj176 Obj175 Obj174 Obj173 Obj172 Obj171
Taksiran selang (Interval) suatu parameter populasi adalah suatu interval yang berbentuk
1
< <
2
,dengan
1
dan
2
tergantung pada nilai statistik . sebagai
contoh: untuk parameter akan terlihat bahwa 1 = dan 2 = , k ditentukan dari distribusi
9
sampel . Jadi . Misalkan dari distribusi sampel dapat ditentukan 1 dan 2 dengan 1 < 2 sedemikian hingga P(1 < < 2 ) sama dengan nilai yang di inginkan. Misalkan 1 dan 2 dicari sehingga memenuhi P(1 < < 2 ) = 0,95. Artinya bahwa dengan peluang 0,95 sampel random yang diambil akan menghasilkan suatu interval yang mengandung . Ini disebut interval kepercayaan 95%, artinya bahwa 95% interval mengandung parameter
yang
sesungguhnya
dari
populasi.
Pada
umumnya
distribusi
memungkinkan menghitung k sehingga: P( - k < < + k ) = 1 - dengan 0 < < 1.
Obj210 Obj209 Obj208 Obj207 Obj206 Obj205
Interval yang dihitung dari suatu sampel tetentu disebut interval kepercayaan (1 - ) = 100%. Jadi bila = 0,05 diperoleh interval kepercayaan 95% dan bila = 0,01 diperoleh interval kepercayaan 99%. Pecahan 1 - disebut koefisien kepercayaan dan - k dan + k disebut batas kepercayaan. Sampling Kelompok (Cluster Sampling) Sampel kelompok (Cluster sampling) ialah sampel acak sederhana dimana setiap sampling unit terdiri dari kumpulan atau kelompok elemen, seperti misalnya rumah tangga terdiri dari beberapa anggota rumah tangga, blok toko di pasar baru Jakarta terdiri dari toko-toko, rayon sekolah terdiri dari beberapa sekolah, segmen pasar terdiri dari banyak pembeli, bidang tanah terdiri dari ssbeberapa plot terdiri dari beberapa pohon dan lain sebagainya. Pengambilan
sampel
secara
blok/kelompok
mempunyai
beberapa
keuntungan, antara lain: Tidak perlu disusun kerangka sampling di seluruh populasi yang ingin diteliti cukup dibuat blok-blok yang ada dan biaya pendataan lebih murah karena sampel yang terambil akan terletak pada jarak yang relatif berdekatan. Sifat-sifat Penaksir Ketelitian atau sering dinamakan dengan presisi dari suatu penaksir yang dibuat berdasarkan sampel, tergantung pada metode penaksiran dan rencana penarikan sampel. Sifat-sifat penaksir untuk sampling kelompok diberikan dalam teorema berikut ini: Teorema 1
Obj213 Obj212 Obj211
10
Misalkanadalah rata-rata sampel yang dipilih n unit dari populasi berukuran N, maka adalah penaksir tak bias dari yaitu rata-rata dari populasi Bukti : a) Tanpa Pengembalian
Obj214
Dari definisi ekspektasi ( nilai harapan ) bahwa:
Obj215
, untuk suatu i. Dengan: Yj adalah nilai-nilai yi yang mungkin ( peubah acak diskrit ) Pj adalah peluang dari Yj (unsur ke-j dari populasi) terpilih sebagai sampel, j = 1,2,3,…,N
Obj216
Perhatikan bahwa suku pertama persamaan diatas menunjukkan peluang Yj tidak terpilih sebagai sample pada pengambilan pertama, suku kedua menunjukkan peluang bahwa Yj tidak terpilih sebagai sampel pada pengambilan sampel berikutnya dan suku terakhir menunjukkan peluang bahwa Yj terpilih sebagai sampel dari N–I+1, sisa elemen pada pengambilan sampel ke-i.
Obj218 Obj217
Dari E(), E dan Pj didapatkan:
Obj219
b) Dengan Pengembalian
Obj221 Obj220
11
Ini berarti bahwa setiap unit akan muncul dalam jumlah sampel yang sama yaitu
Obj222
Akibat dari Teorema 1
Obj224 Obj223
Misalkan adalah rata-rata sampel yang dipilih n unit dari populasi berukuran N, maka adalah penaksir tak bias sari total populasi Y. Bukti :
Obj228 Obj227 Obj226 Obj225
E() = E(N) = N E() = N = Y. Variansi dari Penaksir Dari teori sampling dikenal dua definisi variansi dari yi yaitu:
Obj230 Obj229
(1)
Obj231
(2) Definisi (1) diatas digunakan untuk menurunkan hasil teoritis sedangkan definisi (2) banyak berkaitan dengan analisis variansi utamanya sifat ketakbiasan. Teorema 2
Obj233 Obj232
Misalkan adalah rata-rata sampel berukuran n yang diambil dari populasi berukuran N pada sampling kelompok, maka variansi dari adalah sebagi berikut: a) Tanpa Pengembalian
Obj234
12
Dimana f = n / N adalah fraksi penarikan sampel. b) Dengan Pengembalian
Obj235
Obj237 Obj236
Sedangkan Variansi dari penaksir total populasi adalah:
Obj242 Obj241 Obj240 Obj239 Obj238
Untuk sampel berukuran n dari suatu populasi tak hingga, variansi rata-rata sampel adalah . Hasil ini akan berubah jika populasi terbatas yaitu dengan menambahkan yang disebut sebagai faktor koreksi populasi hingga (fpc). Untuk populasi hingga fraksi sampling sangat kecil, maka . Jadi ukuran populasinya tidak mempunyai pengaruh secara langsung terhadap kesalahan baku dari rata-rata sampel. Dalam praktek fpc dapat diabaikan apabila Teorema 3
Obj245 Obj244 Obj243
Jika (yi, xi) adalah pasangan variabel yang didefinisikan pada setiap unit populasi dan , adalah rata-rata sampling kelompok berukuran n, maka kovarian darididefinisikan sebagai:
Obj246
Obj247
Dengan: Penaksir Variansi Rumus simpangan baku dari penaksir rata-rata populasi dan total populasi digunakan terutama untuk tiga tujuan:
13
1) Membandingkan presisi (ketelitian) yang diperoleh dari sampling kelompok dengan metode sampling lainnya. 2) Untuk memperkirakan ukuran sampel yang dibutuhkan dalam suatu survei yang telah direncanakan. 3) Untuk memperkirakan ketelitian sebenarnya yang didapat dalam suatu survei yang telah dilaksanakan. Pada umumnya dalam praktek S2 adalah variansi populasi tidak diketahui, tetapi dapat ditaksir dari data sampel. Teorema 4
Obj248
Untuk sampling kelompok adalah penaksir tak bias dari
Obj249
Akibat Teorema 4
Obj250
Penaksir tak bias dari variansi adalah:
Obj251
Obj252
Sehingga penaksir tak bias dari variansi adalah:
Obj253
Obj254
Penaksir tak bias dari simpangan baku adalah:
14
Obj255
Obj257 Obj256
Penaksir tak bias dari simpangan bakuadalah: Interval Kepercayaan
Obj272 Obj271 Obj270 Obj269 Obj268 Obj267 Obj266 Obj265 Obj264 Obj263 Obj262 Obj261 Obj260 Obj259 Obj258
Taksiran selang (interval) suatu parameter populasi adalah suatu interval yang berbentuk dengan dan tergantung pada nilai statistik. Bila sampel berasal dari populasi normal atau bila tidak n cukup besar, selang kepercayaan untuk dapat dibuat dengan menggunakan distribusi sampel. Dari teorema limit pusat dikatakan jika sebuah populasi mempunyai rata-rata dan simpangan bakuyang besarnya berhingga, maka untuk ukuran sampel random n cukup besar berdistribusi rata-rata sampel mendekati distribusi normal dengan rata-rata dan simpangan baku . Menurut teorema ini, distribusi sampel dapat diharapkan secara hampiran berdistribusi normal dengan rataan dan simpangan baku . Dari teorema limit pusat diketahui bahwa:, dengan Z merupakan distribusi normal dengan rataan nol dan variansi satu.
Obj273
Rata-rata sampel diperoleh dari sampel berukuran n. Dari tabel normal diperoleh bahwa:
Obj274
Obj275
15
Obj283 Obj282 Obj281 Obj280 Obj279 Obj278 Obj277 Obj276
Suatu sampel random ukuran n diambil dari populasi dengan variansi yang diketahui dan rataan yang dihitung sehingga menghasilkan selang kepercayaan diberikan oleh: . Pada umumnya dalam praktek variansi populasi tidak diketahui, sehingga ditaksir dari data sampel. Taksiran dari adalah . Selang kepercayaan untuk rata-rata populasi pada sampling kelompok adalah:
Obj287 Obj286 Obj285 Obj284
, sebagai pendekatan dapat diambil: , dengan batas bawah kepercayaan untuk ratarata populasi dan merupakan batas atas kepercayaan untuk rata-rata populasi.
Obj288
Selang kepercayaanuntuk total populasi Y pada sampling kelompok adalah:
Obj289
Obj290
Sebagai pendekatan dapat diambil:
Obj291
Dari persamaan: batas bawah kepercayaan untuk total populasi dan
Obj292
batas atas kepercayaan untuk total populasi. Dalam penyelesaian soal yang diberikan pada skripsi ini menggunakan software Microsoft excel sebagai pendukung untuk mempercepat perhitungan. METODE PENELITIAN
16
Ruang Lingkupnya adalah regresi linier sederhana dan sampling acak kelompok, Objek penelitian adalah perbedaan antara penaksiran regresi linier dengan penaksiran pada sampling kelompok, Variabel/Fokus pembicaraan pada skripsi ini mengenai penaksiran variable dependen pada regresi linier sederhana dan berdasar rata-rata sampel kelompok. Kemudian penaksiran bias regresi linier, penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi linier sederhana.
Obj295 Obj294 Obj293
Taksiran berdasar regresi linier sederhana: , sedangkan berdasar rata-rata sample kelompok: . Penaksiran bias dari regresi linier sederhana .
Obj300 Obj299 Obj298 Obj297 Obj296
Untuk sampling kelompok variansi adalah penaksir takbias dari sehingga penaksir variansi rata-rata sampel pada sampling kelompok adalah , sedangkan variansi penaksir variansi regresi linier sederhana adalah .
Teknik dan Olah data Metode yang dipakai dalam penulisan skripsi adalah studi pustaka, merumuskan masalah, pengumpulan data, dan penyelesaian masalah. HASIL DAN PEMBAHASAN Regresi Linier Sederhana
Obj305 Obj304 Obj303 Obj302 Obj301
Sering dalam praktek orang diminta untuk memecahkan persoalan yang menyangkut sekelompok variabel bila diketahui bahwa diantara variabel tersebut terdapat suatu hubungan yang tidak terpisahkan. Variabel-variabel tersebut dinamakan variabel bebas dan variabel terikat atau respon. Hubungan antara variabel bebas dan respon yang dicocokkan pada data suatu percobaan, ditandai dengan persamaan prediksi yang disebut persamaan regresi. Bila y dan x masingmasing tunggal, persoalannya menjadi regresi y pada x. Rataan berkaitan linier
17
dengan x dalam bentuk persamaan linier populasi: , dengan dan merupakan dua parameter yang akan ditaksir dari data sampel. Bila taksiran untuk kedua parameter itu masing-masing dinyatakan dengan a dan b, maka bentuk persamaan garis regresi berdasarkan sampel adalah:.
Obj311 Obj310 Obj309 Obj308 Obj307 Obj306
Bila hanya terdapat satu x dan satu y maka data berbentuk pasangan pengamatan {(xi, yi) ; i= 1, 2, …, n}. Bila nilai x diatur, maka proses percobaan menetapkan atau memilih nilai-nilai xi terlebih dahulu dan kemudian mengamati nilai padananya yi . Bila dimisalkan bahwa semua rataan terletak pada satu garis lurus, tiap Yi dapat ditulis sebagai model regresi linier sederhana yaitu: , dengan E i merupakan variabel random yang mempunyai rataan nol. Setiap pasangan pengamatan (xi, yi) dalam sampel dengan distribusi normal, memenuhi hubungan: dengan: nilai yang dicapai Ei bila Yi berharga yi . Jika menggunakan persamaan regresi, estimasi dari y adalah , sehingga tiap pasangan pengamatan memenuhi: yi = a + bxi + ei , dengan yang disebut sisa.
Obj325 Obj324 Obj323 Obj322 Obj321 Obj320 Obj319 Obj318 Obj317 Obj316 Obj315 Obj314 Obj313 Obj312
Untuk memperkirakan a dan b digunakan metode kuadrat terkecil sehingga jumlah kuadrat dari simpangan antara observasi-observasi dan garis regresi menjadi minimum. Dengan menggunakan metode kuadrat terkecil maka sifat dari penaksir yang diperoleh adalah tak bias dan mempunyai variansi minimum: . Persamaan yi = a + bxi + ei dapat juga ditulis sebagai berikut: , dengan . Dan jumlah sisanya menjadi . Bila L diturunkan terhadap ai dan b, maka diperoleh: dan Penyederhanaan kedua persamaan tersebut di atas menghasilkan: dan , karena , maka dari dua persamaan di atas diperoleh: , sehingga Dan, sehingga . Penaksir Regresi Linier Sederhana
Obj327 Obj326
Penaksir terhadap karakteristik dari suatu populasi dapat dilakukan dengan menggunakan rata-rata sampel. Setelah suatu sampel dipilih dengan salah satu
18
metode sampling, kemudian dihitung rata-rata sampel
yang digunakan untuk
menaksir rata-rata populasi .
Obj329 Obj328
Pada bab pendahuluan telah disinggung salah satu alasan mengapa menggunakan metode penaksiran regresi linier, karena metode penaksiran regresi linier akan memberikan ketelitian yang lebih baik dibandingkan penaksiran dengan menggunakan rata-rata sampel . Hal ini akan dijelaskan pada sub bab 4.7 tentang efisiensi metode penaksiran regresi linier, dan akan diberikan contoh yang memperlihatkan bahwa penaksiran regresi linier memberikan ketelitian yang lebih baik dibandingkan penaksiran dengan menggunakan rata-rata sampel .
Obj336 Obj335 Obj334 Obj333 Obj332 Obj331 Obj330
Misalkan populasi terdiri dari N unit dengan harga (xi , yi), dimana xi >0, untuk . Dimisalkan bahwa xi dan yi masing-masing diperoleh untuk setiap unit dalam sampel dan rata-rata populasi dari xi diketahui. Penaksir regresi linier , ratarata populasi yi , didefinisikan sebagai: , dengan
menyatakan regresi linier
danpenaksir perubahan y bila x bertambah. Penaksir jumlah populasi Y, didefinisikan sebagai . Penaksir regresi linier dapat membantu menyelesaikan masalah penaksiran suatu parameter. Contoh 1: Tabel berikut ini menunjukkan jumlah penduduk (dalam ribuan) untuk setiap sample random dari 49 kota yang diambil dari populasi 196 kota. Misalkan xi menyatakan banyaknya penduduk pada tahun 1920 dan yi menyatakan banyaknya penduduk pada tahun 1930. Apabila jumlah penduduk tahun 1920. X diketahui yakni 22.919 jiwa. Berapakah perkiraan jumlah penduduk dari 196 kota tersebut pada tahun 1930? Jumlah seluruh penduduk yang sebenarnya pada tahun 1930 untuk 196 kota adalah 29.351 jiwa. xi 76 507 30
Yi 80 634 111
xi 2 87 29
Yi 50 105 50
Xi 243 67 121
yi 291 67 113
Xi 138 179 71
yi 143 260 79
19
381 44 25 61 56 36 78 136 36 48
464 58 57 69 142 46 106 139 54 75
50 43 120 64 298 172 38 45 46
64 61 115 77 317 183 52 53 65
256 37 64 43 93 40 74 60 46
288 63 63 50 104 64 93 57 53
23 77 94 387 40 161 66 116 50
48 89 85 459 60 232 86 130 58
Dari data tersebut diatas diperoleh:
Obj338 Obj337
x = 5.054 y = 6.262
=103,1 = 127,8
Obj339
n = 49
N = 196
X = 22.919
= 1,16
Penaksir regresi liniernya:
Obj340
= 127,1 + 1,16(116,9 – 103,1) = 144 jiwa. Taksiran total jumlah penduduk pada tahun 1930 untuk seluruh kota adalah:
Obj341
= (196)(144) = 28.224 jiwa Taksiran berdasarkan atas rata-rata sampel adalah:
Obj342
= (196)(127,8) = 25.048 jiwa Contoh 2: Sensus penduduk propinsi Jawa Tengah tahun 1980 versus tahun 1990. Misalkan xi menyatakan jumlah penduduk hasil sensus tahun 1980 dan yi menyatakan jumlah penduduk hasil sensus tahun 1980 yang diambil dari 15 kabupaten (dalam ribuan). Apabila jumlah penduduk hasil sensus tahun 1980, X
20
diketahui yakni 25.373 jiwa. Berapakah perkiraan jumlah penduduk hasil sensus tahun 1990? Jumlah seluruh penduduk yang sebenarnya pada tahun 1990 untuk 35 Kabupaten adalah 28.522 jiwa. Xi 1013 536 123 1027 976
Yi 1148 631 123 1251 1064
Xi 674 697 1100 652 1225
Yi 823 701 1239 700 1349
xi 706 556 700 600 935
yi 786 617 828 666 1016
Dari data tersebut diatas diperoleh:
Obj344 Obj343
x = 11.520
= 768 y = 12.942
= 862,8
Obj345
n = 15
N = 35
= 1,13 X = 25.373
Penaksir regresi liniernya:
Obj346
= 862,8 + 1,13(724,9 – 763) = 814 jiwa. Taksiran total jumlah penduduk pada tahun 1990 untuk seluruh kabupaten adalah:
Obj347
= (35)(814) = 28.490 jiwa. Taksiran berdasarkan atas rata-rata sampel adalah:
Obj349 Obj348
= N = (35)(862,8) = 30.198 jiwa Dari contoh diatas terlihat bahwa penaksir regresi linier memberikan ketelitian yang lebih baik bila dibandingkan dengan menggunakan rata-rata sampel.
Obj350
Penkasiran Regresi Linier dengan telah ditentukan lebih dahulu
21
Obj353 Obj352 Obj351
Meskipun dalam aplikasi, dihitung dari sampel, kadang-kadang bisa juga untuk memilih lebih dahulu. Dalam sampling berulang, perhitungan sebelumnya dapat memperkirakan bahwa nilai hampir konstan. Teorema 4.3.1
Obj354
Pada sampling kelompok, dimana bo adalah konstan yang ditentukan lebih dahulu, penaksir regresi liniernya adalah: adalah tak bias, dengan variansinya adalah:
Obj355
Bukti: Setelah diketahui persamaan regresi liniernya dan b0 konstan pada penarikan sampel berulang maka diperoleh:
Obj356
Obj360 Obj359 Obj358 Obj357
Jadi menurut teorema 1 pada bahasan tentang sifat-sifat penaksir yang mengatakan bahwa jika tanpa pengembalian dan dengan pengembalian . Ini berarti adalah penaksir tak bias dari.
Obj362 Obj361
Dengan dan , sehingga menurut teorema 2 diperoleh:
Obj363
22
Obj364
Obj365
Obj366
Obj367
Salah satu tujuan dari penaksiran adalah untuk meningkatkan ketelitian atau meminimumkan variansi. Nilai minimum bila:
Obj368
,
Obj370 Obj369
b0 disebut sebagai koefisien regresi linier dari y pada x dalam populasi terbatas. Nilai variansi minimumnya adalah: , dengan adalah koefisien korelasi antara y dan x.
Obj374 Obj373 Obj372 Obj371
Dari teorema 4.3.2 terlihat bahwa variansi dari penaksir regresi linier akan minimum jika . Dari persamaan , jika = 0, maka tidak terdapat hubungan linier antara variabel x dan y dan variansi dari penaksir regresi linier sama dengan penaksir pada sampling acak kelompok, tetapi jika = 1, maka terdapat hubungan linier sempurna antara variabel x dan y, dan variansi dari penaksir regresi linier besarnya nol. Ini berarti titik-titik sampel (xi, yi) terletak pada garis lurus yang menghubungkan antara variabel x dan y.
Obj375
23
Penaksiran regresi linier jika dihitung dari sampel Dari teori regresi linier diketahui bahwa penaksir sampel yang efektif adalah dengan metode kuadrat terkecil dari B, yaitu:
Obj376
Dengan: xi = x1 , x2 , …, xn dan yi = y1 , y2 , …, yn adalah nilai sampel. Teorema 4.3.3
Obj379 Obj378 Obj377
Jika adalah penaksir kuadrat terkecil dari B dan pada sampling acak kelompok berukuran n, dengan n besar, maka:
Obj380
dengan adalah koefisien korelasi antara y dan x. Taksiran Variansi dari Sampel
Obj382 Obj381
Rumus di atas dihitung berdasarkan pada nilai-nilai dari populasi. Sekarang akan dicari taksiran dari yang dihitung berdasarkan atas nilai-nilai dari sampel. Di atas diketahui bahwa rumus variansi regresi linier yang dihitung berdasarkan pada nilai-nilai dari populasi adalah:
Obj383
Obj385 Obj384
taksiran dari dinotasikan dengan, sehingga:
Obj386
24
Obj387
Bias Dari Penaksir Regresi Linier
Obj390 Obj389 Obj388
Pada umumnya penaksir regresi linier adalah suatu penaksir yang bias dari . Berikut ini akan dibahas bias dari penaksir regresi linier. Dari persamaan regresi linier diperoleh:
Obj391
Obj392
Obj394 Obj393
sehingga bias dari adalah Misalkan variabel ei didefinisikan sebagai:
Obj395
Obj396
dari persamaan diatas substitusikan ke persamaan , diperoleh:
Obj397
Obj398
25
Obj399
Obj400
sehingga ruas kanan persamaan diatas dimanipulasi didapatkan:
Obj402 Obj401
dan setelah itu kita masukkan ke kovariannya
Obj403
Obj404
Obj405
Obj406
karena , maka dari persamaan diatas diperoleh:
Obj407
Obj408
misalkan maka diperoleh:
Obj409
26
dari teorema 2.2.3 diperoleh:
Obj410
Obj411
Obj412
Suku ini merupakan komponen kuadaratik dari regresi linier y i pada xi . Jadi jika diplot yi dan xi mendekati linier, maka bias dari menjadi kecil. Efisiensi Metode Penaksiran Regresi Linier Efisiensi suatu penaksir hanya dapat dilakukan dengan membandingkan variansinya. Suatu penaksir dikatakan lebih efisien bilamana variansinya lebih kecil. Dalam hal ini akan dilihat efisiensi dari metode penaksiran regresi linier bila dibandingkan dengan penaksiran pada sampling kelompok, yaitu pada rata-rata populasinya. Dan juga akan dilihat persyaratan apakah suatu penaksir regresi linier memberikan ketelitian yang lebih baik. Untuk perbandingan ini ukuran sample n harus cukup besar sehingga pendekatan rumus untuk variansi regresi berlaku.
Obj415 Obj414 Obj413
Dari teorema 2.2.1 dan teorema 2.2.2 diperoleh bahwa adalah penaksir tak bias dari rata-rata populasi dan variansi dari didefinisikan sebagai:
Obj418 Obj417 Obj416
. Sedangkan dari teorema 4.3.3 diperoleh bahwa variansi dari adalah:
Obj424 Obj423 Obj422 Obj421 Obj420 Obj419
27
Penaksir regresi linier dikatakan lebih baik (efisien) dibandingkan penaksir pada sampling kelompok apabila Dari dua persamaan diatas diperoleh bahwa: . Dari persamaan ini terlihat bahwa: kedua variansi ini sama. Ini ekuivalen dengan mengatakan bahwa lebih efisien dibandingkan , kecuali . Jadi penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok. Apabila tidak ada hubungan linier antara variabel y dan x maka penaksir regresi linier sama dengan penaksir pada sampling kelompok. Contoh 1. Seorang pemilik perkebunan kopi membuat taksiran dengan melihat (tanpa ditimbang) berat kopi yang dihasilkan xi pada setiap pohon kopi dari N = 200. Dia memperoleh berat total X = 11.600. Dari suatu sampel acak yang terdiri atas 10 pohon kopi diperoleh hasil sebagai berikut: Nomor Pohon Berat sebenarnya yi Berat taksiran xi
1 2 3 4 5 6 7 8 9 10 61 42 50 58 67 45 39 57 71 53 59 47 52 60 67 48 44 58 76 58
Total 543 569
Data dasar yang dipunyai adalah sebagai berikut:
Obj426 Obj425
Dari data tersebut diatas maka diperoleh: 1. Penaksir varians regresi linier
Obj427
2. Penaksir varians rata-rata sampel
Obj428
Contoh 2: Data berikut menyatakan banyaknya penduduk dari suatu sampel acak terdiri dari 7 kota yang dipilih dari 28 kota. Misalkan xi menyatakan banyaknya penduduk pada tahun 1970 dan yi menyatakan banyaknya penduduk pada tahun
28
1980 (dalam ribuan). Bila diketahui total penduduk tahun 1970 yakni sebesar X = 3.273 xi (1970) yi (1980)
1 76 80
2 138 143
3 67 67
4 29 50
5 381 464
6 23 48
7 37 63
Data dasar yang dipunyai adalah sebagai berikut:
Obj429
Dari data diatas diperoleh: 1. Penaksir varians regresi linier
Obj430
2. Penaksir varians rata-rata sampel
Obj431
Dari contoh diatas terlihat bahwa variansi penaksir regresi linier lebih kecil dibandingkan penaksir rata-rata sampel. Interval kepercayaan Penaksir Regresi Linier
Obj436 Obj435 Obj434 Obj433 Obj432
Taksiran selang (Interval) suatu parameter populasi adalah suatu interval yang berbentuk dengan dan tergantung pada nilai statistik. Pada bab teori pendukung telah disinggung tentang interval kepercayaan dari sampling kelompok. Sekarang akan dibahas tentang interval kepercayaan dari penaksir regresi linier.
Obj440 Obj439 Obj438 Obj437
Dengan dasar bahwa interval kepercayaan untuk rata-rata populasi pada sampling kelompok adalah:. Dari teorema 4.3.3 diketahui bahwa variansi dari
29
penaksir regresi linier untuk sampel berukuran n dengan n besar adalah: , selang kepercayaan 100 % untuk rata-rata populasi dari penaksir regresi linier adalah:
Obj441
Sebagai pendekatan yang diambil:
Obj442
Obj444 Obj443
batas bawah kepercayaan untuk rata-rata populasi dari penaksir regresi linier dan batas atas kepercayaan untuk rata-rata populasi dari penaksir regresi linier. SIMPULAN DAN SARAN Simpulan Dari hasil pembahasan diatas diperoleh kesimpulan sebagai berikut:
Obj446 Obj445
1. Jika adalah penaksir kuadrat terkecil dari B, maka besarnya variansi dari penaksir regresi linier pada sampling kelompok dengan sampel berukuran besar adalah , ini merupakan variansi minimum dari penaksir regresi linier.
Obj447
2. Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias ini akan menjadi kecil jika hubungan antara xi dan yi mendekati linier.
Obj449 Obj448
3. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok karena kecuali . Saran
30
1. Pada penulisan skripsi ini secara teoritis hanya ditunjukkan hubungan mengenai xi dan yi sedangkan bagaimana garis yang menghubungkan antara xi dan yi perlu penelitian lebih lanjut. 2. Pada penulisan skripsi ditunjukkan secara teoritis dan sofware Microsoft excel bahwa penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok dan ini perlu penelitian lebih lanjut tentang studi empiris dengan menggunakan sofware komputer yang lain. Hal ini dimaksudkan untuk lebih mendalami dan menghayati tentang hasil-hasil yang diperoleh secara lebih baik. DAFTAR PUSTAKA Cochran, W.G. 1991. Sampling Tecniques. ( Terjemahan Rusdiansyah ). Jakarta: UI. Darwis, Sutawanir. 1986. Buku Materi Pokok Survei Sampel 1-10. Jakarta: Karunika. Djarwanto. 1993. Statistik Induktif. Yogyakarta: BPFE. Hines, W.W. and Montgomery, D.C. 1990. Probability and Statistics in Engineering and Management Science ( Terjemahans Rusdiansyah ). Jakarta: UI. Sembiring, R.K. 1995. Analisis Regresi. Bandung: ITB. Supranto, J. 1986. Pengantar Probabilitas dan Statistik Induktif. Jakarta: Erlangga. Walpole, R.E. and Myers R.H. 1972 Probability and Statistics for Engineering and Scientists. ( Terj. Sembiring ). Bandung: ITB. Sugiarto, Dergibson Siagan, Lasmono Tri Sunaryanto dan Oetomo, Denny S.2001. Teknik Sampling, Jakarta: PT Gramedia Pustaka Utama. Sudjana. 1996. Metode Statistika. Bandung: Tarsito. Sukatmi, Pandurang V and Balkrishna.1970. Sampling Theory of Surveys with Applications, USA: Lowa State University Press. Supranto, J. 2001. Statistik Teori dan Aplikasi. Jakarta: Erlangga. Supranto, J.2000. Teknik Sampling Untuk Survey dan Eksperimen, Jakarta: PT Rineka Cipta.