Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
Tugas Matakuliah Probabilitas & Stokastik by Arif Rahman Hakim - Monday, December 14, 2015 http://arif.staf.akademitelkom.ac.id/index.php/2015/12/14/tugas-mtakuliah-probabilitas-stokastik/ MAKALAH PROBABILITAS & STOKASTIK
MATERI : REGRESI
NAMA : ARIF RAHMAN HAKIM NIM
: 13140093
KELAS : TEL-13-03 Pendahuluan
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan variabel(-variabel) yang lain. Variabel "penyebab" disebut dengan bermacammacam istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak. Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan prediksi dan ramalan, dengan penggunaan yang saling melengkapi dengan bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami variabel bebas mana saja yang berhubungan dengan variabel terikat, dan untuk mengetahui bentuk-bentuk hubungan tersebut.
1 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
Pokok Bahasan REGRESI
1. Pengertian regresi Istilah regresi pertama kali diperkenalkan oleh Sir Francis Galton pada tahun 1886. Galton menemukan adanya tendensi bahwa orang tua yang memiliki tubuh tinggi memiliki anak-anak yang tinggi, orang tua yang pendek memiliki anak-anak yang pendek pula. Kendati demikian. Ia mengamati bahwa ada kecenderungan tinggi anak cenderung bergerak menuju rata-rata tinggi populasi secara keseluruhan. Dengan kata lain, ketinggian anak yang amat tinggi atau orang tua yang amat pendek cenderung bergerak kearah rata-rata tinggi populasi. Inilah yang disebut hokum Golton mengenai regresi universal. Dalam bahasa galton, ia menyebutkan sebagai regresi menuju mediokritas. Hukum regresi semesta (law of universal regression) dari Galton diperkuat oleh temannya Karl Pearson, yang mengumpulkan lebih dari seribu catatan tinggi anggota kelompok keluarga. Ia menemukan bahwa rata-rata tinggi anak laki-laki kelompok ayah (yang) pendek lebih besar dari pada tinggi ayah mereka, jadi “mundurnya” (“regressing”) anak laki-laki yang tinggi maupun yang pendek serupa kea rah rata-rata tinggi semua laki-laki. Dengan kata lain Galton, ini adalah “kemunduran kea rah sedang”. Secara umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan satu variabel dependen (terikat) dengan satu atau lebih variabel independent (variabel penjelas/bebas), dengan tujuan untuk mengestimasi dan/ atau memprediksi rata-rata populasi atau niiai rata-rata variabel dependen berdasarkan nilai variabe! independen yang diketahui. Pusat perhatian adalah pada upaya menjelaskan dan mengevalusi hubungan antara suatu variabel dengan satu atau lebih variabel independen. Hasil analisis regresi adalah berupa koefisien regresi untuk masing-masing variable independent. Koefisien ini diperoleh dengan cara memprediksi nilai variable dependen dengan suatu persamaan. Koefisien regresi dihitung dengan dua tujuan sekaligus : Pertama, meminimumkan penyimpangan antara nilai actual dan nilai estimasi variable dependen; Kedua, mengoptimalkan korelasi antara nilai actual dan nilai estimasi variable dependen berdasarkan data yang ada. Teknik estimasi variable dependen yang melandasi analisis regresi disebut Ordinary Least Squares (pangkat kuadrat terkecil biasa). Adakalanya, setelah kita memperoleh data berdasarkan sampel, kita ingin menduga nilai dari suatu variabel Y yang bersesuaian dengan nilai tertentu dari variabel X. Hal ini diperoleh dengan menaksir nilai Y dari kurva kuadrat minimum yang sesuai dengan data yang kita himpun dari sampel. Kurva yang diperoleh dan kita bentuk dari data sampel itu disebut kurva regresi Y terhadap X, karena Y diduga dari X. (Murray R. Spiegel). Dalam melakukan analisis regresi, sebagian besar mahasiswa biasanya tidak melakukan pengamatan populasi secara langsung. Hal itu dilakukan selain pertimbangan waktu, tenaga, juga berdasarkan pertimbangan biaya yang relatif besar jika melakukan pengamatan terhadap populasi. Dalam hal ini, lazimnya digunakan persamaan regresi linier sederhana sampel sebagai penduga persamaan regresi linier sederhana populasi dengan bentuk persamaan seperti berikut : y = a + bX. Dan karena antara Y dan X
2 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
memiliki hubungan, maka nilai X dapat digunakan untuk menduga atau meramal nilai Y. X dinamakan variabel bebas karena variabel ini nilai-nilainya tidak bergantung pada variabel lain. Dan Y disebut variabel terikat juga karena variabel yang nilai-nilainya bergantung pada variabel lain. Hubungan antar variabel yang akan dipelajari disini hanyalah hubungan linier sederhana, yakni hubungan yang hanya melibatkan dua variabel (X dan Y) dan berpangkat satu. (Iqbal Hasan). Regresi sederhana, adalah bentuk regresi dengan model yang bertujuan untuk mempelajari hubungan antara dua variabel, yakni variabel independen (bebas) dan variabel dependen (terikat). Jika ditulis dalam bentuk persamaan, model regresi sederhana adalah y = a + bx, dimana, y adalah variabel takbebas (terikat), X adalah variabel bebas, a adalah penduga bagi intercept (?), b adalah penduga bagi koefisien regresi (?). Atau dengan kata lain ? dan ? adalah parameter yang nilainya tidak diketahui sehingga diduga melalui statistik sampel. (Sambas dan Maman) Menurut kelaziman, dalam ilmu statistika ada dua macam hubungan antara dua variabel yang relatif sering digunakan, yakni bentuk hubungan dan keeratan hubungan. Bentuk hubungan bisa diketahui melalui analisis regresi, sedangkan keeratan hubungan dapat diketahui dengan analisis korelasi. Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan baik, atau untuk mengetahui bagaimana variasi dari beberapa variabel independen mempengaruhi variabel dependen dalam suatu fenomena yang komplek. Jika X1, X2, …., Xn, adalah variabel-variabel independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X dan Y, dimana variasi dari X akan diiringi pula oleh variasi dari Y. Jika dibuat secara matematis hubungan itu dapat dijabarkan sebagai berikut: Y = f(X1, X2, ….., Xn, e), dimana Y adalah variabel dependen (tak bebas), X adalah variabel independen (bebas) dan e adalah variabel residu (disturbace term). Berkaitan dengan analisis regresi ini, setidaknya ada empat kegiatan yang lazim dilaksanakan yakni : (1) mengadakan estimasi terhadap parameter berdasarkan data empiris, (2) menguji berapa besar variasi variabel dependen dapat diterangkan oleh variasi independen, (3) menguji apakah estimasi parameter tersebut signifikan atau tidak, dan (4) melihat apakah tanda magnitud dari estimasi parameter cocok dengan teori. (Moh. Nazir). Hubungan antar variabel dapat berupa hubungan linier ataupun hubungan tidak linier. Misalnya, berat badan orang dewasa sampai pada tahapraf tertentu bergantung pada tinggi badan, keliling lingkaran bergantung pada diameternya, dan tekanan gas bergantung pada suhu dan volumenya. Hubunganhubungan itu bila dinyatakan dalam bentuk matematis akan memberikan persamaan-persamaan tertentu. Untuk dua variabel, hubungan liniernya dapat dinyatakan dalam bentuk persamaan linier, yakni: Y = a + bX. Hubungan antara dua variabel pada persamaan linier jika digambarkan secara (scatter diagram), semua nilai Y dan X akan berada pada suatu garis lurus. Dan dalam ilmu ekonomi, garis itu dinamakan garis regresi
1. Kegunaan regresi Kegunaan regresi antara lain :
3 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
Regresi dalam statistika dalah salah satu dari metode melakukan evaluasi serta hubungan antara variable dependen dengan satu atau lebih variable independen. Sebagai manusia yang serba ingin tahu,maka ramalan tentang apa yang akan terjadi dimasa depan adalah sesuatu yang menarik.Dalam ilmu sosial, ramalan ini bias dilakukan dengan menggunakan analisis regresi.Selain melakukan ramalan, regresi juga dapat digunakan untuk:
1. Menandai (characterized) hubungan antara variable bebas dan terikat dengan menentukan jangkauan,arah dan kekuatan dari hubungan tersebut. 2. Mencari sebuah formula kuantitatif atau persamaan untuk mendeskripsikan variable dependen Y sebagai fungsi dari variabel-variabel independen X3. Mendeskripsikan secara kualitatif ataupun kuantitatif hubungan antara X dan Y dengan tetap mengontrol efek dari variabel yang lain yang tidak diinginkan. 3. Menentukan yang mana di antara beberapa variable independen yang penting dalam mendeskripsikan atau memprediksi variable dependen. 4. Menentukan model matematis yang paling tepat untuk mendeskripsikan hubungan antara variable dependen dengan satu atau lebih variable independen 5. Menilai efek dari interaksi antara dua atau lebih variable independen. 6. Memperoleh kesahihan dan perhitungan yang tepat terhadap satu atau lebih koefisien regresi.
Jenis-jenis regresi
Pada perkembangannya sejalan dengan kemajuan di bidang keilmuan statistika dan bidang komputer, perhitungan analisis regresi menjadi sangat bervariasi dan lebih spesifik menjawab berbagai permasalahan, beberapa diantaranya adalah : Regresi Linier Sederhana. Analisis Regresi Linier Sederhana digunakan untuk sebuah variabel dependen dan sebuah variabel independen Regresi Linier Berganda Pengertian Regresi Linier Berganda merupakan pengembangan dari regresi linear sederhana dan yang membedakannya adalah jumlah variabel independen pada uji regresi berganda adalah lebih dari satu
4 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
variabel. Regresi Variabel Dummy Hal khusus dari uji regresi variabel dummy adalah jika data variabel independen ada yang berjenis data nominal. Regresi Ordinal Pada Regresi Ordinal ciri khususnya adalah jenis data pada variabel dependen berjenis ordinal.
Regresi Logistik Analisis Regresi Logistik memiliki ciri khas pada data variabel dependen yang berjenis nominal. Regresi Polinomial Regresi Polinomial merupakan model regresi non linier, contohnya regresi polinom pangkat 2 atau 3.
Contoh Soal Regresi CONTOH SOAL : 1. Diketahui suatu penelitian terhadap hubungan antara nilai biaya periklanan dengan tingkat penjualan dari sebuah koperasi adalah sebagai berikut : (dalam ribuan rupiah)
Biaya periklanan 50 51 52 53 54
Tingkat Penjualan 40 46 44 55 49
1. Tentukan persamaan regresinya
5 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
2. Berapa besarnya koefisien korelasi dan koefisien determinasinya ? 3. Berapa besarnya kesalahan standar estimasinya ? 4. Dengan tingkat signifikasi 10%, ujilah hipotesis yang menyatakan bahwa hubungan antara biaya periklanan dan tingkat penjualan sedikitnya 40%!
Jawab : 1. Menentukan persamaan regresinya Langkah 1 : Menentukan variable X dan variable Y. Dalam soal ini variable biaya periklanan merupakan variable X dan tingkat penjualan merupakan variable Y. Langkah 2 : Membuat table regresi sederhana
Periklanan (X) 50 51 52 53 54 260
Tkt. Penjualan (Y) 40 46 44 55 49 234
(X)2 2500 2601 2704 2809 2916 13530
(Y)2 1600 2116 1936 3025 2401 11078
(XY) 2000 2346 2288 2915 2646 12195
6 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
Langkah 3 : Menentukan koefisien a dan koefisien b b = n ?XY – ?X.?Y n ?X2 – (?X2) = 5 (12195) –(260)(234) 5 (13530) – (260)2 = 2,7 a = ?Y – b ?X n = {(234) – 2,7 (260)} / 5 = -93,6
Langkah 4: Menentukan persamaan regresi linier sederhana Y = a + b (X) Maka persamaan regresi dalam soal ini adalah : Y = -93,6 + 2,7 (X)
1. Menentukan besarnya koefisien korelasi dan koefisien determinasi Koefisien korelasi :
7 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
r = n (?X 1. Y) – (?X) (?Y)[ n (?X2) – (?X2)]1/2 [ n (?Y2) – (?Y)2]1/2 = 5(12195) – (260) (234)[ 5 (13530) – (260)2] 1/2 [ 5 (11078) – (234)2]1/2 = 0,76
1. Menentukan besarnya kesalahan standar estimasi Se = ?Y2 – a ?Y – b ?XY)n-2 = ?( 11078 - (-93,6) (234) – (2,7) (1915)) 5 -2 = 4,24 1. Pengujian Hipotesis 2. Tentukan Ho dan Ha Ho : ? ? 0,4 Ha : ? <> 2. Uji hipoteis 1 arah 3. Tingkat signifikan alpha = 0,1 4. Wilayah kritis t () db = n – 2 = 5-2 = 3 t (0,1 ; 3) = 1,638
5. Nilai hitung Sb = Se / ? ((?X2) – ((?X)2 / n) = 4,24 / ?(13530 – (260)2 / 5) = 1,342 t hitung = b – ? / Sb = 2,7 - 0,4 / 1,342 = 1,714
8 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
6. Keputusan : terima Ho, tolak Ha 7. Kesimpulan : Pendapat yang menyatakan bahwa hubungan biaya periklanan dengan tingkat penjualan lebih kecil (<) dari 0,4 adalah benar, dimana biaya mempengaruhi tingkat penjualan sebesar 57.76%
RANGKUMAN Analisis Regresi berbeda dengan analisis Korelasi. Jika analisis Korelasi digunakan untuk melihat hubungan dua variable, maka analisi Regresi digunakan untuk melihat pengaruh variable bebas terhadap variable tergantung serta memprediksi nilai variable tergantung dengan menggunakan variable bebas. Dalam analisis Regresi variable bebas berfungsi untuk menerangkan, sedangk an variabel tergantung berfungsi sebagai yang diterangkan.Untuk mengumpulkan data dari waktu ke waktu kita dapat menggunakan deret berkala metode semi average.
DAFTAR PUSTAKA
William H. Kruskal and Judith M. Tanur, ed. (1978), "Linear Hypotheses," International Encyclopedia of Statistics. Free Press, v. 1, Evan J. Williams, "I. Regression," pp. 523–41. Julian C. Stanley, "II. Analysis of Variance," pp. 541–554. Lindley, D.V. (1987). "Regression and correlation analysis," New Palgrave: A Dictionary of Economics, v. 4, pp. 120–23. Birkes, David and Yadolah Dodge, Alternative Methods of Regression. ISBN 0-471-56881-3 Chatfield, C. (1993) "Calculating Interval Forecasts," Journal of Business and Economic Statistics, 11. pp. 121–135. Corder, G.W. and Foreman, D.I. (2009).Nonparametric Statistics for Non-Statisticians: A Step-byStep Approach Wiley, ISBN 978-0-470-45461-9 Draper, N.R. and Smith, H. (1998).Applied Regression Analysis Wiley Series in Probability and Statistics Fox, J. (1997). Applied Regression Analysis, Linear Models and Related Methods. Sage Hardle, W., Applied Nonparametric Regression (1990), ISBN 0-521-42950-1 Meade, N. and T. Islam (1995) "Prediction Intervals for Growth Curve Forecasts," Journal of Forecasting, 14, pp. 413–430.
9 / 10
Tugas Matakuliah Probabilitas & Stokastik - 12-14-2015 by Arif Rahman Hakim - Coretan Arif - http://arif.staf.akademitelkom.ac.id
Cressie (1996) Change of Support and the Modiable Areal Unit Problem. Geographical Systems 3:159–180. S. Fotheringham, C. Brunsdon, and M. Charlton and Sandt Damanik Witwicky. (2002) Geographically weighted regression: the analysis of spatially varying relationships. Wiley.
_______________________________________________ PDF generated by Kalin's PDF Creation Station
10 / 10 Powered by TCPDF (www.tcpdf.org)