PERTEMUAN 9-10 PENGUJIAN HIPOTESIS
Hipotesis adalah suatu pernyataan tentang parameter suatu populasi. Apa itu parameter? Parameter adalah ukuran-ukuran.
Rata-rata penghasilan karyawan di kota binjai adalah Rp. 1.000.000 (1 rata-rata) Terdapat perbedaan antara rata-rata gaji karyawan di kota binjai dan medan (2 ratarata) Proporsi mahasiswa di kaputama yang tidak suka ujian tutup buku lebih dari 50% (1 proporsi) Proporsi mahasiswa kaputama yang tidak suka ujian tutup buku lebih besar daripada perguruan tinggi lainnya (2 proporsi)
Apa itu proporsi? Proporsi adalah persentase dari kejadian yang diinginkan.
Pengujian hipotesis merupakan suatu prosedur yang didasarkan pada bukti sampel dan teori probabilitas yang digunakan untuk menentukan apakah suatu hipotesis adalah pernyataan yang beralasan atau tidak beralasan. Lima langkah prosedur yang dapat dijalankan dalam pengujian suatu hipotesis adalah : Langkah 1
:
Menyatakan hipotesis, hipotesis null (H0) dan hipotesis alternatif (H1)
Langkah 2
:
Memilih tingkat nyata atau level of significance (α)
Langkah 3
:
Merumuskan suatu aturan pembuatan keputusan
Langkah 4
:
Mengidentifikasi statistik uji
Langkah 5
:
Mengambil kesimpulan
Langkah 1 : Hipotesis Langkah awal adalah menyatakan hipotesis yang akan diuji, yaitu hipotesis null (H0) dan hipotesis alternatif (H1). Hipotesis nol ditulis H0, huruf H menyatakan hipotesis dan angka nol menyatakan tidak ada perbedaan. Hipotesis alternatif di tulis H1, dimana H1 kebalikan dari pernyataan H0.
Contoh :
Jika H0 : P = 100, maka H1 : P ≠ 100 Jika H0 : P ≤ 0,4, maka H1 : P > 0,4 Jika H0 : P ≥ 0, maka H1 : P < 0
Langkah 2 : tingkat nyata (α) Tingkat nyata atau level of significance (α) merupakan probabilitas menolak hipotesis null (H0) yang benar. Dengan kata lain, tingkat nyata (α) merupakan resiko kita menolak hipotesis null (H0) ketika H0 benar. α berkisar dari 0 sampai 1, tetapi pada umumnya α yang dipakai adalah 5% (0,05). Walaupun α = 1% dan 10% juga bisa digunakan, karena tidak ada aturan ataupun rumusan yang mengatur penentuan α. Langkah 3 : Kriteria keputusan Kita dapat menentukan kriteria penentuan H0 dan H1 atau daerah penentuan H0 dan H1. Ada 3 macam pengujian (tergantung pada nilai H1) yang menentukan bentuk daerah penerimaan H0 dan H1, yaitu : 1. Pengujian dua arah Jika H1 menyatakan tanda “tidak sama dengan” (≠), maka secara otomatis pengujian yang kita lakukan adalah pengujian dua arah. Dimana α akan dibagi dua. Daerah penerimaan H0
α/2
Daerah penolakan H0
1-α
α/2
H0 : P = 100
Daerah penolakan H0
2. Pengujian satu arah sebelah kanan Jika H1 menyatakan tanda “lebih besar” (>), maka secara otomatis pengujian yang kita lakukan adalah pengujian satu arah sebelah kanan. Dimana kita hanya menggunakan kurva bagian kanan saja di dalam pengujian. Daerah penerimaan H0
1-α
H0 : P ≤ 0,4
α
Daerah penolakan H0
3. Pengujian satu arah sebelah kiri Jika H1 menyatakan tanda “lebih kecil” (<), maka secara otomatis pengujian yang kita lakukan adalah pengujian satu arah sebelah kiri. Dimana kita hanya menggunakan kurva bagian kiri saja di dalam pengujian. Daerah penerimaan H0
α
Daerah penolakan H0
1-α
H0 : P ≥ 0
Bagaimana menentukan nilai yang memisahkan daerah penerimaan H0 dan H1 (biasanya disebut titik kritis). Kita harus menggunakan bantuan tabel distribusi normal (tabel Z) untuk sampel besar (n > 30 atau n1 + n2 > 30) dan tabel distribusi student (tabel t) untuk sampel kecil (n ≤ 30 atau n1 + n2 ≤ 30). Contoh : Misalkan α = 5% dengan pengujian 2 arah
5%/2
95%
2,5%
47,5%
Titik kritis
5%/2
47,5%
2,5%
Titik kritis
Untuk mencari titik kritis, gunakan tabel Z, kemudian carilah nilai Z yang ukuran luasnya mendekati 47,5% (0,475). Angka yang diperoleh adalah 1,645.
Langkah 4 : Pengujian statistik Pengujian statistik sangat dubutuhkan untuk dapat menentukan penerimaan H0 dan H1. Pengujian statistik merupakan penentuan suatu nilai uji berdasarkan informasi sampel yang digunakan untuk menerima atau menolak hipotesis nol. Adapun rumus umum untuk menghitung nilai pengujian statistik adalah : Z atau t = ( statistik sampel – parameter populasi ) / standar deviasi sampel
Langkah 5 : Kesimpulan Langkah terakhir adalah membuat keputusan untuk menerima atau menolak hipotesis nol. Jika nilai statistik uji jatuh di daerah penerimaan H0, maka H0 diterima dan H1 ditolak. Sebaliknya, apabila nilai statistik uji berada di daerah penolakan H0, maka H1 diterima dan H0 ditolak.
Contoh soal pengujian rata-rata populasi Contoh 1 : Produktivitas karyawan suatu perusahaan terdistribusi secara normal dengan rata-rata 200 dan berdeviasi standar 16. Bagian HRD tidak percaya dan menyatakan rata-rata produktivitas karyawan tidak sama dengan 200. Untuk membuktikannya, mereka mengambil sampel 100 karyawan untuk dianalisis dan diperoleh rata-rata sampelnya sebesar 203,5. Dengan α = 1%, ujilah pernyataan tersebut!
Langkah 1 : hipotesis H0 : produktivitas = 200 H1 : produktivitas ≠ 200 Langkah 2 : tingkat nyata (α) α = 1% (0,01) Langkah 3 : kriteria keputusan Pengujian 2 arah (karena H1 : produktivitas ≠ 200) Menggunakan tabel Z (karena sampel = 100)
0,5%
49,5%
-2,58
49,5%
0,5%
2,58
Luas 0,495 (49,5%) di tabel Z adalah ±2,58. Dengan demikian H0 diterima jika nilai statistik uji berada diantara nilai kritis. (-2,58 < nilai statistik uji < 2,58) Langkah 4 : pengujian statistik ̅− 203,5 − 200 = = = 2,19 16/√100 √ Langkah 5 : Kesimpulan Karena nilai statistik uji berada diantara nilai kritis (-2,58 < 2,19 < 2,58), maka H0 harus diterima dan H1 ditolak. Dengan demikian, tidak ada alasan bahwa produktivitas karyawan perusahaan tersebut adalah benar sebesar 200.
Contoh 2 : Sebuah hipotesis menyatakan bahwa rata-rata populasi adalah lebih dari 60. Untuk menguji kebenaran hipotesis tersebut, maka diambil 26 sampel untuk dianalisis. Diketahui rata-rata dan standar deviasi sampel adalah 57 dan 10. Ujilah dengan menggunakan alpha sebesar 1%!
Langkah 1 : Hipotesis H0 : rata-rata populasi ≥ 60 H1 : rata-rata populasi < 60 Langkah 2 : tingkat nyata (α) α = 1% (0,01) Langkah 3 : kriteria keputusan Pengujian 1 arah sebelah kiri (karena H1 : rata-rata populasi < 60) Menggunakan tabel t (karena sampel = 26)
1%
99%
-2,485
Untuk mencari nilai kritis, kita harus menggunakan tabel t. Dengan α = 1% (0,01) dan df = n-1 = 26-1 = 25, Maka nilai kritisnya adalah (t1%,25) : -2,485 Dengan demikian, H0 diterima jika nilai statistik uji > -2,485 Langkah 4 : pengujian statistik ̅− 57 − 60 = = = −1,53 10/√26 √
Langkah 5 : kesimpulan Karena nilai statistik uji (-1,53) > nilai kritis (-2,485), maka H0 harus diterima dan H1 ditolak. Dengan demikian, tidak ada alasan untuk menolak bahwa rata-rata populasi tidak lebih kecil dari 60.
Contoh 3 : Ada pendapat bahwa tidak ada perbedaan yang berarti antara gaji bulanan di perusahaan A dan B. Hasil interview terhadap sampel 50 karyawan A dan 50 karyawan B, dimana gaji ratarata karyawan perusahaan A adalah Rp. 92.000 dengan standar deviasinya sebesar Rp. 3.000, sedangkan karyawan perusahaan B dengan standar deviasi sebesar Rp. 40.000 memiliki ratarata gaji sebesar Rp. 89.000. Dengan alpha sebesar 5%, ujilah pendapat tersebut!
Langkah 1 : penentuan H0 dan H1 H0 : gaji karyawan perusahaan A = gaji karyawan perusahaan B H1 : gaji karyawan perusahaan A ≠ gaji karyawan perusahaan B Langkah 2 : penentuan tingkat nyata (α) α = 5% (0,05) Langkah 3 : kriteria keputusan Pengujian 2 arah Menggunakan tabel Z (karena sampel = 100, 50+50)
2,5%
-1,96
2,5%
1,96
Dengan α/2 = 2,5% maka luas 0,475 (47,5%) di tabel Z adalah ±1,96. Dengan demikian H0 diterima jika nilai statistik uji berada diantara nilai kritis. (-1,96 < nilai statistik uji < 1,96) Langkah 4 : menghitung nilai statistik uji ( ̅ − ̅ )−( − ) = = 0,5288 +
95%
μ1 - μ2 = 0 karena μ1 = μ2 Langkah 5 : membuat keputusan Karena nilai statistik uji berada diantara nilai kritis (-1,96 < 0,5288 < 1,96), maka H0 harus diterima dan H1 ditolak. Dengan demikian, tidak ada perbedaan yang signifikan antara gaji bulanan karyawan perusahaan A dan perusahaan B.
Contoh 4 : Diketahui : n1 = 5
n2 = 6
X1 = 4
X2 = 5
S12 = 8,5
S22 = 4,4
Dengan taraf nyata (α) = 10%, ujilah hipotesis yang menyatakan tidak ada perbedaan antara rata-rata populasi 1 dan 2!
Langkah 1 : hipotesis H0 : rata-rata populasi 1 = rata-rata populasi 2 H1 : rata-rata populasi 1 ≠ rata-rata populasi 2 Langkah 2 : tingkat nyata (α) α = 10% (0,1) Langkah 3 : kriteria keputusan Pengujian 2 arah (karena H1 : rata-rata populasi 1 ≠ rata-rata populasi 2) Menggunakan tabel t (karena sampel = 11)
5%
-1,833
90%
5%
1,833
Untuk mencari nilai kritis, kita harus menggunakan tabel t. Dengan α/2 = 5% (0,05) dan df = n1 + n2 - 2 = 11-2 = 9, Maka nilai kritisnya adalah (t5%,9) : ± 1,833 Dengan demikian, H0 diterima jika -1,833 < nilai statistik uji < 1,833 Langkah 4 : pengujian statistik − = ( − 1) + ( − 1) 1 1 − + −2 =
4−5
= −0,662 (5 − 1)8,5 + (6 − 1)4,4 1 1 + 5+6−2 5 6 Langkah 5 : kesimpuan Karena nilai statistik uji berada di antara titik kritis (-1,833 < -0,662 < 1,833), maka H0 harus diterima dan H1 ditolak. Dengan demikian, rata-rata populasi 1 dan 2 adalah sama.
PERTEMUAN 11-12 ANALYSIS OF VARIANCE (ANOVA) Anova digunakan untuk menguji hipotesis tentang perbedaan lebih dari 2 rata-rata populasi. Misalnya, kita ingin menguji apakah tidak ada perbedaan antara penghasilan rata-rata guru SD, SMP dan SMA. Pengujian Anova dibedakan menjadi dua, yaitu one way anova dan two way anova. Dimana one way anova hanya memperhitungkan satu faktor yang menyebabkan variasi, sedangkan two way anova memperhitungkan dua faktor yang menyebabkan variasi. Langkah pengujian One Way ANOVA 1. Penentuan Hipotesis H0 selalu menyatakan tidak ada perbedaan antara rata-rata beberapa populasi, sedangkan H1 menyatakan satu atau lebih rata-rata populasi tidak sama dengan rata-rata populasi lainnya. H0 : μ1 = μ2 = μ3 = ... = μn H1 : satu atau lebih μ tidak sama dengan μ lainnya 2. Penentuan Kriteria Keputusan Pengujian ANOVA menggunakan uji F dan juga tabel F.
Daerah penerimaan H0
α Daerah penolakan H0 Titik Kritis Titik kritis dicari dengan bantuan tabel F berdasarkan taraf nyata (α) dan derajat kebebasan (df). Kriteria keputusannya : H0 diterima jika Fratio < Ftabel. 3. Penentuan Pengujian Statistik Penghitungan Fratio biasanya menggunakan tabel Anova berikut ini : Sumber Sum of Square df Mean Square Fratio 2 Between n.∑(X-X) k-1 SSBC/df MSBC/MSR Columns Residual n.∑∑(Xit – Xi)2 n-k SSR/df Total 4. Pengambilan Kesimpulan Jika H0 diterima berarti kita menerima hipotesis yang menyatakan bahwa rata-rata populasi tidak berbeda. Jika H0 ditolak berarti kita menolak hipotesis yang menyatakan bahwa rata-rata populasi tidak berbeda.
Contoh : Sebuah penelitian ingin menguji apakah ada perbedaan produktivitas antara tiga merk mesin dengan mengambil sampel masing-masing 5 buah mesin dari setiap merk. Hasil analisis terhadap sampel memberikan informasi sebagai berikut : Mesin A Mesin B Mesin C 47 55 54 53 54 50 49 58 51 50 61 51 46 52 49 2 2 Rata = 49 Rata = 56 Rata2 = 51 Ujilah dengan taraf nyata 5% hipotsis yang menyatakan bahwa rata-rata produktivitas ketiga merk mesin adalah tidak berbeda! Jawab : 1. Hipotesis : H0 : μ1 = μ2 = μ3 H1 : satu atau beberapa μ berbeda dari μ lainnya 2. Kriteria Keputusan :
Daerah penerimaan H0
α = 5% Daerah penolakan H0 Titik Kritis F(α,df) = 3,89 Nilai 3,89 ditentukan pada tabel F pada α = 5%, df1 = 3-1 = 2 dan df2 = 3 (5-1) = 12. Berarti daerah penerimaan H0 adalah < 3,89. 3. Penghitungan statistik uji = .
−
= 5. [(49 − 52) + (56 − 52) + (51 − 52) ] = 130
= .
(
−
)
= (47-49)2 + (53-49)2 + ... + (49-51)2 = 94 SS df Between 130 2 Residual 94 12
MS 65 7,83
Fratio 8,3
4. Kesimpulan Karena Fratio lebih besar dari Ftabel (8,3 > 3,89), maka H0 ditolak. Oleh karena itu ada satu atau lebih rata-rata produktivitas mesin yang berbeda. CARA KEDUA X1 = 47 + 53 + 49 + 50 + 46 / 5 = 49 X2 = 55 + 54 + 58 + 61 + 52 / 5 = 56 X3 = 54 + 50 + 51 + 51 + 49 / 5 = 51 X = 49 + 56 + 51 / 3 = 52 VBS = VBS = 5 S12 =
(
)
(
)
(
)
= 65
∑
S12 = (47 - 49)2 + ... + (46 - 49)2 / 5-1 = 30/4 = 7,5 S22 = (55 - 56)2 + ... + (52 - 56)2 / 5-1 = 50/4 = 12,5 S32 = (54 - 51)2 + ... + (49 - 51)2 / 5-1 = 14/4 = 3,5 VWS = S12 + S22 + S32 / k VWS = 7,5 + 12,5 + 3,5 /3 = 23,5/3 = 7,83 F hitung = VBS / VWS = 65 / 7,83 = 8,30
Langkah pengujian Two Way ANOVA Pada dasarnya, langkah pengujian Two Way Anova sama dengan pengujian One Way Anova. Perbedaannya terletak pada perhitungan degree of freedom dan perhitungan Fratio. Degree of freedom (df) dihitung menggunakan rumus : df1 = k – 1 df2 = (k – 1)(n – 1) Contoh : Operator 1 2
Mesin A 53 47
Mesin B 61 55
Mesin C 51 51
46 52 49 3 50 58 54 4 49 54 50 5 Ujilah dengan taraf nyata 5%, apakah rata-rata produktivitas ketiga merk mesin tersebut tidak berbeda! Jawab : 1. Hipotesis : H0 : μ1 = μ2 = μ3 H1 : satu atau beberapa μ berbeda dari μ lainnya 2. Kriteria Keputusan :
Daerah penerimaan H0
α = 5% Daerah penolakan H0 Titik Kritis F(α,df) = 4,46 Nilai 4,46 ditentukan pada tabel F pada α = 5%, df1 = 3-1 = 2 dan df2 = (3-1)(5-1) = 8. Berarti daerah penerimaan H0 adalah < 4,46. 3. Penghitungan statistik uji : MS1 = SS1/(k-1) = 5[(49-52)2+(56-52)2+(51-52)2]/(3-1) = 130/2 = 65 Operator
Mesin A
Mesin B
Mesin C
1 2 3 4 5 Rata-rata Mesin
53 41 46 50 49
61 55 52 58 54
51 51 49 54 50
Rata-rata Operator 56 51 49 54 51
49
56
51
52
MS2 = SS2/(n-1) = 3[(55-52)2+(51-52)2+(49-52)2+(54-52)2+(51-52)2]/(5-1) = 72/4 = 18 Sebelum mencari nilai MSRes, dilakukan beberapa langkah sebagai berikut : a. Mencari nilai duga dengan rumus : = + − + − Operator 1
Mesin A 52
Mesin B 59
Mesin C 54
48 2 46 3 51 4 48 5 b. Mencari nilai residual dengan rumus : t = −
55 53 58 55
50 48 53 50
Operator Mesin A Mesin B 1 2 1 -1 0 2 0 -1 3 -1 0 4 1 -1 5 2 2 2 2 SSRes = 1 + 2 + (-3) + ... + 0 = 22 c. Mencari MRes dengan rumus : MSRes = SSRes/(n-1)(k-1) = 22/(5-1)(3-1) = 2,75
Antar Mesin Antar operator Residual Total
SS 130 72 22 224
df 2 4 8 14
Mesin C -3 1 1 1 0
MS 65 18 2,75
FRatio 23,6 6,5
4. Kesimpulan : Karena FRatio untuk antar mesin lebih besar dari pada Ftabel (23,6 > 4,48), maka H0 ditolak. Sehingga rata-rata produktivitas setiap mesin berbeda karena ada unsur operator. PERTEMUAN 13-14-15 ANALISIS REGRESI DAN KORELASI SEDERHANA
Analisis regresi sederhana membahas hubungan antara 2 variabel, yaitu variabel terikat (dependent variable) yg biasanya disimbolkan dengan huruf Y dan variabel bebas (independent variable) yg biasanya disimbolkan dengan huruf X. Analisis regresi merupakan suatu proses melakukan estimasi untuk memperoleh suatu hubungan fungsional antara variabel terikat dgn variabel bebas. Dimana persamaan regresi digunakan untuk memprediksi nilai Y untuk nilai X tertentu. Analisis regresi sederhana merupakan analisis regresi antara satu variavel terikat dgn satu variabel bebas. Adapun parameter lain yang digunakan untuk mempelajari hubungan antara dua variabel adalah analisis korelasi. Analisis ini meliputi pengukuran arah dan kekuatan suatu hubungan linier antara dua variabel. Arah dan kekuatan hubungan ini dinyatakan dalam koefisien korelasi.
Persamaan Regresi Sederhana Y’ = a + bX + e Dimana : Y’ : Variabel terikat a
: intersep
b
: koefisien
X
: variabel bebas
e
: error term
untuk mencari nilai intersep (a) dan koefisien (b) digunakan rumus berikut ini : =
atau =
(∑ )(∑ ) − (∑ )(∑ ∑ − (∑ ) ∑
− .
atau =
=
)
∑
− .
∑
Contoh :
− (∑ )(∑ ) ∑ − (∑ )
Salesman A B C D E
Test 4 7 3 6 10
Penjualan 5 12 4 8 11
Carilah persamaan regresi dengan metode least square berdasarkan data di atas. Salesman A B C
Test (X) 4 7 3
Penjualan (Y) 5 12 4
X2 16 49 9
Y2 25 144 16
XY 20 84 12
6 10 30
D E Jumlah
= =
∑ ∑
8 11 40
36 100 210
64 121 370
48 110 274
− (∑ )(∑ ) 5(274) − (30)(40) = = 1,133 ∑ 5(210) − (30) − (∑ )
− .
∑
=
40 30 − (1,133) = 1,202 5 5
Persamaan regresinya adalah : Y’ = 1,202 + 1,133 X + e
Standar Error of Estimate Untuk mengukur dispersi atau simpangan dari data aktual di sekitar garis regresi. Jika simpangan kecil maka garis regresi sangat mewakili data sebenarnya.
.
atau
.
=
=
∑
− −2
∑
− (∑ ) − (∑ −2
Contoh :
)
Carilah standar error of estimate dari data regresi di atas.
.
=
∑
− (∑ ) − (∑ −2
)
=
(864) − (5,25)(70) − (0,42)(1338) = 1,07 6−2
Asumsi Regresi Linier 1. 2. 3. 4.
Untuk setiap nilai X, terdapat suatu kelompok nilai Y yang terdistribusi normal. Rata-rata dari distribusi normal Y ini terletak pada garis linier regresi. Deviasi standar dari distribusi normal Y tersebut semuanya sama. Nilai-nilai Y bersifat independent (tidak saling tergantung) secara statistik. Artinya nilai Y yang dipilih untuk suatu nilai X tidak tergantung pada nilai Y untuk nilai X yang lain.
Korelasi Sederhana Bila regresi berusaha untuk memprediksi nilai suatu hubungan antar variabel, maka korelasi berusaha menghitung arah dan kekuatan hubungan antar variabel. Perbedaan antara regresi dengan korelasi adalah jika pada analisis regresi terdapat hubungan sebab akibat, maka pada korelasi tidak ada. Kekuatan dan arah hubungan antara 2 variabel diukur dengan koefisien korelasi. Koefisien korelasi bertanda + atau -, dengan angka kisaran dari -1 hingga +1. -1
0
Hubungan kuat
+1
Tidak ada hubungan
negatif sempurna
Hubungan kuat positif sempurna
Semakin mendekati +1, koefisien korelasi menunjukkan adanya hubungan yang positif dan kuat. Koefisien korelasi yang mendekati -1 menunjukkan hubungan yang negatif dan kuat. Jika koefisien korelasi mendekati 0, maka menunjukkan indikasi bahwa kedua variabel tidak memiliki hubungan. =
[ .∑
.∑
−∑
.∑
− (∑ ) ]. [ ∑
− (∑ ) ]
Jika dua variabel berkorelasi positif, maka kenaikan variabel satu akan diikuti kenaikan variabel lain dan penurunan variabel satu diikuti dengan penurunan variabel lain. Sedangkan korelasi negatif menunjukkan jika satu variabel naik maka variabel lain akan turun. Contoh : Hitunglah korelasi dari data regresi di atas. =
[ .∑
.∑
−∑
.∑
− (∑ ) ]. [ ∑
= 0,87
− (∑ ) ]
=
5(274) − (30)(40)
[5(210) − (30) ]. [5(370) − (40)
Nilai r = 0,87 menunjukkan bahwa antara nilai test dengan penjualan memiliki hubungan yang positif dan cukup kuat.
Koefisien Determinasi
Koefisien determinasi menunjukkan persentase fluktuasi atau variasi pada suatu variabel (Y) dapat dijelaskan atau disebabkan oleh variabel lain (X). Koefisien determinasi adalah koefisien korelasi yang dikuadratkan (r2). = 1−
atau
=
atau
∑( − ) ∑( − )
∑( − ) − ∑( − ∑( − )
=
.∑
)
+ .∑ − . ∑ − .
Hubungan Koefisien Korelasi, Koefisien Determinasi dan Standar Error of Estimate Untuk melihat hubungan ketiga elemen tersebut bisa dilihat melalui tabel ANOVA. Sumber Regression Error Total
Df 1 n-2 n-1
SS SSR SSE SST
MS SSR SSE/n-2 -
df
: Degree of freedom (derajat kebebasan)
SS
: Sum of Square
MS
: Mean of Square
SSR
: Sum of Square Regression (variasi yg bisa di jelaskan) = ∑( ′ − ) : Sum of Square Error (variasi yg tidak bisa dijelaskan) = ∑( − ′)
SSE
: SSR + SSE = ∑( − )
SST
Koefisien determinasi dapat dihitung dengan cara : =
= 1−
Standar Error of Estimate dapat dihitung dengan cara :
.
=
−2
Pengujian Validitas Koefisien Regresi dan Korelasi Pengujian Koefisien Regresi 1. Hipotesis H0 : β = 0 (tidak ada pengaruh) H1 : β ≠ 0 (terdapat pengaruh) 2. Taraf nyata α = 5 % (bisa 1 %, 5 % atau 10 %) 3. Kriteria keputusan H0 diterima jika pengujian ststiatik berada di antara nilai titik kritisnya. Daerah penerimaan H0
α/2
Daerah penolakan H0
1-α
α/2
Daerah penolakan H0
4. Pengujian statistik =
=
.
∑( − )
b : koefisien regresi Sb: standar deviasi dari koefisien regresi 5. Kesimpulan Bandingkan nilai tstat yang diperoleh dari pengujian statistik dengan nilai ttabel untuk titik kritisnya. Jika nilai tstat berada di antara nilai ttabel, maka H0 diterima yang berarti variabel X tidak signifikan mempengaruhi variabel Y secara statistik. Jika nilai t stat tidak berada di antara nilai ttabel, maka H0 ditolak yang berarti variabel X signifikan mempengaruhi variabel Y secara statistik.
Pengujian Koefisien Korelasi 1. Hipotesis H0 : ρ = 0 (tidak ada hubungan) H1 : ρ ≠ 0 (terdapat hubungan) 2. Taraf nyata α = 5 % (bisa 1 %, 5 % atau 10 %) 3. Kriteria keputusan H0 diterima jika pengujian ststiatik berada di antara nilai titik kritisnya.
Daerah penerimaan H0
α/2
Daerah penolakan H0
1-α
α/2
Daerah penolakan H0
4. Pengujian statistik √ −2 = √1 − 5. Kesimpulan Bandingkan nilai tstat yang diperoleh dari pengujian statistik dengan nilai ttabel untuk titik kritisnya. Jika nilai tstat berada di antara nilai ttabel, maka H0 diterima yang berarti variabel X tidak signifikan berhubungan dengan variabel Y secara statistik. Jika nilai tstat tidak berada di antara nilai ttabel, maka H0 ditolak yang berarti variabel X signifikan berhubungan dengan variabel Y secara statistik.
Analisis Regresi Berganda Model regresi beranda dengan 1 variabel dependent (Y) dengan n variabel independent (X) adalah : Y’ = a + b1X1 + b2X2 + ... + bnXn + e Jika jumlah n = 2 maka : Y’ = a + b1X1 + b2X2 + e Y’
: Nilai Y prediksi
X1
: Variabel bebas 1
X2
: Variabel bebas 2
A
: Intersep
b1, b2 : Koefisien regresi e
: Kesalahan prediksi
untuk membuat model regresi beranda dengan 2 variabel bebas di atas kita membutuhkan data variabel Y, X1, X2 dan parameter a, b1 serta b2 yang dapat diperoleh melalui rumus : = . + .
.
= .
= .
.
+
+
+ .
.
.
.
+
.
+
.
.
Subtitusi dan eliminasi ketiga rumus diatas sehingga akan menghasilkan nilai ketiga parameter tersebut. Sebaiknya gunakan berbagai program yang ada untuk memperoleh nilai ketiga parameter tersebut dengan lebih efisien. Contoh : Buat model regresi hubungan antara penjualan (Y) dengan biaya produksi (X1) dan biaya distribusi (X2) dengan data sebagai berikut : Tahun ke 1 2 3 4 5
Penjualan (jutaan) 5 12 4 8 11
Biaya promo (ratusan) 4 7 3 6 10
Biaya distribusi (ratusan) 2 5 1 4 6
Kita akan memperoleh persamaan sebagai berikut : Y’ = 3,5 – 0,975 X1 + 2,875 X2 b1 : - 0,975 menunjukkan hubungan negatif antara biaya promosi dengan penjualan dimana bila biaya promosi ditingkatkan seratus ribu maka akan menurunkan penjualan sebanyak 975 ribu. b2 : 2,875 menunjukkan hubungan positif antara biaya distribusi dengan penjualan dimana bila biaya distribusi meningkat seratus ribu maka akan menaikkan penjualan sebanyak 2,875 juta.
Analisis Korelasi Berganda Jika terdapat lebih dari satu variabel bebas (X > 1) maka akan ada dua jenis koefisien korelasi yang dapat kita hitung, yaitu koefisien korelasi berganda (suatu ukuran kekuatan hubungan antara variabel terikat dengan semua variabel bebasnya) dan koefisien korelasi parsial (menunjukkan kekuatan hubungan antara variabel teikat dengan salah satu variabel bebasnya dengan asumsi variabel bebas lainnya konstan). ry.x1x2 : koefisien korelasi berganda Y dengan X1 dan X2 ry.x1(x2) : koefisien korelasi parsial Y dengan X1 (X2 dianggap konstan) ry.x2(x1) : koefisien korelasi parsial Y dengan X2 (X1 dianggap konstan) .
=
.
( )=
.
( )=
.∑
+
−
.∑ ∑
. + − .
−
1−
1−
1−
1−
−
.
− .
−
Pengujian Validitas Regresi Berganda a. Global test (F test) Global test menguji kemampuan seluruh variabel X (X1, X2, ... , Xn) secara bersama-sama untuk menjelaskan perilaku variabel Y. Melalui global test inilah kita dapat mengetahui suatu model regresi berganda sudah valid atau sesuai keadaan sebenarnya atau tidak. 1. Hipotesis
H0 : β1 = β2 = ... = βn = 0 (tidak signifikan) H1 : tidak semua β ≠ 0 (signifikan) 2. Taraf nyata α = 5 % (bisa 1 %, 5 % atau 10 %) 3. Kriteria keputusan H0 diterima jika pengujian statistik lebih kecil dari nilai titik kritisnya. Daerah penerimaan H0
α = 5% Daerah penolakan H0 0
Titik Kritis F(α,df)
4. Pengujian statistik =
− −1 5. Kesimpulan Bandingkan nilai Fstat yang diperoleh dari pengujian statistik dengan nilai Ftabel untuk titik kritisnya. Jika nilai Fstat lebih kecil dari nilai Ftabel, maka H0 diterima yang berarti variabel X tidak signifikan menjelaskan pengaruh terhadap variabel Y secara statistik. Jika nilai Fstat lebih besar dari nilai Ftabel, maka H0 ditolak yang berarti variabel X signifikan menjelaskan pengaruh terhadap variabel Y secara statistik. b. Parsial test (t test) Parsial test untuk menguji kemampuan masing-masing variabel X untuk menjelaskan perilaku variabel Y. Dengan demikian, parsial test bertujuan untuk menguji validitas pada masing-masing koefisien regresi. 1. Hipotesis H0 : βn = 0 (tidak ada pengaruh) H1 : βn ≠ 0 (terdapat pengaruh) 2. Taraf nyata α = 5 % (bisa 1 %, 5 % atau 10 %) 3. Kriteria keputusan H0 diterima jika pengujian ststiatik berada di antara nilai titik kritisnya. Daerah penerimaan H0
α/2
1-α
α/2
Daerah penolakan H0
Daerah penolakan H0
4. Pengujian statistik =
=
.
∑( − )
b : koefisien regresi Sb: standar deviasi dari koefisien regresi 5. Kesimpulan Bandingkan nilai tstat yang diperoleh dari pengujian statistik dengan nilai ttabel untuk titik kritisnya. Jika nilai tstat berada di antara nilai ttabel, maka H0 diterima yang berarti variabel X tidak signifikan mempengaruhi variabel Y secara statistik. Jika nilai t stat tidak berada di antara nilai ttabel, maka H0 ditolak yang berarti variabel X signifikan mempengaruhi variabel Y secara statistik.