Korelasi dan Regresi Berikut ini akan diberikan contoh membuat program SPSS untuk masalah korelasi dan regresi. Contoh Korelasi Suatu percobaan dilakukan untuk melihat hubungan antara kesalahan yang dibuat pada suatu pekerjaan (mencocokkan gambar) dengan panjang waktu (detik) yang digunakan untuk menyelesaikan suatu pekerjaan. Data yang diperoleh adalah sebagai berikut: subjek # waktu(X) salah(Y) subjek # waktu(X) salah(Y)
1 285 11
2 599 9
3 1001 5
4 324 15
5 595 5
6 363 9
7 361 4
8 870 4
9 531 2
10 526 6
11 749 3
12 852 5
13 514 7
14 856 1
15 467 6
16 449 12
17 949 2
18 929 1
subjek # waktu(X) salah(Y)
19 776 1
20 348 10
21 507 13
22 640 5
23 474 4
24 497 11
25 953 1
26 575 7
subjek # waktu(X) salah(Y)
28 762 8
29 827 5
30 973 0
31 571 8
32 832 6
33 1352 1
34 813 2
35 603 5
subjek # waktu(X) salah(Y)
37 1357 2
38 1220 1
39 635 7
40 1105 5
41 242 15
42 371 8
43 951 1
44 1183 1
subjek # waktu(X) salah(Y)
46 977 1
47 411 12
48 989 2
49 930 1
50 519 5
51 85 9
52 434 7
53 10 3
27 1253 2 36 866 4 45 1184 7 54 708 2
subjek # waktu(X) salah(Y)
55 941 5
56 170 10
57 889 1
Buatlah program SPSS untuk mencari koefisien korelasi antara variabel X dan Y. Untuk membuat program SPSS-nya, buatlah 2 variabel yaitu variabel waktu dan salah, dan masukkanlah data Anda. Pilihlah menu Statistics, Correlate, dan Bivariate. Bentuk tampilannya seperti berikut ini.
Gambar 8.20
Keluaran dari SPSS adalah:
- - Correlation Coefficients
Salah
Waktu
Salah
Waktu
1.0000 ( 57) P=.
-. 7226 ( 57) P= .000
( 57) P= .000
1.0000 ( 57) P= .
-. 7226
(Coefficient / (Casses) / 2-tailed Significance "." is printed if a coefficient cannot be computed
Analisisnya kira-kira sebagai berikut. Variabel waktu dan kesalahan koefisien korelasinya negatif; r = -0,7226 dengan peluang 0,000 (hipotesis nolnya "tidak ada korelasi antara waktu dan kesalahan" atau H0: ρ = 0).
Karena ρ = 0,000 < 0,05 maka hipotesis nol ditolak secara signifikan untuk α= 0,05. Tanda negatif menunjukkan bahwa semakin besar waktu yang digunakan maka akan semakin kecil kesalahan yang dibuat. Contoh Regresi Menggunakan data korelasi di atas, akan dicari persamaan regresinya dengan menggunakan SPSS. Untuk itu pilihlah menu Statistik, Regression dan Linear. Tampilannya adalah:
Gambar 8.21
Metode yang digunakan di sini adalah Enter. Anda dapat memilih metode lainnya yang Anda inginkan. Hasil dari perhitungannya adalah:
++++ MULTIPLE REGRESSION ++++ Listwise Deletion of Missing Data Equation Number 1 Block Number 1 . Method:
Dependent Variabel .. Enter WAKTU
SALAH
Variabel (s) Entered on Step Number 1.. WAKTU Multiple R R. Square Adjusted R Square Standard Error
. 72258 . 52213 . 51344 2. 71916
Analysis of Variance DF 1 55
Regression Residual F=
60.09351
Sum of Squares 444.32150 406.66096 Signif F =
.0000
----------------- Variabel in the Equation Variabel WAKTU (Constant)
B
End Blok Number
1
----------------
SE B
-. 009604 .00.239 12. 301417 .966245
Mean Square 444.32150 7.39384
Beta -. 722584 12.731
T -7.752 .0000
Sig T .0000
All requested variabels entered
Gambar 8.22
Tampak bahwa koefisien regresi menunjukkan r = 0,72258, yang nilainya agak berbeda sedikit dengan nilai r pada korelasi (r = 0,7226). Tapi jangan kuatir karena hal ini hanyalah pembulatan angka. Keluaran juga memberikan nilai R kuadrat, yaitu 0,52213. Angka ini menunjukkan bahwa variansi pada variabel kesalahan dapat dijelaskan oleh variabel waktu sebesar 52,213 persen. Sedangkan R adjusted adalah nilai R secara teoretis. Artinya semakin besar observasi yang dibuat maka akan semakin dekat nilai R observasi dan nilai R adjusted.
Kedua variabel waktu dan kesalahan mempunyai koefisien korelasi yang signifikan pada peluang 0,0000. Hal ini dapat dilihat pada nilai F = 60,09351 yang signifikan pada peluang 0,0000. Nilai koefisien korelasi keduanya signifikan pada peluang sebesar 0,0000. Untuk melihat hal itu, perhatikan nilai “sig T” untuk variabels in the equation. Persamaan regresinya adalah: Kesalahan = - 0,0096 Waktu + 12,3014
L AT IH AN Untuk memperdalam pemahaman Anda mengenai materi di atas, kerjakanlah latihan berikut! 1) Untuk data berikut ini 18 17 20 11 19
15 21 23 19 16
22 23 22 31
19 18 10 16
18 20 17 17
17 21 19 15
18 20 19 19
20 20 21 20
17 15 20 18
12 18 18 18
16 17 18 40
16 19 24 18
dengan menggunakan SPSS 1) Plot distribusi frekuensi (bukan yang digrupkan) data. 2) Buatlah histogramnya. 3) Buatlah distribusi frekuensi komulatifnya. 4) Buat juga ukuran keterpusatan dan ukuran sebaran data. 2) Dua macam pasta gigi dicobakan kepada dua kelompok anak-anak yang dipilih secara random. Anak-anak ini diminta menggosok gigi dengan menggunakan pasta gigi tersebut untuk jangka waktu 6 bulan. Pada akhir bulan ke-6 dari percobaan, peneliti menghitung jumlah gigi yang berlubang pada masing-masing anak. Data yang diperoleh adalah sebagai berikut:
Pasta gigi X
3
3
2
2
3
4
3
1
0
Pasta gigi Y
1
3
2
1
0
3
1
0
2
Lakukan uji-t dengan menggunakan SPSS, dan apa kesimpulan Anda? 3) Suatu penelitian dilakukan untuk melihat apakah "bila seseorang mentraktir temannya maka ia akan memesan makanan yang lebih murah dari pada teman yang ditraktirnya”? Selain itu, apakah ada perbedaan perilaku dalam memesan makanan kalau ditinjau dari jenis kelamin, baik yang mentraktir atau yang ditraktir? Data mengenai hal tersebut dikumpulkan di suatu restoran, dan hasilnya adalah: Yang Mentraktir Laki-laki 8,00 7,00 8,25 9,00 8,25
Perempuan 8,25 8,75 9,75 8,00 9,25
Yang Ditraktir Laki-laki 9,75 10,25 9,50 9,00 10,50
Perempuan 8,75 9,00 9,25 8,50 08,75
Lakukan analisis variansi 2 arah dengan menggunakan SPSS. Apa kesimpulan Anda? 4) Di suatu sekolah, para pelajar diminta untuk memprediksi nilai yang akan mereka peroleh pada15 mata pelajaran. Nilai taksiran tersebut lalu dibandingkan dengan nilai ujian yang mereka peroleh. Berikut ini diberikan data nilai taksiran dan data nilai yang sebenarnya. Tugas Anda adalah menentukan nilai koefisien korelasi serta persamaan regresi dengan memakai SPSS.
Nilai Taksiran
Nilai Aktual
3,5 3,2 2,8 3,3 3,2 3,2 3,6 4,0 3,0 3,1 3,0 3,3 3,2 3,4 3,7
3,4 2,9 2,6 3,8 3,0 2,5 3,9 4,3 3,8 3,4 2,8 2,9 4,1 2,7 3,9
Petunjuk Jawaban Latihan 1) 2) 3) 4)
Lihat contoh yang diberikan pada kegiatan belajar ini. Lihat contoh yang diberikan pada kegiatan belajar ini. Lihat contoh yang diberikan pada kegiatan belajar ini. Lihat contoh yang diberikan pada kegiatan belajar ini.
RA NG K UM A N Untuk menggunakan program SPSS pilihlah menu melalui icon yang tersedia. Setelah itu akan muncul gambar berbentuk matriks yang siap diisi oleh data. Seandainya akan membuka data yang sudah tersedia, pilih menu File lalu pilih menu Open. Setelah itu tentukan data yang akan Anda buka. Jangan lupa Save Data setelah selesai mengisi data ataupun mengubah data. Data deskiptif dapat Anda pilih dari menu Statistics. Di dalam menu Statistics terdapat lagi beberapa macam menu. Salah satunya adalah Summarizc yang di dalamnya terdapat menu Descriptive.
Uji-t digunakan untuk melihat ada tidaknya perbedaan nilai rata-rata dari dua kelompok data. Ada dua macam kelompok data: kelompok data yang saling bebas dan kelompok data yang berkaitan. Bila Anda ingin menguji nilai mean dari 3 buah sampel atau lebih, gunakan Anova satu arah. Untuk kasus seperti ini jangan gunakan uji-t, karena hasilnya belum tentu benar. Untuk menguji perbedaan nilai-nilai mean dari tiga kelompok atau lebih (dari satu variabel bebas) gunakanlah Analisis variansi 1 arah. Bila variabel bebasnya lebih dari l dan variabel tak bebasnya ada 2 atau lebih, maka pengujian nilai mean mereka menggunakan Analisis variansi Faktorial. Pada analisis Variansi Faktorial ini, peneliti dapat melihat ada atau tidaknya interaksi antara variabel tak bebas dengan variabel bebas.
T ES FO R M AT IF 2 Pilihlah satu jawaban yang paling tepat! 1) Untuk penelitian yang sama peneliti meminta 50 orang dewasa untuk menonton film yang disuguhkan dan meminta mereka menceritakan kembali kisah film tersebut. Peneliti juga mencatat berapa banyak katakata "dan kemudian..." disebut oleh mereka. Datanya adalah: 2) 10
12
5
8
13
10
12
8
7
11
11
10
9
9 7
11 16
15 9
12 1
17 4
14 11
10 12
9 7
8 9
15 10
16 3
10 11
14 14
8
12
5
10
9
7
11
14
10
15
9
Dengan menggunakan SPSS, 1) Plotlah distribusi frekuensinya (bukan yang digrupkan). 2) Buatlah histogramnya. 3) Buatlah frekuensi komulatifnya. 4) Buat juga ukuran keterpusatan dan ukuran sebaran data. 3) Dua perusahaan menawarkan program penurunan berat badan dengan program yang berbeda. Masing-masing program diikuti oleh 20 peserta. Pada akhir bulan ke-6 dari program penurunan berat, peneliti lalu mencatat jumlah berat yang berhasil diturunkan untuk setiap peserta yang mengikuti program secara tuntas. Data yang diperoleh adalah:
Program A
25
21
18
20
12
30
Program B
15
17
9
12
11
19
14
18
16
10
5
13
Jalankan uji-t dengan menggunakan SPSS. Apa kesimpulan Anda? 4) Seorang peneliti (Eysenck,1974) menyelidiki tentang "mengingat kembali materi yang diceritakan secara lisan"(variabel tak bebas). Hal ini dilihat dari dua sisi (variabel bebas) yaitu usia dan tingkat pemrosesan. Hipotesis yang ia miliki adalah materi yang diproses dengan lengkap oleh individu akan lebih mudah diingat. Selain itu ia juga berhipotesis bahwa orang yang berusia lanjut ingatannya lebih sedikit. Data penelitian yang melibatkan 50 responden dengan usia18-30 tahun (muda) dan 50 responden dengan usia 55 - 65 tahun (tua) adalah sebagai berikut.
Tua
Usia
Muda
Counting 9 8 6 8 10 4 6 5 7 7 8 6 4 6 7 6 5 7 9 7
Rhyming 7 9 6 6 6 11 6 3 8 7 10 7 8 10 4 7 10 6 7 7
Ingatan Adjective 11 13 8 6 14 11 13 13 10 11 14 11 18 14 13 22 17 16 12 11
Imagery 12 11 16 11 9 23 12 10 19 11 20 16 16 15 18 16 20 22 14 19
Interntion 10 19 14 5 10 11 14 15 11 11 21 19 17 15 22 16 22 22 18 21
Ujilah hipotesis riset yang dimiliki oleh peneliti menggunakan analisis variansi faktorial. Gunakan SPSS dengan tingkat kesalahan α = 5%. Apa kesimpulan Anda? 5) Berikut ini diberikan data nilai pekerjaan rumah (PR) yang dibuat oleh 20 orang siswa beserta data nilai ujian yang mereka peroleh (skala 0100). Buatlah program SPSS untuk mencari koefisien korelasi dan persamaan regresi. Nilai PR
Nilai ujian
50 60 80 70 90 40 100 85 90 80 50 95 40 80 85 95 70 40 80 30
75 75 90 80 85 60 98 95 95 80 75 90 60 50 70 85 75 60 80 55
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar. Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 2.
Tingkat penguasaan =
Jumlah Jawaban yang Benar Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali 80 - 89% = baik 70 - 79% = cukup < 70% = kurang Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%, Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang belum dikuasai.
Kunci Jawaban Tes Formatif Tes Formatif 1 1) Efek utama memberikan nilai F = 43,740 dengan df = 5 dan hasil ini signifikan dengan ρ = 0,00. Efek materi memberikan nilai F = 47,191 dengan df = 4 dan hasil ini signifikan dengan ρ = 0,00, sedangkan efek umur memberikan nilai F = 29,936 dengan df = 1 dan hasil ini signifikan dengan ρ = 0,00. Kalau kita ambil a = 0,05 maka 0,00 < 0,05 sehingga dapat dikatakan ada perbedaan dari perlakuan baik perlakuan materi ataupun jenis usia. Di samping itu, ternyata ada interaksi antara materi dengan usia, hal ini ditunjukkan oleh nilai ρ = 0,00 < 0,05. 2)
ˆ = 0,475 X + 43,155 dengan X adalah Y nilai Pek. Rumah
Tes Formatif 2 1. Penyelesaian Soal nomor 1: 1) Gambar distribusi frekuensi menurut SPSS adalah:
2) Gambar Histogram menurut SPSS:
3)
Menggambar frekuensi kumulatif menurut SPSS adalah dengan memilih menu Graph, Bar, Define dan Cum.n of cases. Bentuknya adalah:
4) Untuk membuat ukuran keterpusatan dan ukuran sebaran dapat dilakukan dengan 2 cara. Kalau Anda ingin memasukkan ukuran keterpusatan dan ukuran sebaran yang lengkap maka pilihlah Statistics, Summarizes, Frequencies. Kalau hanya ingin menampilkan nilai mean, standar deviasi ataupun variansi saja maka pilihlah Statistics Summarizes dan Descriptive. Berikut ini adalah tampilan yang diperoleh dengan memilih menu descriptive.
Number of valid observations (listwise) = 50.00 Variable
Mean
Std Dev
Variance
Range
Minimum
Maximum
KATA
10.20
3.40
11.59
16.00
1
17
SD
SE of Mean
2. t-tests for independent samples of PROG
Variable BERAT PROG A PROD B
Number of Cases Mean
6 12
19.3333 13.2500
8.140 4.093
Mean Difference = 6.0833 Levene's Test for Equality of Variances: F = 3.612 t-test for Equality of means Variances t-value df Equal 2.14 16 Unequal 1.72 6,30
2-Tail Sig .048 .133
SE of Diff 2.838 3.527
3.323 1.181
P = .076 95% CI for Diff (.065, 12.102) (-2.550, 14.716)
Uji variansi menunjukan bahwa tidak alasan untuk menyatakan bahwa kedua sampel mempunyai variansi yang berbeda. Hal ini dapat, dilihat dari nilai Levene's Test for Equality of Variance di mana F = 3,612 dangan peluang p = 0,076.Tampak bahwa nilai t-hitung adalah 2,14 dangan p = 0,04. Sehingga kesimpulannya adalah terdapat perbedaan antara program A dan Program B. Program B tampaknya lebih manjur karena dapat menurunkan berat badan lebih banyak dari program A.
3.
Penyelesaian Soal Nomor 3 ANALYSIS 0F VARIANCE by
INGAT JENIS USIA
UNIQUE sums of squares All effects entered simultaneously Sum of Mean source of Variation Squares DF Main Effects 1755.190 5 JENIS 1514.940 4 USIA 240.250 1 2-Way Interactions 190.300 4 JENIS USIA 190.300 4 Explainad 1945.490 9 Residual 22.300 90 Total 2667.790 99
Square 351.038 373.735 240.250 47.575 47.575 216.166 8.026 26.947
F 43.740 47.191 29.936 5.928 5.928 26.935
Sig of F .000 .000 .000 .000 .000 .000
100 cases were processed. 0 cases (.0 pct) were missing.
Ternyata ingatan bergantung pada USIA dan juga pada jenis kata yang harus diingat. Hal ini dapat dilihat dari mean efek untuk JENIS (F = 47,191 dengan peluang = 0,000) dan untuk USIA (F = 29,935 dengan peluang 0,000). Jadi, ada perbedaan ingatan untuk USIA tua dan muda. Ingatan berdasarkan jenis-jenis kata juga berbeda. SPSS juga memberikan nilai F = 5,928 dengan peluang = 0,000 untuk interaksi antara USIA dan JENIS. Hal ini menunjukkan bahwa ada interaksi antara JENIS kata yang harus diingat dengan USIA responden. Tampaknya untuk jenis kata tertentu USIA menentukan ingatan responden.
4.
Penyelesaian soal nomor 4. - - Correlation Coefficients - NIL_ PR
NIL_UJ
NIL_PR
1.0000 ( 20) P= .
.7383 ( 20) P= .000
NIL_UJ
.7383 ( 20) P= .000
1.0000 ( 20) P= .
(Coefficient / (Cases) / 2-tailed Significance) “.” is printed if a coefficient cannot be computed
Di bawah ini diberikan plot antara NIL_UJ prediksi dengan nilai sisa dalam bentuk nilai standar z.
Gambar Regression Standardized Residual
Koefisien korelasi antarnilai PR dan nilai Ujian adalah r = 0,7383. Nilai koefisien ini signifikan pada p = 0,0000. Sedangkan persamaan regresi yang dihasilkan adalah:
ˆ UJ = 0,5751 Nil_PR + 43,1556. Nil Nilai koefisien regresi 0,5751 signifikan pada peluang 0,0002 dan koefisien untuk konstanta 43,1556 signifikan pada peluang 0,0000. Nilai PR dapat menjelaskan variansi pada nilai Ujian sebesar 54,51 %. Informasi ini dapat dilihat pada R2. MULTIPLE REGRESSI0N Listwise Deletion of Missing Data Equation Number 1 Dependent Variable.. NIL_UJ Block Number 1. Method: Enter Variable (s) Entered on Step Number 1.. NIL_PR Multiple R R Square Adjusted R Square Standard Error
NIL PR
. 73832 . 54512 . 51985 9.70172
Analysis of Variance Regression Residual
DF 1 18
F =
Signif F =
21.57091
Sum of Squares 2030.32821 1694.22179
Mean Square 2030.32821 94.12343
.0002
------------------ Variables in the Equation -----------------Variable
B
SE B
NIL_PR (Constant)
.475097 43.155642
End Block Number 1
.102294 7.530918
T
Sig T
.738323
4.644 5.730
.0002 .000
All requested variables entered.
MULTIPLE Equation Number 1
Beta
REGRESSION
Dependant Variable..
NIL UJ
Residuals Statistics: Min
Max .
Mean
*PRED 57.4084 90.6654 76.6,500 *RESID -31.1634 11.4611 .0000 *ZPRED -1. 8614 1.3558 .0000 *ZRESID -3.2122 1.1813 .0000 Total Cases = 20 Hi-Res Chart # 1: Scatterplot of •zpred with *zpred
Std Dev 10.3373 9.4430 1.0000 . 9733
N 20 20 20 20
Daftar Pustaka Howel. D.C. (1989). Fundamental Statistics for the Behavioral Sciences. 2nd Ed. Boston: PWS-KENT Publishing Company. SPSS for Window Base System User’s Guide, Release 6.0. (1993). USA: SPSS Inc. Tabachnick. B.G & Fidell. L.S (1989). Using Multivariate Statistics. 2nd Ed. NewYork: Harper Collins Publishers, Inc.