pembilang persamaan (23) adalah rataan jumlah kuadrat galat, N jumlah pengamatan dan M jumlah himpunan bagian. Penyebutnya merupakan fungsi nilai kompleks, dengan C(M) adalah nilai kompleksitas model yang berupa fungsi matriks fungsi basis berukuran MxN : C ( M ) = trace( B( BT B )−1 BT ) + 1 . (24) Model terbaik jika nilai GCV minimum. Model dari MARS dapat dinyatakan dalam persamaan : M
y = f ( x) = a0 + ∑ am Bm ( x)
(25)
m =1
dengan : y = peubah respon = konstanta regresi a0 am = parameter fungsi basis Bm ( x) = fungsi basis
4.4 Kolinearitas dalam MARS Kolinearitas dalam peubah prediktor adalah masalah pokok dalam pemodelan. Salah satu strategi pada MARS untuk mengatasi masalah ini dengan mengurangi secara langsung peubah yang akan dimasukkan ke dalam model. (Friedman dan Silverman, 1990) Hal ini akan mengurangi interaksi palsu yang diakibatkan oleh kolinearitas dan akan membuat pendugaan lebih stabil. Pengurangan peubah dapat disempurnakan dengan menambahkan nilai penalty pada lackof-fit (LOF) dalam pemilihan knot yang
dilakukan di algoritma tahap maju (forward stepwise). M ⎡ Km ⎞ ⎤ ⎛ LOF ( g ) = ⎢1 + γ I ⎜ v ∈ U {v ( k , m )}1 ⎟ ⎥ m =1 ⎝ ⎠⎦ ⎣ (26) Nilai (γ ) mengatur besarnya penalty dalam tahap memasukkan peubah baru dan dapat digunakan untuk mengatur lack-of-fit. 4.5 Verifikasi dan Validasi Model Verifikasi model digunakan untuk mengetahui kemampuan model dalam menjelaskan keragaman data. Validasi model digunakan untuk melihat keterandalan model tersebut dalam peramalan, yang biasa digunakan pada data bebas. Verifikasi model menggunakan kriteria R 2 dan R 2 adj, sedangkan validasi model menggunakan RMSE (Root Mean Square Error) dan MAE (Mean Absolut Error). ^ ⎛ ⎞ ⎜ yi − yi ⎟ ∑ ⎠ i =1 ⎝ n n
RMSE =
2
^ 1 n yi − yi ∑ n i =1 dimana : yi = nilai observasi ke-i
MAE =
(27) (28)
^
yi = nilai dugaan ke-i n = banyaknya observasi
V PEMBAHASAN Dari penelitian mengenai loyalitas pengguna produk shampo yang dilakukan oleh PT MARS terhadap masyarakat di Jakarta. Jumlah responden yang dapat diambil informasinya sebanyak 1007 orang. Bahan analisis yang digunakan dalam karya ilmiah ini sama dengan jumlah awal sebanyak 1007 data responden. Peubah respon yang digunakan adalah Y=1 menunjukkan responden berminat untuk berpindah merek dan Y=0 menunjukkan responden yang tidak berpindah merek. Peubah penjelas yang digunakan adalah faktor budaya, faktor sosial, faktor pribadi, dan faktor jumlah merek. Peubah-peubah penjelas tersebut antara lain : X 1 = Usia responden (AGE)
X 2 = Jenis kelamin responden (GENDER) X 3 = Pendidikan responden (EDU) = Pekerjaan responden (JOB) = Status responden (MAR) = Agama responden (AGAMA) = Jumlah merek yang pernah digunakan oleh responden (PRODUK) X 8 = Tingkat pendapatan responden (SES) Pengkategorian peubah penjelas dapat dilihat pada tabel dibawah ini. X4 X5 X6 X7
Tabel 1. Peubah penjelas beserta kategorinya. Kode Peubah Keterangan (1) (2) (3) (4) AGE <31 tahun 1 0
1 0 0 1 0 0 1 0 0 0
EDU 60
50
40
0 0 1 0 0
0 0 0 1 0
30
20
Percent
0 0 1 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 1 0 1 0
10
0 MENENGAH KEBAWAH
ATAS
TINGGI
EDU
Gambar 3. Sebaran Pendidikan Responden. 0 1 0 0 1 0 0
0 0 1 0
5.1 Analisis Deskriptif Dalam penelitian ini, responden dikategorikan menjadi 3 kelompok usia yaitu usia <31 tahun, 31-40 tahun, dan >40 tahun. Terlihat responden sudah mewaikili seluruh kelompok usia dengan masing-masing presentase 45,6 %, 31,2 %, dan 23,2 %. AGE
Pekerjaan responden dikategorikan menjadi 5 kelompok yaitu pelajar/ mahasiswa, ibu rumah tangga, karyawan, wiraswasta, dan pekerjaan lainnya. Masing-masing memiliki presentase 27,6 %, 14,5 %, 39,5 %, 11,5 %, dan 6,9 %. JOB 50
40
30
20
Percent
31-40 tahun >40 tahun EDU Menengah ke bawah Atas Tinggi JOB Pelajar/Mahasiswa Ibu Rumah Tangga Karyawan Wiraswasta Dan lain-lain MAR Lajang Menikah AGAMA Islam Kristen Lainnya SES D C B A PRODUK 1 Merek > 1 Merek GENDER Pria Wanita
10
0 PELAJAR/MHS
KARYAWAN
IBU RUMAH TANGGA
DAN LAIN-LAIN WIRASWASTA
JOB
Gambar 4. Sebaran Pekerjaan Responden. Status responden dikategorikan menjadi 2 kelompok yaitu lajang dan menikah. Masingmasing memiliki presentase 53,1 % dan 46,9 %.
50
40
MAR
30 60
20 50
Percent
10
40
30
0 <31th
31-40 th
>40 20
Gambar 2. Sebaran Usia Responden. Pendidikan responden dikategorikan menjadi 3 kelompok yaitu pendidikan menengah kebawah, atas, dan tinggi. Masingmasing memiliki presentase 6,4 %, 51,4 %, dan 42,2 %.
Percent
AGE
10
0 LAJANG
MENIKAH
MAR
Gambar 5. Sebaran Status Perkawinan Responden.
Agama responden dikategorikan menjadi 3 kelompok yaitu islam, kristen, dan agama lainnya. Masing-masing memiliki presentase 71,1 %, 26,5 %, dan 2,4 %.
Sebaran responden berdasarkan jenis kelamin memperlihatkan bahwa responden pria memiliki presentase 45,8 %, sedangkan responden wanita memiliki presentase 54,2 %.
AGAMA
Gender
80
60
50 60 40
40
30
20
Percent
Percent
20
0 ISLAM
KRISTEN
10
0
LAINNYA
AGAMA
PRIA
WANITA
Gender
Gambar 6. Sebaran Agama Responden.
Gambar 9. Sebaran Jenis Kelamin Responden.
SES responden dikategorikan menjadi 4 kelompok yaitu A, B, C, dan D. Masingmasing memiliki presentase 18,5 %, 60,8 %, 17,6 %, dan 3,2 %.
5.2 Analisis Regresi Logistik Analisis regresi logistik digunakan untuk mengetahui pengaruh peubah bebas secara bersama-sama terhadap peubah respon. Untuk mendapatkan model terbaik perlu dilakukan beberapa tahapan. Pertama, membuat model yang mengikutsertakan seluruh peubah, kedua, mereduksi peubah-peubah yang tidak nyata secara statistika dengan Uji Wald, ketiga, membandingkan model penuh dengan model reduksi dengan menggunakan statistik Uji G. Untuk mengetahui faktor-faktor yang mempengaruhi minat seseorang untuk berpindah merek dapat dilihat pada Tabel 2. Model penuh dengan mengikutsertakan semua peubah bebas menghasilkan nilai statistik G sebesar 306,320 dengan nilai-p = 0,000. Karena nilai-p lebih kecil dari taraf nyata α = 0,10 . Hal ini berarti paling tidak ada satu nilai β i yang tidak bernilai nol. Pada Tabel 2, terlihat Uji Wald untuk peubah-peubah MAR menunjukkan nilai-p yang kecil (lebih kecil dari α = 0,10 ) sedangkan untuk peubah-peubah lainnya menunjukkan nilai-p yang lebih besar dari α = 0,10 . Nilai tersebut menunjukkan peubah-peubah tersebut tidak nyata secara statistika.
SES 70
60
50
40
30
Percent
20
10 0 SES D
SES C
SES B
SES A
SES
Gambar 7. Sebaran SES Responden. Jumlah produk dikategorikan menjadi 2 kelompok yaitu 1 merek dan >1 merek. Masing-masing memiliki presentase 75 % dan 25 %. Jumlah Produk 80
60
40
Percent
20
0 1 MERK
>1 MERK
Jumlah Produk
Gambar 8. Sebaran Jumlah Produk Responden.
Tabel 2. Hasil analisis regresi logistik model penuh Peubah B Wald Nilai-p MAR(1) -0,826 3,146 0,076 GENDER(1) -0,397 1,272 0,259 AGE(1) -0,439 0,701 0,403 AGE(2) 0,117 0,087 0,768
EDU(1) EDU(2) JOB(1) JOB(2) JOB(3) JOB(4) AGAMA(1) AGAMA(2) SES(1) SES(2) SES(3) PRODUK(1) Constant
-18,338 0,113 0,703 0,984 0,108 0,664 -1,101 -1,053 1,445 2,023 1,788 -20,472 -1,319
0,000 0,142 0,933 2,056 0,032 0,917 1,729 1,514 1,175 2,530 2,005 0,000 1,836
0,996 0,706 0,334 0,152 0,857 0,338 0,189 0,219 0,278 0,112 0,157 0,988 0,360
Statistik-G = 306,320 Nilai-p = 0,000 Log-likelihood = -145,736 Pereduksian peubah penjelas dari model dapat dilakukan selama nilai statistik G model tersebut masih lebih kecil dari nilai khikuadrat dengan derajat bebas sejumlah peubah bebas yang tidak tereduksi dari model sebelumnya. Untuk mereduksi peubah-peubah boneka harus dilakukan dalam peubah bebas induknya sehingga tidak dapat dilakukan untuk salah satu kategori saja. Hal lain yang perlu diperhatikan adalah masalah keberartian dan ketidakberartian peubah tersebut secara ilmu lain selain statistika. Tabel 3. Hasil regresi logistik model tereduksi Peubah B Wald Nilai-p MAR(1) -1,145 21,748 0,000 Constant -1,871 191,018 0,000 Statistik-G Nilai-p
= 24,140 = 0,000
Log-likelihood = -286,4585 Hasil pereduksian model yang ditunjukkan oleh Tabel 3 memperlihatkan 1 peubah yang nyata secara statistika yaitu MAR. Hal ini terlihat dari nilai-p yang kurang dari α = 0,10 , model diatas memiliki nilai statistik G sebesar 24,140 dengan nilai-p = 0,000 sehingga paling tidak ada satu β i yang tidak bernilai nol. Kebaikan model reduksi terhadap model penuh dilakukan dengan menguji kembali dengan menggunakan uji statistik G. Nilai statistik G yang digunakan untuk membandingkan model penuh (Tabel 2) dan model reduksi (Tabel 3) adalah : G=-2((-286,4585)-( -145,736))=281,445
Disebabkan nilai G diatas lebih besar dari nilai χ 20.1(15) , dengan demikian dapat
disimpulkan bahwa model penuh lebih baik daripada model tereduksi. Setelah melakukan pengujian model untuk memilih model regresi terbaik, selanjutnya dilakukan interpretasi terhadap model tersebut. Interpretasi model regresi dilakukan dengan melihat nilai dugaan rasio Odds dan selang kepercayaan rasio Odds untuk setiap peubah yang telah diuji secara statistik. Berdasarkan Tabel 4, responden yang sudah menikah cenderung memiliki minat berpindah merek yang lebih tinggi dibandingkan dengan responden yang lajang atau belum menikah. Dengan nilai dugaan rasio Odds peubah MAR(1) sebesar 0,438, menunjukkan adanya kecenderungan minat berpindah merek responden yang lajang lebih rendah 0,438 kali dari minat berpindah merek responden yang sudah menikah. Hal ini diperkuat dengan selang kepercayaan 90% nilai parameter rasio Odds peubah MAR(1) berkisar antara 0,204 sampai 0,942 (lebih kecil dari 1), menunjukkan bahwa pada populasi yang sesungguhnya minat berpindah merek responden yang lajang lebih rendah dibandingkan dengan minat berpindah merek reponden yang sudah menikah. Pengertian yang setara bahwa jika responden yang sudah menikah 10 kali, maka 4-5 orang responden yang lajang akan berpindah merek. Tabel 4. Nilai koefisien dan nilai dugaan rasio Odds regresi logistik Nilai Dugaan SK 90 SK Rasio % 90% B Peubah Odds (Low) (Up) MAR(1) -0,826 0,438 0,204 0,942 GENDER(1) -0,397 0,672 0,377 1,200 AGE(1) -0,439 0,645 0,272 1,527 AGE(2) 0,117 1,124 0,586 2,155 EDU(1) -18,338 0,000 0,000 0,000 EDU(2) 0,113 1,120 0,683 1,835 JOB(1) 0,703 2,019 0,610 6,681 JOB(2) 0,984 2,674 0,865 8,267 JOB(3) 0,108 1,114 0,415 2,995 JOB(4) 0,664 1,942 0,621 6,073 AGAMA(1) -1,101 0,333 0,084 1,318 AGAMA(2) -1,053 0,349 0,085 1,426 SES(1) 1,445 4,243 0,473 38,029 SES(2) 2,023 7,565 0,933 61,306 SES(3) 1,788 5,975 0,749 47,677 PRODUK(1) -20,472 0,000 0,377 1,200
Secara statistika, peubah lainnya merupakan peubah yang tidak nyata sehingga tidak dapat direpresentasikan dengan baik. Model regresi logistik untuk menggambarkan minat berpindah merek seorang konsumen adalah sebagai berikut :
π ( x) =
eg ( x) 1 + eg ( x)
Y = -0,333703.10-3 + 0,142* BF 5 - 0,172* BF 7 - 0, 244* BF 9 + 0,151* BF11 + 0,542* BF15 + 0,911* BF17 + 0, 686* BF 21 + 0,162* BF 23 - 0, 469* BF 29 model MINAT = BF 5 BF 7 BF 9 BF11 BF15 BF17 BF 21 BF 23 BF 29
g ( x) = −0, 439 AGE (1) + 0,117 AGE (2) − 18,338 EDU (1) + 0,113EDU (2) + 0, 703 JOB (1) + 0,984 JOB(2) + 0,108 JOB (3) + 0, 664 JOB(4) − 0,826 MAR (1) − 1,101AGAMA(1) − 1, 053 AGAMA(2) + 1, 445SES (1) + 2, 023SES (2) + 1, 788SES (3) − 20, 472 PRODUK (1) − 0,397GENDER(1)
Tabel 5. Tabel Klasifikasi Model Regresi Logistik Prediksi Presentase Minat Observasi Benar Pindah (%) Tidak Ya Minat Tidak 898 21 97,7 Pindah Ya 56 32 36,4 Total Benar 92,4 Prediksi model regresi logistik dengan menggunakan software SPSS 13.0 menghasilkan tingkat akurasi sebesar 92,4%. 5.3 Pendugaan Model dengan MARS Untuk menentukan model terbaik ditentukan oleh kriteria GCV, R 2 , dan RMSE. Model terbaik harus mempunyai nilai RMSE dan GCV terkecil, serta nilai R 2 terbesar. Selain itu harus menguji melalui simulasi model sehingga menghasilkan akurasi terbaik. Model terbaik dapat dilihat pada lampiran 2 dengan kriteria nilai GCV terkecil yaitu 0,052 dan nilai R 2 terbesar yaitu 0,349. Model prediksi seorang konsumen untuk berpindah merek dibentuk dengan kriteria input : 1. Minspan (minimal banyak pengamatan tiap knot) = 5 2. MI (maksimum interaksi) = 3 3. Jumlah maksimum fungsi basis = 35 4. Nilai penalty γ = 0 Model MARS untuk menggambarkan minat berpindah merek seorang konsumen adalah sebagai berikut :
dengan fungsi basis : BF 2 = ( PRODUK = 2) BF 3 = ( MAR = 1) * BF 2; BF 4 = ( MAR = 2) * BF 2; BF 5 = ( JOB = 1OR JOB = 2 OR JOB = 4) * BF 4; BF 7 = (GENDER = 0) * BF 4; BF 9 = ( SES = 1OR SES = 4) * BF 4; BF11 = ( AGE = 2) * BF 3; BF15 = ( EDU = 2) * BF 4; BF17 = ( EDU = 3) * BF 4; BF 21 = ( EDU = 3) * BF 3;
BF 23 = ( EDU = 2) * BF 3; BF 26 = ( AGAMA = 1OR AGAMA = 2); BF 28 = ( PRODUK = 2) * BF 26; BF 29 = ( EDU = 3) * BF 28;
Model regresi yang dihasilkan terdiri atas satu intersep dan 9 fungsi basis, yang meliputi 0 interaksi pada level pertama, 0 interaksi pada level kedua, dan 9 interaksi pada level ketiga. Nilai R-Square sebesar 39,5%, nilai RSquare Adj sebesar 39%, nilai RMSE sebesar 0,049 dan nilai MAE sebesar 0,052. Interpretasi model sidik ragam pada lampiran 1. Pada Tabel terlihat semua komponen fungsi basis membentuk model interaksi pada level ketiga. Untuk interaksi level ketiga seperti EDU (BF29) memberikan arti bahwa fungsi basis ini akan memberikan kontribusi terhadap model sebesar -0,496 (bernilai negatif) bila nilai peubah EDU = 3, peubah PRODUK = 2, dan peubah AGAMA = 2 atau 3. Dengan kata lain, bila responden itu memiliki riwayat pendidikan perguruan tinggi, menggunakan produk lebih dari 1 merek, dan beragama islam atau kristen, maka akan cenderung untuk tidak berpindah merek. Untuk Peubah EDU (BF17) memberikan arti bahwa fungsi basis ini akan memberikan kontribusi terhadap model
sebesar 0,911 (bernilai positif) bila nilai peubah EDU = 3, peubah MAR = 2, dan Peubah PRODUK = 2. Dengan kata lain, bila responden itu memiliki riwayat pendidikan perguruan tinggi, sudah menikah, dan menggunakan produk lebih dari 1 merek, maka akan cenderung untuk berpindah merek. Tabel 6. Tingkat Loyalitas Konsumen Fungsi Konsumen Loyalitas Basis Cukup BF 5 - Merek > 1 Loyal - Menikah - Pelajar / Mahasiswa / Ibu Rumah Tangga / Wiraswasta BF 7
- Merek >1 - Menikah - Pria
Cukup Loyal
BF 9
- Merek >1 - Menikah - SES D/ A
Cukup Loyal
BF 11
- Merek >1 - Lajang - Usia 31-40 tahun
Cukup Loyal
BF 15
- Merek >1 - Menikah - Pendidikan Atas
Tidak Loyal
BF 17
- Merek >1 - Menikah - Pendidikan Tinggi
Tidak Loyal
BF 21
- Merek >1 - Lajang - Pendidikan Tinggi
Tidak Loyal
- Merek >1 - Lajang - Pendidikan Atas - Pendidikan Tinggi - Merek >1 - Agama Islam/ Kristen
Cukup Loyal
BF 23
BF 29
Sangat Loyal
Tabel 6 memperlihatkan tingkat loyalitas konsumen dalam menggunakan produk shampo.
Tabel 7. Tabel Klasifikasi Model MARS Prediksi Presentase Minat Observasi Benar Pindah (%) Tidak Ya Minat Tidak 896 23 97,5 Pindah Ya 51 37 42,1 Total Benar 92,7 Prediksi model MARS dengan menggunakan software MARS 2.0 menghasilkan tingkat akurasi sebesar 92,7%. 5.3.1. Peubah Prediktor yang Relatif Penting Peubah yang relatif penting untuk model prediksi adalah jumlah merek yang pernah digunakan oleh responden (PRODUK). Hal ini ditunjukkan pada nilai GCV terkecil (terbesar untuk GCV −1 ) diantara peubah lainnya.
Tabel 8. Peubah yang relatif penting Peringkat Peubah GCV −1 1 PRODUK 0,080 2 AGAMA 0,072 3 MAR 0,063 4 EDU 0,053 5 AGE 0,053 6 GENDER 0,053 7 SES 0,052 8 JOB 0,052 Dari hasil tabulasi silang pada lampiran 3, peubah PRODUK = 2 (jumlah merek lebih dari 1) menyebabkan responden berpindah merek. Oleh karena itu, peubah PRODUK = 2 dipilih sebagai peubah yang sangat berpengaruh dalam model. 5.4 Perbandingan Antara Model Regresi Logistik dengan MARS Pada analisis regresi logistik, model yang didapatkan tidak sebaik pendugaan dengan MARS disebabkan oleh tidak adanya interaksi antara peubah satu dengan peubah lainnya atau dengan kata lain peubahnya saling bebas. Terlihat dengan analisis regresi logistik yang hanya menghasilkan satu peubah yang nyata saja yaitu MAR(1) dan peubah yang lainnya tidak nyata secara statistik. Berbeda dengan analisis MARS, semua peubah berpengaruh terhadap model terutama peubah PRODUK.