PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA
DIMAS FAJAR AIRLANGGA
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
ABSTRAK DIMAS FAJAR AIRLANGGA. Penerapan Metode CHAID dan Regresi Logistik dalam Analisis Segmentasi Pasar Konsumen Aqua. Dibimbing oleh BUDI SUSETYO dan AJI HAMIM WIGENA. Metode yang umum digunakan untuk menyelesaikan masalah pengklasifikasian adalah metode CHAID (Chi-square Automatic Interaction Detection) dan regresi logistik. Metode CHAID dapat menjelaskan hubungan terstruktur antara peubah respon dengan peubah penjelas sehingga memberikan informasi yang mudah dimengerti, sedangkan regresi logistik dapat menunjukkan pengaruh terhadap peubah respon dari suatu kategori dalam peubah penjelas yang dibandingkan dengan kategori referensinya. Penelitian ini bertujuan menerapkan metode CHAID dalam menganalisis segmentasi pasar konsumen Aqua dan menerapkan regresi logistik untuk menguji kekonsistenan peubah yang berpengaruh dalam metode CHAID. Hasil CHAID menunjukkan empat peubah penjelas yang berpengaruh terhadap rencana membeli Aqua, yaitu kota, usia, pendidikan, dan pengeluaran per bulan. Analisis CHAID menghasilkan dua belas segmen pasar konsumen Aqua. Pengujian peubah dengan menggunakan analisis regresi logistik pada tiap node dari dendogram CHAID memberikan hasil yang konsisten. Kata kunci : metode CHAID, regresi logistik, segmentasi pasar
PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA
DIMAS FAJAR AIRLANGGA
Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
Judul Skripsi
: Penerapan Metode CHAID dan Regresi Logistik dalam Analisis Segmentasi Pasar Konsumen Aqua : Dimas Fajar Airlangga : G14070027
Nama NRP
Disetujui
Pembimbing I
Pembimbing II
Dr. Ir. Budi Susetyo, MS NIP. 196211301986031003
Dr. Ir. Aji Hamim Wigena, M.Sc NIP. 195209281977011001
Diketahui Ketua Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si NIP. 196504211990021001
Tanggal Lulus :
RIWAYAT HIDUP Penulis dilahirkan di Bogor pada tanggal 9 Agustus 1989 sebagai anak pertama dari pasangan Aryo Prasuko dan Ety Dwiyatmi. Penulis menyelesaikan pendidikan dasar di SD Tunas Jakasampurna Bekasi pada tahun 2001. Jenjang pendidikan selanjutnya penulis tempuh di Sekolah Menengah Pertama Negeri 1 Bekasi dan lulus tahun 2004. Pada tahun 2007 penulis menyelesaikan pendidikannya di Sekolah Menengah Atas Negeri 1 Bekasi dan pada tahun yang sama penulis diterima sebagai mahasiswa Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui Undangan Seleksi Masuk IPB (USMI). Selama menjadi mahasiswa, penulis aktif dalam kepengurusan Himpunan Profesi Gamma Sigma Beta periode 2009/2010 sebagai staf divisi science. Dalam bidang akademik, penulis juga pernah menjadi asisten dosen mata kuliah Agama Kristen Protestan, Kimia Dasar, dan Metode Statistika. Pada Bulan Februari sampai April 2011, penulis diberi kesempatan untuk melaksanakan praktik lapang di PT. Grup Riset Potensial.
KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas segala rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Karya ilmiah ini merupakan hasil penelitian penulis dalam rangka memenuhi tugas akhir yang merupakan salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Budi Susetyo, MS dan Bapak Dr. Ir. Aji Hamim Wigena, M.Sc selaku pembimbing yang telah memberikan bimbingan dan saran kepada penulis dalam meyelesaikan penelitian. Penulis mengucapkan terima kasih kepada PT. Mars Indonesia yang telah mengizinkan penggunaan data untuk penelitian ini. Ungkapan terima kasih juga disampaikan kepada orang tua dan keluarga atas doa dan dukungannya serta semua pihak yang telah membantu penulis dalam menyelesaikan karya ilmiah ini. Semoga karya ilmiah ini bermanfaat.
Bogor, November 2011
Dimas Fajar Airlangga
DAFTAR ISI Halaman DAFTAR LAMPIRAN ....................................................................................................... vii PENDAHULUAN Latar Belakang......................................................................................................... Tujuan .....................................................................................................................
1 1
TINJAUAN PUSTAKA Segmentasi Pasar ..................................................................................................... Metode CHAID ...................................................................................................... Analisis Regresi Logistik .........................................................................................
1 1 2
METODOLOGI Data ......................................................................................................................... Metode ....................................................................................................................
3 3
HASIL DAN PEMBAHASAN Analisis CHAID....................................................................................................... Analisis Regresi Logistik pada Node 0...................................................................... Analisis Regresi Logistik pada Node 1...................................................................... Analisis Regresi Logistik pada Node 2...................................................................... Analisis Regresi Logistik pada Node 3...................................................................... Analisis Regresi Logistik pada Node 4...................................................................... Analisis Regresi Logistik pada Node 13....................................................................
3 5 5 5 5 6 6
KESIMPULAN ..................................................................................................................
6
DAFTAR PUSTAKA .........................................................................................................
6
LAMPIRAN .......................................................................................................................
8
vii
DAFTAR LAMPIRAN 1 2 3 4 5 6 7
Halaman Dendogram pemisahan hasil analisis CHAID pada taraf nyata 10% .................................. 8 Hasil analisis regresi logistik pada Node 0 ........................................................................ 9 Hasil analisis regresi logistik pada Node 1 ........................................................................ 9 Hasil analisis regresi logistik pada Node 2 ........................................................................ 9 Hasil analisis regresi logistik pada Node 3 ....................................................................... 10 Hasil analisis regresi logistik pada Node 4 ........................................................................ 10 Hasil analisis regresi logistik pada Node 13 ...................................................................... 10
1
PENDAHULUAN Latar Belakang Ketersediaan air minum yang layak dan berkualitas saat ini semakin sulit diperoleh. Kesulitan tersebut menyebabkan peningkatan konsumsi Air Minum Dalam Kemasan (AMDK) sehingga mendorong pertumbuhan bisnis AMDK di Indonesia. Perusahaan yang mengelola bisnis AMDK terus melakukan peningkatan untuk memperluas pangsa pasar produk-produknya. Aqua sebagai perusahaan yang mengelola bisnis AMDK, sebaiknya meningkatkan penjualannya agar dapat bersaing dengan perusahaan lainnya. Salah satu cara untuk meningkatkan penjualan adalah dengan mengetahui segmentasi pasar konsumen Aqua. Segmentasi pasar bertujuan mengelompokkan pasar yang besar dan heterogen ke dalam segmen-segmen pasar yang lebih kecil dan homogen. Perusahaan dapat menyesuaikan produk dan strategi pemasarannya dengan kebutuhan pelanggan berdasarkan segmen pasar yang dituju. Dengan demikian segmentasi pasar membantu perusahaan memusatkan penjualannya pada segmen yang berpotensial memberikan keuntungan bagi perusahaan tersebut. Metode yang sering digunakan dalam riset pemasaran, khususnya dalam segmentasi pasar adalah metode CHAID (Chi-square Automatic Interaction Detection). Metode CHAID merupakan metode eksplorasi untuk mengetahui hubungan peubah respon dengan peubah penjelas serta mendeteksi adanya interaksi antar peubah penjelas secara otomatis. Metode lain yang dapat digunakan untuk menghasilkan klasifikasi adalah regresi logistik. Regresi logistik digunakan untuk menjelaskan hubungan antara peubah penjelas yang berskala kontinu atau kategorik dengan peubah respon yang berskala kategorik. Metode CHAID dan regresi logistik memiliki kelebihan dan kelemahan. Metode CHAID memiliki kelebihan, yaitu hasilnya sederhana berupa dendogram yang menjelaskan hubungan terstruktur antara peubah respon dengan peubah penjelas sehingga memberikan informasi yang mudah dimengerti. Sementara regresi logistik menghasilkan model yang lebih rumit dipahami. Kelebihan dari regresi logistik adalah memiliki nilai rasio odds yang dapat menunjukkan seberapa besar pengaruh terhadap peubah respon dari suatu kategori dalam peubah penjelas yang dibandingkan dengan kategori referensinya. Sedangkan
metode CHAID tidak memiliki nilai rasio odds. Dalam penelitian ini, kelebihan dari metode CHAID dan regresi logistik akan digunakan untuk menghasilkan analisis segmentasi pasar yang lebih baik.
1.
2.
Tujuan Tujuan dari penelitian ini adalah: Menerapkan metode CHAID untuk menganalisis segmentasi pasar konsumen Aqua. Menerapkan regresi logistik untuk menguji kekonsistenan peubah yang berpengaruh dalam metode CHAID. TINJAUAN PUSTAKA
Segmentasi Pasar Segmentasi pasar merupakan pengelompokkan individu (konsumen) menjadi beberapa kelompok (segmen) di mana individu yang berada dalam satu segmen memiliki ciri-ciri atau perilaku yang relatif sama (homogen) dibandingkan dengan individu pada kelompok lain (Kotler 2003). Ada beberapa pendekatan yang digunakan untuk melakukan segmentasi pasar, yaitu demografi, geografi, dan psikografi. Pendekatan demografi meliputi peubah usia, jenis kelamin, pekerjaan, pendidikan, dan pendapatan. Pendekatan geografi cenderung membagi konsumen berdasarkan wilayah tempat tinggal, sedangkan pendekatan psikografi meliputi gaya hidup, sikap-sikap, dan minat konsumen. Metode CHAID Metode CHAID (Chi-square Automatic Interaction Detection) merupakan salah satu tipe dari decision tree yang menggunakan kriteria chi-square dalam pengoperasiannya (Alamudi et al. 1998). CHAID menghasilkan pohon nonbiner yang dapat diterapkan pada masalah tipe klasifikasi dan tipe regresi. Metode CHAID digunakan sebagai metode eksplorasi nonparametrik untuk mengetahui peubah-peubah penjelas yang dominan menjelaskan peubah respon. Prinsip metode CHAID adalah memisahkan data menjadi kelompokkelompok melalui tahap-tahap tertentu. Tahapan ini diawali dengan membagi data menjadi beberapa kelompok berdasarkan satu peubah penjelas yang pengaruhnya paling nyata terhadap peubah respon. Masing-masing kelompok yang diperoleh diperiksa secara terpisah untuk membaginya lagi menjadi beberapa kelompok berdasarkan peubah
2
penjelas. Dengan demikian melalui metode CHAID dapat diketahui peubah-peubah penjelas yang pengaruhnya paling nyata terhadap peubah respon. Algoritma CHAID adalah sebagai berikut (Kass 1980): 1. Buat tabulasi silang untuk masingmasing kategori peubah penjelas dengan kategori peubah respon. 2. Buat sub tabulasi silang berukuran 2 × d yang mungkin tersusun. d adalah banyaknya kategori peubah respon. Kemudian tentukan nilai semua subtabel tersebut. Dengan ditetapkan, tentukan nilai yang terkecil. Jika , maka kedua kategori peubah penjelas yang memiliki digabung menjadi satu kategori. Untuk peubah ordinal, penggabungan hanya dapat dilakukan terhadap kategori yang berurutan. 3. Jika terdapat kategori gabungan yang terdiri dari tiga atau lebih kategori asal, maka harus dilakukan pembagian biner terhadap kategori gabungan tersebut. Dari pembagian ini ditentukan terbesar. Jika terbesar > , maka pembagian biner berlaku. Kembali ke tahap 2. 4. Setelah diperoleh penggabungan optimal untuk setiap peubah penjelas, hitung nilai-p untuk masing-masing tabel yang terbentuk. Nilai-p dari tabel yang mengalami pengurangan kategori dikalikan dengan koreksi Bonferoni sesuai dengan tipe peubahnya. Jika nilaip terkecil < , maka peubah tersebut merupakan peubah penjelas yang pengaruhnya paling nyata bagi peubah respon. 5. Jika pada tahap 4 diperoleh peubah yang pengaruhnya paling nyata, kembali ke tahap 1 untuk setiap bagian data hasil pemisahan. Statistik uji yang digunakan adalah dengan rumus:
dengan: total baris total kolom indeks baris indeks kolom nilai sel baris ke-i kolom ke-j nilai harapan sel baris ke-i kolom ke-j
Koreksi Bonferoni untuk tabel yang mengalami pengurangan kategori sesuai dengan tipe peubahnya: 1. Peubah nominal:
2.
Peubah ordinal:
3.
Peubah float:
Analisis Regresi Logistik Analisis regresi logistik merupakan analisis yang digunakan untuk memodelkan hubungan antara peubah respon yang berskala kategorik dengan peubah penjelas yang berskala kategorik atau kontinu. Model regresi logistik dengan p buah peubah penjelas adalah:
dengan: Untuk memeriksa peranan peubahpeubah penjelas dalam model, dilakukan pengujian terhadap parameter model. Uji yang digunakan adalah statistik uji G dan statistik uji Wald. Statistik uji G digunakan untuk menguji peranan peubah penjelas di dalam model secara bersama-sama (Hosmer dan Lemeshow 2000). Hipotesis yang diuji adalah: H0 : H1 : minimal ada satu dengan i = 1,2,…,p. Statistik uji G didefinisikan sebagai:
Statistik uji Wald digunakan untuk menguji parameter secara parsial (Hosmer dan Lemeshow 2000). Hipotesis yang diuji adalah: H0 : H1 : dengan i = 1,2,…,p Statistik uji Wald didefinisikan sebagai:
Interpretasi koefisien untuk model ini dapat dilakukan dengan melihat nilai rasio oddsnya. Rasio odds adalah ukuran asosiasi yang memperkirakan seberapa besar kecenderungan pengaruh peubah-peubah penjelas terhadap peubah respon. Rasio odds dapat diinterpretasikan sebagai kecenderungan
3
Y=1 pada X=1 sebesar pada X=0.
kali dibandingkan
METODOLOGI Data Data penelitian ini berasal dari hasil survei oleh PT. Mars Indonesia. Survei dilakukan terhadap 2265 responden di tujuh kota, yaitu Jakarta, Bandung, Semarang, Surabaya, Medan, Makassar, dan Banjarmasin. Peubah respon dalam penelitian ini adalah rencana konsumen membeli air minum merek Aqua di mana bernilai 1 untuk konsumen yang berencana membeli Aqua dan bernilai 0 untuk konsumen yang tidak berencana membeli Aqua. Sedangkan peubah penjelas yang digunakan adalah sebagai berikut: 1. Kota: 0 = Jakarta 4 = Medan 1 = Bandung 5 = Makassar 2 = Semarang 6 = Banjarmasin 3 = Surabaya 2. Jenis kelamin: 0 = wanita 1 = pria 3. Pendidikan: 0 = SD 3 = diploma 1 = SMP 4 = S1/S2/S3 2 = SMA 4. Rata-rata pengeluaran per bulan: 0 = > Rp 2.000.000 1 = Rp 1.500.001 – Rp 2.000.000 2 = Rp 700.001 – Rp 1.500.000 3 = Rp 500.001 – Rp 700.000 4 = Rp 500.000 5. Status pernikahan: 0 = belum menikah 2 = duda/janda 1 = menikah 6. Pekerjaan: 0 =direktur/profesional/manajer/pemilik perusahaan 1 = ibu rumah tangga/pensiunan 2 = mahasiswa/pelajar 3 = karyawan/pegawai biasa 4 = guru/tenaga terampil/buruh 5 = lainnya 7. Usia: 0 = < 22 tahun 1 = 22-34 tahun 2 = > 34 tahun
Metode Langkah-langkah yang dilakukan dalam penelitian ini adalah: 1. Melakukan analisis CHAID terhadap peubah respon dan peubah-peubah penjelasnya. 2. Melakukan interpretasi hasil dari analisis CHAID. 3. Melakukan analisis regresi logistik pada tiap node yang dihasilkan dalam analisis CHAID. 4. Melihat kekonsistenan hasil uji dalam regresi logistik dengan hasil dari metode CHAID. 5. Membandingkan hasil analisis dari metode CHAID dan regresi logistik. HASIL DAN PEMBAHASAN Analisis CHAID Analisis CHAID terhadap tujuh peubah penjelas menghasilkan dendogram dengan empat peubah penjelas yang berpengaruh nyata pada taraf nyata 10%. Peubah-peubah tersebut adalah kota, usia, pendidikan, dan pengeluaran per bulan. Terlihat pada Lampiran 1 bahwa dari 2665 responden sebesar 1698 responden berencana membeli Aqua dan 967 responden tidak berencana membeli. Peubah pertama yang mengelompokkan responden adalah kota. Kota membagi responden ke dalam lima kelompok, yaitu kelompok pertama adalah Jakarta dan Surabaya, kelompok kedua adalah Medan, kelompok ketiga adalah Bandung dan Semarang, kelompok keempat adalah Makassar, dan kelompok kelima adalah Banjarmasin. Pengelompokan ini menunjukkan bahwa Jakarta dan Surabaya memiliki karakter pasar yang homogen. Kehomogenan juga terdapat pada karakter pasar Bandung dan Semarang. Sementara pada karakter pasar antar kelompok memiliki perbedaan yang disebabkan adanya interaksi antar peubah penjelas di tiap kelompok yang tidak sama. Perbedaan karakter pasar ini mengakibatkan perusahaan tidak dapat menerapkan strategi pemasaran yang sama untuk semua kota. Konsumen untuk Jakarta dan Surabaya dibagi menjadi dua kelompok berdasarkan peubah usia, yaitu konsumen yang berusia di bawah 22 tahun dan konsumen yang berusia 22 tahun ke atas. Kelompok pertama meliputi 138 responden yang terdiri dari 118 yang berencana membeli Aqua dan 20 yang tidak berencana membeli. Kelompok kedua
4
meliputi 872 responden yang terdiri dari 644 yang berencana membeli Aqua dan 228 yang tidak berencana membeli. Hal ini menunjukkan bahwa konsumen dari berbagai tingkatan usia di Jakarta dan Surabaya umumnya memiliki rencana membeli Aqua. Konsumen untuk Medan dibagi dalam tiga kelompok berdasarkan peubah pendidikan, yaitu konsumen dengan pendidikan SD sebesar 33 responden, SMP sebesar 78 responden, dan di atas SMP sebesar 196 responden. Pada tiap kelompok tersebut, responden yang berencana membeli Aqua terdiri dari kelompok SD sebesar 63.6%, kelompok SMP sebesar 89.7%, dan kelompok di atas SMP sebesar 79.1%. Dapat diketahui bahwa konsumen dari berbagai tingkatan pendidikan di Medan sebagian besar memiliki rencana membeli Aqua. Segmentasi konsumen Bandung dan Semarang dibagi menjadi dua kelompok berdasarkan peubah pendidikan, yaitu konsumen yang berpendidikan SD sebesar 111 responden dan konsumen yang berpendidikan di atas SD sebesar 610 responden. Sebesar 46.8% konsumen yang berpendidikan SD berencana membeli Aqua, sedangkan sebesar 66.6% konsumen yang berpendidikan di atas SD berencana membeli Aqua. Dapat diketahui bahwa konsumen yang tidak berencana membeli Aqua umumnya terdapat pada konsumen yang berpendidikan SD. Oleh karena itu, perusahaan dapat memperbaiki strategi pemasarannya untuk segmen konsumen yang berpendidikan SD sehingga ketertarikan membeli pada konsumen tersebut meningkat. Perusahaan juga dapat memusatkan penjualannya pada segmen konsumen yang berpendidikan di atas SD karena sebagian besar konsumen pada segmen tersebut tertarik membeli Aqua. Konsumen untuk Makassar dibagi dalam tiga kelompok berdasarkan peubah pengeluaran per bulan, yaitu konsumen dengan pengeluaran per bulan lebih dari Rp 2.000.000, antara Rp 1.500.001 sampai Rp 2.000.000, dan Rp 1.500.000 ke bawah. Kelompok pertama meliputi 37 responden yang terdiri dari 24 yang berencana membeli Aqua dan 13 yang tidak berencana. Kelompok kedua meliputi 80 responden dan kelompok ketiga meliputi 204 responden. Sebesar 41.2% responden dengan pengeluaran per bulan Rp 1.500.001 – Rp 2.000.000 berencana membeli Aqua, sedangkan responden dengan pengeluaran per bulan Rp 1.500.000 ke bawah yang berencana membeli Aqua sebesar 22.1%.
Konsumen dengan pengeluaran per bulan Rp 1.500.000 ke bawah terbagi lagi menjadi dua kelompok berdasarkan peubah usia, yaitu konsumen yang berusia 34 tahun ke bawah dan konsumen yang berusia di atas 34 tahun. Responden yang berencana membeli Aqua pada kelompok berusia 34 tahun ke bawah adalah sebesar 27.9% sedangkan pada kelompok berusia di atas 34 tahun sebesar 15.1%. Dapat diketahui bahwa konsumen dengan pengeluaran per bulan Rp 2.000.000 ke bawah umumnya tidak berencana membeli Aqua. Oleh karena itu, perusahaan dapat memusatkan penjualan di Makassar pada segmen konsumen yang memiliki pengeluaran per bulan lebih dari Rp 2.000.000. Perusahaan juga sebaiknya memperbaiki strategi pemasarannya terhadap segmen konsumen dengan pengeluaran per bulan Rp 2.000.000 ke bawah agar dapat meningkatkan penjualannya. Responden yang terdapat di Banjarmasin sebesar 306 responden yang terdiri dari 130 yang berencana membeli Aqua dan 176 yang tidak berencana. Dapat diketahui bahwa konsumen yang tinggal di Banjarmasin umumnya tidak berencana membeli Aqua. Oleh karena itu, perusahaan sebaiknya memperbaiki strategi pemasarannya agar penjualan Aqua di Banjarmasin meningkat. Tidak terdapat interaksi antarpeubah penjelas di Banjarmasin karena tidak ada peubah penjelas lagi yang nyata. Analisis CHAID menghasilkan dua belas segmen pasar konsumen Aqua. Segmen pertama adalah konsumen yang berada di Jakarta dan Surabaya dengan usia di bawah 22 tahun. Segmen kedua adalah konsumen yang berada di Jakarta dan Surabaya dengan usia 22 tahun ke atas. Segmen ketiga adalah konsumen yang berada di Medan dengan pendidikan SD. Segmen keempat adalah konsumen yang berada di Medan dengan pendidikan SMP. Segmen kelima adalah konsumen yang berada di Medan dengan pendidikan di atas SMP. Segmen selanjutnya adalah konsumen yang berada di Bandung dan Semarang dengan pendidikan SD. Segmen ketujuh adalah konsumen yang berada di Bandung dan Semarang dengan pendidikan di atas SD. Segmen kedelapan adalah konsumen yang berada di Makassar dengan pengeluaran per bulan Rp 1.500.000 ke bawah dan berusia 34 tahun ke bawah. Segmen kesembilan adalah konsumen yang berada di Makassar dengan pengeluaran per bulan Rp 1.500.000 ke bawah dan berusia di atas 34 tahun. Segmen kesepuluh adalah konsumen yang
5
berada di Makassar dengan pengeluaran per bulan antara Rp 1.500.001 sampai Rp 2.000.000. Segmen kesebelas adalah konsumen yang berada di Makassar dengan pengeluaran per bulan lebih dari Rp 2.000.000. Segmen kedua belas adalah konsumen yang berada di Banjarmasin. Analisis Regresi Logistik pada Node 0 Pendugaan model regresi logistik dengan menggunakan prosedur backward elimination terhadap tujuh peubah penjelas menghasilkan nilai statistik uji G sebesar 340.994 dengan pvalue sebesar 0.000. Pengujian secara simultan menunjukkan bahwa model nyata pada taraf nyata 10% (Lampiran 2). Pengujian parameter secara parsial dengan menggunakan statistik uji Wald menunjukkan bahwa terdapat empat peubah penjelas yang berpengaruh nyata, yaitu kota, pendidikan, pengeluaran per bulan, dan usia. Hasil uji G dan uji Wald menunjukkan bahwa seluruh peubah penjelas tersebut nyata sehingga dapat dibentuk model logit sebagai berikut:
Kota merupakan peubah penjelas yang berpengaruh paling nyata karena memiliki nilai statistik uji Wald terbesar. Hasil yang sama juga didapat dalam metode CHAID, yaitu peubah penjelas yang memiliki pengaruh paling nyata terhadap peubah respon adalah kota. Hal ini menandakan bahwa hasil regresi logistik pada node 0 memiliki kekonsistenan dengan hasil yang didapat oleh metode CHAID. Interpretasi koefisien parameter dalam regresi logistik dapat dilihat dari nilai dugaan rasio odds. Nilai rasio odds dapat menunjukkan seberapa besar kemungkinan seorang konsumen di suatu kota dalam berencana membeli Aqua dibandingkan dengan konsumen di kota lainnya. Sebagai contoh, nilai dugaan rasio odds untuk kota Bandung adalah sebesar 0.548. Hal ini berarti bahwa kemungkinan konsumen yang berencana membeli Aqua di Bandung lebih sedikit 0.548 kali daripada konsumen di Jakarta.
Analisis Regresi Logistik pada Node 1 Pendugaan model regresi logistik pada node 1 (Jakarta dan Surabaya) menghasilkan peubah usia sebagai peubah penjelas yang berpengaruh nyata terhadap peubah respon pada taraf nyata 10% (Lampiran 3). Peubah usia juga memiliki pengaruh nyata terhadap peubah respon dalam analisis CHAID. Hal ini menandakan bahwa terjadi kekonsistenan antara hasil dari regresi logistik pada node 1 dengan hasil metode CHAID. Interpretasi nilai rasio odds untuk usia antara 22 tahun sampai 34 tahun adalah peluang konsumen di Jakarta dan Surabaya yang berusia antara 22 tahun sampai 34 tahun untuk membeli Aqua lebih sedikit 0.512 kali daripada konsumen dengan usia di bawah 22 tahun. Nilai dugaan rasio odds untuk usia lebih dari 34 tahun sebesar 0.457, artinya peluang konsumen di Jakarta dan Surabaya dengan usia lebih dari 34 tahun yang berencana membeli Aqua lebih sedikit 0.457 kali dibandingkan dengan konsumen dengan usia di bawah 22 tahun. Analisis Regresi Logistik pada Node 2 Hasil pendugaan model regresi logistik pada node 2 (Medan) menunjukkan peubah pendidikan sebagai peubah penjelas yang berpengaruh nyata terhadap peubah respon pada taraf nyata 10% (Lampiran 4). Hasil dari analisis CHAID juga menunjukkan peubah pendidikan berpengaruh nyata terhadap peubah respon. Dari hasil kedua metode tersebut dapat diketahui bahwa hasil regresi logistik pada node 2 konsisten dengan metode CHAID. Interpretasi dugaan rasio odds untuk pendidikan SMP adalah peluang konsumen di Medan dengan pendidikan SMP yang berencana membeli Aqua lebih banyak 5 kali daripada konsumen dengan pendidikan SD. Sementara interpretasi dugaan rasio odds untuk pendidikan SMA adalah peluang konsumen di Medan yang berpendidikan SMA untuk membeli Aqua lebih banyak 2.106 kali dibandingkan dengan konsumen dengan pendidikan SD. Analisis Regresi Logistik pada Node 3 Pendugaan model regresi logistik pada node 3 (Bandung dan Semarang) menghasilkan peubah pendidikan sebagai peubah penjelas yang berpengaruh nyata pada taraf nyata 10% (Lampiran 5). Pada metode CHAID juga menghasilkan peubah pendidikan sebagai peubah penjelas yang memiliki pengaruh nyata terhadap peubah
6
respon. Dari hasil kedua metode menunjukkan bahwa terjadi kekonsistenan antara hasil regresi logistik pada node 3 dengan metode CHAID. Nilai dugaan rasio odds yang dihasilkan untuk pendidikan SMP sebesar 2.250, artinya bahwa kemungkinan konsumen di Bandung dan Semarang yang berpendidikan SMP untuk membeli Aqua lebih banyak 2.250 kali daripada konsumen yang berpendidikan SD. Sementara interpretasi nilai rasio odds untuk pendidikan SMA adalah peluang konsumen di Bandung dan Semarang dengan pendidikan SMA yang berencana membeli Aqua lebih banyak 1.873 kali dibandingkan dengan konsumen dengan pendidikan SD. Analisis Regresi Logistik pada Node 4 Hasil pendugaan model regresi logistik pada node 4 (Makassar) menunjukkan peubah pengeluaran per bulan sebagai peubah penjelas berpengaruh nyata terhadap peubah respon pada taraf nyata 10% (Lampiran 6). Dari dendogram dapat diketahui peubah pengeluaran per bulan juga merupakan peubah penjelas yang memiliki pengaruh nyata pada metode CHAID. Hal ini menunjukkan bahwa terjadi kekonsistenan pada hasil dari kedua metode tersebut. Sebagai contoh, nilai dugaan rasio odds untuk pengeluaran per bulan antara Rp 1.500.001 sampai Rp 2.000.000 adalah sebesar 0.380, artinya peluang konsumen di Makassar yang memiliki pengeluaran per bulan antara Rp 1.500.001 sampai Rp 2.000.000 untuk membeli Aqua lebih sedikit 0.380 kali daripada konsumen dengan pengeluaran per bulan lebih dari Rp 2.000.000. Sementara dugaan rasio odds untuk pengeluaran per bulan antara Rp 700.001 sampai Rp 1.500.000 dapat diinterpretasikan bahwa peluang konsumen dengan pengeluaran per bulan antara Rp 700.001 sampai Rp 1.500.000 di Makassar yang berencana membeli Aqua lebih sedikit 0.179 kali daripada konsumen dengan pengeluaran per bulan lebih dari Rp 2.000.000. Analisis Regresi Logistik pada Node 13 Pendugaan model regresi logistik pada node 13 menghasilkan peubah usia sebagai peubah penjelas yang berpengaruh nyata pada taraf nyata 10% (Lampiran 7). Peubah usia juga memiliki pengaruh nyata terhadap peubah respon dalam analisis CHAID. Hal ini menandakan bahwa hasil dari regresi logistik
pada node 13 konsisten dengan hasil metode CHAID. Nilai dugaan rasio odds yang dihasilkan untuk usia lebih dari 34 tahun sebesar 0.295. Hal ini berarti bahwa kemungkinan konsumen di Makassar yang memiliki pengeluaran per bulan Rp 1.500.000 ke bawah dan berusia lebih dari 34 tahun untuk membeli Aqua lebih sedikit 0.295 kali daripada konsumen dengan pengeluaran per bulan Rp 1.500.000 ke bawah dan berusia di bawah 22 tahun. KESIMPULAN Hasil CHAID menunjukkan bahwa peubah yang berpengaruh terhadap rencana membeli Aqua, yaitu kota, usia, pendidikan, dan pengeluaran per bulan. Analisis CHAID menghasilkan dua belas segmen pasar konsumen Aqua. Pengujian peubah dengan menggunakan analisis regresi logistik pada tiap node dari dendogram CHAID memberikan hasil yang konsisten. Konsumen yang berada di Medan memiliki peluang lebih besar dalam berencana membeli Aqua daripada konsumen di kota lainnya. Di Jakarta dan Surabaya, konsumen yang berusia 22 tahun ke atas memiliki kemungkinan lebih sedikit dalam berencana membeli Aqua daripada konsumen dengan usia di bawah 22 tahun. Konsumen di Medan, Bandung, dan Semarang dengan pendidikan di atas SD berpeluang lebih besar dalam berencana membeli Aqua daripada konsumen dengan pendidikan SD. Konsumen di Makassar dengan pengeluaran per bulan lebih dari Rp 2.000.000 memiliki peluang lebih besar dalam berencana membeli Aqua daripada konsumen dengan pengeluaran per bulan Rp 2.000.000 ke bawah. Kemungkinan konsumen di Makassar dengan usia 22 tahun ke atas dan pengeluaran per bulan Rp 1.500.000 ke bawah yang berencana membeli Aqua lebih sedikit daripada konsumen yang berusia di bawah 22 tahun dan pengeluaran per bulan Rp 1.500.000 ke bawah. DAFTAR PUSTAKA Alamudi A, Wigena AH, Aunuddin. 1998. Eksplorasi Struktur Data Menggunakan Metode CHAID. Forum Statistika dan Komputasi. Institut Pertanian Bogor. ISSN: 0853 8115. Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. Second Edition. New York: John Wiley and Sons.
7
Kass GV. 1980. An Exploratory Technique for Investigating Large Quantities of Categorical Data. Appl. Statist. 29, No. 2: 119-127. Kotler P. 2003. Marketing Management. Eleventh Edition. New Jersey: Pearson Education.
LAMPIRAN
Lampiran 1 Dendogram pemisahan hasil analisis CHAID pada taraf nyata 10%.
8
9
Lampiran 2 Hasil analisis regresi logistik pada Node 0 Peubah
Standard Error
Beta
Kota
Statistik Uji Wald 252.043
Derajat bebas 6
Nilai-p
Rasio Odds
.000
Kota(1)
-.602
.142
17.858
1
.000
.548
Kota(2)
-.615
.155
15.811
1
.000
.541
Kota(3)
-.130
.150
.753
1
.386
.878
Kota(4)
.235
.174
1.832
1
.176
1.265
Kota(5)
-1.931
.158
149.478
1
.000
.145
Kota(6)
-1.457
.153
90.491
1
.000
.233
10.255
4
.036
Pendidikan (1)
.187
.137
1.868
1
.172
1.205
Pendidikan (2)
.051
.125
.165
1
.684
1.052
Pendidikan (3)
.136
.232
.346
1
.556
1.146
Pendidikan (4)
.679
.237
1.972
Pendidikan
Pengeluaran per bulan
8.199
1
.004
20.838
4
.000
Pengeluaran per bulan (1)
-.142
.142
1.010
1
.315
.867
Pengeluaran per bulan (2)
-.418
.130
10.349
1
.001
.659
Pengeluaran per bulan (3)
-.615
.161
14.521
1
.000
.541
Pengeluaran per bulan (4)
-.651
.352
3.432
1
.064
.521
4.643
2
.098
2.364
1
.124
Usia Usia(1)
-.210
.136
.811
Usia(2)
-.280
.130
4.637
1
.031
.756
Constant
1.578
.206
58.476
1
.000
4.846
Lampiran 3 Hasil analisis regresi logistik pada Node 1 Peubah
Beta
Standard Error
Usia
Statistik Uji Wald
Derajat bebas
Nilai-p
8.978
2
.011
Rasio Odds
Usia(1)
-.669
.270
6.123
1
.013
.512
Usia(2)
-.784
.262
8.978
1
.003
.457
Constant
1.775
.242
53.877
1
.000
5.900
Rasio Odds
Lampiran 4 Hasil analisis regresi logistik pada Node 2 Peubah
Beta
Standard Error
Pendidikan
Statistik Uji Wald
Derajat bebas
Nilai-p
10.568
4
.032
Pendidikan (1)
1.609
.520
9.585
1
.002
5.000
Pendidikan (2)
.745
.409
3.317
1
.069
2.106
Pendidikan (3)
.604
.627
.926
1
.336
1.829
Pendidikan (4)
1.743
1.109
2.468
1
.116
5.714
Constant
.560
.362
2.391
1
.122
1.750
10
Lampiran 5 Hasil analisis regresi logistik pada Node 3 Peubah
Beta
Standard Error
Statistik Uji Wald
Derajat bebas
Nilai-p
12.116
4
.017
Pendidikan
Rasio Odds
Pendidikan (1)
.811
.245
10.971
1
.001
2.250
Pendidikan (2)
.628
.230
7.429
1
.006
1.873
Pendidikan (3)
.809
.434
3.467
1
.063
2.245
Pendidikan (4)
.873
.427
4.180
1
.041
2.393
Constant
.034
.283
.015
1
.904
1.035
Lampiran 6 Hasil analisis regresi logistik pada Node 4 Peubah
Beta
Standard Error
Statistik Uji Wald
Derajat bebas
Nilai-p
29.053
4
.000
Pengeluaran per bulan
Rasio Odds
Pengeluaran per bulan (1)
-.967
.413
5.492
1
.019
.380
Pengeluaran per bulan (2)
-1.722
.400
18.517
1
.000
.179
Pengeluaran per bulan (3)
-1.999
.494
16.411
1
.000
.135
Pengeluaran per bulan (4)
-2.606
.705
13.649
1
.000
.074
.613
.344
3.170
1
.075
1.846
Constant
Lampiran 7 Hasil analisis regresi logistik pada Node 13 Peubah
Beta
Standard Error
Usia
Statistik Uji Wald
Derajat bebas
Nilai-p
6.939
2
.031
Rasio Odds
Usia(1)
-.639
.450
2.016
1
.156
.528
Usia(2)
-1.220
.466
6.841
1
.009
.295
Constant
-.511
.365
1.957
1
.162
.600