PREFERENSI KARAKTERISTIK KOPI 3 IN 1 MENGGUNAKAN METODE POHON REGRESI DAN KLASIFIKASI
FITRIYANTO
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010
RINGKASAN FITRIYANTO. Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi. Dibimbing oleh AUNUDDIN dan LA ODE ABDUL RAHMAN. Saat ini, banyak perusahaan yang berlomba-lomba memproduksi kopi 3 in 1. Hal ini menimbulkan tantangan bagi salah satu pihak perusahaan kopi 3 in 1, yaitu PT X yang memproduksi kopi X. Perusahaan ini harus lebih pandai menciptakan produk yang disukai masyarakat agar produknya laris di pasaran. Untuk mengetahui apakah produk sudah disukai oleh konsumen perlu dilakukan evaluasi produk. Tahap awal yang dapat dilakukan oleh PT X adalah eksplorasi data dengan membuat klasifikasi karakteristik kopi X. Analisis yang dapat digunakan untuk membuat klasifikasi adalah metode pohon regresi dan klasifikasi (classification and regression trees). Pohon regresi dan klasifikasi adalah salah satu metode eksplorasi data yaitu berupa teknik pohon keputusan. Pohon keputusan yang digunakan pada penelitian ini adalah pohon klasifikasi. Penelitian ini menghasilkan pohon klasifikasi optimum dengan peubah penjelas yang masuk kedalam pohon yaitu kekuatan aroma kopi dan kekuatan rasa susu. Hasil klasifikasi sebanyak tiga klasifikasi karakteristik kopi X dengan dua klasifikasi memiliki label kelas bahwa konsumen menyukai produk kopi X dan sisanya memiliki label kelas bahwa konsumen biasa saja terhadap produk ini. Kata kunci: pohon klasifikasi, kopi 3 in 1
PPREFERENSI KARAKTERISTIK KOPI 3 IN 1 MENGGUNAKAN METODE POHON REGRESI DAN KLASIFIKASI
FITRIYANTO
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010
Judul : Nama : NRP :
Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi Fitriyanto G14061368
Menyetujui: Pembimbing I,
Pembimbing II,
Prof. Dr. Ir. Aunuddin, M.Sc NIP.19470615 197106 1 001
La Ode Abdul Rahman, S.Si, M.Si
Mengetahui: Ketua Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si NIP. 19650421 199002 1 001
Tanggal Lulus:
KATA PENGANTAR Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas segala rahmat, hidayah, kemudahan, dan karunia-Nya sehingga skripsi yang berjudul “Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi ” ini dapat diselesaikan dengan baik. Pada kesempatan ini, penulis mengucapkan terima kasih kepada: 1. Bapak Prof. Dr. Ir. Aunuddin, M.Sc sebagai ketua komisi pembimbing atas kesabarannya dalam membimbing dan memberi ide, saran serta kritik membangun selama penulisan karya ilmiah ini. 2. Bapak La Ode Abdul Rahman, S.Si, M.Si selaku dosen pembimbing atas seluruh masukan dan dukungan yang diberikan sehingga karya ilmiah ini dapat diselesaikan dengan baik. 3. Ibu Pika Silvianti selaku penguji luar atas kesediaannya memberikan saran dan membantu penulis dalam menyempurnakan karya ilmiah ini. 4. Bapak Kelik Harjono dan M Mufti Mubarak yang telah bersedia membantu penulis untuk memperoleh data yang digunakan dalam karya ilmiah ini. 5. Ibu Endang, Mba Susan dan suluruh Ibu pengasuh di Yayasan Namira yang telah membantu membiayai kuliah penulis 6. Ibu dan kakak tersayang atas segala dukungan dan semangat yang tak henti-hentinya selama ini. 7. Nurhayati atas diskusi dan semangatnya dalam membantu penulis menyelesaikan penulisan ini. 8. Teman-teman STK 43. “Terima kasih atas diskusi dan motivasinya.” Penulis sangat berharap karya ilmiah ini dapat bermanfaat bagi penulis dan pembaca. Bogor, Desember 2010
Fitriyanto
RIWAYAT HIDUP Penulis dilahirkan di Jakarta pada tanggal 18 Mei 1988 sebagai anak bungsu dari pasangan Bapak Wardaya dan Ibu Sutarni. Penulis mengawali pendidikan dasar pada tahun 1994 di SD Negeri 03 Petang Jakarta dan lulus pada tahun 2000. Penulis melanjutkan sekolah ke SLTP Negeri 131 Jakarta hingga tahun 2003. Selanjutnya, penulis menamatkan pendidikan menengah atas di SMA Negeri 49 Jakarta pada tahun 2006 dan pada tahun yang sama penulis diterima di Perguruan Tinggi Institut Pertanian Bogor melalui jalur SPMB dengan mayor Statistika dan minor Manajemen Fungsional. Selama menjadi mahasiswa, Penulis aktif di kelembagaan kemahasiswaan IPB sebagai anggota Himpunan Keprofesian Gamma Sigma Beta Statistika IPB. Penulis pernah menjadi asisten dosen untuk mata kuliah rancangan percobaan pada semester enam dan mata kuliah metode statistika pada semester tujuh. Penulis juga pernah bekerja menjadi staf promosi di bimbingan belajar dan olah data Statistics Centre periode tahun 2008 sampai 2009.
DAFTAR ISI Halaman DAFTAR TABEL ................................................................................................................. viii DAFTAR GAMBAR ............................................................................................................ viii DAFTAR LAMPIRAN ......................................................................................................... viii PENDAHULUAN Latar Belakang................................................................................................................. Tujuan..............................................................................................................................
1 1
TINJAUAN PUSTAKA Pohon Regresi dan Klasifikasi ......................................................................................... Pemilihan Pemilah ........................................................................................................... Penentuan Simpul Terminal ............................................................................................ Penandaan Label Kelas .................................................................................................... Penentuan Pohon Optimum .............................................................................................
1 1 2 2 2
DATA DAN METODE Data ................................................................................................................................. Metode .............................................................................................................................
3 3
HASIL DAN PEMBAHASAN Deskripsi Peubah Respon ................................................................................................ Analisis Pohon Klasifikasi Menggunakan Metode Pohon Regresi dan Klasifikasi .........
3 4
SIMPULAN DAN SARAN Simpulan .......................................................................................................................... Saran ................................................................................................................................
6 6
DAFTAR PUSTAKA ...........................................................................................................
6
LAMPIRAN ..........................................................................................................................
7
DAFTAR TABEL 1 2
Halaman Statistik Deskriptif Kesukaan Konsumen terhadap Kopi X Secara Keseluruhan .......... 3 Urutan Pohon Klasifikasi ............................................................................................... 4
DAFTAR GAMBAR 1 2 3
Halaman Struktur Pohon Klasifikasi ............................................................................................. 1 Pohon Klasifikasi Optimum ........................................................................................... 4 Pohon Klasifikasi Hasil Pengembangan Satu Tahap dari Pohon Klasifikasi Optimum ........................................................................................................................ 5
DAFTAR LAMPIRAN 1 2 3
Halaman Karakteristik Peubah ...................................................................................................... 8 Nilai Tingkat Salah Pengklasifikasian Pengganti Relatif Validasi Silang Setiap Pohon .................................................................................................................. 8 Pohon Klasifikasi Hasil Pengembangan Dua Tahap dari Pohon Klasifikasi Optimum ........................................................................................................................ 9
1
PENDAHULUAN Latar Belakang Saat ini banyak perusahaan yang memproduksi kopi 3 in 1 dengan berbagai merek. Salah satu untuk jenis minuman ini adalah kopi X. Kopi X merupakan minuman kopi 3 in 1 susu, yaitu campuran antara kopi, gula dan susu yang diproduksi oleh PT X. Banyaknya perusahan yang berlombalomba memproduksi kopi 3 in 1, mengakibatkan adanya persaingan yang ketat. Adanya persaingan menimbulkan tantangan bagi salah satu pihak perusahaan kopi 3 in 1, yaitu PT X. Pihak perusahaan minuman ini harus lebih pandai menciptakan produk agar produknya laris di pasaran. Pada kenyataannya, sering kali suatu konsumen menginginkan produk dengan karakteristik tertentu. Oleh karena itu, PT X harus menciptakan produk yang disukai konsumen. Untuk mengetahui apakah produk sudah disukai oleh konsumen perlu dilakukan evaluasi produk. Tahap awal yang dapat dilakukan oleh PT X adalah eksplorasi data. Eksplorasi data yang dapat dilakukan berbentuk klasifikasi. Analisis yang dapat digunakan untuk membuat klasifikasi adalah metode pohon regresi dan klasifikasi (classification and regression trees). Sedangkan untuk tahap selanjutnya dapat dilakukan dengan metode lain. Tujuan Tujuan penelitian ini adalah membuat klasifikasi karakteristik kopi X yang disukai menggunakan metode pohon regresi dan klasifikasi.
TINJAUAN PUSTAKA Pohon Regresi dan Klasifikasi Pohon regresi dan klasifikasi (classification and regression trees) adalah salah satu metode eksplorasi data yaitu berupa teknik pohon keputusan. Metode ini dikembangkan oleh Leo Breiman, Jerome H. Friedman, Richard A. Olshen dan Charles J. Stone sekitar tahun 1980. Pohon regresi dan klasifikasi merupakan pendekatan yang populer untuk membangun klasifikasi berdasarkan pohon biner (Mulier 1998). Metode ini akan menghasilkan pohon regresi jika peubah responnya kontinu dan menghasilkan pohon klasifikasi jika peubah responnya kategorik.
Pohon klasifikasi merupakan penyekatan data secara berulang (rekursif) dan menghasilkan sekatan yang biner, karena selalu membagi kumpulan data menjadi dua sekatan. Hal ini dapat ditunjukan dalam suatu gambar struktur pohon (Gambar 1). Node/ Simpul
A ya
tidak
cabang
C
B
C
C
Simpul terminal
Gambar 1 Struktur pohon klasifikasi Menurut Breiman et al. (1993), pohon klasifikasi terdiri dari tiga elemen, yaitu: 1. Pemilihan pemilah. 2. Penentuan simpul terminal. 3. Penandaan label kelas. Misalkan (X, y) merupakan peubah penjelas dan peubah respon dengan X=(x1, x2, ..., xq)ЄRq tersusun dari q vektor penjelas dan y={1, 2, ..., j} vektor label yang berkaitan, sehingga terdapat himpunan data L={(xn, jn), n=1, 2, ..., N}. T dinamakan pohon klasifikasi sedangkan ∀t∈T dinamakan simpul pohon. Elemen minimum dari T dinamakan akar(T). Jika g,h∈T dan sisi kiri bagian simpul t (g=l(h)) atau sisi kanan simpul t (g=r(h)), maka h dinamakan simpul induk (induk(g)) dan g dinamakan simpul anak (anak(h)). Jika h=induk(g) atau h=induk(induk(g)), g dinamakan keturunan(h) dan h dinamakan tertua(g). Tt adalah himpunan bagian dari T yang memuat t dan seluruh keturunan t. Pemangkasan cabang Tt dari T dengan cara menghilangkan seluruh keturunan(t) dari T yaitu potong seluruh Tt kecuali akar(Tt). Pohon terpangkas dinotasikan dengan T-Tt (Kardiana et al. 2006). Pemilihan Pemilah Pada tahap ini akan dicari pemilah yang menurunkan tingkat keheterogenan yang paling tinggi dari setiap simpul. Breiman et al. (1993) menjelaskan bahwa impuritas merupakan ukuran keheterogenan suatu simpul. Fungsi impuritas yang dapat digunakan adalah indeks Gini. Bila nilai impuritas suatu simpul semakin besar maka semakin heterogen simpul tersebut.
2
Nilai impuritas menggunakan indeks Gini pada simpul t, i(t), dapat ditulis sebagai berikut: = 1 − ∑ | dimana p(j|t) adalah peluang unit pengamatan dalam kelas ke-j berasal dari simpul t yang dinyatakan sebagai berikut: | =
/
∑ /
dengan adalah peluang awal kelas ke-j, adalah banyaknya unit pengamatan yang termasuk dalam kelas ke-j, dan adalah banyaknya unit pengamatan yang termasuk dalam kelas ke-j pada simpul t. Pemilahan dimulai dari ruang umum dengan cara memeriksa nilai-nilai dari setiap peubah penjelas. Misalkan untuk setiap peubah penjelas xq dimana xq ∈ X, q=(1, 2, ..., m). Untuk peubah penjelas yang dapat diurutkan, pemilah peubah penjelas dilakukan dengan bentuk xq ≤ c lawan xq > c, c adalah bilangan riil . Jika peubah penjelas xq yang tidak dapat diurutkan dengan b kategori, dimana b∈{b1, b2,..., bd}, d adalah banyaknya kategori peubah penjelas ke-q, maka b kategori dibagi menjadi dua himpunan saling lepas (akan terdapat sebanyak 2b-1-1 kemungkinan pemilah) Misalkan terdapat calon pemilah s yang memilah t menjadi tL (dengan proporsi PL) dan menjadi tR (dengan proporsi PR), maka kebaikan dari s didefinisikan sebagai penurunan impuritas: ∆, = – – Pengembangan pohon dilakukan dengan cara, pada simpul t1, carilah s* yang memberikan nilai penurunan impuritas tertinggi yaitu: ∆ ∗, = max − − ∈!
dengan S adalah gugus yang berisi semua kemungkinan penyekatan. Maka t1 dipilah menjadi t2 dan t3 menggunakan s*. Dengan cara yang sama dilakukan juga pencarian pemilah terbaik pada t2 dan t3 secara terpisah, dan seterusnya. Sehingga didapatkan penurunan keheterogenan pohon dengan membelah simpul t sebagai berikut:
∆", = # − − $ dimana p(t) adalah peluang amatan berada pada simpul t yang dapat ditulis sebagai berikut: = % /
Penentuan Simpul Terminal Suatu simpul t akan menjadi simpul terminal atau tidak akan dipilah kembali, apabila adanya batasan minimum jumlah pengamatan. Umumnya jumlah pengamatan minimum pada simpul sebesar 5 dan terkadang berjumlah 1 (Breiman et al. 1993). Maka selanjutnya t tidak dipilah lagi tetapi dijadikan simpul terminal dan hentikan pembentukan pohon. Penandaan Label Kelas Label kelas dari simpul terminal ditentukan berdasarkan aturan jumlah terbanyak, yaitu jika P(j0|t) = max P(j|t), maka label kelas untuk terminal t adalah j0 (Breiman et al. 1993). Penentuan Pohon Optimum Breiman et al. (1993) menjelaskan bahwa pohon klasifikasi T tidak dibatasi ukurannya. Pohon klasifikasi terbesar memberikan nilai salah pengklasifikasian paling kecil sehingga kita akan selalu cenderung memilih pohon ini untuk prakiraan. Tetapi, pohon ini cukup kompleks dalam menggambarkan struktur data. Sehingga perlu dipilih pohon optimal yang berukuran sederhana tetapi memberikan tingkat salah pengklasifikasian pengganti yang kecil. Salah satu cara penentuan pohon klasifikasi dengan pemangkasan (pruning). Pemangkasan berturut-turut memangkas beberapa bagian pohon. Hal ini bertujuan untuk memperoleh pohon yang berukuran sederhana. Ukuran pemangkasan yang digunakan untuk memperoleh ukuran pohon yang optimum adalah biaya kompleksitas (cost-complexcity). Persamaan ukuran biaya kompleksitas adalah: &' () = &() + '|(+) | adalah tingkat salah dengan &(, pengklasifikasian pada pohon bagian Tk untuk -, adalah himpunan simpul terminal k ≥ 1, ( -, | adalah banyaknya simpul pada Tk, |(
3
terminal pada Tk, dan α adalah parameter biaya kompleksitas. Tingkat salah pengklasifikasian penggganti didapatkan dengan cara amatan induk L yang berukuran n dibagi secara acak menjadi v kelompok, yaitu L1, L2, ..., Lv yang sedapat mungkin berukuran sama. Himpunan data untuk membentuk pohon ke-v adalah L(v) = L Lv, dimana v = 1, 2, ..., V yang digunakan untuk membentuk v urutan pohon T(v)(α). Bila ukuran v besar, maka seharusnya memiliki tingkat salah pengklasifikasian yang sama dengan T(α) = T(αk) = Tk. Tingkat salah pengklasifikasian pengganti T(α) sebagai berikut: &./ (' =
1 % 0| )1 1,
dengan N adalah banyaknya data pada L, c(i|j) adalah biaya salah pengklasifikasian responden kelas ke-j diklasifikasikan sebagai responden kelas ke-i. dimana Ni j adalah banyaknya responden kelas ke-j diklasifikasikan sebagai responden kelas ke-i. 1 = % 1 (2) 2
dengan 1 (2) adalah banyaknya responden kelas ke-j diklasifikasikan sebagai responden kelas ke-i oleh T(v)(α). Kemudian gunakan amatan induk L untuk membentuk urutan {Tk} dengan αk ≤ α < αk+1. Definisikan '′, = 4', ',5 maka tingkat salah pengklasifikasian pengganti validasi silang pada pohon bagian Tk sebagai berikut: &./ ((, ) = &./ ((('′, )) Hasil proses pemangkasan berupa sederet pohon klasifikasi Tk dan dengan validasi silang v-lipatan dapat ditentukan pohon optimum Tk0 sebagai berikut: &./ ((,6 )
=
min(&./ ((, )) ,
DATA DAN METODE Data Data yang digunakan untuk penelitian ini adalah data CLT (Central Location Test) untuk produk kopi 3 in 1 di beberapa kota di Indonesia yang didapat dari Pixel Research (PT. Global Insight Indonesia). Pengambilan
data dengan mengumpulkan beberapa responden pada suatu tempat tertentu dan memberikan kopi X yang sudah dihidangkan kemudian responden menjawab pertanyaan pada lembar pertanyaan. Total responden sebanyak 415 orang dari tiga kota yaitu Bandung, Cimahi dan Sukabumi. Produk kopi yang dicobakan kepada responden merupakan produk kopi baru yang dilambangkan dengan produk kopi X. Semua responden merupakan peminum kopi 3 in 1 dengan merek tertentu. Peubah respon merupakan peubah kategorik yang bernilai 1 sampai 9 dengan skala ordinal. Responden yang suka dengan produk kopi X (y=3) terdiri dari skala 7 sampai 9, responden yang biasa saja dengan produk kopi X (y=2) terdiri dari skala 5 sampai 6, dan responden yang tidak suka dengan produk kopi X (y=1) terdiri dari skala 1 sampai 4. Peubah penjelas merupakan peubah kategorik yang bernilai 1 sampai 5 dengan skala ordinal. Peubah penjelas yang digunakan sebanyak sembilan peubah yang mencirikan karakteristik dari produk kopi 3 in 1 susu. Sembilan peubah penjelas tersebut adalah kekutan aroma kopi, warna, tekstur ampas, kekentalan, kekuatan rasa kopi, kekuatan aroma susu, kekuatan rasa susu, kepahitan, dan kemanisan. Metode Tahapan-tahapan yang dilakukan dalam penelitian ini adalah: 1. Melakukan analisis statistika deskriptif terhadap peubah respon. 2. Melakukan analisis pohon klasifikasi menggunakan metode pohon regresi dan klasifikasi. 3. Melakukan intepretasi hasil. Software yang digunakan untuk analisis adalah CART ver 4.0 dan Answertree ver 3.0.
HASIL DAN PEMBAHASAN Deskripsi Peubah Respon Deskripsi tingkat kesukaan konsumen terhadap kopi X secara keseluruhan dapat dikategorikan pada Tabel 1. Tabel
1
Tidak Suka Biasa Saja Suka Total
Statistik deskriptif kesukaan konsumen terhadap kopi X secara keseluruhan Frekuensi 3 58 354 415
Persentase 0.72 13.98 85.30 100.00
4
Pada Tabel 1 dapat dilihat bahwa terdapat tiga kategori yaitu konsumen yang tidak suka, biasa saja dan suka terhadap produk kopi X. Konsumen yang suka terhadap produk kopi X sebanyak 354 orang (85.30%), konsumen yang biasa saja sebanyak 58 orang (13.98%) dan konsumen yang tidak suka sebanyak 3 orang (0.72%). Secara deskriptif dapat dikatakan bahwa sebagian besar konsumen menyukai kopi X. Analisis Pohon Klasifikasi Menggunakan Metode Pohon Regresi dan Klasifikasi Hasil analisis berupa urutan pohon klasifikasi. Hasil analisis ini disajikan pada Tabel 2. Pada Tabel 2 dapat dilihat bahwa terjadi pemangkasan pohon klasifikasi dari nomor pohon satu sampai nomor pohon tujuh. Pohon klasifikasi optimum tercapai pada nomor pohon tujuh. Jika nomor pohon semakin besar maka jumlah simpul terminal semakin kecil namun jika nomor pohon semakin besar maka nilai parameter kompleksitas semakin besar. Tabel 2 Urutan pohon klasifikasi Nomor Pohon
Jumlah Simpul Terminal 1 26 2 23 3 19 4 12 5 8 6 5 7** 3 8 1 ** pohon klasifikasi optimum
Parameter Kompleksitas 0 8.24E-04 0.001 0.002 0.003 0.005 0.006 0.024
Pohon klasifikasi optimum diperoleh dari pemangkasan pohon klasifikasi terbesar yang menggunakan batasan minimum jumlah amatan pada simpul induk sebanyak 5 sedangkan simpul anak sebanyak 1. Pohon klasifikasi optimum disajikan pada Gambar 2. Proses pemangkasan pohon klasifikasi ini dilakukan dengan dasar aturan biaya kompleksitas minimum dan validasi silang 10 lipatan. Pohon klasifikasi ini tercapai pada parameter kompleksitas bernilai 0.006. Pohon klasifikasi ini memiliki tiga simpul terminal. Peubah penjelas yang masuk kedalam pohon klasifikasi optimum yaitu kekuatan aroma kopi dan kekuatan rasa susu. Peubah pertama yang menyekat adalah kekuatan aroma kopi. Hal ini menyatakan bahwa peubah ini merupakan peubah yang dominan dalam pembentukan pohon klasifikasi. Konsumen sebanyak 415 orang, konsumen yang merasa kekuatan aroma kopi sangat
kurang kuat atau kurang kuat sebanyak 71 orang mengelompok pada simpul 1 (kiri) sedangkan konsumen yang merasa kekuatan aroma kopi pas, kuat atau sangat kuat sebanyak 344 orang mengelompok pada simpul 2 (kanan). Simpul 2 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul pertama sebesar 0.0506. kesukaan kopi X secara keseluruhan
Node 0 Category % n tidak suka 0.72 3 biasa saja 13.98 58 suka 85.30 354 Total (100.00) 415 Kekuatan Aroma Kopi Improvement=0.0506
sangat kurang kuat, <=kurangkuat kuat kurang Node 1 Category % tidak suka 2.82 biasa saja 47.89 suka 49.30 Total (17.11)
n 2 34 35 71
pas, kuat, sangat >kurang kuatkuat Node 2 Category % n tidak suka 0.29 1 biasa saja 6.98 24 suka 92.73 319 Total (82.89) 344
Kekuatan Rasa Susu Improvement=0.0307
sangat kurang kuat, <=kurang kuat kurang kuat Node 3 Category % n tidak suka 7.69 2 biasa saja 84.62 22 suka 7.69 2 Total (6.27) 26
pas, kuat, sangat >kurang kuatkuat Node 4 Category % tidak suka 0.00 biasa saja 26.67 suka 73.33 Total (10.84)
n 0 12 33 45
Gambar 2 Pohon klasifikasi optimum Pada simpul 1, konsumen yang merasa kekuatan rasa susu sangat kurang kuat atau kurang kuat sebanyak 26 orang mengelompok pada simpul 3 (kiri) sedangkan konsumen yang merasa kekuatan rasa susu pas, kuat atau sangat kuat sebanyak 45 orang mengelompok pada simpul 4 (kanan). Simpul 3 dan 4 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul 1 sebesar 0.0307. Hasil pohon klasifikasi optimum yaitu tiga klasifikasi karakteristik kopi X. Klasifikasi yang terbentuk sebagai berikut: 1. Kekuatan aroma kopi dan kekuatan rasa susu kurang. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X. 2. Kekuatan aroma kopi kurang namun kekuatan rasa susu pas atau kuat. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X. 3. Kekuatan aroma kopi pas atau kuat. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X.
5
Karakteristik kopi X yang disukai konsumen pada pohon klasifikasi ini yaitu kopi X pada klasifikasi kedua dan ketiga. Konsumen yang suka dengan kopi X sebanyak 389 orang, konsumen yang menyukai karakteristik kopi X pada klasifikasi kedua sebanyak 45 orang sedangkan pada klasifikasi ketiga sebanyak 344 orang. Hal ini menjelaskan bahwa sebagian besar konsumen menyukai karakteristik kopi pada klasifikasi ketiga. Jika pohon optimum dikembangkan satu tahap lagi maka menghasilkan pohon dengan pencabangan dari simpul 2. Pohon ini disajikan pada Gambar 3. Pohon ini tercapai pada parameter kompleksitas bernilai 0.005. Pohon ini memiliki tiga peubah penjelas yang masuk kedalam pohon klasifikasi yaitu kekuatan aroma kopi, kekuatan rasa susu dan kekuatan rasa kopi. Pohon ini memiliki jumlah klasifikasi lebih banyak dibandingkan dengan pohon klasifikasi optimum yaitu sebanyak lima buah. Pada simpul 2, konsumen yang merasa kekuatan rasa kopi sangat kurang kuat, kurang kuat atau pas sebanyak 323 orang mengelompok pada simpul 5 (kiri) sedangkan konsumen yang merasa kekuatan rasa kopi kuat atau sangat kuat sebanyak 21 orang
mengelompok pada simpul 6 (kanan). Simpul 5 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul 2 sebesar 0.0158. Pada simpul 6, konsumen yang merasa kekuatan aroma kopi pas sebanyak 15 orang mengelompok pada simpul 13 (kiri) sedangkan konsumen yang merasa kekuatan aroma kopi kuat atau sangat kuat sebanyak 6 orang mengelompok pada simpul 14 (kanan). Simpul 13 dan 14 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul 6 sebesar 0.0092. Hasil pengembangan satu tahap dari pohon klasifikasi optimum yaitu pohon klasifikasi dengan lima klasifikasi karakteristik kopi X. Klasifikasi yang terbentuk sebagai berikut: 1. Kekuatan aroma kopi dan kekuatan rasa susu kurang. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X. 2. Kekuatan aroma kopi kurang namun kekuatan rasa susu pas atau kuat. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X. 3. Kekuatan aroma kopi pas atau kuat namun kekuatan rasa kopi kurang atau pas. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X.
kesukaan kopi X secara keseluruhan
Node 0 Category % tidak suka 0.72 biasa saja 13.98 suka 85.30 Total (100.00)
n 3 58 354 415
Kekuatan Aroma Kopi Improvement=0.0506
pas, kuat, sangat kuat
Sangat kurang kuat, <=kurang kuat kurang kuat Node 1 Category % tidak suka 2.82 biasa saja 47.89 suka 49.30 Total (17.11)
>kurang kuat
Node 2 Category % n tidak suka 0.29 1 biasa saja 6.98 24 suka 92.73 319 Total (82.89) 344
n 2 34 35 71
Kekuatan Rasa Kopi Improvement=0.0158
Kekuatan Rasa Susu Improvement=0.0307
Sangat kurang kuat, <=kurang kuat kurang kuat Node 3 Category % n tidak suka 7.69 2 biasa saja 84.62 22 suka 7.69 2 Total (6.27) 26
pas, kuat, sangat kuat >kurang kuat
Node 4 Category % tidak suka 0.00 biasa saja 26.67 suka 73.33 Total (10.84)
n 0 12 33 45
sangat kurang kuat, <=Pas kurang kuat, pas
kuat, sangat kuat
Node 5 Category % n tidak suka 0.00 0 biasa saja 4.64 15 suka 95.36 308 Total (77.83) 323
Node 6 Category % n tidak suka 4.76 1 biasa saja 42.86 9 suka 52.38 11 Total (5.06) 21
>Pas
Kekuatan Aroma Kopi Improvement=0.0092
pas
<=Pas
Node 13 Category % n tidak suka 0.00 0 biasa saja 26.67 4 suka 73.33 11 Total (3.61) 15
kuat, sangat kuat >Pas
Node 14 Category % n tidak suka 16.67 1 biasa saja 83.33 5 suka 0.00 0 Total (1.45) 6
Gambar 3 Pohon klasifikasi hasil pengembangan satu tahap dari pohon klasifikasi optimum
6
4.
Kekuatan aroma kopi pas dan kekuatan rasa kopi pas atau kuat. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X. 5. Kekuatan aroma kopi dan kekuatan rasa kopi kuat. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X. Karakteristik kopi X yang disukai konsumen pada pohon klasifikasi ini yaitu kopi X pada klasifikasi kedua, ketiga dan keempat. Konsumen yang suka dengan kopi X sebanyak 383 orang, konsumen yang menyukai karakteristik kopi X pada klasifikasi kedua sebanyak 45 orang, pada klasifikasi ketiga sebanyak 323 orang, dan pada klasifikasi keempat sebanyak 15 orang. Hal ini menjelaskan bahwa sebagian besar konsumen menyukai karakteristik kopi pada klasifikasi ketiga. Klasifikasi kedua, ketiga dan keempat memiliki label kelas bahwa konsumen menyukai produk X sedangkan sisanya memiliki label kelas bahwa konsumen biasa saja terhadap kopi X. Konsumen terbanyak terdapat pada klasifikasi ketiga yaitu sebanyak 323 orang sedangkan kosumen yang paling sedikit terdapat pada klasifikasi kelima yaitu sebanyak 6 orang. Pohon klasifikasi yang akan dipilih merupakan pohon klasifikasi yang memiliki nilai RCV terkecil. Jika melihat pohon hasil pencabangan satu tahap dari pohon klasifikasi optimum, pohon ini lebih terperinci namun ada klasifikasi yang jumlah konsumennya sedikit. Sehingga pohon klasifikasi yang dipilih yaitu pohon klasifikasi optimum.
SIMPULAN DAN SARAN Simpulan Pohon klasifikasi yang terbentuk sebanyak delapan urutan pohon klasifikasi. Pohon klasifikasi yang akan dipilih merupakan pohon klasifikasi yang memiliki nilai RCV terkecil. Sehingga pohon klasifikasi yang dipilih yaitu pohon klasifikasi optimum. Pohon klasifikasi optimum menghasilkan tiga klasifikasi karakteristik kopi X. Klasifikasi yang terbentuk sebagai berikut: 1. Kekuatan aroma kopi dan kekuatan rasa susu kurang. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X. 2. Kekuatan aroma kopi kurang namun kekuatan rasa susu pas atau kuat. Label
kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X. 3. Kekuatan aroma kopi pas atau kuat. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X. Karakteristik kopi X yang disukai yaitu kopi X pada klasifikasi kedua dan ketiga. Saran Untuk penelusuran peubah penjelas dalam pendugaan tingkat kesukaan konsumen secara keseluruhan terhadap kopi 3 in 1, dapat menggunakan metode analisis yang lain seperti metode pohon gabungan.
DAFTAR PUSTAKA Breiman L, JH Friedman, RA Olshen, CJ Stone. 1993. Classification and Regression Trees. New York: Chapman and Hall. Kardiana A, Aunuddin, AH Wigena, H Wijayanto. 2006. Metode Klasifikasi Berstruktur Pohon Biner: Kasus Prakiraan Sifat Hujan Bulanan di Bogor. Yogyakarta, 17 Juni 2006. Seminar Nasional Aplikasi Teknologi Informasi (SNATI). hlm: G21-G25. Kurniawan T. 2002. Penerapan Metode Pemangkasan dalam CART (Classification and Regression Trees): Kasus Pendugaan Status Gizi Anak di Kecamatan Bogor Timur [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Mulier C. 1998. Learning From Data Concept, Theory, and Methods. New York: John Wiley & Sons, Inc. Sinambela YS. 2008. Penerapan Metode Pohon Klasifikasi dengan Algoritma CART pada Data Status Daerah Kabupaten di Indonesia [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Wulandari SA. 2004. Analisis Tingkat Keberhasilan Mahasiswa S2 IPB Menggunakan Pendekatan Pohon Regresi [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
7
LAMPIRAN
8
Lampiran 1 Karakteristik peubah Kode Y
Peubah Kesukaan Kopi X Secara Keseluruhan
X1
Kekuatan Aroma Kopi
X2
Warna
X3
Tekstur Ampas
X4
Kekentalan
X5
Kekuatan Rasa Kopi
X6
Kekuatan Aroma Susu
X7
Kekuatan Rasa Susu
X8
Kepahitan
X9
Kemanisan
Keterangan 1: tidak suka 2: biasa saja 3: suka 1: sangat kurang kuat 2: kurang kuat 3: pas 4: kuat 5: sangat kuat 1: terlalu terang 2: terang 3: pas 4: gelap 5: terlalu gelap 1: terlalu halus 2: halus 3: pas 4: kasar 5: terlalu kasar 1: terlalu encer 2: encer 3: pas 4: kental 5: terlalu kental 1: sangat kurang kuat 2: kurang kuat 3: pas 4: kuat 5: sangat kuat 1: sangat kurang kuat 2: kurang kuat 3: pas 4: kuat 5: sangat kuat 1: sangat kurang kuat 2: kurang kuat 3: pas 4: kuat 5: sangat kuat 1: sangat kurang pahit 2: kurang pahit 3: pas 4: pahit 5: terlalu pahit 1: sangat kurang manis 2: kurang manis 3: pas 4: manis 5: terlalu manis
Lampiran 2 Nilai tingkat salah pengklasifikasian pengganti relatif validasi silang setiap pohon Nomor Pohon 1 2 3 4 5 6 7** 8
Tingkat Salah Pengklasifikasian Pengganti Relatif Validasi Silang 0.705 +/- 0.094 0.738 +/- 0.095 0.770 +/- 0.095 0.705 +/- 0.089 0.672 +/- 0.085 0.705 +/- 0.077 0.672 +/- 0.065 1.000 +/- .734046E-04
9
Lampiran 2 Pohon klasifikasi hasil pengembangan dua tahap dari pohon klasifikasi optimum kesukaan kopi X secara keseluruhan Node 0 Category % n tidak suka 0.72 3 biasa saja 13.98 58 suka 85.30 354 Total (100.00) 415 Kekuatan Aroma Kopi Improvement=0.0506
Sangat kurang kuat, <=kurang kuat kurang kuat Node 1 Category % tidak suka 2.82 biasa saja 47.89 suka 49.30 Total (17.11)
Pas, kuat, sangat kuat >kurang kuat
Node 2 Category % n tidak suka 0.29 1 biasa saja 6.98 24 suka 92.73 319 Total (82.89) 344
n 2 34 35 71
Kekuatan Rasa Kopi Improvement=0.0158
Kekuatan Rasa Susu Improvement=0.0307
Sangat kurang kuat, <=kurang kuat kurang kuat Node 3 Category % n tidak suka 7.69 2 biasa saja 84.62 22 suka 7.69 2 Total (6.27) 26
Pas, kuat, sangat kuat >kurang kuat
Node 4 Category % tidak suka 0.00 biasa saja 26.67 suka 73.33 Total (10.84)
n 0 12 33 45
Sangat kurang kuat, <=Pas kurang kuat, pas
Kuat, sangat kuat >Pas
Node 5 Category % n tidak suka 0.00 0 biasa saja 4.64 15 suka 95.36 308 Total (77.83) 323
Node 6 Category % n tidak suka 4.76 1 biasa saja 42.86 9 suka 52.38 11 Total (5.06) 21
Kepahitan Improvement=0.0094
Sangat kurang pahit, <=kurang pahit kurang pahit Node 9 Category % tidak suka 0.00 biasa saja 50.00 suka 50.00 Total (4.82)
Pas, pahit, terlalu >kurang pahit pahit
n 0 10 10 20
Node 10 Category % n tidak suka 0.00 0 biasa saja 8.00 2 suka 92.00 23 Total (6.02) 25
Kemanisan Improvement=0.0060
Sangat kurang manis, <=Pas kurang manis, pas Node 15 Category % n tidak suka 0.00 0 biasa saja 37.50 6 suka 62.50 10 Total (3.86) 16
Manis, terlalu manis >Pas
Node 16 Category % n tidak suka 0.00 0 biasa saja 100.00 4 suka 0.00 0 Total (0.96) 4
Kepahitan Improvement=0.0043
Sangat kurang pahit
<=Sangat kurang pahit
Node 27 Category % n tidak suka 0.00 0 biasa saja 100.00 2 suka 0.00 0 Total (0.48) 2
Kurang pahit
>Sangat kurang pahit
Node 28 Category % n tidak suka 0.00 0 biasa saja 28.57 4 suka 71.43 10 Total (3.37) 14
Kekuatan Aroma Kopi Improvement=0.0092
pas
<=Pas
Node 13 Category % n tidak suka 0.00 0 biasa saja 26.67 4 suka 73.33 11 Total (3.61) 15
Kuat, sangat kuat >Pas
Node 14 Category % n tidak suka 16.67 1 biasa saja 83.33 5 suka 0.00 0 Total (1.45) 6