LAPORAN AKHIR ANALISIS LANJUT RISET KESEHATAN NASIONAL TAHUN 2014 LB.02.01/I.3/7963/2014
JUDUL PENELITIAN:
PEMETAAN PERILAKU MEROKOK PADA REMAJA DENGAN PENDEKATAN MODEL BASED-CLUSTERING
Tim Peneliti:
Shofi Andari, S.Stat, M.Si
(Koordinator Peneliti / Statistika FMIPA ITS)
Ir. Mutiah Salamah Chamid, M.Kes
(Anggota Peneliti / Statistika FMIPA ITS)
Eta Dian Ayu, S.ST
(Anggota Peneliti / BPS Kalimantan Timur)
JURUSAN STATISTIKA FMIPA INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA
2014
i
ii
SUSUNAN TIM PENELITI
1. Koordinator peneliti : Shofi Andari (NIP. 19871207 201404 2 001) 2. Anggota peneliti
: Ir. Mutiah Salamah, M.Kes (NIP. 19571007 198203 2 001)
3. Anggota peneliti
: Eta Dian Ayu A. Sita (NIP. 19800209 200212 2 004)
iii
KATA PENGANTAR
Syukur Alhamdulillah tim peneliti memanjatkan kehadirat Allah SWT yang telah memberikan nikmat, rahmat dan hidayahNya sehingga tim peneliti dapat menyelesaikan laporan penelitian analisis lanjut tahun 2014 dengan topik Perilaku Kesehatan yang berjudul “Pemetaan Perilaku Merokok Remaja dengan Pendekatan Model-Based Clustering”. Dilatarbelakangi oleh lemahnya regulasinya terhadap rokok dan tembakau di antara negara-negara tetangga ASEAN lainnya serta kekhawatiran akan generasi muda yang diawali oleh remaja (usia 10 – 19 tahun) untuk melanjutkan kebiasaan merokok pada saat dewasa, penelitian ini bertujuan untuk mengidentifikasi factor-faktor yang relevan dalam mempengaruhi perilaku merokok pada remaja serta karakteristik pada remaja tersebut. Pembuatan laporan penelitian analisis lanjut ini masih jauh dari kesempurnaan, untuk itu tim peneliti sangat mengharapkan adanya kritik dan saran demi kebaikan penulisan karya tulis selanjutnya.
Surabaya, 19 Desember 2014
Peneliti
iv
RINGKASAN EKSEKUTIF
Kebiasaan merokok telah menjadi fenomena yang wajar di kalangan masyarakat Indonesia. Bagi mereka yang telah memulai kebiasaan merokok sejak dini atau remaja, lebih besar kemungkinannya untuk terus merokok sampai dewasa, ukuran kemungkinan ini bisa mencapai 80%. Fenomena ini sangat krusial dan mengkhawatirkan, mengingat Indonesia paling lemah regulasinya terhadap rokok dan tembakau di antara negara-negara tetangga ASEAN lainnya. Sebagai bahan pertimbangan, perlu dikaji tentang bagaimana pola perilaku penduduk muda dalam konsumsi tembakau. Studi yang diusulkan ini akan fokus pada pemetaan perilaku konsumsi tembakau pada penduduk usia remaja (adolescent) yakni usia 10 sampai dengan 19 tahun beserta kebiasaan merokok orang tua dan pendidikan terakhir orang tua. Sumber data yang diperlukan adalah hasil survai Riskesdas 2013. Mempertimbangkan data besar berskala nasional yang akan dihadapi dalam studi ini serta sebagian besar skala pengukuran data adalah berskala ordinal atau nominal, maka analisis data akan dilakukan dengan pendekatan machine learning. Metode analisis yang diusulkan dalam studi ini adalah analisis clustering berdasarkan model (model-based clustering) salah satu pertimbangannya yaitu clustering berbasis model beberapa tahun belakangan lebih populer dibandingkan clustering berbasis heuristik karena dasar matematis yang lebih jelas dan interpretasi yang lebih informatif. Sedangkan untuk mengetahui likelihood seorang remaja menjadi perokok di usia muda digunakan analisis regresi logistik biner.
Kata Kunci: perilaku remaja merokok, model-based clustering, analisis regresi logistik biner
v
DAFTAR ISI
Judul ................................................................................................................................... i Lembar Pengesahan ........................................................................................................... ii SK Penelitian ..................................................................................................................... iii Kata Pengantar ................................................................................................................... iv Ringaksan Eksekutif .......................................................................................................... v Daftar Isi ............................................................................................................................ vi
Pendahuluan Latar Belakang ........................................................................................................... 1 Perumusan Masalah Penelitian .................................................................................. 1 Pertanyaan Penelitian ................................................................................................. 2 Tujuan Penelitian ....................................................................................................... 2 Manfaat Penelitian ..................................................................................................... 2 Tinjauan Pustaka Clustering Multidimensional ...................................................................................... 3 Clustering Data Kategorik ......................................................................................... 3 Reresi Logistik Biner ................................................................................................. 4 Perilaku merokok remaja: gloal dan domestic ........................................................... 5 Metode Penelitian Kerangka Teori .......................................................................................................... 8 Kerangka Konsep ....................................................................................................... 9 Definisi Operasional Variabel .................................................................................... 11 Pengolahan dan Analisis Data .................................................................................... 12 Hasil ................................................................................................................................... 13 Pembahasan ....................................................................................................................... 15
Daftar Pustaka .................................................................................................................... 18
vi
PENDAHULUAN Latar Belakang Kebiasaan merokok telah menjadi fenomena yang wajar di kalangan masyarakat Indonesia. Merokok bagi sebagian penduduk berusia muda (13 sampai dengan 17 tahun) justru telah menjadi kebiasaan yang mendarah daging secara budaya (Ng, Weinehall dan Ohmann, 2007). Sebagai pasar terbesar kelima dalam pasar tembakau dunia, sangat mudah bagi pihak luar untuk mempenetrasi Indonesia dan penduduknya dengan rokok. Mudahnya akses rokok masuk ke Indonesia juga disebabkan oleh lemahnya peraturan dan control tembakau pada level nasional. Sampai 2014, Indonesia merupakan satusatunya Negara anggota WHO (World Health Organization) di Asia Tenggara yang tidak terdaftar sebagai anggota Framework Convention and Tobacco Control (FCTC), sebuah komunitas beranggotakan negara-negara di bawah WHO yang berfokus pada control tembakau dan akibat-akibatnya terhadap kesehatan dunia. Ng, Weinehall dan Ohmann (2007) memaparkan bahwa pada tahun 2005, prevalensi perokok muda di Indonesia mencapai presentase 38% di antara anak laki-laki dan 5.3% di antara anak perempuan. Di pertengahan tahun 2014 (Tobacco Free Kids, 2014) sebuah laporan survai mengemukakan bahwa di antara penduduk muda (13 sampai dengan 15 tahun) Indonesia, 20 % di antaranya telah mulai merokok.
Bagi mereka yang telah memulai kebiasaan merokok sejak dini atau remaja, lebih besar kemungkinannya untuk terus merokok sampai dewasa, ukuran kemungkinan ini bisa mencapai 80%. Fenomena ini sangat krusial dan mengkhawatirkan, mengingat Indonesia paling lemah regulasinya terhadap rokok dan tembakau di antara negara-negara tetangga ASEAN lainnya. Sebagai bahan pertimbangan, perlu dikaji tentang bagaimana pola perilaku penduduk muda dalam konsumsi tembakau. Studi yang diusulkan ini akan fokus pada pemetaan perilaku konsumsi tembakau pada penduduk usia remaja (adolescent) yakni usia 10 sampai dengan 19 tahun beserta kebiasaan merokok orang tua dan pendidikan terakhir orang tua. Sumber data yang diperlukan adalah hasil survai Riskesdas 2013. Mempertimbangkan data besar berskala nasional yang akan dihadapi dalam studi ini serta sebagian besar skala pengukuran data adalah berskala ordinal atau nominal, maka analisis data akan dilakukan dengan pendekatan machine learning.
1
Teknik machine learning merupakan teknik semakin popular dalam duapuluh tahun terakhir dan menjadi bagian tak terpisahkan dari data mining terutama untuk kepentingan pengenalan pola (pattern recognition), clustering untuk big data, dan lain lain terkait data berskala dan berdimensi besar. Metode analisis yang diusulkan dalam studi ini adalah analisis clustering berdasarkan model (model-based clustering) salah satu pertimbangannya yaitu clustering berbasis model beberapa tahun belakangan lebih populer dibandingkan clustering berbasis heuristik karena dasar matematis yang lebih jelas dan interpretasi yang lebih informatif (McLachlan, 2007).
Perumusan Masalah Penelitian Tingginya prevalensi kebiasaan merokok pada penduduk usia muda di Indonesia cukuo mengkhawatirkan, mengingat mereka yang memulai merokok pada usia dini kemungkinan besar akan terus merokok sampai usia dewasa. Dalam usulan penelitian ini, inti permasalahan penelitian adalah pada bagaimana kita dapat mengetahui pemetaan perilaku merokok pada penduduk usia muda. Komponen-komponen yang menjadi dasar pengelompokan adalah perilaku merokok, karakteristik individu (usia, jenis kelmain, pendidikan), dan karakteristik keluarga (kebiasaan merokok orang tua dan pendidikan orang tua). Keluaran dari studi ini diharapkan dapat menjadi pertimbangan dalam menentukan kebijakan terutama mengenai regulasi tembakau di Indonesia demi pencegahan kebiasaan merokok sejak dini.
Pertanyaan Penelitian 1) Bagaimana pengelompokan perilaku merokok penduduk usia muda di Indonesia? 2) Bagaimana karakteristik setiap kelompok yang terbentuk berdasarkan perilaku merokok faktor-faktor pendorongnya? 3) Bagaiamana seberapa besar likelihood seorang remaja menjadi perokok dari faktorfaktor yang tersedia dari data Riskesdas 2013? Tujuan Penelitian Tujuan Umum Mengidentifikasi pola perilaku merokok penduduk usia muda berdasarkan perilaku merokok faktor-faktor pendorongnya.
2
Tujuan Khusus 1) Mengetahui pengelompokan perilaku merokok penduduk usia muda di Indonesia, 2) Mengidentifikasi karakteristik setiap kelompok yang terbentuk berdasarkan berdasarkan perilaku merokok faktor-faktor pendorongnya.
Manfaat Penelitian Melalui penelitian yang diusulkan ini, diharapkan dapat memberi masukan/pertimbangan bagi pemerintah pusat maupun daerah terkait dengan penentuan kebijakan mengenai regulasi dan control tembakau untuk melindungi generasi penerus bangsa dari bahaya rokok, baik secara kesehatan, mental maupun sosial. Selain itu penelitian ini juga diharapkan dapat memperkaya khasanah aplikasi metode machine learning untuk data besar (large-scale data) khususnya data kategorik.
3
TINJAUAN PUSTAKA
Clustering multidimensi Ide clustering multidimensi direkomendasikan oleh Chen dan Wang (2011). Dengan menggunakan prinsip statistika untuk menemukan himpunan atribut yang berpontensial mengalami tumpang tindih. Setiap himpunan membentuk partisi dan bisa diperoleh dengan analisis cluster himpunan-himpunan tersebut secara simultan dengan model tunggal.
Dalam tulisannya, Chen dan Wang fokus pada clustering atau pengelompokan partisional. Satu buah partisi yang terdiri atas beberapa objek berkorespondensi dengan satu varaibel atau konsep mengenai obejk-objek tersebut. Sebagai contoh, pembagian manusia menjadi laki-laki dan perempuan berkorespondensi dengan variabel yang beranama ‘jenis kelamin’, dan partisi populasi dunia ke dalam negara-negara tertentu berkorespondensi dengan variabel bernama ‘kewarganegaraan’. Oleh karena itu, dengan memilah-milah objek ke dalam partisi-partisi sama dengan menentukan variabelvariabelnya. Variabel-variabel tersebut tidak dapat diamati langsung, karenanya disebut variabel laten. Sebaliknya, atribut yang dimiliki oleh objek bisa diukur dan disebut variabel manifest.
Secara konsep, model-based clustering dilakukan dalam tiga tahap. Pertama, mengasumsikan adanya model probabilitas yang menjelaskan hubungan variabel manifest dengan variabel laten. Kemudian menentukan detail model dari data menggunakan principal statistika. Terakhir, memaparkan partisi yang diperoleh dari model. Ketika ada beberapa laten variabel dalam model, disebut clustering multidimensional.
Clustering untuk data ketegorik Belakangan penelitian-penelitian machine learning banyak berfokus pada data teks, gambar, dan biology (microarray). Chen dkk (2011) menggunakan data yang diperoleh dari survey yang memiliki tipe data kategorik terdiri atas puluhan hingga ratusan atribut serta ratusan hingga ribuan records atau pengamatan. Analisis dengan data tersebut relevan dengan bidang keilmuan psikologi, ilmu sosial, pendidikan dan riset pasar. 4
Latent class models (LCM) (Lazarsfeld dan Henry, 1968) yakni pendekatan model di mana atribut-atribut yang digunakan semua bertipe diskret atau kategorik. Diasumsikan antar variabel laten saling bebas dan mengikuti distribusi multinomial. LCM dan variannya telah umum digunakan untuk menganalisis data kategorik. Secara teknis, LCM adalah jaringan Bayesian (Pearl, 1988) dengan satu laten variabel diskret dan satu variabel manifest diskret. Menganalisis data menggunakan LCM juga disebut dengan analisis latent class. Langkah-langkahnya adalah sebagai berikut: Menentukan kardinalitas untuk latent variabel atau banyaknya kluster Mengestimasi parameter model atau menentukan property-propoertu statistic untuk setiap kluster
Clustering berdasarkan model statistika Metode clustering yang populer digunakan termasuk metode single linkage, complete linkage, Ward;s method dan clustering k-means yang merupakan prosedur-prosedur yang tidak secara intuisi baik tetapi tidak memiliki model yang bias menjelaskan asal nilai suatu observasi. Kelebihan metode clustering adalah mampu mengindikasi bagaimana sekelompok pengukuran (p × 1) variable xj, dari N objek dibangkitan. Model yang paling sering dijumpai ketika sebanyak k cluster memiliki proporsi ekspektasi pk berdasarkan objek-objek dan pengukuran yang dibangkitkan dengan fungsi densitas fk(x). Oleh karena itu, jika ada sebanyak k cluster, vector observasi untuk objek tunggal domodelkan dan muncul sebagai distribusi campuran (mixing distribution) k
f Mix (x) p j f j x j 1
Di mana setiap p j 0 dan
k j 1
pk 1 . Distribusi ini f Mix x disebut
Langkah-langkah metode clustering berbasis model: 1. Menentukan K-inisial sebagai penentu cluster awal untuk membentuk model mixed distribution 2. Menentukan proablilitas dari setiap model yang dibentuk 3. Membentuk cluster dari K= 1, 2, … v dan menentukan cluster terbaik berdsarkan kriteria (BIC terkecil), dengan v adalah banyaknya variable yang dianalisis dalam clustering
5
Regresi Logistik Biner Regresi logistic biner adalah suatu metode analisis data yang digunakan untuk menentukan huungan anatara variable respon (Y) yang nilainya biner (0 untuk tidak dan 1 untuk ya) terhadap variable predictor (X) (Hosmer dan Lemeshow, 2002). Variabel respon Y mengikuti distribusi Bernoulli untuk setiap observasi, dengan fungsi probabilitasnya adalah sebagai berikut f ( yi , ) iyi 1 i
1 yi
, dengan yi 0,1 dan i 1,2,..., n (n adalah banyaknya sampel)
Fungsi regresi logistik yang dihasilkan adalah f z
ez 1 ez
Yang apabila dijabarkan akan meembntuk model regresi logistik sebagai berikut X
e
0 1 X1 ... p X p
1 e
0 1 X1 ... p X p
dengan p adalah banyaknya variable prediktor.
Untuk mengukur likelihood remaja mempunyai perilaku merokok dapat dilihat melalui odds ratio dari model regresi logistic tersebut.
Perilaku merokok: global dan domestik Lebih enam juta remaja dan dewasa muda yang lahir antara tahun 1983 dan 2000 akan mati disebabkan oleh penyakit yang berhubungan dengan merokok (Hahn dkk, 2014). Terdapat beebrapa karakteristik dan risiko berkaitan dengan penggunaan tembakau dan kedulitan berhenti merokok, banyak faktor tidak hanya berlaku untuk remaja tapi segala umur secara keseluruhan. Merokok bagi sebagian penduduk berusia muda (13 sampai dengan 17 tahun) justru telah menjadi kebiasaan yang mendarah daging secara budaya (Ng, Weinehall dan Ohmann, 2007). Sebagai pasar terbesar kelima dalam pasar 6
tembakau dunia, sangat mudah bagi pihak luar untuk mempenetrasi Indonesia dan penduduknya dengan rokok. Mudahnya akses rokok masuk ke Indonesia juga disebabkan oleh lemahnya peraturan dan control tembakau pada level nasional. Sampai 2014, Indonesia merupakan satu-satunya Negara anggota WHO (World Health Organization) di Asia Tenggara yang tidak terdaftar sebagai anggota Framework Convention and Tobacco Control (FCTC), sebuah komunitas beranggotakan negaranegara di bawah WHO yang berfokus pada control tembakau dan akibat-akibatnya terhadap kesehatan dunia. Ng, Weinehall dan Ohmann (2007) memaparkan bahwa pada tahun 2005, prevalensi perokok muda di Indonesia mencapai presentase 38% di antara anak laki-laki dan 5.3% di antara anak perempuan. Di pertengahan tahun 2014 (Tobacco Free Kids, 2014) sebuah laporan survai mengemukakan bahwa di antara penduduk muda (13 sampai dengan 15 tahun) Indonesia, 20 % di antaranya telah mulai merokok.
Bagi mereka yang telah memulai kebiasaan merokok sejak dini atau remaja, lebih besar kemungkinannya untuk terus merokok sampai dewasa, ukuran kemungkinan ini bisa mencapai 80%. Fenomena ini sangat krusial dan mengkhawatirkan, mengingat Indonesia paling lemah regulasinya terhadap rokok dan tembakau di antara negara-negara tetangga ASEAN lainnya. Sebagai bahan pertimbangan, perlu dikaji tentang bagaimana pola perilaku penduduk muda dalam konsumsi tembakau. Studi yang diusulkan ini akan fokus pada pemetaan perilaku konsumsi tembakau pada penduduk usia remaja (adolescent) yakni usia 10 sampai dengan 19 tahun beserta kebiasaan merokok orang tua dan pendidikan terakhir orang tua.
7
METODE PENELITIAN
Kerangka Teori
Perhatian utama dari pendidikan kesehatan adalah perilaku kesehatan (Glanz dkk, 2008). Perilaku kesehatan merupakan variable dependen yang krusial dalam berbagai macam riset dalam kaitan terhadap dampak strategi pendidikan kesehatan. Jelas bahwa perubahan perilaku kesehatan merupakan tujuan utama dari pendidikan keshatan. Jika perilaku berubah tetapi kesehatan tidak semakin baik, hasilnya akan menjadi paradoks yang harus ditelaah kembali berdasarkan aspek-aspek yang lain, misalkan hubungan perilaku dengan status kesehatan atau bagaimana perilaku dan kesehatan diukur. Memnuat keputusan berlandaskan pengetahuan dan pendidikan merupakan ujung yang diharapkan dalam menyelesaikan masalah terkain ketidakpastian keseahtan ( Rimer dkk, 2004).
Begitu pula intervensi lingkungan yang mengubah persepsi determinan
lingkungan sosial terhadap perilaku kesehatan dimaksudkan untuk memperbaiki kondisi kesehatan dengan mengubah perilaku (Smedley dan Syme, 2000; Story dkk, 2008). Oleh karena itu, usaha untuk memperbaiki lingkungan dan kebijakan dipastikan dapat dievaluasi melalui pengaruhnya terhadap perilaku kesehatan.
Salah satu perilaku kesehatan yang diukur dalam Riskesdas 2013, adalah perilaku merokok penduduk. Dilihat dari dampaknya, merokok merupakan kebiasaan yang cukup mengkhawatirkan karena menyumbang risiko dalam dua penyebab kematian terbesar bagi penduduk usia muda dunia (WHO, 2012). Menurut WHO (2012) lima penyebab utama kematian remaja adalah kecelakaan di jalan (lalu lintas), HIV, bunuh diri, infeksi saluran pernapasan, dan kekerasan. Dua di antara penyebab terbesar tersebut, HIV dan infeksi saluran pernapasan, merupakan penyakit berisiko dari kebiasaan merokok.
8
Gambar 1. Kerangka teori faktor-faktor yang berhubungan dengan kebiasaan merokok di usia remaja
Terdapat beberapa faktor yang tercatat mempengaruhi inisiasi merokok pada usia dini. Faktor-faktor tersebut termasuk karakteristik individu, yakni tingkat stress dan perasaan tertekan. Selain itu terdapat faktor karakteristik social seperti: orang tua yang merokok (Gilman dkk, 2009), saudara yang merokok, atau teman yang merokok O’Loughlin dkk, 2009). Terksposenya anak-anak dengan iklan rokok yang terang-terangan juga merupakan salah satu alasan remaja mulai merokok di usia dini (Hanewinkel, 2011). Semakin muda seseorang berinisiasi untuk merokok, semakin sulit berhenti merokok pada usia dewasa (Tobacco Free Kids, 2010; US Dept of Health, 2012). Latar belakang pendidikan orang tua juga memiliki peran dalam fenomena kebiasaan merokok pada remaja (Johnston, 2014).
Kerangka Konsep Berdasarkan paparan teori mengenai perilaku merokok dan faktor-faktor yang berpotensi untuk menyebabkan perilaku merokok pada remaja itu terjadi, dalam studi ini akan dikaji mengenai pengelompokan perilaku merokok beserta karakteristik individu dan kebiasaan merokok orang tua serta pendidikan orang tua. Selain clustering akan ditentukan model klasifikasi menggunakan regresi logistic biner untuk mengetahui 9
seberapa besar likelihood seorang remaja mempunyai kebiasaan merokok berdasarkan faktor-faktor di atas, menyesuaikan data Riskesdas 2013 yang tersedia.
Gambar 2. Kerangka konsep studi pemetaan perilaku dan likelihood kebiasaan merokok pada remaja
Dalam studi ini, faktor-faktor yang yang akan diperiksa pengaruhnya terhadap kebiasaan merokok terbatas pada variable dan ketersediaan data di Riskesdas 2013. Faktor yang tidak dipelajari di antaranya: kebiasaan merokok saudara atau teman karena variable ini tidak ditanyakan dalam kuesioner Riskesdas 2013, faktor kejiwaan karena variablevariabel pada faktor ini hanya ditanyakan kepada responden di atas 15 tahun, sedangkan lingkup usia pada studi ini adalah 10 -19 tahun, serta ukuran paparan iklan rokok yang diserap anak-anak karena data ini tidak tersedia dan sulit diukur. Minimum sampel yang diperlukan secara general adalah 20 x 5 yakni 100 balis data, tetapi karena fokus dari studi ini adalah bagaimana metode yang diusulkan bekerja dengan data berskala besar, maka pengusul berharap dapat memperoleh seluruh data yang bisa disediakan dari Riskesdas 2013 berdasarkan variabel-variabel yang dibutuhkan dalam studi ini.
10
Definisi Operasional Variabel Variabel-variabel yang diusulkan dalam penelitian ini diringkas dalam Tabel 2.1 berikut.
Tabel 1 Definisi operasional variabel
No
Variabel
Nama variabel
Definisi variabel
Skala
Munculnya aktivitas merokok pada responden usia 10 – 19 tahun meliputi: merokok atau
1
Y
Perilaku merokok remaja
tidak dalam satu bulan terakhir, kapan mulai merokok setiap hari, kapan mulai berinisiasi
Nominal
untuk merokok, berapa batang rokok yang dihisiap per hari, apakah merasa rishi jika merokok di dekat orang lain. Tingkat pendidikan remaja 10 – 19 tahun,
2
X1
Pendidikan
meliputi pilihan: tidak sekolah, SMP, SMA
Ordinal
atau perguruan tinggi 3
X2
Usia
4
X3
Jenis kelamin
5
X4
Orang tua perokok
6
7
8
X5
X6
X7
Pendidikan terakhir orang tua
Orang tua perokok
Pendidikan terakhir orang tua
Usia remaja 10 – 19 tahun Jenis kelamin remaja 10 – 19 tahun: laki-laki atau perempuan Kebiasaan merokok pada orang tua remaja yang bersangkutan (Ayah)
Rasio
Nominal
Nominal
Pendidikan terakhir orang tua remaja: Tidak sekolah, SD, SMP, SMA, Perguruan Tinggi
Ordinal
(Ayah) Kebiasaan merokok pada orang tua remaja yang bersangkutan (Ibu)
Nominal
Pendidikan terakhir orang tua remaja: Tidak sekolah, SD, SMP, SMA, Perguruan Tinggi (Ibu)
11
Ordinal
Pengolahan dan Analisis Data Pengolahan dan analisis data akan dilakukan dengan software Ms. Excel 2007 serta SPSS untuk manajemen data dan R versi 3.1.1 untuk pengolahan data dan komputasi. Secara ringkas, proses analisis data yang akan dilakukan dalam studi ini diringkas dalam diagram alir berikut:
Gambar 3. Diagram alir langkah analisis yang dilakukan dalam studi meliputi: 1) tahap pre-proses data, 2) tahap clustering dan 3) tahap regresi logistik untuk menentukan likelihood
12
HASIL ANALISIS
Analisis data yang dilakukan dalam penelitian ini telah disesuaikan dengan Complex Analysis. Total responden yang hasil estimasi adalah 23.535.822 remaja dari seluruh daerah di Indonesia (yang tersaring dari Riskesdas 2013), jumlah ini mencapai 10 % dari jumlah penduduk Indonesia secara keseluruhan yang hamper mencapai 250 juta orang. Berikut table frekuensi dari masing-masing variable yang digunakan dalam analisis.
Tabel 2 Tabel Frekuensi No
Variabel
1
Merokok/Tidak (Y)
2
Pendidikan (X1)
3
Usia (X2)
4
Jenis Kelamin (X3)
5
Kebiasaan merokok ayah (X4)
6
Pendidikan terakhir ayah (X5)
7
Kebiasaan merokok ibu (X6)
8
Pendidikan terakhir ibu (X7)
Kategori
Merokok (1) Tidak Merokok (2) Tidak/Belum pernah sekolah Tidak tamat SD/MI Tamat SD/MI Tamat SMP/MTS Tamat SMA/MA Tamat D1/D2/D3 Tamat PT 10 – 13 th 14 – 16 th 17 – 19 th Laki-laki Perempuan Merokok Tidak merokok Tidak/Belum pernah sekolah Tidak tamat SD/MI Tamat SD/MI Tamat SMP/MTS Tamat SMA/MA Tamat D1/D2/D3 Tamat PT Merokok Tidak merokok Tidak/Belum pernah sekolah Tidak tamat SD/MI Tamat SD/MI Tamat SMP/MTS Tamat SMA/MA Tamat D1/D2/D3 Tamat PT
13
Persentase (%)
10 90 3,2 24,5 31,6 28,4 12,2 0,1 0,0 40,0 30,5 29,4 52,3 47,7 71,8 28,2 4,0 12,0 36,1 17,2 23,9 2,5 4,3 2,2 97,8 4,5 12,7 39,6 18,4 19,5 2,4 2,8
Adapun keluaran hasil uji independensi bagi variable-variabel tersebut adalah sebagai berikut: Tabel 3. Hasil Uji Independensi Variabel Respon Y terhadap Seluruh Prediktor No
Varaibel Prediktor
F-hitung
1 2 3 4 5 6
Pendidikan (X1) Jenis kelamin (X3) Kebiasaan merokok ayah (X4) Pendidikan terakhir ayah (X5) Kebiasaan merokok ibu (X6) Pendidikan terakhir ibu (X7)
Signifikansi (P-value)
361,005 5270,114 80,651 60,01 100,376 9,978
0,000 0,000 0,000 0,000 0,000 0,000
Keluaran hasil analisis regresi logistik ditampilkan dalam Tabel 4 berikut. Tabel 4. Hasil Uji Kecocokan Model Regresi Logistik Sumber Variasi (Corrected Model)
Derajat bebas 1
Derajat bebas 2
Wald F
Signifikansi (P-value)
28.000 100594.000
189.318
0.000
(Intercept)
1.000 100621.000
1824.722
0.000
X1
6.000 100616.000
14.068
0.000
X2
1.000 100621.000
1084.021
0.000
X4
4.000 100618.000
53.087
0.000
X5
6.000 100616.000
6.160
0.000
X6
4.000 100618.000
7.620
0.000
X7
6.000 100616.000
9.381
0.000
X2
1.000 100621.000
2684.002
0.000
Tabel klasifikasi ditampilkan sebagai berikut: Tabel 5. Tabel Ketepatan Klasifikasi
Observasi (%) Merokok Tidak merokok Total
Prediksi (%) Merokok Tidak merokok 3 7 2 88 5 95
14
Total 10 90 100
Untuk kepentingan pemetaan karakteristik perilaku merokok pada remaja, berikut merupakan keluaran hasil clustering menggunakan package mclust pada software R 3.1.2. Tabel 6. Keluaran mclust > dataclust <- Mclust(data) > summary(dataclust) ---------------------------------------------------Gaussian finite mixture model fitted by EM algorithm ---------------------------------------------------Mclust EEE (elliposidal, equal volume, shape and orientation) model with 7 components: log.likelihood n df BIC ICL -150889 9700 303 -304559.5 -306122.9 Clustering table: 1 2 3 4 5 6 7 35 3126 2607 102 3436 20 374
15
PEMBAHASAN
Pengelompokan perilaku merokok penduduk usia muda di Indonesia Pengelompokan perilaku merokok penduduk usia muda dijawab dengan analisis clustering menggunakan pendekatan model based clustering. Berdasarkan keluaran pada Tabel 6, diperoleh tujuh cluster untuk mengelompokkan karakteristik perokok berusia muda di Indonesia. Ketujuh cluster tersebut dapat diidentifikasi sebagai berikut:
Tabel 7. Identifikasi karakteristik setiap cluster No
Cluster
Karakteristik cluster
1
Cluster pertama
Mulai merokok lebih awal
2
Cluster kedua
Ayah merokok
3
Cluster ketiga
Merokok jenis tertentu
4
Cluster keempat
Pendidikan lebih rendah
5
Cluster kelima
Umur lebih muda
6
Cluster keenam
Ayah tidak merokok, pendidikan leih rendah
7
Cluster pertama
Umur lebih tua
Identifikasi karakteristik setiap kelompok yang terbentuk berdasarkan berdasarkan perilaku merokok faktor-faktor pendorongnya Berdasarkan analisis regresi logistik, semua variabel penelitian berpegaruh terhadap apakah remaja merokok atau tidak. Ketepatan klasifikasi mencapai 91% karena adanya imbalanced data. Dengan adanya fakta bahwa model yang kurang baik tetapi ketepatan klasifikasinya tinggi, maka perlu dilakukan analisis dan pengolahan data untuk mengatasai imbalanced data ini.
16
DAFTAR KEPUSTAKAAN Dupas P, 2011, Health Behavior in Developing Countries, Annual Review of Economics Vol 3. Banerjee A, Duflo E, Glennerster R, dan Kinnan C, 2009, The Miracle of Micro.nance? Evidence from a Randomized Evaluation, Mimeo MIT. Bingenheimer, J. B., , 2004, and Raudenbush, S. W. “Statistical and Substantive Inferences in Public Health: Issues in the Application of Multilevel Models.” Annual Review of Public Health, 25, 53–77. Cunningham PJ, 2009, Chronic Burdens: The Persistently High Out.of.Pocket Health Care Expenses Faced by Many Americans with Chronic Conditions, Washington D.C: The Commonwealth Fund, Issue Brief, Vol. 63. Chen T, Zhang NL, Liu T, Poon KM, Wang Y, 2012, Model-Based Multidimensional Clustering of Categorical Data, Artificial Intelligence, Vol 176 hal 2246 – 2269. Glanz K, Rimer B, Viswanath W, 2008, Health Behavior and Health Education 4 Ed, Josey Bass A Wiley Print. Lazarsfeld PF, Henry NW, 1968, Latent Structure Analysis, Houghton Mifflin Boston. Notoatmodjo, 2003, Ilmu Perilaku Kesehatan, Erlangga. Pattanayak SK, Pfaff A, 2009, Behavior, Environment, and Helath in Developing Countries: Evaluation and Valuation, The Annual Review of Resource Econnomics Vol 1 hal 183 – 217. Pearl J, 1988, Probabilistic Reasoning in intelligence systems, Morgan Kauffamn, San Mateo. Gilman, S. E., Rende, R., Boergers, J., Abrams, D. B., Buka, S. L., Clark, M. A., et al. (2009). Parental smoking and adolescent smoking initiation: An intergenerational perspective on tobacco control. Pediatrics, 123(2), e274-e281. O’Loughlin, J. O., Karp, I., Koulis, T., Paradis, G., & DiFranza, J. (2009). Determinants of first puff and daily cigarette smoking in adolescents.American Journal of Epidemiology, 170(5), 585-597. Hanewinkel, R., Isensee, B., Sargent, J. D., & Morgenstern, M. (2011). Cigarette advertising and teen smoking initiation.Pediatrics, 127(2), e271-e278.
17
Johnston, L. D., O’Malley, P. M., Bachman, J. G., & Schulenberg, J. E. (2014). Monitoring the Future national survey results on drug use, 1975-2013: Overview of key findings on adolescent drug use. Ann Arbor, MI: Institute for Social Research, The University of Michigan. Retrieved June 11, 2014 National Survey on Drug Use and Health cited by Campaign for Tobacco-Free Kids. (2010). Tobacco use among youth. Retrieved June 11, 2014
18