PENGELOMPOKAN PASIEN DEMAM BERDARAH DENGUE (DBD) MENGGUNAKAN LATENT CLASS CLUSTER ANALYSIS (Studi Kasus: di Rumah Sakit Cipto Mangunkusumo Jakarta)
TRY APRIANTI UTAMI
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009
RINGKASAN Try Aprianti Utami. Pengelompokan Pasien Demam Berdarah Dengue (DBD) Menggunakan Latent Class Cluster Analysis (Studi kasus: di Rumah Sakit Cipto Mangunkusumo Jakarta). Dibimbing oleh MUHAMMAD NUR AIDI dan I MADE SUMERTAJAYA. Analisis gerombol merupakan salah satu metode untuk mengelompokan objek berdasarkan tingkat kemiripan agar objek yang berada dalam satu kelompok relatif lebih homogen. Dua metode yang sering digunakan dalam melakukan penggerombolan, metode hirarki dan non-hirarki, biasanya menggunakan ukuran jarak dalam proses pengelompokan. Permasalahan yang sering muncul dalam analisis ini adalah ketika peubahnya bertipe kategorik dan campuran, selain itu penentuan jumlah gerombol ditentukan secara subjektif oleh peneliti. Analisis Kelas Laten merupakan metode lain yang dapat digunakan untuk menggerombolkan peubah yang bersifat kategorik, kontinu, jumlah dan campuran (kategorik dan kontinu). Metode ini pada prinsipnya memiliki proses pengelompokan yang tidak begitu berbeda dibandingkan K-rataan namun lebih kompleks. Analisis Kelas Laten menggunakan peluang posterior dalam pengelompokan objek pengamatan. Tujuan dari penelitian ini adalah mengelompokkan pasien DBD dan melihat karakteristik masing-masing gerombol. Pengelompokan pasien DBD di RSCM berdasarkan delapan diagnosis yang dilakukan terhadap pasien dianalisis dengan metode Kelas Laten. Berdasarkan nilai BIC, dari lima model yang disarankan model dengan tiga gerombol terpilih sebagai model terbaik. Model ini memiliki nilai BVR yang cenderung kecil, hal ini mengindikasikan bahwa model telah cukup akurat dalam melakukan pengklasifikasian. Gerombol 1 dengan 78 pasien, sebanyak 39 pasien berada dalam gerombol 2, dan 10 pasien sisanya terdapat pada gerombol 3. Gerombol 1 dicirikan dengan pasien yang tidak mengalami demam, sakit perut dan pegal-pegal tapi mengalami bintik-bintik merah serta Haemoglobin yang cukup tinggi dan Leokosit yang cukup rendah. Gerombol 2 merupakan kelompok pasien dengan ciri-ciri mengalami demam, sakit perut dan pegal-pegal tapi tidak mengalami bintik-bintik merah, dan memiliki jumlah Haemoglobin dan Hematrokit tertinggi serta jumlah Trombosit dan Leukosit terendah. Gerombol 3 memperlihatkan pasiennya memiliki jumlah Haemoglobin yang cenderung rendah, Trombosit dan Leokosit yang tinggi. Nilai R2 untuk masingmasing peubah terlihat cukup besar untuk peubah kontinu, hal ini dikarenakan peubah kontinu lebih berperan dalam mendiagnosis jenis penyakit. Kata Kunci: DBD, Analisis Kelas Laten, Peluang Posterior, BIC, Kebebasan Lokal
PENGELOMPOKAN PASIEN DEMAM BERDARAH DENGUE (DBD) MENGGUNAKAN LATENT CLASS CLUSTER ANALYSIS (Studi Kasus: di Rumah Sakit Cipto Mangunkusumo Jakarta)
TRY APRIANTI UTAMI
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009
Judul Skripsi : Pengelompokan Pasien Demam Berdarah Dengue (DBD) Menggunakan Latent Class Cluster Analysis (Studi Kasus: di Rumah Sakit Cipto Mangunkusumo Jakarta) Nama : Try Aprianti Utami NRP : G14050794
Menyetujui, Pembimbing I,
Pembimbing II,
Dr. Ir. Muhammad Nur Aidi M.S NIP. 19600818 198903 1 004
Dr. Ir. I Made Sumertajaya M.Si NIP. 19680702 199402 1 001
Mengetahui, Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. drh. Hasim, DEA NIP. 19610328 198601 1 002
Tanggal Lulus:
RIWAYAT HIDUP Penulis bernama lengkap Try Aprianti Utami, dilahirkan di Sukabumi pada tanggal 11 April 1988. Penulis merupakan anak bungsu dari tiga bersaudara dari pasangan ibu Atik Sumastika dan bapak Teddy Suryadi. Pada tahun 2005 penulis lulus dari Sekolah Menengah Umum Negeri 3 Sukabumi dan pada tahun yang sama diterima di Institut Pertanian Bogor melalui jalur USMI (Undangan Seleksi Masuk IPB) pada Depertemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama mengikuti perkuliahan, penulis aktif mengikuti organisasi kemahasiswaan seperti Himpunan Profesi (HIMPRO) Gamma Sigma Beta periode 2006/2007 pada divisi kesekretariatan. Penulis juga diberi kesempatan oleh Departemen Statistika untuk menjadi Asisten Dosen Metode Statistika pada tahun 2007. Selama bulan Februari hingga April 2009 penulis melaksanakan praktek lapang di Balai Besar Taman Nasional Gunung Gede Pangrango, Cibodas-Cianjur.
KATA PENGANTAR Assalamu’alaikum wr. wb. Segala puji dan syukur penulis panjatkan kepada Allah SWT, atas segala rahmat, nikmat, hidayah serta karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini sebagai salah satu syarat untuk memperoleh gelar sarjana pada Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Karya ilmiah ini berjudul “Pengelompokan Pasien Demam Berdarah Dengue (DBD) Menggunakan Latent Class Cluster Analysis (Studi Kasus: di Rumah Sakit Cipto Mangunkusumo Jakarta)”. Dalam penelitian ini diterapkan metode Analisis Kelas Laten untuk mengelompokkan data pasien demam berdarah dengue berdasarkan karakteristik dari masing-masing objek pengamatan. Ucapan terimakasih kepada semua pihak yang telah membantu penulis mulai dari proses awal hingga terselesaikannya karya ilmiah ini, yaitu kepada: 1. Bapak Dr. Ir. Muhammad Nur Aidi M.S selaku ketua komisi pembimbing skripsi yang telah membimbing, mengarahkan dan memberikan saran kepada penulis. 2. Bapak Dr. Ir. I Made Sumertajaya M.Si selaku anggota komisi pembimbing skripsi yang telah membimbing serta memberikan masukan bagi penulis. 3. Bapak Anang Kurnia, M.Si selaku dosen penguji atas masukan dan sarannya. 4. Bapak Bonifasius yang telah membantu penulis dalam mencari data. 5. Staf Tata Usaha dan Perpustakaan Statistika yang telah membantu penulis dalam proses pembuatan karya ilmiah ini. 6. Mama dan papa yang tercinta dan selalu memberikan dukungan serta doa yang tidak terputus bagi penulis. Kak Windra dan kak Herdi yang selalu memberikan semangat. 7. Nanda Hadittama terimakasih untuk saran, perhatian dan dukungannya bagi penulis. 8. Teman-teman di Wisma Cantik (Dina, Resna, Mila, Nisa, Dita, Esti, Dewi dan adik-adik 45). 9. Ayu, Neli, Fiya, Mba Nur, Wiwit, Wi2ed, Yuli, Monica, Andi, Dauz dan seluruh temanteman Statistika 42 khususnya. 10. Semua pihak yang tidak dapat disebutkan satu persatu atas saran, masukan, dan kritiknya kepada penulis. Semoga semua amal ibadah baik dan bantuan yang telah diberikan kepada penulis mendapat balasan dari Allah SWT, dan semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan. Bogor, September 2009
Penulis
DAFTAR ISI Halaman DAFTAR TABEL ................................................................................................................... viii DAFTAR GAMBAR ...............................................................................................................
viii
DAFTAR LAMPIRAN ............................................................................................................
viii
PENDAHULUAN Latar Belakang .......................................................................................................... Tujuan .......................................................................................................................
1 1
TINJAUAN PUSTAKA Demam Berdarah ...................................................................................................... Pemodelan Campuran ............................................................................................... Sebaran Multivariate ................................................................................................. Analisis Gerombol Kelas Laten ................................................................................ Pendugaan Parameter................................................................................................. Kebebasan Lokal ....................................................................................................... Penentuan Jumlah Gerombol ....................................................................................
1 2 2 2 3 3 4
BAHAN DAN METODE Bahan ......................................................................................................................... Metode .......................................................................................................................
4 4
HASIL DAN PEMBAHASAN Penggerombolan Menggunakan Analisis Kelas Laten............................................... Kriteria Masing-masing Peubah ................................................................................ Peubah Nominal ............................................................................................. Peubah Kontinu .............................................................................................. Kriteria Masing-Masing Gerombol ..........................................................................
5 6 6 7 8
KESIMPULAN Kesimpulan ................................................................................................................
9
DAFTAR PUSTAKA ..............................................................................................................
9
LAMPIRAN.............................................................................................................................
11
DAFTAR TABEL Halaman Tabel 1. Diagnosis yang dilakukan beserta tipe peubah ................................................................. 4 Tabel 2. Pengklasifikasian objek kedalam gerombol yang terbentuk ............................................ 6
DAFTAR GAMBAR Halaman Gambar 1. Nilai BIC untuk masing-masing model ........................................................................ 5 Gambar 2. Jumlah kriteria ya dan tidak untuk peubah Fever ......................................................... 6 Gambar 3. Jumlah kriteria ya dan tidak untuk peubah Petekie ...................................................... 6 Gambar 4. Jumlah kriteria ya dan tidak untuk peubah Mialgia ..................................................... 7 Gambar 5. Jumlah kriteria ya dan tidak untuk peubah abdomial ................................................... 7 Gambar 6. Boxplot Haemoglobin .................................................................................................. 7 Gambar 7. Boxplot Hematokrit ...................................................................................................... 7 Gambar 8. Boxplot Trombosit ....................................................................................................... 8 Gambar 9. Boxplot Leokosit .......................................................................................................... 8 Gambar 10. Tri-plot karakteristik peubah untuk masing-masing gerombol ................................... 9
DAFTAR LAMPIRAN Halaman Lampiran 1. Perbandingan metode penggerombolan Hirarki, K-rataan, dan Analisis Gerombol Kelas Laten ............................................................................................................. 12 Lampiran 2. Nilai BIC, Log-Likelihood dan selang BVR untuk masing-masing gerombol ...... 13 Lampiran 3. Nilai Bivariate Residual (BVR) dan korelasi Pearson untum memeriksa asumsi kebebasan lokal ...................................................................................................... 14 Lampiran 4. Peluang rataan (Probmeans) delapan peubah .......................................................... 15 Lampiran 5. Peluang pada peubah nominal serta nilai rata-rata untuk peubah kontinu pada masing-masing gerombol ........................................................................................ 16 Lampiran 6. Nilai R2 dan uji statistik Wald .................................................................................. 17 Lampiran 7. Plot-profil ................................................................................................................. 18 Lampiran 8. Iterasi algoritma EM dan Newton Rhapson ............................................................. 19
PENDAHULUAN Latar Belakang Analisis gerombol merupakan suatu metode penggerombolan satuan objek pengamatan menjadi beberapa kelompok berdasarkan peubah-peubah yang dimiliki, sehingga objek-objek yang terletak dalam kelompok yang sama relatif lebih homogen dibandingkan dengan objek-objek pada kelompok yang berbeda. Dua metode yang sering dipergunakan dalam proses penggerombolan objek pengamatan, yaitu hierarchical (hirarki) dan non-hierarchical (non-hirarki), dimana kedua metode tersebut menggunakan jarak dalam pengelompokkan. Metode hirarki digunakan ketika objek pengamatannya relatif sedikit, dimana penentuan jumlah gerombolnya dapat dilihat menggunakan dendogram. Namun jika objek pengamatannya relatif besar maka metode yang digunakan adalah metode non-hirarki seperti K-rataan. Jumlah gerombol dalam metode ini ditentukan secara subjektif oleh peneliti. Permasalahan yang biasa ditemukan dalam metode non-hirarki yaitu ketika objek pengamatan bertipe kategorik dan campuran serta penentuan banyaknya kelompok yang dilakukan secara subjektif oleh peneliti. Salah satu alternatif metode yang dapat digunakan untuk mengatasi masalah ini adalah menggunakan Analisis Gerombol Kelas Laten (Latent Class Cluster Analysis, LCCA). Penentuan jumlah gerombol dalam analisis ini salah satunya dapat dilakukan menggunakan alat statistik seperti kriteria informasi. Analisis yang pertama kali diperkenalkan oleh Lazarfeld dan Henry pada tahun 1968 untuk peubah dikotomi dan kemudian diperluas untuk peubah nominal oleh Goodman (1974) ini memungkinkan penggerombolan objek pada peubah kategori (nominal dan ordinal), kontinu, jumlah (count) dan peubah campuran (mixture variable) antara peubah kontinu dan peubah kategorik. Prinsipnya, Analisis Gerombol Kelas Laten tidak jauh berbeda dengan analisis gerombol K-rataan, yaitu mengelompokkan sejumlah objek yang terdekat dengan pusat kelompoknya sehingga jarak setiap individu ke pusat kelompok dalam satu kelompok adalah minimum. Perbedaannya adalah, jika pada K-rataan digunakan pendekatan jarak untuk menyatakan kedekatan objek pada pusatnya sedangkan pada pengerombolan Kelas Laten, untuk menyatakan bahwa satu objek dekat dengan pusatnya didasarkan pada peluang pengelompokkan posterior yang
maximum diestimasi melalui metode likelihood (ML) (Vermunt dan Magidson, 2002b). DBD atau dalam bahasa medisnya disebut Dengue Hemorrhagic Fever (DHF) merupakan suatu penyakit demam akut yang disebabkan oleh virus genus Flavivirus dengan 4 jenis serotype yaitu den-1, den-2, den-3 dan den-4. Infeksi oleh salah satu jenis serotype ini akan memberikan kekebalan seumur hidup tetapi tidak menimbulkan kekebalan terhadap serotype yang lain. Seseorang yang hidup di daerah endemis DHF dapat mengalami infeksi sebanyak 4 kali seumur hidupnya (Kwok, 2008). Analisis Gerombol Kelas Laten dapat digunakan untuk mengelompokkan pasien DBD di RSCM berdasarkan delapan diagnosis laboratorium yang dilakukan terhadap masing-masing pasien. Metode ini diharapkan dapat membantu pengelompokan pasien ke dalam kelompok yang sesuai dengan kriteria keadaan pasien. Dalam penelitian ini, proses penggerombolan dilakukan berdasarkan software Latent GOLD 4.0. Tujuan Tujuan penelitian ini adalah untuk menggerombolkan pasien DBD dengan fungsi campuran menggunakan analisis gerombol Kelas Laten dalam software LatentGOLD 4.0 dan mengetahui karakteristik gerombol yang terbentuk. TINJAUAN PUSTAKA Demam Berdarah Virus yang ditularkan melalui perantara nyamuk Aedes aegypti atau Aedes albopictus ini dapat menyebabkan gangguan pada pembuluh darah kapiler dan pada sistem pembekuan darah, sehingga mengakibatkan perdarahan. Penyakit ini banyak ditemukan didaerah tropis seperti Asia Tenggara, India, Brazil, Amerika termasuk di seluruh pelosok Indonesia, kecuali di tempat-tempat ketinggian lebih dari 1000 meter di atas permukaan air laut. Gejala seseorang terkena DBD diantaranya adalah demam yang berlangsung antara 2-7 hari, bintik-bintik merah, sakit kepala, diare, nyeri sendi, pendarahan, mual, muntah, haemoglobin maksimum, kenaikan hematrokit di atas 20% dari normal, trombosit minimum (di bawah 100000/mm3), dan leokositnya rendah (Anonim, 2008).
Pemodelan Campuran Pemodelan campuran (Mixture modeling) adalah suatu metode yang memodelkan atau mengelompokkan data di dalam suatu data set menjadi kelompok-kelompok data yang sebelumnya tidak terdefinisikan. Dalam penelitian ini metode yang diteliti adalah pengelompokan data yang memodelkan suatu sebaran statistik bercampur dengan sebaran statistik yang lain dalam bentuk campuran (penjumlahan berproporsi). Penganalisaan data menggunakan mixture modelling menghasilkan analisa berupa jumlah kelompok di dalam model tersebut, persentase data di dalam setiap kelompok relatif terhadap jumlah keseluruhan data proportion), parameter yang (mixing menerangkan setiap kelompok yang ditemukan dan keterangan data-data yang tercakup di dalam setiap kelompok. Persentase merupakan salah satu contoh bentuk mixing proportion, tapi dalam bentuk mixture modeling persentase ini sering dimodelkan menggunakan sebaran multivariate (Agusta, 2009). Sebaran multivariate Sebaran yang diberikan oleh parameter model , , dapat berasal dari beragam tipe peubah sebagai berikut: 1. Nominal (1) merupakan peluang peubah , dengan kategori S (banyaknya ketegori dari peubah, dalam penelitian ini S=2 yaitu tidak untuk 1 dan ya untuk 2) jika objek i di dalam gerombol k. yis bernilai 1 jika i memiliki tingkat respon s untuk peubah p (s = 1, 2, ..S) dan bernilai 0 untuk lainnya. 2. Normal (kuantitatif) (2) (Morrison, 1990) Analisis Gerombol Kelas Laten Analisis Gerombol Kelas Laten merupakan nama lain dari Mixture Modelling (Agusta, 2009). Vermunt dan Magidson (2002a) mendefinisikan model Kelas Laten sebagai metode statistik untuk mengidentifikasi keanggotaan kelas (gerombol) yang tidak terukur antara subjek dengan peubah yang diamati. Model Kelas
Laten dapat dirumuskan dengan persamaan sebagai berikut:
, (3) Keterangan : = Sebaran yang diberikan oleh parameter model = Peluang awal Kelas Laten atau gerombol k pada data y = Peluang suatu objek pada gerombol k K = Banyaknya gerombol (k=1, 2, …, K), dimana dan = Banyak data pada gerombol ke k N = Banyak data keseluruhan (y1, y2, …, yp) merupakan suatu vektor dari p peubah yang setiap peubah memiliki sebaran. yih adalah nilai dari h contoh objek untuk peubah ke-i (h=1, 2, …, n). Vektor baris yh (yh` = [yih, y2h, …, yph]) mengacu ke bentuk respon dari peubah ke-i. Sedangkan untuk data campuran dapat digunakan rumus : (4) dimana i merupakan banyaknya fungsi yang digunakan (Pujiati, 2008). Metode ini pada dasarnya membagi objek pengamatan menjadi dua kelompok secara dan acak, nilai peluang awal kelas laten, , didapat dari persamaan (3). Fungsi g(yi|αi) didapatkan dari persamaan (1) untuk peubah nominal dengan banyak kategori sebanyak dua (S=2, ya dan tidak) dan persamaan (2) untuk peubah kontinu dimana ragam dan nilai tengahnya didapatkan dari objek-objek pengamatan pada masing-masing peubah. Akhirnya fungsi g(yi|αi) yang didapat dari persamaan (1) dan persamaan (2) dimasukan dalam persamaan (4). Hal ini juga berlaku untuk gerombol 3, 4 dan 5. Perbandingan Analisis Gerombol Kelas Laten dengan analisis gerombol hirarki dan non-hirarki dapat dilihat pada Lampiran 1, terlihat Analisis Kelas Laten menawarkan lebih banyak solusi dalam penggerombolan. Selain itu metode ini dapat digunakan mulai dari data yang berukuran relatif kecil hingga besar. Vermunt dan Magidson (2002b) mengatakan ketika data bersifat kontinu dan cukup besar, Analisis Kelas Laten memberikan hasil yang lebih baik dibandingkan analisis K-rataan. Pengujian ini dilakukan dengan menggunakan data simulasi.
Pendugaan Parameter Pendugaan parameter pada Analisis Gerombol Kelas Laten menggunakan LatentGOLD diduga menggunakan metode Maksimum Likelihood, fungsi likelihood dapat dimaksimumkan menggunakan metode iteratif. Untuk menemukan nilai ML yang optimum maka digunakan algoritma Expectation Maximization (EM) dan metode Newton Rhapson (Snellman, 2008). Fungsi likelihood untuk Analisis Kelas Laten model campuran adalah:
dimana peubah pengamatan bebas bersyarat pada setiap gerombol k. dengan dan zik =1 jika yi muncul dari gerombol k, zik=0 untuk lainnya. Vektor indikator yang tidak diketahui dari K gerombol memiliki bentuk log-likelihood lengkap: (5) Algoritma EM dapat memaksimumkan persamaan (5) dengan kendala dan kendala tambahan untuk kasus nominal dan ordinal yaitu dan secara berurutan. EM adalah salah satu algoritma yang berdasarkan model, dimana pendekatannya adalah menggunakan model yang ada untuk mengelompokkan dan mencoba untuk mengoptimalkan kecocokan antara data dengan model. EM termasuk algoritma penggerombolan yang masuk dalam kategori partitional clustering (proses pengelompokan yang dilakukan dengan membagi objek berdasarkan kemiripan masing-masing objek) dan berbasiskan model yang menggunakan perhitungan peluang. Metode iteratif tersebut akan menghasilkan ML, yang menghasilkan parameter baru, yaitu bobot campuran, nilai tengah, dan standar deviasi (Anonim, 2009). Rumus tersebut dihitung ulang dengan nilai dugaan. EM terdiri dari dua tahap yaitu: 1. Expectation (E): mencari karakteristik dari masing-masing gerombol. 2. Maximization (M): mencari komposisi gerombol dan data agar memaksimumkan nilai likelihood data terhadap model gerombol yang dihasilkan. kedua tahapan ini dilakukan hingga konvergen (Agusta, 2009)
Program akan dialihkan pada metode Newton-Raphson ketika algoritma EM di atas telah optimal. Nilai awal dalam Newton Rhapson dimulai dari suatu himpunan parameter
Keterangan: g = Gradien vektor berisi turunan pertama dari log-posterior ke semua parameter yang dievaluasi pada H = Matriks Hessian yang berisi turunan kedua dari seluruh parameter = Skalar yang menotasikan ukuran tahapan. Tahapan ukuran dibutuhkan untuk mencegah penurunan dari log-posterior terjadi. Newton Rhapson menghasilkan standar error sebagai hasil sampingan dari matriks Hessian. Matriks dievaluasi sampai menghasilkan akhir. (Snellman, 2008). Dugaan nilai parameternya ( , , , dan ) didapatkan ketika kedua algoritma tersebut selesai. Kebebasan Lokal Model Kelas Laten memiliki asumsi bahwa setiap peubah yang berada dalam satu gerombol haruslah saling bebas (independency local). Asumsi ini harus terpenuhi untuk mendapatkan hasil klasifikasi yang akurat (Handayani, 2009). Asumsi kebebasan lokal yang dimaksud merupakan asumsi kebebasan lokal antara peubah dengan tipe yang sama dalam gerombol, untuk menguji asumsi ini digunakan tabel kontingensi Chi-Square untuk melihat hubungan kedua peubah tersebut. Pelanggaran asumsi ini dapat diperiksa menggunakan statistik uji Bivariate Residual (BVR). Hipotesis untuk kasus ini adalah: H0 : kebebasan lokal pada model Kelas Laten terpenuhi H1 : kebebasan lokal pada model Kelas Laten tidak terpenuhi dimana H0 ditolak pada saat nilai BVR cukup besar, yaitu lebih besar dari χ2db=1,α=0.05 = 3.84 (Vermunt dan Magidson, 2005b). Nilai BVR dapat diperoleh menggunakan rumus :
Keterangan : = = frekuensi observasi =
= frekuensi harapan
df = (b-1)(k-1) b, k = Banyaknya baris atau kolom, kategori dalam peubah Ada beberapa solusi yang dapat dilakukan ketika dua peubah dalam suatu gerombol tidak saling bebas. Pertama dengan menghapus salah satu peubah, namun cara ini tidak dapat digunakan ketika banyak peubah yang tidak saling bebas. Kedua dapat meningkatkan jumlah kategori dalam peubah, misalkan dalam suatu peubah hanya memiliki dua kategori (tinggi dan rendah) maka dapat dirubah menjadi tiga kategori (tinggi, sedang dan rendah). Ketiga menggunakan metode penggabungan peubah (direct effect) menurut Uebersax dalam Snellman (2003). Dalam LatentGOLD, masalah ini diatasi menggunakan direct effect (Vermunt dan Magidson, 2005b). Penentuan Jumlah Gerombol Pendekatan yang paling poluler digunakan sebagai alat seleksi model pada analisis gerombol Kelas Laten adalah kriteria informasi BIC (Bayes Information Criterion). Menurut Agusta (2009) BIC cenderung digunakan karena secara eksperiman terbukti BIC menghasilkan model yang lebih akurat dibandingkan AIC dan CAIC. Nilai untuk BIC dapat diperoleh menggunakan rumus:
Keterangan : N = Banyaknya objek pengamatan M = Jumlah parameter (Npar pada Lampiran 2) LL = Nilai log-likelihood yang telah optimum (Lampiran 2) Model terbaik yang terpilih merupakan model dengan nilai BIC terkecil. Model yang terpilih dapat dievaluasi dengan membandingkan frekuensi data dengan frekuensi harapan, jika terdapat nilai perbedaan yang cukup jauh mengindikasikan model tersebut belum cukup baik dalam mengepaskan model. Seleksi model dapat dilakukan menggunakan Pearson χ2 dan rasio likelihood G2. Rumus untuk G2 didapatkan dengan menggunakan persamaan sebagai berikut:
dimana ns merupakan frekuensi observasi dan sebagai frekuensi dugaan (Snellman, 2008). BAHAN DAN METODE Bahan Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Rumah Sakit Cipto Mangunkosumo (RSCM) Jakarta yang merupakan data pasien demam berdarah dengue berdasarkan 8 diagnosis yang dilakukan terhadap pasien tersebut. Peubah yang digunakan dalam penelitian ini merupakan peubah bertipe nominal (ketegorik) yaitu dengan notasi 1 untuk tidak dan notasi 2 untuk ya serta peubah bertipe kontinu. Peubah yang digunakan beserta tipenya dapat dilihat pada tabel 1. Tabel 1. Diagnosis yang dilakukan beserta tipe peubah Peubah type Fever (demam) nominal Mialgia (pegal-pegal) nominal Petekie (bintik merah) nominal Abdominal pain (sakit perut) nominal Haemoglobin kontinu Trombosit kontinu Hematokrit kontinu Leokosit Kontinu Metode Tahapan yang dilakukan dalam melakukan penggerombolan menggunakan metode Kelas Laten adalah sebagai berikut: 1. Pendugaan parameter dengan maksimum likelihood a. Defenisikan nilai awal
b. Hitung:
Peubah nominal:
Peubah kontinu:
c. Expectation (E): perhitungan nilai dugaan dari parameter. Untuk menyatakan suatu objek masuk dalam gerombol ke-K, maka persamaan di
bawah ini mendekati 1 ketika k=K (Snellman, 2008).
dimana h = 1, 2, …, n; k = 1, 2, …, K dan merupakan peluang bersyarat yang menyatakan yh muncul dari k. d. Maximization (M): perhitungan nilai ML dengan mengasumsikan parameter sama dengan nilai dugaan dari tahap expectation.
Nominal
Kontinu Rataan dari gerombol k:
Ragam (diasumsikan dalam tiap gerombol:
konstan)
di
Melihat karakteristik dari masingmasing peubah berdasarkan probmeans dan peluang profilnya. Melihat karakteristik masing-masing gerombol berdasarkan tri-plot dan profil-plot. 5. Mengklasifikasikan keanggotaan gerombol setiap objek. Proses analisis dilakukan dengan menggunakan LatentGold 4.0 dan aplikasi lainnya. HASIL DAN PEMBAHASAN Penggerombolan Menggunakan Analisis Kelas Laten Pendugaan banyak gerombol data pasien demam berdarah dengue berdasarkan 8 peubah dan 127 pasien, dilakukan dengan menggunakan software LatentGOLD 4.0. Langkah awal pemilihan model terbaik dari lima gerombol yang disarankan dipilih berdasarkan nilai BIC terkecil, gambar 1 memperlihatkan nilai BIC untuk kelima model. Model 3 memperlihatkan nilai BIC terendah yaitu sebesar 3731.064 dibandingkan empat model lainnya, bahkan cenderung terjadi peningkatan nilai BIC untuk model 4 dan 5 (Gambar 1).
e. Ulangi tahap c dan d sampai konvergen. program akan dialihkan pada metode Newton-Raphson ketika algoritma EM telah optimal. 2. Memilih gerombol terbaik dengan melihat nilai BIC terkecil dari lima model yang dicobakan. Nilai BIC didapatkan dengan menggunakan rumus:
3. Memeriksa asumsi kebebasan lokal dengan menggunakan rumus BVR sebagai berikut:
Nilai BVR ≥ 3.84 mengindikasikan asumsi kebebasan lokal tidak terpenuhi. 4. Menginterpretasikan hasil Analisis Kelas Laten.
Gambar 1. Nilai BIC untuk masing-masing model. Salah satu syarat yang harus dipenuhi untuk menyatakan bahwa model tersebut sudah cukup akurat adalah terpenuhinya asumsi kekebasan lokal, yaitu dengan melihat nilai BVR. Nilai BVR yang besar mengindikasikan asumsi ini tidak terpenuhi. Model ini memiliki nilai BVR dengan selang 0.0006 - 2.8753. Karena tidak terdapat nilai BVR yang cukup besar (di atas 3.84), maka asumsi kebebasan lokal pada model ini terpenuhi. Seperti yang terlihat pada Lampiran 2, meskipun nilai BIC antara model 2 dan model 3 tidak begitu jauh, namun pada model 2 asumsi ini tidak terpenuhi. Lampiran 3 memperlihatkan nilai BVR untuk masing-
masing peubah nominal dan kontinu pada model 3. Karena itu direct effect tidak diperlukan dalam penelitian ini. Nilai BVR didapatkan dengan menggunakan tabel kontingensi Chi-Square yang biasanya digunakan untuk data bersifat kategorik, untuk peubah kontinu uji ini dapat dilakukan dengan mengubah datanya menjadi kategorik terlebih dahulu. Pada Lampiran 3, selain nilai BVR juga disertakan korelasi Pearson untuk masing-masing peubah kontinu dari setiap gerombol. Baik itu pada gerombol 1, 2 ataupun 3 terlihat antar peubah kontinu tidak terdapat korelasi (asumsi kebebasan lokal terpenuhi). Hal ini membuktikan bahwa nilai BVR cukup baik untuk melihat kebebasan lokal antar peubah kontinu. Tabel 2. Pengklasifikasian objek kedalam gerombol yang terbentuk Gerombol n Peluang Posterior 1 78 0.62 2 39 0.28 3 10 0.10 Total 127 1.00 Model ini memperlihatkan sekitar 78 pasien termasuk dalam gerombol satu, 39 pasien termasuk gerombol dua dan sisanya 10 pasien termasuk dalam gerombol tiga. Sedangkan peluang posterior untuk masingmasing gerombol yaitu 0.6177, 0.2812 dan 0.1012 secara berurutan (Tabel 2). Nilai R2 pada Lampiran 6 untuk masingmasing peubah memperlihatkan keempat peubah kontinu dapat diterangkan lebih baik dibandingkan peubah kategorik. Nilai R2 terbesar dimiliki oleh peubah hematrokit dan trombosit yaitu 38.68% dan 37.28% untuk masing-masing peubah. Sedangkan nilai R2 terkecil terdapat pada peubah abdominal sebesar 0.26%. Hal ini disebabkan karena gejala seperti haemoglobin, hematokrit, trombosit, dan leokosit lebih berperan dalam mendiagnosis keadaan pasien. Sedangkan gejala-gejala seperti demam, bintik-bintik merah, pegal-pegal, dan sakit perut merupakan gejala yang biasanya dialami oleh penderita DBD. Secara keseluruhan model ini sudah cukup layak untuk digunakan, terlihat dari nilai-p yang lebih kecil dari 0.05 yaitu sebesar 1.9x10-5 (Lampiran 6). Iterasi algoritma EM dan Newton Rhapson dapat dilihat pada Lampiran 8. Nilai log-likelihoodnya maksimum pada saat iterasi algoritma EM ke 21 dan kemudian dilanjutkan dengan Newton Rhapson, hingga akhirnya didapatkan nilai log-likelihood akhir sebesar -1773.4922.
Kriteria Masing-masing Peubah Peubah Nominal DBD diawali oleh demam mendadak dengan gejala klinik yang tidak spesifik seperti lemah, nyeri pada punggung, tulang, sendi dan kepala yang berlangsung antara 2-7 hari yang kemudian turun secara lysis (Adhyatma, 1981). Gambar 2 memperlihatkan pasien pada ketiga gerombol mengalami demam dengan masa demam antara 2-7 hari. Gerombol 2 dan 3 bahkan menunjukkan seluruh pasiennya mengalami demam. Hal ini sesuai dengan peluang mengalami demam untuk peubah ini yang menunjukkan nilai yang besar untuk ketiga gerombolnya, yaitu 0.8859, 0.9993 dan 0.9980 untuk masingmasing gerombol.
Gambar 2. Jumlah kriteria ya dan tidak untuk peubah Fever Manifestasi perdarahan yang pada umumnya muncul pada hari ke 2-3 demam. Salah satu yang sering terjadi yaitu bintikbintik merah disekitar badan, manifestasi ini biasanya berlangsung selama 3-6 hari (Adhyatma, 1981). Gambar 3 memperlihatkan ketiga gerombol menunjukkan gejala yang sama, yaitu hampir semua pasien yang terdapat dalam ketiga gerombol mengalami petekie. Jika dilihat berdasarkan nilai peluangnya gerombol 1 memiliki nilai peluang yang lebih besar pasiennya mengalami petekie pada bagian tubuhnya yaitu sebesar 0.5629. Sedangkan gerombol tiga menunjukkan peluang yang lebih kecil yaitu 0.2993.
Gambar 3. Jumlah kriteria ya dan tidak untuk peubah Petekie
Pegal-pegal merupakan gelala klinis lain yang biasa dialami oleh pasien, peluang pasien mengalami gejala ini memperlihatkan ketiga gerombol yang sama-sama menunjukkan angka yang cukup besar yaitu 0.6366, 0.8087 dan 0.8707 untuk masing-masing gerombol secara berurutan. Gambar 4 memperlihatkan sebagian besar pasien pada ketiga gerombol mengalami gejala ini.
Peubah Kontinu Haemoglobin yang semakin tinggi mengindikasikan pasien terserang DBD, gambar 6 memperlihatkan haemoglobin tertinggi terdapat pada gerombol 2 dengan nilai rata-rata 15.8281. Gerombol ini cenderung memiliki rata-rata jumlah haemoglobin yang di atas rata-rata jumlah haemoglobin gerombol 1 dan 3. 19 18 17
Data
16 15 14 13 12 11 10
Gambar 4. Jumlah kriteria ya dan tidak untuk peubah Mialgia Gejala klinis seperti sakit pada perut semacam diare terlihat tidak begitu banyak terjadi pada pasien dari ketiga gerombol. Peluang mengalami gejala ini untuk masingmasing gerombol pun memperlihatkan nilai yang tidak begitu besar, yaitu 0.1833, 0.208, dan 0.2484. Hal ini diperkuat dengan gambar 5 yang menunjukkan lebih banyak pasien tidak mengalami gejala ini.
HB_1
HB_2
HB_3
Gambar 6. Boxplot untuk Haemoglobin Kenaikan kadar Hematokrit merupakan pertanda pasien menderita DBD, jika dilihat dari nilai rataannya pada gerombol 3 kadar hematokritnya berkisar diangka 31%. Sedangkan gerombol 1 dan 2 memperlihatkan kenaikan kadar hematokrit yang tidak begitu tinggi dibandingkan gerombol 3, yaitu sekitar 7% dan 14 % untuk masing-masing gerombol. 90 80 70
Data
60 50 40 30 20 10 0 H_1
Gambar 5. Jumlah kriteria ya dan tidak untuk peubah abdominal Peluang yang dijelaskan di atas merupakan peluang untuk masing-masing kategori peubah (ya dan tidak) didalam setiap gerombol, untuk lebih lengkap dapat dilihat pada Lampiran 5. Probmeans pada Lampiran 4 memperlihatkan peluang pasien mengalami ataupun tidak mengalami keempat gejala seperti fever, petekie, mialgia dan abdominal paling banyak pada gerombol 1 dibandingkan 2 gerombol lainnya. Hal ini disebabkan karena jumlah pasien pada gerombol 1 lebih banyak dibandingkan dua gerombol lainnya.
H_2
H_3
Gambar 7. Boxplot Hematokrit Trombosit di bawah 100.000/mm3 biasanya ditemukan diantara hari ke 3 sampai hari ke 7. Gerombol 2 pada gambar 8 memperlihatkan nilai trombosit yang lebih rendah dibandingkan dua gerombol lainnya. Rata-rata jumlah trombosit pada gerombol 2 hanya berkisar di angka 15.000/mm3, jumlah sangat kecil dibandingkan dua gerombol lainnya dengan jumlah trombosit sekitar meskipun begitu ketiga 50.000/mm3, gerombol masih memiliki jumlah trombosit dibawah 100.000/mm3. Hanya sebagian kecil yang memiliki nilai trombosit diatas 100.000/mm3.
140 120 100
Data
80 60 40 20 0 T_1
T_2
T_3
Gambar 8. Boxplot untuk Trombosit Indikator yang juga digunakan untuk mendiagnosis adalah jumlah leokosit di dalam tubuh, penderita DBD biasanya memiliki jumlah leokosit yang rendah. Gambar 9 memperlihatkan rata-rata jumlah leokosit terendah terdapat pada gerombol 2. Meskipun nilainya tidak begitu berbeda dengan gerombol 1 namun selang jumlah leokosit pada gerombol 2 memperlihatkan nilai yang cenderung lebih kecil, sedangkan pada gerombol 1 terdapat beberapa nilai yang cenderung besar bahkan terdapat satu nilai pencilan sehingga rata-rata jumlahnya tidak berbeda jauh dengan gerombol 2. 12
10
Data
8
6
4
2
0 L_1
L_2
L_3
Gambar 9. Boxplot untuk Leokosit Probmeans pada Lampiran 4 memperlihatkan peluang lima selang jumlah keempat peubah kontinu untuk masing-masing gerombol. LatentGOLD membagi menjadi lima selang nilai secara otomatis. Peluang selang haemoglobin tertinggi yaitu 15.90 19.40 terdapat pada gerombol 2 sebesar 0.7389. Selang jumlah hematrokit tertinggi (15.03-83.33) peluang terbesarnya terdapat pada gerombol 2 (0.5280), namun pada gerombol 3 datanya paling banyak terdapat pada selang ini, hal inilah yang menyebabkan rata-rata pasien pada gerombol 3 memiliki kenaikan hematrokit yang cukup tinggi dibandingkan dua gerombol lainnya (Gambar 7). Sedangkan untuk jumlah trombosit terendah, peluang terbesar terdapat dalam gerombol 2. Peluang pasien dengan selang jumlah leokosit rendah paling besar terdapat
pada gerombol 1. Hasil berbeda dengan Gambar 9, hal ini disebabkan karena sebagian besar pasien pada gerombol 2 memiliki jumlah trombosit pada selang 0.00 - 3.30, sedangkan gerombol 1 semua selangnya memiliki peluang yang cukup tinggi. Delapan kriteria di atas dapat digunakan untuk menerangkan karakteristik peubah dari masing-masing gerombol. Untuk karakteristik ketiga gerombol secara lebih jelasnya dapat dilihat pada plot-profil pada Lampiran 7 dan tri-plot yang terpadat pada Gambar 10. Karakteristik ketiga gerombol ini yang akan dijelaskan pada tiga paragraf selanjtunya. Kriteria Masing-masing Gerombol Ciri-ciri yang terdapat pada gerombol 1 berdasarkan plot-profil pada Lampiran 7 menunjukkan gerombol ini memiliki pasien dengan gejala demam, pegal-pegal dan sakit perut berada di bawah gerombol 2 dan 3, sedangkan bintik-bintik merah disekitar tubuh cukup banyak terjadi pada gerombol ini. Namun jumlah haemoglobin lebih sedikit dan kenaikan hematrokitnya tidak begitu tinggi dibandingkan gerombol 2, trombositnya pun tidak terlalu minim, jumlah leokositnya tidak serendah pada gerombol 2. Gambar 10 memperlihatkan gerombol ini memiliki karakteristik pasien seperti tidak mengalami fever, mialgia dan abdominal namun mengalami petekie dengan jumlah haemoglobin antara 13.80-15.80, jumlah hematrokit antara 01.00-8.60, jumlah trombosit antara 30.00-50.00 dan jumlah leokosit antara 2.10-2.60. Gerombol 2 berdasarkan plot-profil mengindikasikan pasien dengan gambaran sebagian besar pasiennya mengalami demam, dan gejala bintik-bintik merah, pegal-pegal serta sakit perut diatara gerombol 1 dan 3. Gerombol ini memiliki nilai haemoglobin yang lebih tinggi dibandingkan dua gerombol lainnya, namun hematokritnya tidak terlalu tinggi, sedangkan trombosit dan leokositnya sama-sama berjumlah lebih rendah dibandingkan dua gerombol lainnya (Lampiran 7). Sedangkan berdasarkan Tri-plot (gambar 10) untuk gerombol ini memiliki karakteristik peubah nominal yang bertolak belakang dibandingkan gerombol 1, dimana pasien mengalami fever, mialgia dan abdominal namun tidak mengalami petekie untuk gerombol 2. Gerombol ini memiliki jumlah haemoglobin antara 15.90-19.40, jumlah hematrokit antara 8.90-83.33, jumlah trombosit antara 2.00-29.00 dan jumlah leokosit antara 0.00-2.00 dan 2.70-3.30.
Cluster3 1.0
0.0
0.8
fever petekie mialgia abdomial HB_max hematokrit trombosit_minim leokosit_rendah
0.2
0.6
0.4
0.4
0.6
15.03 - 83.33
4.700 - 10.70 74 - 137 13 - 13.70 0.2 9.700 - 12.90 51 - 71
30- 50 13.80 - 14.90 1- 4
0.0
1
1.0 Cluster1
0.8
3.400 - 4.500
1
1 2 2 2
2 0900 - 2 - 15 16.500 - 8.600 15 - 15.80 8. 4.300 - 6.300 2.100 - 2.600 0.8
17 - 29 2.700 - 3.300
0.6
15.90 - 19.40 0.4
Cluster2
2 - 16
1.0 0.2
0.0
Gambar 10. Tri-plot karakteristik peubah untuk masing-masing gerombol. Gerombol ketiga merupakan pasien dengan indikasi yang sama dengan dua gerombol sebelumnya, namun gerombol ini memiliki jumlah haemoglobin yang lebih rendah serta jumlah hematrokit, trombosit dan leokosit yang cenderung lebih tinggi dibandingkan gerombol 1 dan 2 (lampiran 7). Sedangkan berdasarkan Tri-plot untuk gerombol ini memiliki karakteristik pasien dengan jumlah haemoglobin antara 9.7014.90, jumlah trombosit antara 51.00-137.00 dan jumlah leokosit antara 3.40-10.70 (Gambar 10).
dan Leukosit terendah. Gerombol 3 memperlihatkan pasiennya memiliki jumlah Haemoglobin yang cenderung rendah, Trombosit dan Leokosit yang tinggi. Pengujian asumsi kebebasan lokal bagi peubah kotinu menggunakan tabel kontingensi Chi-Square memberikan hasil yang sama baik jika dibandingkan dengan hasil korelasi antar peubah kontinu menggunakan uji korelasi Pearson. Berdasarkan nilai R2, Peubah kontinu memperlihatkan nilai R2 yang lebih besar dibandingkan peubah nominal. Hal ini mengindikasikan peubah kontinu lebih dapat diterangkan oleh model.
KESIMPULAN Penggerombolan menggunakan Analisis Kelas Laten pada data DBD menghasilkan tiga gerombol dari lima gerombol yang dicobakan. Nilai BVR yang cenderung kecil mengindikasikan pelanggaran asumsi tidak terjadi di dalam model. Dari 127 pasien, sebanyak 39 pasien (P = 0.2812) termasuk dalam gerombol 2, 78 pasien (P = 0.6177) pada gerombol 1 sedangkan 10 pasien (P = 0.1012) sisanya pada gerombol 3. Gerombol 1 dicirikan dengan pasien yang tidak mengalami demam, sakit perut dan pegal-pegal tapi mengalami bintik-bintik merah serta Haemoglobin yang cukup tinggi dan Leokosit yang cukup rendah. Gerombol 2 merupakan kelompok pasien dengan ciri-ciri mengalami demam, sakit perut dan pegalpegal tapi tidak mengalami bintik-bintik merah, dan memiliki jumlah Haemoglobin dan Hematrokit tertinggi serta jumlah Trombosit
DAFTAR PUSTAKA Adhyatma. M. 1981. Demam Berdarah Diagnosa & pengelolaan penderita. Jakarta: Dept. Kesehatan RI Agusta, Yudi. 2009. Mixture Modelling. Bali: STMIK STIKOM Bali [Anonim]. 2008. Penyakit Demam Berdarah Dengue. http://www.infopenyakit.com/ [Senin 18 Mei 2009] [Anonim]. 2009. Expectation Maximization (EM). http://www.ittelkom.ac.id/ [Senin, 25 Mei 2009] Handayani, Sukma. 2009. (abstrak) PENERAPAN MODEL LATENT CLASS DENGAN DEPENDENSI LOKAL (Studi Kasus Pengelompokkan Rumah Tanggahasil Pendataan Social Ekonomi Penduduk Tahun 2005). [Skripsi]. Surabaya: Institut Teknologi Sepuluh November.
http://digilib.its.ac.id/ [Senin 25 Mei 2009] Kwok. 2008. Demam Berdarah Dengue. http://dokterkwok’s.wordpress.com [Kamis, 27 Agustus 2009] Morrison, D. F. 1990. Multivariate Statistical Methods. Singapore: McGraw-Hill Publishing Company Pujiati, Suhermin Ari. 2008. Analisis Latent Cluster. http://blog.its.ac.id/ [Senin 18 Mei 2009] Snellman, Marja. 2008. Case Definition of Pneumococcal Pneumonia — a Latent Class Analysis Approach. Helsinki: Department of Vaccines Vermunt, Jeroen K. dan Magidson, Jay. 2002a. “Latent Class Cluster Analysis”, Applied Latent Class. Belmont, MA: Statistical Innovation. Inc Vermunt, Jeroen K. dan Magidson, Jay. Latent Class Models for 2002b. clustering: A Comparison of K-means clustering. Canadian Journal of Marketing Research, 20. Vermunt, Jeroen K. dan Magidson, Jay. 2003. Latent Gold 4.5: About LC Modelling. Belmont, MA: Statistical Innovations Inc. Vermunt, Jeroen K. dan Magidson, Jay. 2005a. Latent Gold 4.0 User’s Guide. Belmont, MA: Statistical Innovations Inc. Vermunt, Jeroen K. dan Magidson, Jay. 2005b. Technical Guide for Latent GOLD 4.0: Basic and Advanced, Belmont, MA: Statistical Innovations Inc.
LAMPIRAN
Lampiran 1. Perbandingan metode penggerombolan Hirarki, K-rataan, dan Analisis Gerombol Kelas Laten. No 1
Aspek yang dibandingkan Jenis peubah kriteria penggerombolan
Metode hirarki Kuantitatif (rasio, interval, ordinal) atau peubah biner
Metode k-rataan Kuantitatif, (rasio atau interval)
2
Konsep jarak yang berlaku
euclid
3
Prasyarat atau asumsi sebaran peubah kriteria
Euclidean, chisquare, pattern difference, simple matching, dsb -
4
Ukuran data
Data relatif kecil
Data besar
5
Penentuan banyaknya gerombol
Secara posterior berdasarkan dendogram
Secara apriori ditentukan oleh peneliti
tidak
tidak
6 covariate (Vermont dan Magidson, 2003)
-
LCCA Kategorik, kontinu, jumlah, dan campuran Peluang posterior Asumsi kebebasan lokal Data kecil sampai besar Secara otomatis berdasarkan kriteria statistik iya
Lampiran 2. Nilai BIC, Log-likelihood dan selang BVR untuk masing-masing gerombol
Model
LL
BIC(LL) Npar Class.Err. Selang BVR Tanpa direct effect Model1 1-Cluster -1881.2 3820.527 12 0 0.0359-11.0476 Model2 2-Cluster -1805.31 3731.725 25 0.0589 0.0006-6.0139 Model3 3-Cluster -1773.49 3731.064 38 0.0953 0.0006-2.8753 Model4 4-Cluster -1752.21 3751.466 51 0.1537 0.0010-2.6186 Model5 5-Cluster -1736.43 3782.891 64 0.1487 0.0460-2.5832
Lampiran 3. Nilai Bivariate Residual (BVR) dan korelasi Pearson untuk memeriksa asumsi kebebasan lokal Indicators fever mialgia abdominal petekie
fever . 0.0006 0.4571 1.7586
mialgia
Indicators HB hematokrit trombosit leokosit
HB . 0.2349 1.6257 2.8753
hematokrit
Gerombol 1 Hematokrit Trombosit leokosit
Gerombol 2 Hematokrit Trombosit leokosit
Gerombol 3 Hematokrit Trombosit leokosit
abdominal
petekie
. 0.2563 0.8999
. 0.1164 trombosit
. leokosit
. 0.3731 2.08
. 0.0367
.
HB *0.016 **0.886 *0.186 **0.104 *0.121 **0.293
hematokrit
trombosit
*-0.071 ** 0.536 *-0.040 ** 0.725
*0.037 **0.750
HB *-0.169 ** 0.302 *-0.187 ** 0.255 *0.114 **0.489
hematokrit
trombosit
*-0.059 ** 0.721 *0.238 **0.144
*0.075 **0.652
HB *0.177 **0.624 *0.056 **0.878 *-0.105 **0.773
hematokrit
trombosit
*-0.364 ** 0.301 *0.327 **0.356
*-0.293 ** 0.412
Keterangan : * Korelasi Pearson **Nilai-p
Lampiran 4. Peluang rataan (probmeans) delapan peubah Cluster1 0.6177
Cluster2 0.2812
Cluster3 0.1012
1 2
0.9997 0.5886
0 0.3025
0.0003 0.1089
1 2
0.5433 0.691
0.3128 0.25
0.1439 0.0591
1 2
0.7724 0.5542
0.184 0.321
0.0436 0.1248
1 2
0.6282 0.5747
0.2773 0.297
0.0945 0.1283
0.7638 0.6904 0.7019 0.6537 0.2583
0.0625 0.1184 0.1967 0.3094 0.7389
0.1737 0.1913 0.1014 0.0369 0.0028
0.86 0.8071 0.727 0.5967 0.0957
0.1103 0.1822 0.2253 0.3621 0.528
0.0297 0.0107 0.0477 0.0412 0.3762
0.1867 0.4751 0.779 0.8783 0.7957
0.7953 0.4656 0.1213 0.0001 0
0.0179 0.0593 0.0997 0.1216 0.2043
0.6075 0.7484 0.5025 0.549 0.6868
0.3468 0.241 0.4825 0.274 0.0672
0.0457 0.0106 0.015 0.177 0.246
Overall Indicators Fever
Petekie
Mialgia
Abdominal
HB 09.70 - 12.90 13.00 - 13.70 13.80 - 14.90 15.00 - 15.80 15.90 - 19.40 hematokrit 01.00 - 04.00 04.30 - 06.30 06.50 - 08.60 08.90 - 15.00 15.03 - 83.33 Trombosit 02.00 - 16.00 17.00 - 29.00 30.00 - 50.00 51.00 - 71.00 74.00 - 137.00 Leokosit 0.00 - 2.00 2.10 - 2.60 2.70 - 3.30 3.40 - 4.50 4.70 - 10.70
Lampiran 5. Peluang pada peubah nominal serta nilai rata-rata pada peubah kontinu untuk masing-masing gerombol Cluster1 0.6177
Cluster2 0.2812
Cluster3 0.1012
1 2
0.1141 0.8859
0.0007 0.9993
0.002 0.998
1 2
0.4371 0.5629
0.5519 0.4481
0.7007 0.2993
1 2 Abdominal 1 2 HB Mean Hematokrit Mean Trombosit Mean Leokosit Mean
0.3634 0.6366
0.1913 0.8087
0.1295 0.8705
0.8167 0.1833
0.792 0.208
0.7516 0.2484
14.0258
15.8281
13.0956
6.8189
14.1968
31.3306
55.79
15.3597
65.0119
3.3163
2.7971
5.3088
Cluster Size Indicators Fever
Petekie
Mialgia
Lampiran 6. Nilai R2 dan uji statistik Wald Models for Indicators Cluster1 fever 1 1.5785 2 -1.5785 petekie 1 -0.2609 2 0.2609 mialgia 1 0.3709 2 -0.3709 abdominal 1 0.0906 2 -0.0906 HB -0.2907 hematokrit -10.6299 trombosit 10.4028 leokosit -0.4911
Cluster2
Cluster3
-1.0636 1.0636
-0.5149 0.5149
1.0391
0.59
0.0459
-0.0302 0.0302
0.291 -0.291
2.1403
0.34
0.0291
-0.0695 0.0695
-0.3014 0.3014
3.0951
0.21
0.042
0.0122 -0.0122
-0.1028 0.1028
0.1859
0.91
0.0026
1.5116
-1.2209
24.7231
4.30E-06
0.2622
-3.2519
13.8818
23.0624
9.80E-06
0.3868
-30.0275
19.6247
104.9682
1.60E-23
0.3728
-1.0103
1.5014
8.8239
0.012
0.1431
Model for Clusters Intercept Cluster1 0.8653
Cluster2 0.0783
Wald
p-value
Cluster3 -0.9436
R²
Wald 21.7822
p-value 1.90E-05
Lampiran 7. Plot-profil
n a e M 1- 0 h ad n er _ti s ok o el
n a e M 1- 0 m i ni m_ti s ob mor t
n a e M 1- 0 ti r k ot a me h
n a e M 1- 0 x a m_ B H
2 l ai mo db a
2 ai gl ai m
0.0
0.2
0.4
0.6
0.8
1.0
2 r e v ef
Cluster1 Cluster2 Cluster3
2 ei k et e p
Lampiran 8. Iterasi algoritma EM dan Newton Rhapson Starting set 1 2 3 4 5 6 7 8 9 10 Iteration
log-posterior -1791.0125767149 -1787.0403401642 -1790.9974729387 -1790.9990217059 -1787.0407412022 -1791.0134344075 -1787.0402988902 -1818.2800962628 -1791.0008452154 -1787.0404553704 log-posterior 0 -1787.0402988902 EM 5 -1787.0401714805 EM 8 -1787.0401304685 Newton 1 -1787.0400062938 Newton 2 -1787.0400062905 Newton 3 -1787.0400062905 Standard errors Preparing output
log-likelihood -1775.5124836050 -1771.6041531884 -1775.3928325670 -1775.4146526944 -1771.6038677020 -1775.5173040148 -1771.6050792455 -1801.9117303892 -1775.4471520956 -1771.6043048304 log-likelihood -1771.6050792455 -1771.6052375115 -1771.6053455650 -1771.6064902287 -1771.6064951487 -1771.6064951489
Wall clock time=0.3125 CPU=0.2656
seed 60078 543260 1075383 2294464 576551 2639058 81616 1742042 236782 938731 criterion 0.01608046 0.00983398 0.12343423 0.00046151 0.00000001