CARA MELAPORKAN HASIL ANALISIS STATISTIK:
GENERALISASI DARI SAMPEL KE POPULASI
PENDAHULUAN
Kebanyakan penelitian biomedik bergantung pada kepastian bahwa apa yang benar terjadi pada sampel juga benar terjadi pada populasi dimana sampel tsb diambil, Karena itu, karakteristik dari sampel digunakan untuk estimasi karakteristik yang sama pada populasinya
PENDAHULUAN
Akurasi data estimasi2 tsb bergantung pada variasi berkaitan dengan:
Teknik pengukuran (measurement error) Jumlah dan teknik sampling (sampling error) Variasi biologik pada karakteristik tsb (random error)
Dinyatakan sebagai confidence interval
PENDAHULUAN
confidence interval, adalah nilai range yang melalui nilai aktual yang terjadi pada populasi confidence interval yang lebar menunjukkan presisi yang kurang baik, demikian sebaliknya
CONTOH
Perbandingan rerata suhu tubuh antara kelompok perlakuan (n=15) dan kelompok kontrol (n=15) menunjukkan bahwa kelompok perlakuan secara statistik mempunyai mean (SD) yang lebih tinggi dibandingkan kelompok kontrol: 56 oC (3 oC) versus 33 C (5 oC). Beda rerata kedua kelompok adalah 23 o C (95% CI = 19,9 sampai 26,1 oC)
Laporkan confidence interval untuk semua perbandingan primer baik yang bermakna maupun tidak
Laporan ilmiah yang baik bergantung lebih pada jawaban yang akurat terhadap pertanyaan penelitian dan bukan pada kemaknaan statistik. Hasil yang diperoleh dari sampel masih merupakan estimasi: belum yang sebenarnya dalam artian absolut, sehingga masih mungkin bervariasi antar sampel, yang dapat diperlihatkan melalui nilai confidence
interval
Laporkan confidence interval untuk semua perbandingan primer baik yang bermakna maupun tidak
confidence interval yang sering digunakan dalam kedokteran adalah 95%, artinya interval tsb dapat digunakan untuk menunjukkan apakah estimasi perubahan tsb secara statistik bermakna pada tingkat 0,05 Nilai lain dapat digunakan, misal 90% untuk jumlah sampel kecil Secara umum, bila 95% CI estimasi beda antara 2 kelompok tidak melibatkan angka 0 (angka 1 untuk OR), maka hasilnya bermakna pada tingkat 0,05
CONTOH
Beda rerata ukuran fungsi paru antar 2 kelompok adalah 0,51 L/menit (95% CI = 0,23 sampai 0,79) Beda rerata ukuran fungsi paru antar 2 kelompok adalah 0,12 L/menit (95% CI = -0,16 sampai 0,40)
CONTOH
OR insidens terjadinya kanker pada perokok dan non-perokok adalah 4,2 (95% CI = 1,32 sampai 13,33) OR insidens terjadinya kanker pada perokok dan non-perokok adalah 4,2 (95% CI = 0,92 sampai 18,63)
CONTOH
Sekelompok pasien mempunyai tekanan diastolik yang rendah setelah menerima obat selama 6 minggu, yang dapat dilaporkan sbb:
Efek obat bermakna secara statistik. Efek obat untuk menurunkan tekanan diastolik secara statistik bermakna (P < 0,05) Rerata tekanan diastolik dari kelompok perlakuan turun dari 100 menjadi 92 mm Hg (P = 0,02) Obat menurunkan tekanan diastolik dengan rerata sebesar 8 mm Hg, dari 100 menjadi 92 mm Hg (96% CI = 2 sampai 14 mm Hg).
Laporkan confidence interval untuk statistik deskriptif
Estimasi untuk keluaran data yang utama (mean, median, proporsi), harus disertakan dengan CI untuk menunjukkan presisinya
CONTOH
Rerata kadar serum IGF-1 dari 138 pasien osteoporosis adalah 300 ng/ mL (95% CI = 272 sampai 327 ng/ mL)
CATATAN
Jangan menggunakan SEM sebagai CI CI yang lebar dapat membuat penggunaan estimasi menjadi tidak valid
CARA MELAPORKAN HASIL ANALISIS STATISTIK:
MASALAH PADA MULTIPLE COMPARISON
UJI GANDA SERING DILAKUKAN :
Uji beberapa karakteristik data dasar ataupun faktor prognostik antara kelompok perlakuan dan kontrol Membandingkan tiga atau lebih kelompok data melalui analisis terpisah untuk dua kelompok setiap saat (ANOVA, regresi ganda) Menguji efek ganda yang dipengaruhi oleh satu set variabel yang sama
UJI GANDA SERING DILAKUKAN :
Melakukan analisis tambahan setelah data terkumpul yang tidak direncanakan sebelumnya Melakukan analisis tambahan sebagai analisis sub-kelompok yang tidak direncanakan sebelumnya Melakukan analisis interim dari akumulasi data (efek pada beberapa waktu yang berbeda) Membandingkan kelompok pada beberapa waktu pengamatan
YANG PERLU DIPERHATIKAN PADA UJI GANDA :
Fenomena data dredging Dapat bermanfaat untuk menghasilkan pertanyaan penelitian yang baru yang bermanfaat secara biologis, asalkan tidak men-cari2 (fishing expedition) Bagaimana dengan nilai kemaknaan P nya?
PERUBAHAN NILAI KEMAKNAAN P:
Nilai kemaknaan P sudah ditetapkan oleh peneliti, apakah perlu disesuaikan nilainya untuk uji ganda?
Menggunakan 0,01 dan bukan 0,05 Menggunakan koreksi Bonferroni dengan menghitung nilai kemaknaan baru yaitu nilai kemaknaan lama / jumlah analisis Lebih mengutamakan hipotesis utama
MELAPORKAN KESAMAAN ANTAR KELOMPOK
Laporkan nilai klinis untuk menilai kesamaan antar kelompok dan jangan bergantung pada nilai P Pada uji klinis tanpa randomisasi, karakteristik data awal dapat dan sering dilaporkan untuk membandingkan apakah perbedaannya bermakna secara statistik dan ada artinya secara klinis:
adanya beda menunjukkan adanya systematic bias pada saat pengalokasian subyek, sedangkan bila secara statistik tidak ada perbedaan bermakna maka belum tentu kedua kelompok sudah sama bila secara statistik belum bisa menunjukkan adanya beda secara klinis
MELAPORKAN KESAMAAN ANTAR KELOMPOK
Pada uji klinis dengan randomisasi, setiap perbedaan klinis atau statistik yang ditemukan antar kelompok, secara definisi merupakan hasil dari suatu kebetulan:
Ketidakseimbangan secara klinis, walaupun merupakan suatu kebetulan adalah sesuatu yang nyata dan perlu disatukan dalam suatu model multivariabel.
MELAPORKAN KESAMAAN ANTAR KELOMPOK
Beda yang bermakna secara statistik merupakan sesuatu yang kebetulan dan apabila perbedaannya tidak bermakna secara statistik, tidak menunjukkan bahwa kedua kelompok tidak ada beda tetapi menunjukkan kalau alokasinya efektif Dari 80 studi RCT yang dipublikasi, hanya 46 studi (58%) yang membandingkan karakteristik data awal
MELAPORKAN PERBANDINGAN SECARA BERPASANGAN DARI KELOMPOK2 PERLAKUAN
Jelaskan prosedur perbandingan ganda yang digunakan untuk menunjukkan pasangan dari kelompok yang paling berpengaruh dari semua kemaknaan statistik mengenai perbandingan kelompok:
Bila tiga atau lebih data dibandingkan masing2 dua dengan analisis terpisah, maka jumlah tes akan menjadi banyak untuk masuk ke tes ganda Contoh, bila ada 4 kelompok yang dibandingkan 2 setiap saat dengan uji-t, maka akan ada 4(4-1)/2 atau 6 uji-tes. Bila alpha ditentukan dengan nilai 0,05 maka probabilitas untuk menemukan perbedaan bila tidak ada beda adalah 0,05*6 = 0,3 atau 1 dari setiap 3 nilai P akan diinterpretasikan salah
MELAPORKAN PERBANDINGAN SECARA BERPASANGAN DARI KELOMPOK2 PERLAKUAN
Untuk mengatasi masalah tsb maka teknik membandingkan kelompok dengan ANOVA dapat menganalisis data dari seluruh kelompok dan menunjukkan adanya perbedaan antar kelompok tsb Bila ada perbedaan maka prosedur selanjutnya (prosedur perbandingan ganda) dapat dilakukan untuk menunjukkan kelompok2 mana yang paling mempengaruhi adanya perbedaan menyeluruh antar kelompok Prosedur perbandingan ganda yang biasa dilakukan adalah: Tukey’s, Student-NeumanKeuls, Duncan’s, Dunnett’s, Scheffe’s, LSD, Bonferroni’s
MELAPORKAN ANALISIS SEKUNDER (RETROSPEKTIF ATAU POST HOC)
Hasil dari suatu studi dapat menemukan hubungan yang baru yang tidak direncanakan sebelumnya. Namun, karena studi tidak direncanakan untuk menguji hubungan tsb, maka analisis ulang hasil berdasarkan kriteria yang berbeda dapat menimbulkan masalah dalam menginterpretasikannya:
Contoh, suatu studi dirancang untuk menguji perbedaan dalam tajam penglihatan antara laki-laki dan perempuan. Setelah mendapatkan hasilnya, peneliti memutuskan untuk menganalis ulang datanya berdasarkan kelompok usia daripada berdasarkan gender. Karena asalnya kelompok perlakuan dan kontrol telah disepadankan dalam gender dan bukan dalam usia, maka analisis post hoc yang dilakukan harus dipertimbangkan penjelasan hasilnya, semenarik atau sebermakna apapun secara statisik
MELAPORKAN ANALISIS SUBKELOMPOK
Banyak proyek riset yang mengumpulkan sejumlah data yang tidak ada kaitannya dengan perbandingan primernya, misal: data demografik (umur dan jenis kelamin), karena banyak gambaran klinis bervariasi berdasarkan faktor tsb. Peneliti mempelajari efek obat antidepresan, dan mendapatkan bahwa efek obat tidak beda dengan plasebo
Analisis lebih lanjut menemukan adanya penurunan depresi secara bermakna pada perempuan post-menopause sebagai sub kelompok dari kelompok perlakuan asal Hasil dari analisis sub-kelompok boleh saja dilaporkan – mungkin saja obat tsb memang dipengaruhi oleh kadar hormon, namun harus dilaporkan sebagai penemuan awal karena tidak diantisipasi sejak awal
MELAPORKAN ANALISIS SUBKELOMPOK
Alternatif untuk analisis sub-kelompok adalah dengan menggabungkan faktor2 dalam satu model prediksi (persamaan regresi) dibanding dengan menganalisis masing2 sub-kelompok secara terpisah.
Contoh, peneliti dapat menganalisis interaksi antar usia, gender dan perlakuan dengan perbaikan depresinya dan menghindarkan analisis subkelompok Sub-kelompok yang ditentukan setelah data dikumpulkan dapat menggambarkan efek perlakuan Analisis sub-kelompok berisiko melakukan kesalahan tipe 2 (jumlah sampel kurang)
MELAPORKAN ANALISIS SUBKELOMPOK
Analisis sub-kelompok dapat lebih diterima apabila:
Perbedaan antar kelompok cukup besar baik penting secara klinis maupun bermakna secara statistik Perbandingan antar sub-kelompok merupakan bagian dari analisis prioritas dan bukan analisis post hoc Perbandingan antar sub-kelompok merupakan bagian dari hipotesis tambahan dan bukan hasil dari “data dredging” Perbedaan yang ada berdasarkan perbedaan dari studi yang sama dan bukan data dari studi lain Perbedaannya konsisten sepanjang studi Bukti2 lain mendukung adanya perbedaan tsb
MELAPORKAN ENDPOINT GANDA
Identifikasikan efek utama sebelum memulai studi:
Analogi dengan masalah analisis sekunder, dimana variabel2 ditemukan secara bermakna merupakan masalah efek ganda; Untuk uji klinis dengan 5 efek, maka kesempatan untuk membuktikan hipotesis null bahwa sedikitnya 1 perbedaan perlakuan mencapai nilai kemaknaan P < 0,05 adalah sekitar 20%
MELAPORKAN ENDPOINT GANDA
Contoh:
Bila obat tekanan darah secara tidak sengaja juga merangsang pertumbuhan rambut, maka studi dapat melaporkan kedua efek tsb: tekanan darah dan pertumbuhan rambut. Seperti halnya pada analisis sekunder, jumlah efek yang dapat dianalisis bisa banyak dan menimbulkan masalah masalah uji ganda Perbandingan utama, yaitu efek obat pada tekanan darah harus merupakan fokus dari laporan, dan efeknya pada pertumbuhan rambut harus dilaporkan sebagai hasil awal/preliminari
ANALISIS INTERIM DARI AKUMULASI DATA
Laporkan seluruh analisis interim dari akumulasi data dan buat rasional untuk analisis tsb:
Untuk studi yang memerlukan waktu bulanan atau tahunan, seringkali diperlukan uji dari hasil secara berkala sehingga studi tidak berisiko untuk subyek Bila hasil analisis menunjukkan keunggulan atau ketidakunggulan obat atau obat membahayakan maka studi harus dihentikan Namun menimbulkan masalah uji ganda, misal analisis dilakukan setiap subyek menyelesaikan protokol studi, sehingga jumlah kasus yang dianalisis akan bertambah satu pada setiap analisis:
Uji analisis akan memberikan hasil bermakna setelah kasus ke 23, tidak bermakna setelah kasus ke 27, bermakna lagi setelah kasus ke 34 dan seterusnya Analisis interim yang tidak direncanakan dapat menimbulkan masalah interpretasi
ANALISIS INTERIM DARI AKUMULASI DATA
Laporkan kriteria statistik untuk menghentikan studi dan tunjukkan bahwa kriteria2 tsb dibuat sebelum studi dimulai:
Bila studi dihentikan terlalu cepat (baru beberapa kasus yang menyelesaikan protokol), maka power statistik bisa rendah Bila studi diteruskan maka akan berisiko untuk subyek
ANALISIS INTERIM DARI AKUMULASI DATA
Tentukan untuk siapa hasil analisis ini perlu dilaporkan:
Melaporkan hasil analisis interin kepada komunitas kedokteran dapat menimbulkan bias:
Bila hasilnya obat yang satu lebih superior terhadap obat yang lain, maka dokter tidak akan mengijinkan pasiennya untuk diuji
Mempublikasikan melalui media:
Bila kemudian hasilnya menjadi berbeda maka akan hilangkan kepercayaan dari ilmuwan dan publik
MEMBANDINGKAN KELOMPOK PADA WAKTU2 YANG BERBEDA
Bila kelompok dibandingkan pada waktu2 yang berbeda, jelaskan prosedur statistik yang digunakan dan penyesuaian yang dilakukan untuk perbandingan ganda tsb:
Studi yang membandingkan dua atau lebih kelompok pada waktu2 yang berbeda akan menghasilkan nilai P ganda, sedikitnya 1 untuk setiap waktu Contoh: untuk menentukan beda saat diberikan dan lama anastesi antara dua jenis anestesi, pengukuran dapat dilakukan setiap jam selama 12 jam
MEMBANDINGKAN KELOMPOK PADA WAKTU2 YANG BERBEDA
Contoh: untuk menentukan beda saat diberikan dan lama anastesi antara dua jenis anestesi, pengukuran dapat dilakukan setiap jam selama 12 jam:
Kedua kelompok dapat dibandingkan secara statistik setiap jam untuk menentukan pada waktu yang mana beda terjadi secara bermakna Untuk itu sering dilakukan perbandingan kelompok ganda secara individual, satu untuk setiap waktu yang ditentukan, sehingga menimbulkan masalah uji ganda (ada 12 nilai P, sehingga memerlukan koreksi nilai alpha, misal dengan Bonferroni)