BAB I1 TINJAUAN PUSTAKA 2.1 Metode 'Gold Standard'
Metode gold stmmtzrd merupakan metode pengukuran dari suatu besaran yang dipandang baku dan keakuratannya diakui secara luas (Bland & Altman, 1999). Metode gold stmmtzrd bukan merupakan metode pengukuran yang memberikan hasil tanpa salah, tetapi sebelum ditemukan suatu metode pendekatan yang lain (approximate methods) yang tingkat keakuratannya dipandang layak, metode gold standard dipandang sebagai metode pengukuran yang benar.
Namun demikian
adakalanya untuk menerapkan metode gold sikmhrd ini dibutuhkan waktu, tenaga dan biaya yang tidak sedikit, bahkan seringkali dapat merusak objek yang akan diamati. Dengan demikian suatu metode baru yang bersifat lebih efisien perlu terus diciptakan clan dikembangkan. Apabila metode baru ini memiliki tingkat kesesuaian yang relatif tin& dengan metode goM standard rnaka metode baru tersebut dapat menggantikan metode gold standilmd atau pemakaiamya &pat saling dipertukarkan. Penelitian-penelitian mengenai pembandingan suatu metode pengukuran dengan metode gold standird telah banyak dilakukan. Salah satu diintaranya adalah Prigent et al dalam St.Laurent (1998) telah mengamati metode SPECT (Single Photon Emission Computed Tomography) dan metode Plmuw Imaging untuk menentukan persentase otot jantung yang terinfeksi. Dari kedua metode tersebut ingin diketahui metode mana yang tingkat kesesuaiannya paling dekat dengan metode pemeriksaan patologis yang dalam kasus ini dipandang sebagai gold standad. Berdasarkan kriteria kesesuaian penduga Laurent ternyata metode SPECT memiliki tingkat kesesuaian yang lebih dekat dengan metode patologis (r, = 0.86) dibandingkan dengan metode PIanar Imaging (rg=0.55). Begitupula dengan kriteria kesesuaian penduga gabungan (blended estimutor) yang diiemukakan Haris et a1 (2001) metode SPECT relatif lebih sesuai dengan metode patologis, bahkan tingkat kesesuaian metode SPECT terhadap metode patologis berdasarkan kriteria penduga gabungan lebih tinggi (&=
0.88) dibandingkan dengan penduga Laurent.
Penelitian-penelitian lainnya mengenai pengukuran dengan metode gold st&d
pembandingan
suatu metode
diantaranya adalah W a x et a1 dalam
St.Laurent (1998) yang mengamati kesesuaian konsentrasi alkohol dalam darah berdasarkan hasil pengukuran electrochemical meter sebagai metode pembanding dengan konsentrasi alkohol dalarn darah yang ditentukan berdasarkan kekebalan darah (blood immunoassay) sebagai gold startciird. Hutson et a1 dalam Harris (2001) mengamati perubahan kecil pada area endocardial berdasarkan echocardiographic
imaging sebagai gold standard dan pengukuran dengan algoritma komputer sebagai metode pembanding. 2.2 Ukuran Kesesuaian pada Studi Pembandingan Metode
Altman & Bland (1986) mengemukakan bahwa suatu metode pengukuran dikatakan sesuai sempurna (perfect agreement) dengan metode pengukuran lainnya
jika hasil pengukuran kedua metode tersebut seluruhnya terletak pada garis kesesuaian (line of agreement), yaitu suatu garis yang melalui titik asal (0,O) clan membentuk sudut 45' terhadap sumbu ordinat maupun absis. Menurut Harris et a1 (2001) kesesuaian diantara dua metode pengulcuran tidak hanya membutuhkan tingkat korelasi linier yang tinggi tetapi juga membutuhkan hubungan linier yang konsisten yaitu memiliki slope sama dengan satu dan intersep sama dengan nol. Garis dengan intersep no1 dan slope sama dengan satu ini juga merupakan garis kesesuaian (line of ageement). Selain berdasarkan kriteria tersebut di atas, untuk menentukan suatu metode relatif sesuai atau tidak dengan metode laimya diperlukan pula penetapan kriteria kesesuaian yang dianggap layak berdasarkan tujuan penelitian dan dimana metode tersebut akan digunakaa Penetapan lcriteria ini tentunya memerlukan pemahaman yang mendalam mengenai latar belakang keilmuan yang berkaitan dengan penelitian. Menurut Hutson et a1 (1998) pendekatan-pendekatan yang telah banyak digunakan selama ini dalam menentukan kesesuaian diantara metode pengukuran adalah : uji-t berpasangan (Paired t-test), koefisen korelasi Pearson (Pearson
Correlation CoefJicient), koefisen korelasi intraclass (Intraclass Correlation
Coeflcient), regresi linier sederhana (Simple Linear Regression), koefisien korelasi konkordan Lin (Lin 's Concordrmce Con-ehtioit Coeflcient). Untuk kondisi-kondisi tertentu, pendekatan-pendekatan tersebut ternyata tidak selalu layak digunakan sebagai kriteria pengukur tingkat kesesuaian. Koefisien korelasi Pearson merupakan ukuran yang paling sering disalahgunakan, karena sesungguhnya koefisien korelasi Pearson ini merupakan ukuran yang menunjukkan tingkat hubungan (msociation) linear diantara dua peubah, bukan tingkat kesesuaian (degree of agreement) dua peubah. Koefisien korelasi Pearson tergantung pada kisaran (range) pengukuran dan amatan yang terpilih.
Dengan demikian koefisien korelasi Pearson nampaknya kurang tepat jika digunakan sebagai ukuran kesesuaian (Altman & Bland, 1986) kecuali bila contoh yang dipilih benar-benar menggarnbarkan keadaan populasi (representatzn. Hutson et al (1998) mengemukakan bahwa baik koefisien korelasi Pearson maupun koefisen korelasi zntraclass dapat merupakan ukuran kesesuaian yang keliru terutama jika nilai-nilai contoh mempunyai kisaran pengukuran yang sempit. Begitupula dengan koefisien korelasi konkordan Lin memiliki kelemahan yang serupa dengan korelasi Pearson. Penggunaan uji-t berpasangan (paired t-test) dalam mengukur kesesuaian juga nampaknya perlu hati-hati, karena pada uji-t berpasangan dibutuhkan asumsi selisih antara kedua metode menyebar normal dan antara selisih dengan rataan harus saling bebas. Altman & Bland (1986) menduga bahwa antara selisih dengan rataan dari dua metode pengukuran selalu akan berhubungan. Menurut Hutson et a1 (1998) uji-t berpasangan juga dapat merupakan ukuran kesesuaian yang keliru jika plot hasil-hasil pengukuran kedua metode tegak lurus terhadap garis kesesuaian (line of agreement). Bland (2001) dan Lin (1989) menyampaikan bahwa pengukuran kesesuaian melalui metode regresi linier biasa diantara hasil-hasil pengukuran dua metode juga dapat memberikan hasil yang keliru, terutama j i b diperoleh slope tidak sama dengan satu clan intersep tidak sama dengan nol, belum tentu tingkat kesesuaian diantara dua metode tersebut rendah.
Altman (1986) menyarankan suatu metode yang dinarnakan batas kesesuaian 95% (95 % limit of agreement) untuk menentukan kesesuaian diantara dua metode
pengukuran. Menurut Altman metode ini lebih mudah diinterpretasikan dan lebih mudah dalam perhitungannya. St.Laurent (1998) menyatakan bahwa ukuran kesesuaian antara dua metode dapat diinterpretasikan sebagai koefisien korelasi intraclasrs populasi pada model dua peubah terkendala (model dengan slope=l dan intersep=O). St Laurent (1998) telah menurunkan penduga bagi koefisien korelasi intraclass tersebut berdasarkan pendugaan terhadap komponen ragam untuk kedua metode yang akan dibandingkan. Harris et a1 (2001) membangkitkan suatu kelompok penduga berdasarkan besaran pivot yang kemudian gabungan dari dua anggota tertentu dalam kelompok penduga tersebut (blended estimator) berperan sebagai penduga dari koefisien korelasi intraclass populasi pada model dua peubah terkendala.
2.3 Batas kesesuaian 95 % (95 % Limit of Agreement)
Batas kesesuaian 95% merupakan suatu selang yang menunjukkan dimana 95% dari selisih hasil pengukuran dua metode diharapkan akan terletak dalam selang
tersebut. Batas kesesuaian ini tidak sarna dengan batas kepercayaan (wnzdence limit) tetapi lebih merupakan suatu selang patokan (reference interval).
Batas kesesuaian 95% diduga oleh
(2 f 1.96%).
Bland & Altman (1999)
mengembangkan batas kesesuaian 95% berdasarkan pada asumsi bahwa bias diantara dua metode menyebar normal. Selain itu untuk menggunakan metode ini dibutuhkan juga nilai tengah dan simpangan baku bias yang bersifat konstan pada seluruh kisaran pengukuran. Bland (2001) menjelaskan bahwa masalah kesesuaian diantara dua metode pengukuran bukan merupakan suatu pengujian hipotesis tetapi merupakan suatu ha1 yang harus diduga. Pendugaan terhadap suatu besaran tentunya tidak terlepas dari galat dan tentunya juga memiliki selang kepercayaan.
Penduga selang untuk batas bawah dan batas atas bagi batas kesesuaian 95 % dirumuskan sebagai berikut :
2.4 Penduga Laurent
Untuk menduga kesesuaian suatu metode pengukuran dibandingkan terhadap suatu gold standcrrd, St.Laurent ( 1 998) menyarankan penggunaan model sebagai berikut :
Xi = GI+ Ei dengan :
X = peubah acak hail pengukuran metode bdpembanding (approximate methods) Gi = peubah acak hasil pengukuran goldstamhrd ; E (G) = p, Var ((G = Cov (Xi,G) -20 Ei = galat
pengukuran
Model di atas mengasumsikan bahwa E
(Ei) =
0, Var (Ei)
=
d dan Ei saling bebas
dengan Gi . Model tersebut juga dapat diinterpretasikan sebagai model regresi dua peubah dengan kendala intersep sarna dengan no1 dan slope sarna dengan satu. Berdasarkan model tersebut St.Laurent (1998) mengemukakan koefisien korelasi intraclass sebagai ukuran kesesuaian antara metode barn dengan gold st&d
sebagai berikut :
Nilai p yang makin mendebti 1 menunjukkan bahwa metode baru relatif makin sesuai dengan gold strmdird. dimuskan sebagai berikut :
Nilai p tersebut diduga oleh r, yang
dengan : SDD = E(Xi- G)*= zd,d m ,S
= X (Gi -
St Laurent (1998) juga menyatakan jika
Ei
dan Gi menyebar normal maka
r, merupakan penduga kemungkinan maksimum bagi p.
2.5 Penduga Gabungan (Blended Estimaior)
Penduga bagi koefisien korelasi intraclass p untuk model yang disarankan St Laurent (1998) juga telah diamati oleh Harris et a1 (2001).
Penduga tersebut
diturunkan berdasarkan besaran pivot, prinsipnya adalah menyamakan suatu besaran pivot dari parameter yang ingin diduga dengan suatu nilai dari sebaran pivot tersebut yang mana sebaran dari besaran pivot tersebut tidak tergantung pada parameter yang ingin diamati. Dengan metode ini dapat dibangkitkan suatu kelompok penduga yang memiliki sifat-sifat bias dan KTG (Kuadrat Tengah Galat) kecil. Telah ditunjukkan pula bahwa dalam kelompok penduga ini tercakup penduga koefisien intraclass yang disarankan St Laurent (1998).
Diantara kumpulan penduga p dalam kelompok
tersebut, terdapat dua anggota tertentu dimana gabungan keduanya ini mempunyai bias dan KTG yang lebih baik daripada penduga kemungkinan maksimum untuk p yaitu r,. Gabungan dari kedua anggota penduga tersebut dinamakan Blended Estimator (Hims et al ,2001). Penduga gabungan (blended estimator) yang didasarkan pada asumsi Ei dan Gi yang menyebar normal adalah :
Harris el al(2001) telah menunjukkan bahwa
brnakan memiliki KTG dan bias yang
lebih baik dibandingkan dengan r, di seluruh kisaran ruang parameter p. Jika Ei dan
Gi tidak menyebar normal maka bW masih layak digunakan asalkan LI(kurtosis baku kumulatif keempat) untuk Ei dan Gi lebih besar atau sama dengan -413.