sumber:www.oseanografi.lipi.go.id
ISSN 0216- 1877
Oseana, Volume XXI, Nomor 3, 1996 : 33 - 43
PENDUGAAN NILAI DATA YANG HILANG Oleh
Giyanto 1)
ABSTRAK
MISSING DATA ESTIMATION. Sometimes, the researcher is not always lucky getting good data of his observations due to one or some of the experimental animals may die (but not of the treatment), the equipment is out of order or the bad weather condition. Those accidents result in the missing data. Although the least squares procedure can be applied to the data that are present, missing data destroy the symmetry and simplicity of the analysis. To avoid that problem, the missing data is estimated With some modifications, the usual analysis of variance can be applied and gives results that are correct enough for practical purposes. Some formulas and some examples to estimate the missing data are reviewed in this article.
PENDAHULUAN
pecah, ataupun karena keadaan cuaca yang tidak memungkinkan untuk pengambilan data (seperti ombak besar). Adanya unit pengamatan yang hilang (data hilang) menyebabkan banyaknya unit pengamatan tidak sama, kerapkali menimbulkan kesulitan dalam analisa data. Walaupun prosedur kuadrat terkecil dapat diterapkan untuk data yang ada, tetapi data yang hilang dapat merusak kesimetrian dan kesederhanaan dalam analisa data (SNEDECOR & COCHRAN 1967). Pada klasifikasi satu arah seperti pada RAL (Rancangan Acak Lengkap = The Complety Randomized Design) yang pada
Dalam melakukan suatu percobaan atau penelitian. kita telah merencanakan untuk pengambilan data pada tempat dan saat tertentu dimana data tersebut diharapkan dapat mendukung dalam analisa penelitiannya. Tapi kenyataan di lapangan kerapkali berbeda dengan yang telah direncanakan semula. Data yang semula direncanakan dapat terambil ternyata tidak dapat terambil karena sesuatu di luar kekuasaan kita, seperti hewan percobaan mati (tetapi bukan karena perlakuan), alat pengukur yang digunakan dalam percobaan tiba-tiba saja rusak atau
1) Balitbang Biologi Laut, Pusat Penelitian dan Pengembangan Oseanologi - LIPI, Jakarta.
33
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
awalnya dirancang dengan banyak unit pengamatan sama untuk setiap perlakuannya, karena terdapat data yang hilang menyebabkan banyak unit pengamatan menjadi tidak sama. Analisa sidik ragam (Analysis of Variance) tetap dapat dilakukan pada rancangan tersebut dengan mengikuti aturan-aturan analisa sidik ragam yang berlaku untuk RAL dengan banyak unit pengamatan tidak sama untuk setiap perlakuan. Jadi dalam hal ini, tak ada pendugaan untuk nilai data yang hilang (SNEDECOR & COCHRAN 1967). Tetapi bagaimana halnya bila data yang hilang tersebut terjadi pada bentuk rancangan dasar percobaan lainnya seperti pada RBAL (Rancangan Blok Acak Lengkap = The Randomized Complete Block Design) dan RBSL (Rancangan Bujur Sangkar Latin = The Latin Square Design) ? Jika menghadapi hal yang demikian. dengan data pengamatan yang ada, kita menginginkan untuk menduga nilai data yang hilang tersebut. Beberapa ahli statistika telah mengembangkan beberapa prosedur analisa untuk menduga nilai data yang hilang tersebut. Tulisan ini akan mengulas tentang bagaimana cara menduga nilai data yang hilang pada ber-
bagai rancangan dasar percobaan, disertai contohcontoh penerapannya dalam bidang kelautan.
PENDUGAAN NILAI DATA YANG HILANG PADA RBAL Jika perlakuan-perlakuan diterapkan pada materi yang relatif homogen dalam setiap blok atau kelompok dan diulangi pada blok atau kelompok yang lainny a, rancangannya disebut dengan Rancangan Blok Acak Lengkap atau disingkat RBAL (FEDERER 1967). Dalam hal ini, semua perlakuan dilakukan secara acak (random) untuk setiap blok atau kelompok. Dalam RBAL ini, sebuah data yang hilang dapat diduga nilainya dengan suatu rumus yang diperkenalkan pertama kali oleh ALLAN & WISHART (dalam FEDERER 1967). YATES (dalam FEDERER 1967) memperlihatkan bahwa rumus tersebut diperoleh dengan meminimumkan jumlah kuadrat sesatannya (eror sum of squares). Misalkan X = hasil pengamatan, n = banyak blok, k = banyak perlakuan dan X11 = nilai data yang hilang, maka Rancangan Blok Random Lengkapnya dapat dilihat pada Tabel 1.
Tabel 1. Rancangan Blok Random Lengkap dengan satu buah data yang hilang
34
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Untuk kombinasi lain dari data yang hilang dapat dicari dengan prosedur seperti yang dilakukan di atas, tetapi hal ini tidaklah mudah, lebih-lebih bila ini melibatkan lebih banyak lagi unit data yang hilang. YATES (dalam FEDERER 1967); STEEL & TORRIE 1980; SUGANDI & SUGIARTO 1994 menggunakan prosedur berulang (prosedur iteratif) untuk menduga beberapa unit percobaan yang hilang. Dalam prosedur berulang, pertama-tama ditetapkan nilai dugaan awal untuk semua data yang hilang, kecuali satu unit dihitung dari Rumus 1 (rumus untuk menduga satu nilai data yang hilang pada RBAL). Besarnya nilai dugaan awal itu bisa sembarang tetapi sebaiknya nilainya tidak terlalu jauh dengan rata-rata dari baris i dan kolom j yang hilang (FEDERER 1967). Sedangkan SUGANDI & SUGIARTO 1994 menyebutkan bahwa besarnya nilai dugaan awal berdasarkan rata-rata antara rata-rata nilai data yang ada dalam kelompok yang sama dengan data yang hilang. Adanya perbedaan dalam memberikan nilai dugaan awal akan mempengaruhi banyaknya siklus yang harus dilakukan agar diperoleh nilai dugaan yang stabil untuk data yang hilang tersebut. Jadi bila terdapat z unit data yang hilang, maka (z-1) buah data yang hilang tersebut nilainya diduga sembarang sedangkan satu nilai data hilang sisanya dihitung dengan Rumus 1. Setelah diperoleh nilai dugaan untuk nilai
data hilang dari Rumus 1 tersebut, maka dapat dicari nilai dugaan untuk data hilang yang lainnya yang sebelumnya diduga dengan nilai sembarang. Setelah melakukan satu siklus penuh, dimulai lagi siklus kedua dengan urutan seperti sebelumnya. Prosedur ini terus berlangsung sampai nilai yang diduga menjadi stabil untuk setiap unit data yang hilang. Biasanya tiga kali siklus atau ulangan akan menghasilkan nilai dugaan yang stabil, tetapi banyaknya siklus tergantung dari seberapa dekatnya kita memberikan nilai dugaan awal pada data yang hilang. Untuk memperoleh gambaran yang lebih jelas tentang bagaimana caranya menduga nilai data yang hilang pada RBAL dapat dilihat pada contoh berikut ini. Contoh 1 : Seorang peneliti ingin menyelidiki apakah jumlah zooxanthella pada karang batu dari jenis Acropora formosa dipengaruhi oleh kedalaman dimana Acropora formosa tersebut hidup. Untuk itu sipeneliti membuat pengamatan terhadap Acropora formosa dengan menganggap kedalaman sebagai perlakuan dan lokasi penelitian sebagai blok. Ada 3 buah taraf perlakuan yang dipilih dan masing-masing perlakuan secara acak dilakukan pada setiap blok yang dipilih. Jumlah zooxanthellae per cm2 (dalam jutaan) dicatat dan hasilnya disajikan seperti dalam Tabel 2.
36
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Tabel 2. (data fiktif) Lokasi (Blok)
Kedalaman (meter)
St. I
St. II
St. III
St.IV
(tanpa data hilang)
1
21,34
20,73
22,52
21,09
85,68
5
21,54
X22
22,92
21,47
65,93
10
21,79
20,95
23,07
21,99
87,80
Jumlah (tanpa data hilang)
64,67
41,68
68,51
64,55
239,41
Jumlah
Karena sesuatu di luar kekuasaan si peneliti, tidak diperoleh data jumlah zooxanthella pada Lokasi St. II di kedalaman 5 m, atau dengan kata lain, terjadi data hilang pada X22. Dengan data yang ada, si peneliti ingin menduga nilai dari data yang hilang tersebut. Maka dengan menggunakan rumus 1, nilai X22 dapat diduga yaitu :
Contoh 2 : Lihat kembali contoh 1. Misalkan terdapat 2 buah data yang hilang yaitu X13 dan X12 sehingga tabelnya menjadi seperti dalam Tabel 3. Tabel 3. (data fiktif) Kedalaman ( meter )
Lokasi (Blok) St. I
St.II
St.II
St. IV
Jumlah (tanpa data hilang)
1
21,34
20,73
X13
21,09
63,16
5
21,54
X22
22,92
21,47
65,93
10
21,79
20,95
23,07
21,99
87,80
Jumlah (tanpa data hilang)
64,67
41,68
45,99
64,55
216,89
37
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Untuk menduga nilai X]3 dan X 22 dapat dilakukan dengan dua cara sebagai berikut : a. Cara 1 (menggunakan rumus yang meminimumkan JKS) Rumus untuk menduga dua buah data yang hilang dengan meminimumkan JKS telah diketahui untuk kombinasi data X 11 dan X 21 (Rumus 2a dan 2b) serta kombinasi data X11 dan X 22 (Rumus 3a dan 3b). Padahal kombinasi data yang hilang pada contoh 2 ini yaitu nilai X]3 dan X 22 . Bila kita perhatikan kembali data pada Tabel 3, kedua data yang hilang tersebut sebenarnya dapat dicari dengan menggunakan Rumus 3a dan 3b bila susunan baris dan kolom dirubah sedemikian rupa sehingga rumus tersebut dapat diterapkan. Dalam hal ini X13 berubah menjadi X 11 sedangkan X 22 tak berubah sehingga susunannya seperti dalam label 4.
Dengan menggunakan Rumus 3a dan 3b akan diperoleh :
dan
b. Cara 2 (dengan menggunakan prosedur berulang) Lihat kembali Tabel 3. Untuk menduga nilai X13 dan X22, pertama-tama tetapkan nilai dugaan awal untuk salah satu nilai dan data hilang. (i) Siklus 1 Misalkan dugaan awal untuk X 13 = 22,02 (tentu saja dapat dipilih nilai-nilai yang lainnya, tetapi itu akan mempengaruhi banyaknya siklus yang harus dilakukan untuk mendapatkan nilai dugaan yang stabil untuk data yang hilang).
38
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Untuk menduga dua atau lebih data yang hilang, seperti halnya pada RBAL, prosedur meminimumkan JKS juga diterapkan pada RBSL. Misalkan,untuk dua buah data yang hilang yaitu X111 dan X221 , maka nilainya dapat diduga menggunakan rumus berikut :
Sedangkan untuk kombinasi data hilang X111 dan X222 nilai dugaan yaitu
diperoleh nilai dugaan yang stabil untuk seluruh nilai data yang hilang tersebut.
Untuk kombinasi data hilang lainnya, prosedur yang sama seperti di atas dapat dilakukan. YATES (dalam FEDERER 1967) juga menggunakan prosedur berulang (prosedur iteratif) untuk menduga beberapa nilai data yang hilang pada RBSL. Adapun caranya mirip seperti halnya pendugaan nilai data yang hilang pada RBAL, yaitu menetapkan nilai dugaan awal untuk semua data hilang, kecuali satu nilai diduga menggunakan Rumus 4. Dari satu nilai yang diduga dengan menggunakan Rumus 4 tersebut, nilai-nilai lainnya dapat diduga kembali sehingga
Contoh 3 : Seorang peneliti ingin mengetahui apakah ada perbedaan persentase tutupan karang hidup antara berbagai panjang transek garis yang dilakukan (Panjang garis transek A = 10m B= 30m ; C = 50 m ; D = 70 m dan E = 100 m). Dalam penelitian ini, lokasi penelitian dimasukkan ke dalam baris dan pengambil data ke dalam kolom. Hasil pengambilan datanya sepertinya dalam Tabel 5.
40
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
42
Oseana, Volume XXI no. 3, 1996
sumber:www.oseanografi.lipi.go.id
PENUTUP
derajat bebas untuk total dan derajat bebas sesatan dikurangi dengan banyaknya data hilang yang diduga (SNEDECOR & COCHRAN 1967; SOKAL & ROHLF 1995). Hal ini disebabkan karena rumus pendugaan nilai data yang hilang menduga nilai tengah populasi sehingga tidak menyumbang apa-apa pada jumlah kuadrat sesatan (STEEL & TORRIE 1980). Sebelum mengakhiri tulisan ini, satu hal yang perlu ditekankan yaitu data hilang bukanlah suatu kegagalan perlakuan. Jika perlakuan yang diterapkan pada suatu percobaan mengakibatkan matinya hewan percobaan ataupun hal-hal lain yang menyebabkan diperoleh nilai nol; maka nilai tersebut harus dimasukkan sebagai nilai nol. bukan sebagai data hilang.
DAFTAR PUSTAKA
PENUTUP Pendugaan nilai data yang hilang pada rancangan dasar seperti pada RBAL dan RBSL seperti yang telah diuraikan diatas sangatlah membantu sekali pada pendugaan nilai data yang hilang pada bentuk rancangan lain yang menggunakan rancangan dasar tersebut, Sebagai contoh, pada rancangan faktorial yang disusun dari RBAL atau RBSL, maka teknik pendugaan nilai data hilangnya sama seperti cara-cara yang telah diuraikan pada masing-masing rancangan tersebut (FEDERER 1967). Dengan adanya pendugaan nilai data yang hilang tidak menambah informasi pada peneliti, tetapi mengatasi kesulitan dalam analisa data. YATES (dalam FEDERER 1967) telah menyelidiki keabsahan dari analisa sidik ragam (Analisys of Variance) dan ternyata hanya ada sedikit gangguan bila proporsi nilai-nilai yang hilang tidak terlalu besar. Setelah nilai dugaan untuk data yang hilang diperoleh, pada analisa sidik ragam,
FEDERER, W. T. 1967. Experimental Design : Theory and Application. Oxford & IBH Publishing Co., New Delhi : 544 pp. SNEDECOR, G. W. and W.G. COHRAN. 1967. Statiscal Methods. 6th ed. Iowa State Univ. Press, Ames, Iowa: 593pp. STEEL, R. G. D. andJ. H. TORRIE. 1980. Principles and Procedures ofStatitics. 2nd ed. McGraw-Hll, New York : 633 pp. SUGANDI E. dan SUGIARTO. 1994. Rancangan Percobaan : Teori dan Aplikasi Andi Offset, Yogjakarta: 236 pp. SOKAL, R. R. and F. J. ROHLF. 1995. Biometry : The Principles and Practice of Statistics in Biological Research. 3 rd ed. W. H. Freeman and Co., New York:887 pp.
43 Oseana, Volume XXI no. 3, 1996