MODEL AMMI TERAMPAT UNTUK DATA BERDISTRIBUSI BUKAN NORMAL
ALFIAN FUTUHUL HADI
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini saya menyatakan bahwa tesis Model AMMI Terampat untuk Data Berdistribusi Bukan Normal adalah karya saya sendiri dan belum pernah diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya penulis lain baik yang diterbitkan maupun yang tidak diterbitkan telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Bogor, Januari 2006
Alfian Futuhul Hadi NIM G151020011
ABSTRAK ALFIAN FUTUHUL HADI. Model AMMI Terampat untuk Data Berdistribusi Bukan Normal. Dibimbing oleh AHMAD ANSORI MATTJIK dan I MADE SUMERTAJAYA. Model AMMI (Additive Main Effect Multiplicative Interaction) untuk interaksi tabel dua arah memberikan manfaat besar pada kajian stabilitas dan adaptabilitas melalui pemodelan interaksi genotipe lingkungan secara multiplikatif. Kesahihan model AMMI bergantung pada kenormalan dan kehomogenan ragam galat. Pada kajian ketahanan genotipe terhadap hama/penyakit, kejadian serangan hama/penyakit pada tanaman misalnya, kelayakan model AMMI diragukan. Upaya transformasi kenormalan dengan transformasi pangkat metode Box-Cox mampu mengatasi ketidaknormalan. Sehingga model AMMI dengan metode kuadrat terkecil pada pendugaan parameternya dapat secara sah digunakan pada data hasil transformasi . Pendekaan lain untuk menangani ketaknormalan ini adalah pemodelan suku multiplikatif interaksi pada kelas pemodelan yang lebih luas, yaitu Model Linier Terampat (MLT/GLM). Pendugaan parameter secara iteratif melalui regresi GLM bolak-balik pada baris dan kolom. Model ini dikenal dengan model GAMMI (Generalized Additive Main Effect Multiplicative Interaction) atau GBMs (Generalized Bilinear Models). Suku multiplikatif model GAMMI dapat disajikan secara visual melalui Biplot, sebagaimana pada model AMMI. Pendekatan ini dapat digunakan untuk berbagai sebaran data termasuk sebaran Normal. Aplikasi kedua pendekatan dilakukan pada data cacahan (berdistribusi Poisson) dari suatu studi hama daun genotipe kedelai dan data persentase/proporsi (berdistribusi Binomial) gabah isi varietas padi. Perbandingan matriks interaksi dugaan hasil dekomposisi kedua pendekatan ini memberikan informasi bahwa AMMI pada pendekatan transfomasi Box-Cox proporsi gabah isi padi memberikan matriks interaksi dugaan yang berbeda dari model GAMMI logit-link (nilai R-kuadrat procrostes kurang dari 25 persen). Sementara pada data rataan populasi hama daun kedelai, model AMMI dengan transformasi Box-Cox tidak banyak berbeda dengan model GAMMI log-link (nilai R-kuadrat lebih dari 98 persen). Eksplorasi data ini menunjukkan bahwa karakter sebaran data ini sangat mirip dengan sebaran Normal. Bila sebaran data simetrik, sangat mirip dengan sebaran Normal, maka hasil AMMI dengan pendekatan transformasi kenormalan tidak jauh berbeda dengan penggunan GAMMI. Sebaiknya pada data yang berdistribusi bukan Normal hasil kedua pendekatan ini sangat berbeda. Informasi tambahan pada model log-biliner yang tidak dapat diperoleh pada model AMMI yaitu rasio odds. Ini menjadi kelebihan model GAMMI loglink dibandingkan dengan model AMMI dengan transformasi kenormalan pada data berdistribusi Poisson.
ABSTRACT ALFIAN FUTUHUL HADI. Generalized AMMI for Non-Normal Data. Under supervision of AHMAD ANSORI MATTJIK and I MADE SUMERTAJAYA. AMMI (Additive Main Effect Multiplicative Interaction) model for interactions in two-way table provide the major mean for studying stability and adaptability through genotype × environment interaction (GEI), which modeled by full interaction model. Eligibility of AMMI models depends on that assumption of normally independent distributed error with a constant variance. In the study of genotypes’ resistance, disease and pest (insect) incidence on a plant for example, the appropriateness of AMMI model is being doubtful. Transform the observation by power family of Box-Cox transformation is an effort to handle the non-normality. AMMI model then can be applied to the transformed data appropriately following by the use of ordinary least square for estimating parameters. There is another way to handle this non-normality, i.e. by introducing multiplicative terms for interaction in wider class of modeling, Generalized Linear Models. An algorithm of iterative alternating generalized regression of row and column estimates its parameters. This model is known as GAMMI (Generalized Additive Main Effect Multiplicative Interaction) or GBMs (Generalized Bilinear Models). The multiplicative terms of GAMMI models can be visualized through Biplot, as in AMMI. A comparison of the two approaches above is investigated by applying them to a count data of pest population of Poisson distribution, which came from a study of leave pest in soybean genotype, and to study of rice genotype stability of filled grain per panicle (Binomial data). For data averages of filled grain per panicle, AMMI model for transformed data gives interaction matrix estimator slightly difference from of the one given by GAMMI logit-link model. R-square of Procrustes Rotation is less than 20 percent. On the other hand, for transformed data average of pest population, the two approaches do not give significant differences. Data exploration for the last case (the transformed data average of pest population) shows that its distribution character is very similar to Normal distribution. Therefore, it can be concluded that: (1) when the data distribution is close to Normal distribution, results of transformed AMMI and GAMMI are not significantly different; (2) when the data distribution is non Normal, results of the two approaches are quite different. Additional information on log-bilinear, which cannot be obtained from the transformed AMMI model, is odd ratio. This makes the GAMMI model superior compared to effort of transforming normality on Poisson distributed data.
MODEL AMMI TERAMPAT UNTUK DATA BERDISTRIBUSI BUKAN NORMAL
ALFIAN FUTUHUL HADI
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006
Judul Tesis
:
Model AMMI Terampat untuk Data Berdistribusi Bukan Normal
Nama
:
Alfian Futuhul Hadi
NIM
:
G151020011
Disetujui Komisi Pembimbing
Prof. Dr. Ir. A. A. Mattjik, MSc. Ketua
Dr. Ir. I Made Sumertajaya, MSi. Anggota
Diketahui, Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Budi Susetyo, M.S
Prof. Dr. Ir. Syafrida Manuwoto, MSc.
Tanggal Ujian: 24 November 2005
Tanggal Lulus: ………………
dedicated to my lovely wife, son, & daughter
PRAKATA Alhamdulillah hirabbil ‘alamin. Penulis bersyukur kepada Allah SWT atas karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini adalah penangan data berdistribusi bukan selain Normal (selain distribusi Normal) pada pemodelan bilinier dengan judul Model AMMI Terampat untuk Data Berdistribusi Bukan Normal. Sebagian dari tesis ini, Bab 3 Model AMMI Terampat untuk Data Berdistribusi Bukan Normal, telah diterbitkan dalam prosiding Seminar Nasional Statistika ke-7 Institut Teknologi Sepuluh November Surabaya. Penulis mengucapkan terima kasih kepada Bapak Prof. Dr. Ir. Ahmad Ansori Mattjik, MSc. dan Bapak Dr. Ir. I Made Sumertajaya, MS. selaku pembimbing. Disamping itu, penghargaan penulis sampaikan kepada Fred van Eeuwijk (Wageningen University, The Netherland) dan Paul Keizer (DLO-Centre for Plant Breeding and Reproduction Research Wageningen, The Netherland), atas prosedur GAMMI pada GENSTAT 7.1 dan diskusinya, serta Dr. Suharsono dari Malang, atas saran dan motivasinya. Kepada Balitpa Sukamandi dan Balitkabi Malang untuk data percobaannya. Kepada Bagus Sartono. MSi., Anang Kurnia, MSi., dan Utami Diyah, MSi., atas diskusinya, serta Sri Winarni atas koreksi ejaannya. Dr. Ir. Hari Wijayanto, Ir. Achmad Djauhari, MS. dan Ir. Arif Musaddad atas dukungan tempat tinggal di Bogor selama menempuh studi S2. Dr. Sudarko dan Dr I Made Tirta di Universitas Jember atas dukungan dan pinjaman fasilitasnya. Terima kasih juga penulis ucapkan kepada istri dan anak-anak tercinta, bapak dan ibu di Jember, serta seluruh keluarga khususnya kepada ”kembaranku” Dani, atas segala do’a dan dukungannya. Penulis berharap karya ilmiah ini bermanfaat. Semoga. Bogor, Januari 2006
Alfian Futuhul Hadi
RIWAYAT HIDUP Penulis dilahirkan di Jember pada tanggal 19 Juli 1974 dari ayah Abdul Muchith Muzadi dan ibu Siti Faridah. Penulis dilahirkan kembar, anak ke delapan dari delapan bersaudara. Tahun 1993 penulis lulus dari SMA Negeri 1 Jember dan pada tahun yang sama lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB pada Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam, lulus tahun 1998. Kesempatan melanjutkan studi ke program magister diperoleh pada tahun 2002. Beasiswa pendidikan pascasarjana ini diperoleh dari Departemen Pendidikan Nasional Republik Indonesia. Penulis bekerja sebagai Staf Pengajar di Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember, sejak tahun 1999. Penulis mengajar mata kuliah Statistika dan menekuni bidang Statistika Terapan utamanya pada bidang Pertanian. Di Jember, penulis membina sebuah kelompok studi mahasiswa bernama Lingkar studi Statistika Terapan ( e L S t a t ) . Pada tahun 2001 penulis menikah dengan Halimatus Sa’diyah, dan kini dikaruniai Allah seorang putri bernama Hasna Adibah Qotrunnada dan seorang putra bernama Azzam Muzadi Al-Afief. Karya ilmiah berjudul Model AMMI Terampat untuk Data Berdistribusi Bukan Normal dan Penerapannya Pada Kajian Stabilitas dan Ketahanan Genotipe telah disajikan pada Seminar Nasional Statistika ke-7 Institut Teknologi Sepuluh November Surabaya pada Bulan November 2005. Artikel lain berjudul Model AMMI untuk Analisis Interaksi Genotipe × Lokasi, telah diterbitkan pada Jurnal Ilmu Dasar, FMIPA Universitas Jember volume 5 nomor 1 Januari 2004. Karyakarya ilmiah tersebut merupakan bagian dari program S2.
DAFTAR ISI Halaman DAFTAR TABEL.................................................................................................. iii DAFTAR GAMBAR ............................................................................................. iv DAFTAR LAMPIRAN............................................................................................v I. PENDAHULUAN ...............................................................................................1 1.1
Latar Belakang ..........................................................................................1
1.2
Tujuan Penelitian ......................................................................................3
1.3
Kerangka Pemikiran..................................................................................3
II. MODEL AMMI PADA DATA BERDISTRIBUSI BUKAN NORMAL: TRANSFORMASI KENORMALAN................................................................5 2.1
Pendahuluan ..............................................................................................5
2.2
Model AMMI dan Asumsi Kenormalan Galat .........................................5
2.3 Langkah Pemodelan AMMI .....................................................................7 2.3.1 Perhitungan Jumlah Kuadrat..................................................................8 2.3.2 Penguraian Derajat Kebebasan ..............................................................8 2.3.2 Penguraian Nilai Singular ......................................................................8 2.3.4 Nilai Komponen AMMI ........................................................................9 2.3.5 Penentuan Banyaknya Komponen AMMI.............................................9 2.3.6 Interpretasi Biplot AMMI ....................................................................10 2.4 Transfomasi Data ......................................................................................11 2.4.1 Transformasi Box-Cox.........................................................................12 2.5 Metodologi Penelitian ............................................................................14 2.5.1 Data ......................................................................................................14 2.5.2 Tahapan Penelitian...............................................................................14 2.6 Hasil dan Pembahasan ............................................................................15 2.6.1 Kestabilan Gabah Isi Varietas Padi: Data Persentase/Proporsi ...........15 2.6.2 Ketahanan Kedelai Terhadap Hama Daun: Data Frekuensi/Populasi Hama ....................................................................................................18 2.7
Simpulan .................................................................................................20
III. MODEL AMMI TERAMPAT UNTUK DATA BERDISTRIBUSI BUKAN NORMAL.........................................................................................................22 3.1 Pendahuluan ..............................................................................................22 3.2
Model Linier Terampat (Generalized Linear Models) ...........................23
3.3
Model AMMI Terampat (Generalized AMMI Model/GAMMI) ............25
i
3.3.1 Algoritma Pengepasan Model AMMI Terampat .................................26 3.3.2 Penentuan Banyaknya Suku Multiplikatif ...........................................28 3.3.3 Diagnostik Sisaan.................................................................................29 3.4 Penyajian Interaksi melalui Biplot Model GAMMI ................................30 3.4.1 Model GAMMI Log-Bilinier ...............................................................31 3.5 Metodologi Penelitian ............................................................................34 3.5.1 Data ......................................................................................................34 3.5.2 Tahapan Penelitian...............................................................................35 3.6 Hasil dan Pembahasan ............................................................................37 3.6.1 Ketahanan Kedelai Terhadap Hama Daun: Model Log-Bilinier .........37 3.6.2 Kestabilan Gabah Isi Varietas Padi: Model Logit-Bilinier..................39 3.7 Simpulan ...................................................................................................40 IV. PERBANDINGAN KONFIGURASI MATRIKS INTERAKSI: METODE PROCRUSTES.................................................................................................42 4.1
Pendahuluan ............................................................................................42
4.2
Kesesuaian Dua Konfigurasi Matriks: Metode Procrustes .....................43
4.3
Metodologi ..............................................................................................46
4.4 Hasil Perbandingan Matriks Interaksi.....................................................47 4.4.1 Matriks Interaksi Ketahanan Kedelai Terhadap Hama Daun ..............47 4.4.2 Matriks Interaksi Kestabilan Gabah Isi Varietas Padi .........................48 4.3 Simpulan ...................................................................................................49 V. KESIMPULAN DAN SARAN ........................................................................50 5.1
Kesimpulan .............................................................................................50
5.2
Saran .......................................................................................................51
DAFTAR PUSTAKA ............................................................................................52 LAMPIRAN...........................................................................................................54
ii
DAFTAR TABEL Halaman Tabel 2.1 Analisis ragam untuk data gabah isi yang ditransformasi ...................16 Tabel 2.2 Analisis ragam untuk populasi hama daun yang ditransformasi .........19 Tabel 3.1 Fungsi Penghubung (kanonik) dalam Model Linier Terampat............24 Tabel 3.2 Rataan populasi lima jenis hama daun pada empat genotipe kedelai ..37 Tabel 3.3 Analisis devians untuk data populasi hama daun ................................38 Tabel 3.4 Analisis devians untuk data gabah isi ..................................................39
iii
DAFTAR GAMBAR Halaman Gambar 1.1 Kerangka Pemikiran ...........................................................................4 Gambar 2.1 Langkah penggunaan transformasi kenormalan pada AMMI..........14 Gambar 2.2 Plot log-likelihood transformasi Box-Cox data proporsi gabah isi..15 Gambar 2.3 Uji kenormalan data proporsi gabah isi sebelum transformasi (kiri) dan sesudah transformasi Box-Cox (kanan) ...........................16 Gambar 2.4 Plot sisaan model AMMI data gabah isi yang ditransformasi: (a) Plot kenormalan sisaan; (b) Plot sisaan vs fitted value ...............17 Gambar 2.5 Bilpot AMMI 2 data gabah isi hasil transformasi Box-Cox ............18 Gambar 2.6 Plot log-likelihood transformasi Box-Cox data populasi hama daun ..................................................................................................18 Gambar 2.7 Plot uji kenormalan hasil transformasi Box-Cox data populasi hama daun.........................................................................................19 Gambar 2.8 Biplot AMMI 2 data populas hama daun yang ditransformasi ........20 Gambar 3.1 Tinjauan geometris tentang Odds (A) dan Rasio Odds (B)..............34 Gambar 3.2 Algoritma pengepasan model GAMMI............................................36 Gambar 3.3 Plot residual untuk data hama kedelai: Plot residual terstadardisasi terhadap nilai dugaan model GAMMI-2 log-link (kiri); Plot working variate terhadap prediktor linier (kanan). ..................38 Gambar 3.4 Biplot GAMMI-2 untuk interaksi hama daun dengan fungsi hubung logaritma..............................................................................39 Gambar 3.5 Biplot interaksi data gabah isi model GAMMI-2 logit-link. Lokasi ditunjukkan dengan kotak, verietas padi dengan garis.........40
iv
DAFTAR LAMPIRAN Halaman Lampiran 1. Data pengamatan populasi hama daun kedelai pada umur 14 hari setelah tanam ....................................................................................55 Lampiran 2. Nilai lambda dugaan dan log-likelihood transformasi Box-Cox data populasi hama daun ..................................................................55 Lampiran 3. Plot sisaan model AMMI 2 data populasi hama daun ternormalkan.....................................................................................56 Lampiran 4. Nilai lambda dugaan dan log-likelihood transformasi Box-Cox data proporsi gabah isi......................................................................56 Lampiran 5. Diagnostik sisaan AMMI data gabah isi ternormalkan ....................57 Lampiran 6. Biplot AMMI1: KUI1 vs rataan proporsi gabah isi ternormalkan ...57 Lampiran 7. Biplot AMMI1: KUI1 vs rataan populasi hama daun ternormalkan.....................................................................................58 Lampiran 8. Karakteristik distribusi data hama daun ...........................................58 Lampiran 9. Contoh perintah GENSTAT untuk transformasi Box-Cox .............58 Lampiran 10.Prosedur GAMMI pada GENSTAT 7..............................................59 Lampiran 11.Contoh Perintah GENSTAT untuk GAMMI ...................................70 Lampiran 12.Perintah GENSTAT untuk Procrustes..............................................70
v
I. PENDAHULUAN 1.1
Latar Belakang Interaksi antara genotipe dan lingkungan telah diketahui sejak lama, yang
merupakan fenomena umum pada seluruh organisme hidup. Genotipe dan lingkungan berinteraksi untuk menghasilkan fenotipe. IGL (Interaksi Genotipe × Lingkungan) didefinisikan sebagai perbedaan antara nilai fenotipe dengan nilai yang diharapkan dari hubungan genotipe dan lingkungan. Jika respons dari dua genotipe terhadap perbedaan derajat cekaman lingkungan dibandingkan, suatu interaksi dapat dijelaskan secara statistika sebagai simpangan dari dua kurva respons secara paralel. Interaksi genotipe dan lingkungan adalah variasi yang disebabkan oleh pengaruh bersama dari genotipe dan lingkungan (Matjik, 2005). Model AMMI (Additive Main Effect Multiplicative Interaction) telah memberikan sumbangan yang sangat berarti bagi penelitian terapan, terutama pada bidang pemuliaan yaitu analisis stabilitas dengan dekomosisi IGL. Model AMMI mampu menjelaskan interaksi secara lebih baik (Sumertajaya, 1998). Struktur interaksi diuraikan dengan memanfaatkan sifat-sifat matematis penguraian nilai singular (Singular Value Decomposition, SVD).
Struktur
interaksi ini didekomposisi dari matriks sisaan komponen aditif. SVD merupakan pendekatan kuadrat terkecil dengan reduksi dimensi (pangkat matriks) data yang terbaik dan menyediakan penyajian secara grafis. Dalam konteks pemuliaan tanaman, komponen acak pada model ini seringkali diasumsikan menyebar Normal dengan ragam konstan.
Kajian
stabilitas genetik pada data-data pengukuran seperti tinggi tanaman, produktifitas, umur dapat menggunakan model AMMI. Model ini telah berhasil memberikan informasi tentang stabilitas dan adaptasi spesifik suatu genotipe terhadap lingkungan, karena ia dilengkapi dengan visualisasi matriks IGL pada dimensi rendah (dua atau tiga dimensi) melalui reduksi dimensi, yang dikenal secara luas dengan nama biplot. Analisis stabilitas dapat digunakan untuk mengidentifikasi ketahanan terhadap hama dan penyakit. Jika ada interaksi antara kultivar dan patogen, maka perlu untuk mengidentifikasi suatu kultivar yang memiliki resistensi umum dan
2
resistensi spesifik (Mattjik, 2005). Namun untuk kajian ini (ketahanan terhadap penyakit dan kejadian serangan hama pada tanaman misalnya), kelayakan model AMMI dengan galat yang Normal dan ragam konstan tidak selalu dapat dipenuhi. Jika matriks data bebas, bersebaran Normal dengan ragam konstan, penduga kemungkinan maksimum tereduksi menjadi SVD, namun tidak demikian bila tidak menyebar Normal. Pencatatan data serangan hama/penyakit dalam bentuk cacahan (counting) merupakan salah satu contoh fenomena ini.
Sebagian peneliti melakukan
pencatatan menggunakan counting kemudian menganlisisnya sebagai intensitas serangan dalam persentase. Dengan data persentase ini kemudian ia melakukan transformasi sehingga asumsi-asumsi yang diperlukan (kenormalan dan kehomogenan ragam) terpenuhi.
Selama tranformasi berhasil mengatasinya
cukuplah bagi kita untuk memilih cara ini. Sayangnya menemukan transformasi yang sesuai tidaklah mudah. Sementara itu, pada pemodelan aditif telah dikenal luas apa yang disebut dengan Generalized Linear Models (GLM) atau Model Linier Terampat (MLT) sebuah kelas pemodelan yang menangani data-data berdistribusi bukan Normal. Model multiplikatif (bilinear) menjembatani kesenjangan antara model pengaruh utama (pada ANOVA ataupun GLM) dan model interaksi lengkap dengan sebuah parameter interaksi untuk setiap sel dalam tabel dua arah.
Model ini pun
memberikan visualisasi corak utama interaksi melalui biplot.
Karenanya
pengembangan teori model linier terampat dengan mengakomodasi komponen multiplikatif untuk interaksi sangat diperlukan. Kekuatan eksplorasi model multiplikatif AMMI terletak pada visualisasi interaksi melalui biplot.
Van Eeuwijk, 1995, memperkenalkan model
multiplikatif dalam konteks model linier terampat sebagai perluasan dari model AMMI yang disebut dengan Generalized AMMI atau disingkat GAMMI. Pada pemodelan GAMMI, visualisasi interaksi ini masih dimungkinkan. Permasalahan yang muncul kemudian adalah bagaimana pengepasan model GAMMI ini dilakukan? Bagaimana dengan penggunaan transformasi sebagai upaya pemenuhan asumsi kenormalan pada model AMMI? Pendekatan manakah
3
yang lebih menguntungkan?
Penelitian ini ingin membandingkan kedua
pendekatan tersebut, disertai penerapannya pada penelitian pemuliaan tanaman. 1.2
Tujuan Penelitian Tujuan penelitian ini adalah: 1. Mempelajari bagaimana pengepasan (fiting) model bilinear dalam konsep model linier terampat, yaitu model GAMMI.
Khususnya untuk
pengamatan berupa cacahan (distribusi Poisson dan Binomial) 2. Mempelajari penggunaan transformasi kenormalan data pada model AMMI 3. Membandingkan hasil pendekatan pertama dan kedua dalam menguraikan interaksi. 1.3
Kerangka Pemikiran Upaya penyelesaiannya permasalahan dalam penelitian ini dilalukan melalui
kerangka pemikiran pada Gambar 1.1. Interaksi direpresentasi oleh data dalam bentuk tabel dua arah. Transformasi kenormalan dimaksudkan agar dekomposisi interaksi melalui metode AMMI dapat dilakukan secara sahih. Pembandingan
hasil
kedua
pendekatan
ini
dilakukan
dengan
membandingkan matriks interaksi antara hasil model AMMI dari data tertrasformasi dan hasil model GAMMI dari data asal. Matriks interaksi dugaan dapat diperoleh dari model penuh ataupun model terbaik. Perbandingan ini dimaksudkan untuk membandingkan hasil dekomposisi interaksi oleh kedua model. Pada bagian berikutnya akan disajikan penggunaan transformasi kenormalan menggunakan transformasi pangkat Box-Cox dalam model AMMI (Bab 2), Penanganan data berdistribusi bukan Normal menggunakan model GAMMI (Bab 3). Sedangkan perbandingan kedua pendekatan penanganan data bukan Normal tersebut akan dibicarakan pada Bab 4, dan kesimpulan disajikan pada Bab 5.
4
Data Cacahan dari Percobaan Multilokasi
Data Cacahan (non-Normal) Tabel Dua Arah
Transformasi Kenormalan
Normal?
Tidak
Ya GAMMI
Biplot GAMMI 2
Interpretasi Kestabilanadaptasi spesifik
AMMI
Matris Interaksi Dugaan
Matris Interaksi Dugaan
Perbandingan
Kesimpulan
Gambar 1.1. Kerangka Pemikiran
Biplot AMMI 2
Interpretasi Kestabilanadaptasi spesifik
II. MODEL AMMI PADA DATA BERDISTRIBUSI BUKAN NORMAL: TRANSFORMASI KENORMALAN 2.1
Pendahuluan Analisis AMMI adalah suatu teknik analisis data percobaan dua faktor
perlakuan dengan pengaruh utama perlakuan bersifat aditif sedangkan pengaruh interaksi dimodelkan dengan model bilinier. Model AMMI merepresentasikan observasi ke dalam komponen sistematik yang terdiri dari pengaruh utama (main effect) dan pengaruh interaksi melalui suku-suku multiplikatif (multiplicative interactions), di samping komponen acak sisaan atau galat. Komponen acak pada model ini diasumsikan menyebar Normal dengan ragam konstan. Pada dasarnya analisis AMMI menggabungkan analisis ragam aditif bagi pengaruh utama perlakuan dengan analisis komponen utama ganda dengan pemodelan bilinier bagi pengaruh interaksi yang memanfaatkan peguraian nilai singular (SVD) pada matriks interaksi (Mattjik A. A, & Sumertajaya, I. M., 2002). Kelayakan model AMMI dengan galat yang Normal dan ragam konstan ada kalanya tidak terpenuhi. Transformasi data pengamatan mungkin menjadi salah satu teknik untuk mengatasi masalah ketidaknormalan ini. Bab ini bertujuan mendiskusikan penggunanan transformasi kenormalan untuk mendapatkan data yang menekati Normal (setidaknya simetrik) dan kemudian memodelkannya dengan AMMI. 2.2
Model AMMI dan Asumsi Kenormalan Galat Model AMMI dikenal luas pada bidang terapan, terutama pada bidang
pemuliaan yaitu kajian interaksi genotipe × lingkungan (IGL).
Sebutan lain
seperti model bilinear, atau model biaditif lebih menunjuk pada struktur model tersebut. Secara umum model AMMI untuk peubah acak y ij dari baris ke-i dan K
kolom ke-j adalah: E( y ij ) = μ + α i + β j + ∑ λ k γ ki δ kj k =1
dengan μ adalah rataan umum, α i pengaruh aditif (utama) baris ke-i (i = 1,..., I ) ,
dan β j pengaruh aditif
kolom ke-j ( j = 1,..., J ) .
Pada pendugaannya kedua
6
pengaruh utama ini diidentifikasi dengan kendala berupa jumlah yang sama dengan nol. (Mattjik A. A. & Sumertajaya, I. M., 2002; Van Eeuwijk, 1995) Pengaruh interaksi dimodelkan sebagai jumlah dari suku multiplikatif, yang banyaknya sama atau kurang dari pangkat matriks sisa dari pengaruh aditif (utama). Parameter suku multiplikatif pengaruh interaksi untuk baris dinotasikan dengan γ ki adalah juga skor baris sumbu ke-k dan kolom ke-i. Skor kolom ke-j pada sumbu ke- k dinotasi dengan δ ki . Nilai singular yang berpadanan dengan
λ k adalah ukuran asosiasi antara skor
sumbu ke-k yang direpresentasi oleh
baris dan kolom. Nilai yang diperoleh dari penguraian nilai singular (SVD) ini mengindikasikan tingkat kepentingan sumbu. Kuadrat dari nilai singular, yaitu nilai akarciri sama dengan jumlah kuadrat sumbu yang bersangkutan.
Kendala
untuk parameter suku multiplikatif meliputi jumlah yang sama dengan nol (terpusatkan) dan perkalian silangnya sama dengan nol (ortonormal). Dalam kasus data tidak menyebar Normal, kelayakan model AMMI menjadi tidak terpenuhi. Jika matriks data bebas, berdistribusi Normal dengan ragam konstan, penduga kemungkinan maksimum tereduksi menjadi SVD. Manakala sebarannya bukan Normal –Binomal, Poisson, invers Gaussian, misalnya– kesamaan ini tidak lagi berlaku (Falguerolles, 1996). Data yang berdistribusi bukan Normal cenderung tidak homogen, dan bila dimodelkan dengan AMMI ketakhomogenan ragam dapat berakibat buruk, sedangkan skala dugaannya mungkin juga tidak memuaskan. Kedua fenomena ini bisa jadi membutuhkan dimasukkannya suku interaksi tambahan (Van Eeuwijk, 1995). Kadangkala ada alasan kuat untuk tetap memodelkan data pada skala pengamatan. Kehomogenan ragam dapat diatasi dengan menambahkan satu atau lebih suku multiplikatif interaksi.
Ketika tidak ada alasan untuk memaksa
pemodelan tetap pada skala pengamatan, maka transformasi terhadap peubah respon dapat dilakukan untuk mengurangi masalah ini. Model linier atau bilinier dikenakan pada data yang telah ditransformasi, dan sifat sebaran sisaan diasumsikan memenuhi sebaran Normal.
7
2.3
Langkah Pemodelan AMMI
Pemodelan bilinier bagi pengaruh interaksi genotipe dengan lokasi (γ ge ) pada analisis ini adalah sebagai berikut : 1. Langkah pertama menyusun pengaruh interaksi dalam bentuk matriks dimana genotipe (baris) × lokasi (kolom), sehingga matriks ini berorde a×b.
⎡υ11 ⎢ υ = ⎢ ... ⎢⎣υ a1
... υ1b ⎤ ⎥ ... ... ⎥ ... υ ab ⎥⎦
2. Langkah selanjutnya dilakukan penguraian bilinier terhadap matriks pengaruh interaksi n
υ ge = ∑ λ jϕ gj ρ ej + δ ge j =1
λ1 ϕ g1 ρ e1 + λ 2 ϕ g 2 ρ e 2 + .... + λ n ϕ gn ρ en + δ ge
=
sehingga model AMMI secara lengkap dapat dituliskan sebagai berikut :
Υger = μ + α g + β e + ∑ λ n ϕ gn ρ en + δ ge + ε ger n
= μ + α g + β e + λ1 ϕ g1 ρ e1 + λ1 ϕ g 2 ρ e1 + .... + λ n ϕ gn ρ en + δ ge + ε ger keterangan : g = 1,2,….,a ; e = 1,2,…., b ; n = 1, 2, …,m dengan
λ n nilai
singular untuk komponen bilinier ke-n ( λ n adalah akarciri Z’Z)
λ1 ≥ λ 2 ≥ .... ≥ λ1b . ϕ gn adalah pengaruh ganda genotipe ke-g melalui komponen bilinier ke-n, ρ en pengaruh ganda lokasi ke-e melalui komponen bilinier ke-n. Dengan kendala (identification constrains) : (1). (2).
∑ ϕ = ∑ ρ = 1, untuk n=1,2,…,m, dan 2
2
gn
g
g
en
∑ ϕ ϕ = ∑ ρ ρ = 0, g
gn
gn '
e
en
en '
untuk n ≠ n’, δ ge
simpangan dari
pemodelan bilinier (Crossa 1990 diacu dalam Mattjik A. A. & Sumertajaya, I. M., 2002).
8
2.3.1 Perhitungan Jumlah Kuadrat
Pada pemodelan ini pengaruh aditif genotipe dan lingkungan serta jumlah kuadrat dan kuadrat tengahnya dihitung sebagaimana umumnya pada analisis ragam, tetapi berdasarkan pada data rataan per genotipe × lokasi. Pengaruh ganda genotipe dan lingkungan pada interaksi diduga dengan
z ge = y ge − y g . − y.e + y.. sehingga jumlah kuadrat interaksi dapat diturunkan sebagai berikut : JK (GE ) = r ∑ z ge = r ∑ ( y ge − y g . − y.e + y.. ) 2 = r teras(zz ') 2
g .e
Berdasarkan teorema pada aljabar matriks bahwa teras dari suatu matriks sama dengan jumlah seluruh akar ciri matriks tersebut:
tr ( A) = ∑ λi i
maka jumlah kuadrat untuk pengaruh interaksi komponen ke-n adalah akar ciri ke-n pada pemodelan bilinier tersebut ( λ n ), jika analisis ragam dilakukan terhadap data rataan per genotipe × lingkungan. Jika analisis ragam dilakukan terhadap data sebenarnya
maka jumlah
kuadratnya adalah banyaknya ulangan dikalikan akar ciri ke-n ( rλ n ). Pengujian masing-masing komponen ini dilakukan dengan membandingkannya terhadap kuadrat tengah galat gabungan. 2.3.2 Penguraian Derajat Kebebasan
Derajat bebas untuk setiap komponen tersebut adalah a+b-1-2n. Besaran derajat bebas ini diperoleh dari jumlah p parameter yang diduga dikurangi dengan jumlah n kendala. Banyaknya parameter yang diduga adalah a+b-1 sedangkan banyak kendala untuk komponen ke-n adalah 2n. Kendala yang dipertimbangakan adalah kenormalan dan keortogonalan. 2.3.2 Penguraian Nilai Singular
Penguraian Nilai Singular (Singular Value Decomposition) untuk matriks pengaruh interaksi Z sebagaimana dikemukakan oleh Greenacre (1984) adalah memodelkan matriks tersebut sebagai berikut: Z = U L A’
9
Dengan Z adalah matriks data terpusat, n x p, L adalah matriks diagonal akar dari akarcirri positif bukan nol dari Z’Z, D
(
λn
)
m×m
selanjutnya disebut
nilai singular, A dan U adalah matriks ortonormal (A’A=U’U=Ir). Kolom-kolom matriks A={a1,a2, …,an} adalah vektor-vektor ciri Z’Z sedangkan U diperoleh dengan: U = ZAL−1 ⎛ Za =⎜ 1 ⎜ λ ⎝ 1
Za 2
λ2
L
Za n ⎞⎟ λn ⎟⎠
2.3.4 Nilai Komponen AMMI
Secara umum nilai komponen ke-n untuk genotipe ke-g adalah sedangkan nilai komponen utama untuk lokasi ke-e adalah l n mendefinisikan
Lk (0 ≤ k ≤ 1) sebagai matrik diagonal
1− k
ln ϕ gn k
ρ en . Dengan
yang elemen-elemen
diagonalnya adalah elemen-elemen matriks L dipangkatkan k demikian juga dengan matrik L1-k, dan G=ULk serta H=AL1-k maka penguraian nilai singular tersebut dapat ditulis: Z=GH’
Dengan demikian skor komponen untuk genotipe adalah kolom-kolom matriks G sedangkan skor komponen untuk lingkungan adalah kolom-kolom matriks H. Nilai k yang digunakan pada analisis AMMI adalah ½ . 2.3.5 Penentuan Banyaknya Komponen AMMI
Jika beberapa kolom pertama matriks G dan H telah dapat menghasilkan penduga Z dengan baik maka banyak kolom matriks G dan H dapat dikurangi. Gauch pada tahun 1988 dan kemudian Crossa 1990 mengemukakan dua metode penentuan banyaknya sumbu komponen utama yang sudah cukup untuk penduga, yaitu Postdictive Success dan Predictive Success..
Postdictive success berhubungan dengan kemampuan suatu model yang tereduksi untuk menduga data yang digunakan dalam membangun model tersebut. Salah satu penentuan banyaknya komponen berdasarkan Postdictive success adalah berdasarkan banyaknya sumbu tersebut yang nyata pada uji F analisis
10
ragam. Metode ini diusulkan oleh Gollob pada 1968 dan direkomendasikan oleh Gauch pada 1988 (Sumertajaya ,1998).
Predictive success berhubungan dengan kemampuan suatu model dugaan untuk memprediksi data lain yang sejenis tetapi tidak digunakan dalam membangun model tersebut (data validasi). Penentuan banyak sumbu komponen utama berdasarkan predictive success ini dilakukan dengan validasi silang, yaitu membagi data menjadi dua kelompok, satu kelompok untuk membangun model dan kelompok lain digunakan untuk validasi (menentukan jumlah kuadrat sisaan). Hal ini dilakukan berulang-ulang, pada setiap ulangan dibangun model dengan berbagai sumbu komponen utama. Banyaknya komponen utama yang terbaik adalah rataan akar kuadrat tengah sisa (RMSPD=Root Mean Square Predictive
Different) dari data validasi paling kecil. 2.3.6 Interpretasi Biplot AMMI
Alat yang digunakan untuk menginterpretasi hasil dari metode AMMI adalah biplot. Pada dasarnya metode ini merupakan upaya untuk memberikan peragaan grafik dari suatu matriks dalam suatu plot dengan menumpangtindihkan vektor-vektor dalam ruang berdimensi dua. Vektor-vektor yang dimaksud yaitu vektor yang mewakili nilai skor komponen lingkungan. Biplot adalah plot antara satu kolom G dengan kolom G yang lain yang ditampilkan secara bersama-sama dengan plot kolom H dengan kolom H yang lain yang bersesuaian dengan kolom G yang diplot (Jolliffe, 1986). Sebagian statistikawan membuat plot antar kolom U dan antar kolom H secara bersamaan. Sebagian peneliti pertanian (pemuliaan tanaman) bahkan membuat plot antara kolom-kolom tersebut dengan nilai rataan data asli per peubah amatan yang sesuai. Biplot pada analisis AMMI biasanya berupa biplot antara nilai komponen utama pertama dengan rataan respon (biplot AMMI1). Biplot antara komponen utama kedua dan nilai komponen pertama (biplot AMMI2) bisa ditambahkan jika komponen utama kedua ini nyata Interpretasi biplot AMMI1 adalah bagi titik-titik yang sejenis. Jarak titiktitik amatan berdasarkan sumbu datar (rataan respon) menunjukkan perbedaan pengaruh utama amatan-amatan tersebut. Sedangkan jarak titik-titik amatan
11
berdasarkan sumbu tegak (KUI1) menunjukkan perbedaan pengaruh interaksinya atau perbedaan kesensitifannya terhadap lokasi. Biplot AMMI1 menunjukkan bahwa genotipe dikatakan mempunyai daya adaptasi baik pada suatu lingkungan jika genotipe dan lingkungan bertanda sama (berinteraksi positif). Biplot AMMI2 menggambarkan pengaruh interaksi antara genotipe dan lingkungan. Titik-titik amatan yang mempunyai arah yang sama berarti titik-titik amatan tersebut berinteraksi positif (saling menunjang), sedangkan titik-titik yang berbeda arah menunjukkan bahwa titik-titik tersebut berinteraksi negatif. 2.4 Transfomasi Data
Akibat ketaknormalan dan ketakhomogenan ragam pada model linier atau biliner telah disinggung pada sub bab 2.1. Transformasi pada peubah respon ditengarai merupakan upaya perbaikan atas kedua hal tersebut. Model linier atau bilinier dapat dikenakan pada data yang telah ditransformasi, dan sifat sebaran sisaan diasumsikan memenuhi sebaran Normal. Berikut ini akan dibahas tentang metode transformasi. Transformasi data pada hakekatnya adalah suatu usaha untuk mungubah data dari suatu skala ke skala yang lain. Model linier yang klasik (analisis ragam atau regresi) telah dikembangkan berdasarkan pada beberapa asumsi pokok yaitu keaditifan (model pengaruh utama), ragam perlakuan yang homogen (keragaman data bersifat bebas dari rataan dan banyaknya ulangan), dan kenormalan data. Asumsi pertama berkaitan dengan struktur data yang pada akhirnya menyangkut penafsiran data, asumsi kedua berperan dalam menyederhanakan metode pendugaan parameter. Sedangkan yang terakhir sangat erat kaitannya dengan pengujian hipotesis. Metode pengujian hipotesis yang telah berkembang sangat lanjut adalah yang didasarkan pada kenormalan data, oleh karena itu patokan-patokannya dapat dengan mudah diperoleh dalam tabel-tabel sebaran statistik, seperti tabel t, F atau Khi-kuadrat (Aunuddin, 2005). Dalam hal ini, transformasi bertujuan untuk mengatasi tiga masalah utama yaitu keheterogenan ragam, ketaknormalan galat, dan ketakaditifan/ketaklinieran pengaruh sistematik. Diakui bahwa bagaimanapun, tidak mudah mengatasi ketiga hal tersebut dengan satu langkah tunggal transformasi. Transformasi tunggal
12
biasanya manjur untuk mengatasi satu masalah tertentu tetapi tidak ketiganya. Keberhasilan
transformasi
untuk
memperoleh
kesederhanaan
model
(aditifitas/linieritas) mungkin mengakibatkan ketaknormalan dan ketakhomogenan ragam bila sebelumnya dua asumsi ini terpenuhi. Ada kalanya transformasi yang dilakukan untuk memperoleh ragam yang statbil membawa kita pada ketaknormalan (Rawling, J.O. et al., 1998) . Beruntunglah, bahwa transformasi untuk memperoleh kehomogenan ragam dan ketaknormalan mempunyai kecenderugan diperoleh secara bersamaan (hand-
in-hand), sehingga tidak jarang kedua asumsi dapat terpenuhi oleh suatu transformasi yang tepat (Bartlet, 1947 diacu dalam Rawling, J.O.et al.,1998) Transformasi untuk kehomogenan ragam seringkali juga memenuhi kenormalan.
Transformasi logit, arcsinus, dan probit yang digunakan untuk
menstabilkan ragam dan menyederhanakan model
juga membuat distribusi
mendekati kenormalan. Transformasi tersebut umumnya menarik (streching) ekor distribusi untuk memberikan bentuk distribusi yang mendekati bentuk genta. Demikian halnya dengan transformsi keluarga pangkat juga berguna untuk membuat distribusi menjadi semakin simetrik (mengurangi kemenjuluran). Harapannya adalah diperoleh distribusi data yang semakin mendekati Normal. Kriteria yang berbeda untuk menentukan tranformasi apa yang akan digunakan tidak harus munuju pada pilihan yang sama, tetapi sering terjadi transformasi yang optimum untuk suatu masalah juga memperbaiki masalah yang lain. Pada keluarga transformasi ini telah dikenal luas suatu metode perhitungan untuk menentukan transformasi optimum, yaitu transformasi Box-Cox. 2.4.1 Transformasi Box-Cox
Transformasi ini bertujuan memenuhi ketiga asumsi model linier, yaitu keheterogenan ragam, ketaknormalan galat, dan keaditifan/ketaklinieran pengaruh sistematik. Box-Cox menggunakan kriteria yang menggabungkan tujuan memperoleh model yang sederhana dan ragam yang homogen pada satu sisi serta tujuan kenormalan data pada sisi lain .
13
Metode transformasi Box-Cox menggunakan keluarga transformasi parametrik yang didefinisikan dalam bentuk terbakukan sebagai berikut: Yi ( λ )
⎧ Yi λ − 1 ,untuk λ ≠ 0 ⎪ = ⎨ λ Y& λ −1 ⎪Y& ln(Y ) ,untuk λ = 0 i ⎩
()
dengan Y& adalah rataan geometrik dari peubah asal yaitu Y& = exp ∑∀i [ln(Yi )] n (Rawling, J.O.et al.,1998; Box, Hunter, & Hunter, 1978) Parameter λ diperoleh secara empirik melalui penduga kemungkinan maksimum untuk beberapa nilai λ yang dipilih. Tahapan perhitungan sebagai berikut: 1. Nilai λ dipilih dari selang tertentu, umumnya λ ∈ [-2,2], katakanlah
λ =[ -2, -1.5,-1, -0.5, -0.25, 0, 0.25, 0.5, 1, 1.5, dan 2] 2. Jumlah kuadrat sisaan dari model Yi ( λ ) dituliskan sebagai JKS (λ ) , dan ragam bagi λ didefinisikan sebagai σ 2 (λ ) = JKS (λ ) n . 3. Untuk
masing-masing
[
λ
dihitung
fungsi
kemungkinan
]
1 L(λ ) = − ln σˆ 2 (λ ) 2 4. Memaksimumkan
fungsi
kemungkinan
sama
artinya
dengan
meminimumkan jumlah kuadrat sisaan. Dengan membuat plot antara λ dan L(λ ) dan memperhatikan titik kritis λ pada L(λ ) maksimum, maka λmaks ini adalah penduga titik bagi λ. Catatlah bahwa λ
dapat pula diperoleh dari plot atau antara λ dan
JKS (λ ) n dengan memperhatikan λ pada JKS (λ ) n minimum.
Dengan transformasi ini kita akan memperoleh sebaran yang simetrik mendekati Normal. transformasi ini.
Ketakhomogenan ragam pun dapat dikurangi dengan
14
2.5
Metodologi Penelitian
2.5.1 Data
Terdapat dua gugus data yang digunakan dalam penelitian ini.
Data
pertama dari Balai Penelitian Padi (Balitpa) Departemen Pertanian RI di Sukamandi, Jawa Barat, merupakan data uji daya hasil percobaan multilokasi yang melibatkan 12 varietas padi pada 5 lokasi. Penelitian akan memodelkan data persentase gabah isi, yang diamati saat panen. Data kedua adalah data percobaan pengendalian terhadap hama daun pada galur kedelai tahan hasil persilangan oleh Balai Penelitian Kacang-kacangan dan Umbi-umbian (Balitkabi) Departemen Pertanian RI di Malang, Jawa Timur.
Percobaan ini melibatkan empat
galur/varietas kedelai tahan hasil persilangan (Wilis, IAC-100, IAC-80-596-2 dan W/80-2-4-20). Penelitian ini memanfaatkan data populasi hama daun pada umur 14 hari setelah tanam. 2.5.2 Tahapan Penelitian
Pada bagian ini akan disajikan secara ringkas tahapan penelitian, sebagaimana dalam Gambar 2.1. Data Percobaan
Pengujian Kenormalan
Normal
Tidak Trasformasi Box-Cox
Tidak
Pengujian Kenormalan Normal Model AMMI
Biplot AMMI 2
Gambar 2.1 Langkah penggunaan transformasi kenormalan pada AMMI
15
Langkah langkah pekerjaan penelitian adalah sebagai berikut: 1. Pengujian Kenormalan dilakukan dengan metode Anderson Darling atau Kolmogorov-Smirnov 2. Transformasi Box-Cox akan memperolah nilai lambda bagi peubah baru hasil transformasi.
Transformasi Box-Cox dilakukan dengan
bantuan GENSTAT (Lampiran 9). 3. Pengepasan model AMMI dilakukan dengan GENSTAT prosedur GAMMI dengan sebaran Normal dan fungsi hubung Identitas (Lampiran 10 & 11). 2.6
Hasil dan Pembahasan
2.6.1 Kestabilan Gabah Isi Varietas Padi: Data Persentase/Proporsi
Data dalam bentuk proporsi biasanya tidak berdistribusi Normal. Hal ini ditunjukkan oleh uji kenormalan pada Gambar 2.3. Metode transformasi Box-Cox pada data proporsi gabah isi menghasilkan nilai dugaan lambda sebesar 7.80 pada nilai maksimum log-likelihood sebesar 160.79. Plot log-likelihood disajikan pada Gambar 2.2 sedangkan nilai lambda untuk beberapa nilai log-likehood disajikan pada Lampiran 2. Dengan demikian diperoleh transformasi pangkat 7.8.
Katakanlah yp
adalah peubah populasi hama daun maka peubah transformasinya adalah
yz = yp 7.80 . Uji kenormalan menunjukkan peubah yz ini menyebar mengikuti distribusi Normal (Gambar 2.3 kanan). 80
60
Log likelihood
40
20
0
0
2
4
6
8
10
Lambda
Gambar 2.2 Plot log-likelihood transformasi Box-Cox data proporsi gabah isi
16
Analisis AMMI pada peubah yz menghasilkan nilai singular sebagai berikut 0.4041, 0.3483, 0.2100, dan 0.1199. Kontribusi keragaman yang mampu diterangkan oleh masing-masing komponen adalah 37.34%, 32.18%, 19.40%, 11.08% menunjukkan bahwa tiga komponen pertama memiliki peran dominan
.999
.999
.99
.99
.95
.95
Probability
Probability
dala menerangkan keragaman pengaruh interaksi.
.80 .50 .20
.80 .50 .20 .05
.05 .01
.01
.001
.001 0.75
0.85
0.1
0.95
0.2
0.3
p
0.4
0.5
0.6
0.7
0.8
0.9
Yz
Average: 0.904975 StDev: 0.0463283 N: 60
W-test for Normality R: 0.9572 P-Value (approx): < 0.0100
Average: 0.487487 StDev: 0.164410 N: 60
W-test for Normality R: 0.9940 P-Value (approx): > 0.1000
Gambar 2.3 Uji kenormalan data proporsi gabah isi sebelum transformasi (kiri) dan sesudah transformasi Box-Cox (kanan) Berdasakan metode postdictive success diperoleh dua komponen pertama yang nyata dengan nilai F sebesar 3.59 dan 3.11 pada nilai-p< 0.015 dan nilaip<0.015 (Tabel 2.1). Hal ini berarti proporsi gabah isi melalui transformasi pangkat 7.80 dapat diterangkan menggunakan model AMMI2 dengan kemampuan menerangkan keragaman pengaruh interaksi sebesar 69.51%. Tabel 2.1. Analisis ragam untuk data gabah isi yang ditransformasi Sumber
Derjat Bebas
Jumlah Kuadrat
Kuadrat Tengah
Lingkungan Genotipe AMMI 1 AMMI 2 AMMI 3 Residual Total
4 11 14 12 10 8 59
1.0277 0.2240 0.1633 0.1213 0.0441 0.0144 1.5948
0.2569 0.0204 0.0117 0.0101 0.0044 0.0018 0.0270
Pengujian 1 Suku Multiplikatif Nilai F Nilai-p 79.12 <0.000 6.27 <0.001 3.59 <0.007 3.11 <0.015
Pengujian 2 Suku Multiplikatif Nilai F Nilai-p 143.06 0.0000 11.34 0.0010 6.49 0.0061 5.63 0.0103 2.45 0.1086
Diagnosis sisaan menunjukkan kelayakan model ini, tidak ada penyimpangan yang serius pada plot sisaan (Gambar 2.4)
17
y 3
.999 2
.99
1
.80
stdres
Probability
.95
.50 .20
0 -1
.05 -2
.01 .001
-3
- 0.04
- 0.02
0.00
0.02
0.04
0.1
residual AMMI Aver ag e: 0. 000 0002 StD ev : 0. 015 6053 N: 60
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
fit And erson-Darling Normalit y Test A -Squared: 0.555 P -Value: 0.146
(a) (b) Gambar 2.4 Plot sisaan model AMMI data gabah isi yang ditransformasi: (a) Plot kenormalan sisaan; (b) Plot sisaan vs fitted value Biplot AMMI1 memunjukkan varietas C (B19154F-PN-1-1-4) mempunyai
nilai rataan gabah isi ternormalkan yang paling rendah diantara varietas yang laun, sedangkan varietas L (IR 64) mempunyai nilai rataan yang tertinggi (Lampiran 6). Vaietas K (OBS 1658) dan E (Bio-Xa-5) mempunyai nilai rataan gabah isi yang sama namun interaksi dengan lingkungan yang berbeda, demikian pula dengan varietas G (Bio-Xa-7) dan F (S3383-1D-PN-41-3-1). Interaksi genotpie dan lingkungan lebih jelas dan detail digambarkan oleh biplot AMMI2 Biplot AMM2 hasil transformasi Box-Cox (Gambar 2.5) memperlihatkan varietas A (B10278-B-MR-2-4-2) relatif stabil pada seluruh lokasi, varietas lain beradaptasi secara spesifik pada lokasi tertentu. Varietas E (Bio-Xa-5) dan H (OBS. 1656) beradaptasi dengan baik di lokasi Talang sedangkan varietas G (BioXa-7) di Maroangin. Varietas F (S3383-1D-PN-41-3-1) sangat baik di Jatibaru dan Maranu namun masih mungkin tumbuh dengan baik di Talang. Varietas J (OBS. 1657) dan D (S3382-2d-3-3) mampu beradaptasi di Jatibaru dan Maranu. Varietas L (IR 64) dan C (B19154F-PN-1-1-4) mampu beradaptasi di Paritdalam dan Maroangin, varietas K (OBS 1658) beradaptasi baik di Talang namun masih mungkin berkembang di Paritdalam.
Varietas M (Memberamo) tidak secara
spesifik beradaptasi dengan salah satu lokasi namun diperkirakan tidak mampu beradaptasi di Talang dan Paritdalam.
18
0.6
Paritdalam
0.5 0.4 0.3
K
0.2
E
Jatibaru -0.2 F Maranu
-0.4
-0.3
C
Talang 0.1B
H
A
0 -0.1
J
L
0
0.1
0.2
0.3
0.5
G
-0.2
D
0.4
-0.1
M
-0.3
Maroagin
-0.4
Kode A B C D E F G H J K L M
Galur Padi B10278B-MR-2-4-2 S3254-2G-21-2 B9154F-PN-1-1-4 S3382-2D-3-3 Bio Xa-5 S3383-1D-PN-41-3-1 Bio Xa-7 OBS. 1656 OBS. 1657 OBS. 1658 IR. 64 MEMBERAMO
Gambar 2.5 Bilpot AMMI 2 data gabah isi hasil transformasi Box-Cox 2.6.2 Ketahanan Kedelai Terhadap Hama Daun: Data Frekuensi/Populasi Hama
Metode transformasi Box-Cox pada data populasi hama daun menghasilkan nilai dugaan lambda sebesar 0.66 pada nilai maksimum log-likelihood sebesar -11.76. Plot log-likelihood disajikan pada Gambar 2.6 sedangkan nilai lambda untuk beberapa nilai log-likehood disajikan pada Lampiran 4. Pow er : Box-Cox
-20
Log likelihood
-40
-60
-80
-100
0
2
4
6
8
10
Lambda
Gambar 2.6 Plot log-likelihood transformasi Box-Cox data populasi hama daun Dengan demikian transformasi yang diperoleh adalah transformasi pangkat 0.66. Katakanlah a adalah peubah populasi hama daun maka peubah transformasinya adalah az = a 0.66 . Uji kenormalan menunjukkan peubah az ini menyebar mengikuti distribusi Normal (Gambar 2.7).
19
Normal Probability Plot
.999 .99
Probability
.95 .80 .50 .20 .05 .01 .001 1.0
1.5
2.0
2.5
az Average: 1.65575 StDev: 0.589420 N: 20
W-test for Normality R: 0.9958 P-Value (approx): > 0.1000
Gambar 2.7 Plot uji kenormalan hasil transformasi Box-Cox data populasi hama daun Analisis AMMI pada peubah az menghasilkan nilai singular sebagai berikut 1.451, 0.7614, 0.1505. Kontribusi keragaman yang mampu diterangkan oleh masing-masing komponen adalah 61.41%, 32.22%, dan 6.37%, menunjukkan bahwa dua komponen pertama memiliki peran dominan dalam menerangkan keragaman pengaruh interaksi. Tabel 2.2 Analisis ragam untuk populasi hama daun yang ditransformasi Sumber Hama Daun Genotipe AMMI 1 AMMI 2 Residual Total
Derjat Bebas
Jumlah Kuadrat
Kuadrat Tengah
4 3 6 4 2 19
2.2659 1.6252 2.1065 0.5797 0.0227 6.5999
0.5665 0.5417 0.3511 0.1449 0.0113 0.3474
Pengujian 1 Suku Multiplikatif Nilai F Nilai-p 5.64 0.032 5.40 0.039 3.50 0.077
Pengujian 2 Suku Multiplikatif Nilai F Nilai-p 50.02 0.0197 47.83 0.0205 31.00 0.0316 12.80 0.0738
Berdasakan metode postdictive success diperoleh komponen pertama yang nyata dengan nilai F sebesar 31.00 pada nilai-p<0.04, sedangkan komponen kedua nyata nilai-p=0.074 (Tabel 2.2). Sekalipun nilai-p komponen kedua cukup besar namun dua komponen pertama sangat dominan, kemampuan menerangkan keragaman pengaruh interaksi sebesar 93.63%. Hal ini berarti populasi hama daun melalui transformasi pangkat 0.66 dapat diterangkan menggunakan model AMMI2. Diagnosis sisaan juga memperkuat hal ini, tidak ada penyimpangan yang serius pada plot sisaan (Lampiran 3). Biplot AMMI1 menunjukkan genotipe IAC-100 merupakan genotipe dengan nilai rataan populasi hama (ternormalkan) paling rendah, sedangkan Wilis
20
yang paling tinggi (Lampiran 7). Selengkapnya, interaksi ini digambarkan oleh Biplot AMMI2 dengan lebih baik. Gambar 2.8 menunjukkan biplot AMMI 2 data populasi hama daun tanaman kedelai yang ternormalkan. Pada fase ini, populasi Lamprosema hampir sama pada semua genotipe. Genotipe IAC 80 paling tahan terhadap keseluruhan hama daun pada fase ini (14 HST) dibanding yang lain. Sementara genotipe lain secara spesifik rentan terhadap hama tertentu. W/80 relatif rentan terhadap Lalat Kacang (Agromyza), IAC 100 relatif rentan terhadap Emproasca. -0.9
-0.4
0.1
0.6
1.1
1 Longitarsus
Wilis
0.5
IAC -80 IAC -100 0
Bemisia Lamprosema
Emproasca
Agromyza -0.5 W/80
-1
Gambar 2.8 Biplot AMMI 2 data populas hama daun yang ditransformasi 2.7
Simpulan
Transformasi pangkat Box-Cox mampu mengatasi ketaknormalan data. Dengan
transformasi
Box-Cox
dapat
dilakukan
pemodelan
interaksi
menggunakan model AMMI secara sahih pada data ternormalkan. Studi kestabilan gabah isi varietas padi melalui transformasi memberikan informasi bahwa varietas A (B10278-B-MR-2-4-2) relatif stabil pada seluruh lokasi, varietas lain beradaptasi secara spesifik pada lokasi tertentu. Varietas E (Bio-Xa-5) dan H (OBS. 1656) beradaptasi dengan baik pada di Talang sedangkan varietas G (Bio-Xa-7) di Maroangin. Varietas F (S3383-1D-PN-41-3-1) sangat baik di Jatibaru dan Maranu namun masih mungkin tumbuh dengan baik di
21
Talang. Varietas J (OBS. 1657) dan D (S3382-2d-3-3) mampu beradaptasi di Jatibaru dan Maranu. Varietas L (IR 64) dan C (B19154F-PN-1-1-4) mampu beradaptasi di Paritdalam dan Maroangin, varietas K (OBS 1658) beradaptasi baik di Talang namun masih mungkin berkembang di Paritdalam.
Varietas M
(Memberamo) tidak secara spesifik beradaptasi dengan salah satu lokasi namun diperkirakan tidak mampu beradaptasi di Talang dan Paritdalam. Studi ketahanan hama daun kedelai pada data ternormalkan memberikan genotipe Wilis dan IAC 80 memiliki kesamaan, sama-sama relatif tahan terhadap keseluruhan hama daun pada fase ini (14 HST) dibanding yang lain. Sementara genotipe lain secara spesifik rentan terhadap hama tertentu. W/80 relatif rentan terhadap Lalat Kacang (Agromyza), IAC 100 relatif rentan terhadap Emproasca.
III. MODEL AMMI TERAMPAT UNTUK DATA BERDISTRIBUSI BUKAN NORMAL 3.1 Pendahuluan
Arti penting pemodelan statistika adalah meyediakan interpretasi atas fenomena yang dipelajari, dan menyatakannya dengan bahasa yang sesuai dengan bidang aplikasi. Transformasi dapat dihindari manakala kehomogenan ragam dapat dimodelkan oleh suku-suku multiplikatif pengaruh interaksi pada struktur sistematik model. Bagaimanapun, untuk data bukan Normal yang dimodelkan pada skala observasi, interaksi multiplikatif kemungkinan besar merefleksikan dua hal, kehomogenan ragam dan interaksi multiplikatif yang sebenarnya. Tidak ada jaminan penuh bahwa transformasi data pada skala pengamatan dapat memisahkan kedua hal di atas. Transformasi, dalam kasus analisis regresi ataupun analisis ragam, bertujuan untuk memperoleh kehomogenan ragam, mendekati kenormalan galat, dan keaditifan pengaruh sistematik. Tidaklah mudah medapatkan sebuah transformasi yang memenuhi semua kebutuhan itu. Sebagai contoh, untuk data cacahan yang berdistribusi Poisson dan pengaruh sistematiknya multiplikatif, transformasi akar akan berhasil memperoleh ragam yang konstan, transformasi pangkat dengan pangkat dua per tiga akan menghasilkan distribusi yang mendekati simetrik atau Normal, sedangkan tranformasi logaritma menghasilkan aditifitas pengaruh sistematik. Jadi, setelah transfomasi pun, suku multiplikatif kemungkinan (masih) mencerminkan campuran keheterogenan ragam dan pengaruh multiplikatif. Sementara itu, pada pemodelan aditif telah dikenal luas apa yang disebut dengan Generalized Linear Models (GLM) atau Model Linier Terampat (MLT) sebuah kelas pemodelan yang menangani data-data bukan Normal. Pada MLT, keaditifan pengaruh sistematik ditentukan pada skala ternormalkan. Kenormalan (dan kehomogenan) ragam tidak lagi diperlukan, karena dengan (quasi) likelihood hanya relasi antara nilai tengah dan ragam yang perlu ditetapkan.
23
Model multiplikatif (bilinear) menjembatani kesenjangan antara model pengaruh utama (pada ANOVA ataupun GLM) dan model interaksi lengkap dengan parameter interaksi untuk tiap-tiap sel dalam tabel dua arah. Model ini pun memberikan visualisasi corak utama interaksi melalui biplot. Karenanya pengembangan teori GLM dengan mengakomodasi komponen multiplikatif untuk interaksi sangat diperlukan. Kekuatan eksplorasi model multiplikatif AMMI terletak pada visualisasi interaksi melalui biplot.
Van Eeuwijk, 1995, memperkenalkan model
multiplikatif dalam konteks MLT sebagai perluasan dari model AMMI yang disebut dengan Generallized AMMI atau disingkat GAMMI. Pada pemodelan GAMMI, visualisasi interaksi ini masih dimungkinkan.
Namun seperti
disebutkan Van Eeuwijk interpretasinya masih harus diinvestigasi karena sangat tergantung pada fungsi hubung yang digunakan. Walaupun jarak antar titik masih merepresentasikan ketakaditifan atau ketakbebasan. Bab ini bertujuan membicarakan bagaimana pengepasan (fiting) model bilinear GAMMI dalam konsep MLT.
Khususnya untuk pengamatan berupa
cacahan, distribusi poisson dan binomial. 3.2
Model Linier Terampat (Generalized Linear Models)
Model linear klasik mempunyai karakteristik: galat atau peubah respon mengikuti sebaran Normal dengan ragam konstan, ragam bebas dari rataan, dan galat atau peubah respon saling bebas. Pada kelas pemodelan yang lebih luas tidak lagi terikat dengan asumsi ini. Nelder dan Wedderburn pada tahun 1972 mengenalkan model linear terampat (MLT, generalized linear model) yang tidak bergantung pada karakteristik atau asumsi model linear klasik, tetapi bergantung hanya sifat fungsi penghubung (link function) yang menghubungkan antara μ i (rataan) dan η i (prediktor linear [linear predictor]) dari model sebaran peluang yang digunakan (McChullagh & Nedler, 1989). Peubah respon y i (i = 1, K, n) merupakan nilai-nilai pengamatan peubah acak Yi yang diasumsikan menyebar mengikuti sebaran tertentu (keluarga eksponensial) dengan nilai tengah E ( y i ) = μ i . Pada kenyataannya, suatu fungsi
24
ragam dari nilai tengah, V ( μ ) , yang mungkin menyertakan parameter dispersi, memenuhi asumsi distribusi. Var ( y i ) = φ V ( μ i ) dengan φ parameter dispersi (faktor skala) dan V (⋅) adalah fungsi ragam. Nilai tengah μ i berhubungan dengan prediktor linear (η i = ∑ j −1 β j xij atau η = Xβ dimana xij peubah penjelas yang n
diketahui, sedang β j adalah parameter, yang nilainya tidak diketahui) melalui suatu fungsi hubung: g i ( μ i ) = η i .
Walaupun setiap pengamatan mungkin
mempunyai fungsi penghubung yang berbeda, tetapi hal ini sangatlah jarang sehingga indeks i dalam fungsi gi dapat dihilangkan atau g i ( μ i ) tereduksi menjadi g (μ i ) .
Pendugaan parameter β j dalam vektor β dilakukan melalui prosedur
iterasi regresi linier terboboti dari fungsi hubung yang terlinierisasi dan dikenakan kepada pengamatan (y ) pada peubah penjelas (x) . Fungsi hubung terlinierisasi atau fungsi hubung yang disesuaikan atau dalam GLIM dikenal dengan sebutan working variate, z,
mempunyai bentuk z = η + (y − μ ) δη δμ atau
z i = η i + g ′ [ −1 (η i )]( y i − μ i ) (McChullagh & Nedler, 1989; Van Eeuwijk, 1995;
Falguerolles,1996). Setiap pengamatan juga mempunyai pembobot awal (prior weight) wi = [Var ( z i )]−1 , atau w = (δμ δη) 2 V (μ) . Pada setiap putaran iterasi nilai x dan z akan di-update. Metode ini dikenal dengan Iterative Reweighted Least Square disingkat IRLS.
Tabel 3.1. Fungsi Penghubung (kanonik) dalam Model Linier Terampat SEBARAN RESPON
NAMA
SIFAT HUBUNGAN
Normal
Identitas
η = g (μ ) = μ
Poisson
Log
η = g (μ ) = log(μ )
Binomial
Logit
η = g ( μ ) = log ⎜⎜
Binomial Negatif
Log
η = g ( μ ) = log⎜⎜
Gamma
Kebalikan
η = g (μ ) =
⎛ μ ⎞ ⎟⎟ ⎝1− μ ⎠
⎛ μ ⎞ ⎟⎟ ⎝μ+k ⎠
−1
μ
25
Secara umum, model linier terampat mempunyai karakteristik: 1. Peubah respon, Y , mempunyai sebaran dalam keluarga sebaran eksponensial. 2. Komponen linear atau sistematik yang menghubungkan prediktor linear η ke perkalian antara matrik rancangan X dan parameter β , η = Xβ . 3. Fungsi penghubung (link function) g (⋅) –yang mengaitkan prediktor linear dengan nilai-nilai dugaan model (fitted values)– mempunyai sifat monotonik dan diferensiabel.
g (⋅) ini mendeskripsikan bagaimana rataan respon yang
diharapkan dihubungkan dengan η , misalnya η = Xβ dan μ = g −1 (η) = E (Y ) . 4. Peubah respon boleh mempunyai ragam tidak konstan yang nilainya berubah dengan berubahnya nilai rataannya, σ i2 = f ( μi ) .
3.3
Model AMMI Terampat (Generalized AMMI Model/GAMMI) Dalam suatu percobaan, respon yang diamati terkadang berupa data
kategorik.
Hal ini mengakibatkan pendekatan model AMMI menjadi tidak
relevan sehingga perlu dilakukan analisis dengan menggunakan pendekatan lain. Untuk kasus ini, metode AMMI juga telah dikembangkan untuk menangani kasus-kasus yang lebih general.
Model pendekatannya dikenal dengan nama
model Generalized AMMI disingkat GAMMI (Van Eeuwijk, 1995) atau Generalized Bilinear Models disingkat GBMs (Falguerolles, 1996, & Gabriel,
1998). Model GAMMI dapat dituliskan sebagai berikut: K
ηij = ν + α i + β j + ∑ λk γ kiδ kj k =1
Suatu model AMMI adalah model GAMMI dengan link identitas dan ragam konstan. Dengan menetapkan nilai βj dan δkj mereduksi model menjadi GLM sepanjang baris, sedang menetapkan nilai αi dan δik menjadi GLM sepanjang kolom. Karakteristik dari model GAMMI ini dapat menjadi dasar untuk menentukan prosedur pendugaan parameter. Prosedur pendugaan parameter pada GLM lainnya, biasanya menggunakan metode kuadrat terkecil terboboti secara iteratif.
26
3.3.1 Algoritma Pengepasan Model AMMI Terampat Pengepasan Model AMMI Terampat dilakukan secara iteratif dengan beberapa tahapan sebagai berikut (Van Eeuwijk, 1995; Falguerolles, 1996): Tahapan pendugaan parameter pada model GAMMI dapat dilakukan sebagai berikut: (i)
Menentukan nilai awal untuk pengaruh utama dan interaksi kolom Ketika suatu model GAMMI dengan poros K akan disesuaikan dan tidak ada hasil yang didapat dari penyesuaian dengan poros M < K 1. Modelkan pengaruh utama sebagai berikut: ηij = v + αi + βj 2. Simpan pendugaan βˆ j dari efek utama kolom 3. Pilih skor kolom, δˆkj , untuk poros 1 sampai K (skor-skor ini tidak harus sama semua, dan sebaiknya telah distandarisasi dan diortonormalisasi; J
J
j =1
j =1
∑ δˆ kj = 0 , ∑ δˆ kj2 = 1, untuk k = 1, ..., K, ∑ δˆ
kj
δˆ k ' j = 0 , untuk k ≠ k’)
Ketika pendugaan parameter dapat digunakan untuk model GAMMI dengan poros M < K, nilai dari βˆ j dan δˆ kj , sekarang dengan k mulai dari 1, ..., M, dapat digunakan sebagai nilai awal untuk GLM pada tahap selanjutnya. Untuk nilai δˆ kj yang dimiliki poros M + 1, M + 2, ..., K, nilai dapat dipilih lagi. (ii)
Pendugaan pengaruh utama dan interaksi baris Tentukan b j = βˆ j dan d kj = δˆ kj , dan modelkan regresi baris K
η ij = v + α i + b j + ∑ γ ki d kj k =1
keterangan: bj diharapkan telah diketahui dan tidak harus diduga dkj menggambarkan variabel concomitant pada faktor kolom.
Parameter αi dan γ1i, γ2i, ..., γKi adalah intersep dan slop untuk regresi dari entri baris i pada variabel d1, d2, ..., dK. Pengaruh utama baris, αˆ i , tidak
27
perlu dipusatkan dalam proses iterasi, ini mungkin sebaiknya hanya dilakukan setelah konvergen. (iii) Pemusatan dan pengortogonalan pengaruh interaksi baris I
∑ γˆ
= 0 , untuk k = 1, ..., K
ki
i =1 I
∑ γˆ
ki
i =1
γˆ k ' i = 0 , untuk k ≠ k’
(iv) Pendugaan efek utama dan interaksi kolom Tentukan ai = αˆ i dan c ki = γˆ ki , dan modelkan regresi kolom K
ηij = v + ai + β j + ∑ ckiδ kj k =1
keterangan: ai membentuk offset, ketika nilai cki menunjukkan variabel concomitant
pada faktor baris. Parameter βj dan δ1j, δ2j, ..., δKj adalah intersep dan slop untuk regresi pada entri kolom j pada variabel c1, c2, ..., cK. Tidak perlu memusatkan efek utama kolom, βj, dalam prosedur. (v)
Standarisasi dan pengortonormalan pengaruh interaksi kolom Standarisasi dan ortonormalisasi: J
∑δˆ j =1
kj
J
= 0, ∑δˆkj2 = 1, untuk k = 1, ..., K
∑δˆ δˆ
kj k ' j
j =1
= 0, untuk k ≠ k’
Jika tidak terpenuhi maka lanjutkan prosesnya,
b
j
= βˆ
j
dan d kj = δˆ kj , dan
fitkan regresi baris,
η ij = v + α i + b j +
K
∑γ k =1
ki
d kj
Perubahan dari deviansi dari salah satu atau kedua regresi baris dan kolom dapat digunakan sebagai kriteria konvergen, atau perubahan dalam pendugaan dari salah satu atau keduanya parameter baris dan kolom. Jika kriteria kekonvergenan terpenuhi maka deviansi sisaan dari regresi baris akan menjadi
28
sama dengan deviansi sisaan dari regresi kolom. Metode ini sering juga disebut metode pendugaan maksimum quasi-likelihood. Pada saat konvergen maka I
∑ γˆ i =1
Parameter
2 ki
= λK
λK menunjukkan suatu parameter asosiasi general, suatu nilai
singular general. Kecuali untuk kasus model AMMI, tidak akan ada hubungan sederhana antara banyaknya deviansi yang bersesuaian dengan poros k dan kuadrat dari nilai singular:
(λ)
2
k
= λk .
3.3.2 Penentuan Banyaknya Suku Multiplikatif Banyaknya unsur multiplikatif dalam model GAMMI dapat ditetapkan melalui generalisasi uji pada model AMMI, yaitu: 1) Uji rasio likelihood untuk akar ciri pertama, untuk akar ciri kedua jika diketahui yang pertama, dan untuk akar ciri berikutnya. Uji ini membandingkan persentase yang diterangkan oleh suku tertentu dengan jumlah total yang tetap akan diterangkan, dan tidak memerlukan suatu pendugaan untuk galat. 2) Uji
F
tidak
membutuhkan
tabel
khusus
dan
mudah
dalam
perhitungannya. Suatu pendugaan bebas dari galat (over/under dispersi) diperlukan dan mungkin akan menyebabkan masalah. 3) Uji sederhana dengan atribut derajat bebas (I – 1) + (J – 1) – (2k – 1) kepada akar ciri bersesuaian dengan poros k, menjadi perbedaan antara banyaknya parameter yang akan diduga dan banyaknya konstrain identifikasi yang dikenakan. Kuadrat tengah yang bersesuaian kemudian diuji melawan suatu pendugaan galat (over/under dispersi). Uji ini diusulkan oleh Golob pada 1968 (Van Eeuwijk, 1995). Ketika akar ciri pertama relatif cukup besar terhadap akar ciri selanjutnya, atribut derajat bebas aman untuk mengikuti Gollob dan mengumpulkan suku berikutnya untuk suatu pendugaan galat (over/under dispersi). Aplikasi sekuensial dari prosedur ini, menguji akar ciri suksesif melawan pendugaan galat terkumpul.
29
Penambahan komponen multiplikatif lainnya untuk model GAMMI membutuhkan perhitungan kembali pada suku yang telah dimasukkan. Karena perbedaan bobot sel, dimensionalitas suksesif tidak disarangkan sebagaimana biasanya untuk model AMMI dengan bobot sel yang sama.
3.3.3 Diagnostik Sisaan Sisaan untuk tujuan diagnostik, setelah konvergen, dapat diperoleh dari regresi baris sebaik regresi kolom. Sisaan regresi baris dan kolom akan menyimpang sedikit dari sesamanya, karena perhitungan dari sisaan regresi baris mengasumsikan bahwa parameter kolom lebih diketahui daripada yang diduga, sedangkan untuk sisaan regresi kolom pendugaan dari parameter baris tidak perlu diketahui juga. Kemungkinan lainnya adalah untuk membuat peregresi dari hasil parameter interaksi baris dan kolom dalam jalan yang sama dengan uji satuderajat bebas untuk ketakaditifan yang dapat memberikan suatu interpretasi regresi, dan mencocokkan suatu model dengan efek utama dan peregresiperegresinya. Sisaan dari model ini adalah suatu kompromi antara sisaan dari regresi baris dan regresi kolom. Diagnostik sisaan yang dilakukan untuk menilai kelayakan model, diadopsi dari kelas GLM/MLT. Kelayakan model dapat diperiksa secara informal melalui plot sisaan terhadap suatu fungsi dari nilai dugaan model (fitted value). Untuk penilaian kelayakan model secara umum pemeriksaan disarankan menggunakan sisaan devians terbakukan (standardized deviance residual) untuk diplot terhadap prediktor linier (linear predictor) ataupun terhadap nilai dugaan model (fitted value) yang ditransformasi menjadi konstanta skala informasi bagi sebaran galat.
Transformasi fitted value untuk beberapa sebaran galat antara lain:
μˆ 2 μˆ 2 sin −1 μˆ
2 log μˆ − 2μˆ
−1
2
untuk galat berdistribusi Normal untuk galat Poisson untuk galat Binomial untuk galat Gamma untuk galat Invers Gaussian
30
Kelayakan model ditunjukkan oleh pola sisaan yang menyebar secara acak dengan kisaran konstan disekitar nilai tengah nol. Penyimpangan sistematik pada plot ini dapat berupa (i) bentuk kurva atau (ii) adanya perubahan kisaran dengan berubahnya fitted value.
Bentuk kurva dapat disebabkan oleh salah satunya
adalah penggunann fungsi hubung yang salah. Sehingga jika plot ini tidak mengandung penyimpangan dapat kita katakan fungsi hubung yang digunakan tepat (model sesuai). Hal yang sama dapat kita peroleh pula dari plot sisaan dengan prediktor linier.
Catatan: Plot ini tidak bermakna bagi data biner.
Beberapa plot sisaan lain digunakan secara khusus memeriksa fungsi ragam dan fungsi hubung yang digunakan (McChullagh & Nelder, 1989). Plot antara nilai mutlak sisaan terhadap nilai dugaan model (fitted value) memberikan pemeriksaan informal tentang kelayakan fungsi ragam yang diasumsikan. tebaran
Kelayakan fungsi ragam yang diasumsikan ditunjukkan oleh
titik-titik
yang
membentang
kostan
secara
horisontal,
tidak
mengindikasikan suatu tren atau pola tertentu. Ketidak sesuaian fungsi ragam ditunjukkan oleh tren pada nilai tengah, tren positif menunjukkan fungsi ragam yang digunakan saat ini meningkat lambat dengan meningkatnya nilai tengah. Kecenderungan negatif mengindikasikan sebaliknya. Pemeriksaan informal untuk kesesuaian fungsi hubung yang digunakan dapat diperiksa melalui plot antara working variate terhadap prediktor linier, tetapi ini tidak berlaku umum, untuk sebaran binomial terutama, plot ini tidak bermakna.
3.4 Penyajian Interaksi melalui Biplot Model GAMMI Biplot sangat baik dalam memperlihatkan interaksi multiplikatif dalam model AMMI. Dalam biplot, baris dan kolom digambarkan oleh titik dalam dua atau tiga-ruang dimensi. Koordinat dari titik didapatkan dari skor baris dan kolom. Nilai singular ditempatkan ke skor baris dan kolom dalam cara yang berbeda tergantung pada yang diperhatikan adalah dalam hubungan antarbaris, antarkolom, atau antara baris dan kolom. Dengan skor baris γ ki′ = γ ki λk diplotkan, jarak antara titik baris adalah proporsional pada banyaknya interaksi antarbaris. Memplotkan δ’kj, dengan δ kj′ = δ kj λ k mentransfer hubungan ini ke
31
titik kolom. Dengan titik baris dan kolom sebagai titik akhir dari vektor yang dimulai dari titik pangkal, geometri sederhana dapat memperlihatkan bahwa banyaknya interaksi, atau non-penjumlahan, antara sebuah baris dan kolom dapat didekati oleh inner product antara vektornya dari dalam biplot. Inner product ini dapat dihasilkan dengan memproyeksikan salah satu dari vektor baris atau kolom ke lainnya, dan kemudian mengalikan panjang dari proyeksi dengan panjang dari vektor tempat di mana proyeksi itu berada. Untuk kelas yang lebih luas dari model GAMMI, adalah mungkin untuk memvisualisasi interaksi dengan menggunakan biplot, tetapi interpretasinya tergantung pada fungsi hubung tertentu.
3.4.1 Model GAMMI Log-Bilinier Secara khusus berikut ini disajikan teladan lain model GAMMI yang merupakan model baris × kolom Goodman (RC Goodman model) untuk tabel frekuensi (cacahan) dua arah I×J. Model ini mengasumsikan bahwa setiap sel I×J saling bebas dan bersebaran Poisson. Pij adalah peluang bagi suatu pengamatan berada pada baris ke-i dan kolom ke-j,
⎛ K ⎞ Pij = α i β j exp⎜ ∑ λ k γ kjδ kj ⎟ ⎝ k =1 ⎠ dengan α i dan β j parameter yang positif. Sebagai kendala identifikasi bagi suku multiplikatif interaksi, digunakan kendala yang sama dengan kendala pada model AMMI. Dengan mengambil nilai logaritma, model tersebut ekuivalen dengan model log-bilinier: K
ηij = log( Pij ) = v + α i + β j + ∑ λ k γ kiδ kj k =1
dan dapat dikenali sebagai model AMMI terampat dengan fungsi hubung logaritma. Untuk model asosiasi baris × kolom yang relevan adalah bentuk dari nonindependen daripada non-aditif. Goodman mendefinisikan dua bentuk dari nonindependen. ⎛ P ⎞ K 1) ω = log ⎜ ij ⎟ = ∑ λ k γ δ ki kj ij ⎜ α β ⎟ k =1 ⎝ i j⎠
32
⎛ Pij Pst ⎞ K ⎟= λ k (γ ki − γ ks ) δ kj − δ kt ⎜P P ⎟ ∑ = 1 k ⎝ it sj ⎠
(
2) log rasio odds: π = log ⎜ ij
)
didefinisikan untuk sel dalam baris i dan s, dan kolom j dan t. Parameter baris yang diskalakan γ ki′ = γ ki λk , dapat diinterpretasikan sebagai slop dari suatu regresi linear terboboti dari ukuran non-independen ω ij pada skor kolom, J
δ kj : ∑ λ ij δ kj = γ ' ki . Ketika γ’ki digunakan sebagai koordinat untuk titik baris dalam j =1
biplot, jarak kuadrat antara dua titik baris mendekati non-independen antara dua baris, karena
∑ (γ ' K
k =1
(
−γ ' ks ) = ∑ ω ij − ω sj ki J
2
j =1
)
2
Hubungan yang sama dapat dideduksikan untuk δ’kj dan γki. Oleh karenanya, Goodman merekomendasikan untuk tampilan hanya dari titik baris untuk menggunakan γ ki′ = γ ki λk , dan untuk titik kolom δ kj′ = δ kj λ k . Untuk tampilan simultan, rekomendasinya adalah untuk menggunakan
γ *ki = γ ki λ0k.5(1−c ) dan δ kj* = δ kj λ0k.5c (0 ≤ c ≤ 1), di mana pemilihan dari c tergantung pada titik beratnya berada pada baris atau kolom. Inner product dari titik baris dan kolom dalam suatu biplot simultan mendekati ukuran non-independen ω ij di mana γ dan δ diskalakan menjadi γ* dan δ*, seperti yang terlihat pada K ⎛ Pij ⎞ K ⎟ = ∑ λ k γ δ = ∑ γ * δ * = γ * δ * cos γ * ,δ * , ki kj ki kj i j i j ⎜ α β ⎟ k =1 k =1 ⎝ i j⎠
(
ω ij = log ⎜
)
di mana γi* dan δj* dinotasikan sebagai vektor dari panjang K. Dalam biplot yang sama, inner product dari suatu perbedaan titik baris dengan suatu perbedaan titik kolom mendekati log-rasio odd
⎛ Pij Pst ⎞ K ⎟= λ k (γ ki − γ ks ) δ kj − δ kt ⎜PP ⎟ ∑ k = 1 ⎝ it sj ⎠
(
π ij = log ⎜
(
)
) (
)
= ∑ (γ *ki − γ *ks ) δ kj* − δ kt* = γ i* − γ *s δ *j − δ t* cos γ i* − γ *s ,δ *j − δ t* , K
k =1
33
dengan γi*, γs*, δj*, dan δt* vektor dari panjang K. Biplot simultan menghasilkan suatu alat yang sangat baik untuk memvisualisasi non-independen dalam tabel dua-arah dari perhitungan yang dianalisis oleh model asosiasi baris × kolom. Untuk model GAMMI lainnya interpretasi dari hubungan biplot tetap harus diinvestigasi. Tidak lupa juga, jarak antara titik dari salah satu baris atau kolom akan selalu mengindikasikan beberapa bentuk dari non-aditif atau nonindependen. Tampilan simultan seharusnya diinterpretasikan dengan lebih hatihati, namun di sini inner product dari titik baris atau kolom akan tetap mendekati non-aditif pada skala linear prediktor. Secara khusus, untuk kasus data Poisson (model Log-bilinier) Biplot memberikan informasi dua informasi penting.
Pertama tentang ketakbebasan
antar baris atau antar kolom yang ditunjukkan oleh jarak (kuadrat) antar titik-titik baris atau antar titik kolom pada Biplot. Informasi lain yang cukup menarik adalah tentang perbandingan dua peluang kejadian (odd ratio). Informasi ini merupakan interpretasi geometrik yag memanfaatkan sifat proyeksi vektor, secara ringkas sebagai berikut: •
Odds. Odds adalah perbandingan dua peluang kejadian. Dari tabel dua arah genotipe × populasi hama dapat diperoleh informasi perbandingan peluang. Kita definisikan xij sebagai nilai sel baris ke-i kolom ke-j dan
Pij = xij
∑
ij
xij peluang kejadian baris ke-i kolom ke-j, sehingga dapat
dihitung perbandingan peluang dua genotipe, katakanlah genotipe ke-i dan ke-s, terserang suatu hama, katakan hama ke-j sebagai Pij Psj . Odds untuk hama ke-t pada kedua genotipe yang sama dapat dihitung dengan cara yang sama Pst Pit .
Tinjauan geometris atas fenomena ini
direpresentasikan gambar 3.1A. Perhatikan bila panjang a dan b sama, jarak dari titik hama akan sama untuk kedua genotipe. •
Rasio Odds. Perbandigan dua odds, misalnya rasio antara odds untuk hama ke-j terhadap genotipe ke-i dan genotipe ke-s dengan odds untuk hama ke-t terhadap genotipe-genotipe yang sama ditulis sebagai
Pij Pit Pst Psj
.
34
Hama ke-j
log
Hama ke-j
Pij Psj
⎛ Pij Pst log ⎜ ⎜P P ⎝ it sj
≈ a−b
b
⎞ ⎟ ≈ log ⎛⎜ a b ⎞⎟ = log ⎛⎜ a ⋅ d ⎞⎟ ⎜c d ⎟ ⎟ ⎝ b⋅c ⎠ ⎝ ⎠ ⎠
b
a
Gen ke-s
α
a
Gen ke-i
d
Gen ke-s
c
Gen ke-i
Hama ke- t
A
B
Gambar 3.1. Tinjauan geometris tentang Odds (A) dan Rasio Odds (B) . Rasio odds ini dapat dipahami melalui gambar 3.1B, dengan memperhatikan perbandingan selisih panjang a dan b dengan c dan d. Catatan: Bila vektor yang menghubungkan dua hama dan yang menghubungkan dua genotipe saling tegak lurus, α=90o, maka perbandingan ini akan sama dengan satu, nilai log dari rasio odds ini adalah nol. Menurut model log-bilinier (GAMMI log-link) rasio odds ini dapat diperoleh skala logaritma: ⎛ Pij Pst ⎞ K ⎟= λ k (γ ki − γ ks ) δ kj − δ kt . ⎜P P ⎟ ∑ k = 1 ⎝ it sj ⎠
(
π ij = log ⎜
)
Melalui penurunan rumus
sehingga diperoleh
(
)
(
)
π ij = ∑ (γ *ki − γ *ks ) δ kj* − δ kt* = γ i* − γ *s δ *j − δ t* cos γ i* − γ *s ,δ *j − δ t* , K
k =1
3.5
Metodologi Penelitian
3.5.1 Data Terdapat dua gugus data yang digunakan dalam penelitian ini.
Data
pertama adalah data percobaan pengendalian terhadap hama daun pada galur kedelai tahan hasil persilangan oleh Balitkabi di Malang, Jawa Timur. Percobaan ini melibatkan empat galur/varietas kedelai tahan hasil persilangan (Wilis, IAC100, IAC-80-596-2 dan W/80-2-4-20). Penelitian ini memanfaatkan data populasi hama daun pada umur 14 hari setelah tanam.
Data kedua dari Balitpa di
Sukamandi, Jawa Barat, merupakan data uji daya hasil percobaan multilokasi yang melibatkan 12 varietas padi pada 5 lokasi. Penelitian akan memodelkan data
35
persentase gabah isi, dan banyaknya gabah/malai dalam butir (keduanya diamati saat panen).
3.5.2 Tahapan Penelitian Pada bagian ini akan disajikan secara ringkas langkah-langkah pekerjaan penelitian mulai dari penanganan data percobaan, pengepasan (fitting) model, analisis devians dan penentuan suku multiplikatif, pemeriksaan kelayakan model, dan pengembangan eksplorasi untuk memperoleh informasi tentang stabilitas ketahanan genotipe. 1. Identifikasi Distribusi dan Penanganan Data Percobaan. Data populasi hama daun diidentifikasi sebagai data berdistribusi Poisson, sedangkan data persetase gabah isi dan total banyaknya gabah diidentifikasi sebagai data berdistribusi binomial. Kedua gugus data disusun dalam tabel dua arah I×J, genotipe vs jenis hama daun dan genotipe vs lokasi, dengan sel berisi rataan dari ulangan/blok. 2. Pengepasan Model GAMMI. Algoritma pengepasan model GAMMI cukup rumit karena merupakan regresi bolak-balik (criss-cross regession/alternating regression) antara regresi baris dan kolom, dimana masing-masing regresi dalam kelas GLM yang dilakukan secara iteratif melalui metode Iteratif Reweighted Least Square (IRLS). Dengan demikian algoritma ini melibatkan tiga kekonvergenan, pada regresi baris, regresi kolom, dan pada regresi bolakbalik. Disinilah kompleksitas algoritma pemodelan ini. Namun ide dasar algoritma ini tampak tidak sulit dipahami. Algoritma ini disajikan dalam Gambar 1. Pengepasan model GAMMI dilakukan menggunakan software GENSTAT edisi 7 versi ujicoba, dapat diperoleh secara cuma-cuma dari http://www.vsn-intl.com/.
Prosedur GAMMI yang digunakan adalah
modifikasi untuk model penuh dari prosedur yang ditulis oleh Fred van Eeuwijk dan Paul Keizer dari CPRO-DLO Wageningen, Belanda (Lampiran 10).
Penggunan prosedur tersebut dalam tesis ini dan modifikasinya
dilakukan sepengetahuan pembuatnya. Data berdistribusi Poisson dimodelkan menggunakan GAMMI dengan fungsi hubung logaritma, sedangkan data binomial dengan fungsi hubung logit.
36
3. Analisis Devians. Bila dalam AMMI (ANOVA pada umumnya) pengujian pengaruh faktor digunakan jumlah kuadrat, pada model GAMMI (GLM pada umumnya) digunakan devians.
Penentuan sumbu/komponen multiplikatif
dilakukan melalui uji F, dengan membandingkan rasio antara rataan devians komponen yang diuji rataan devians galat terhadap nilai F-tabel. 4. Kelayakan Model. Kelayakan model diperiksa dengan diagnostik sisaan secara visual, melalui plot sisaan. Tabel dua arah Yij ∼ non Normal
η ij = v + α i + β j + Langkah (1) Mengepas model
K
∑
k =1
λ k γ ki δ kj
η ij = v + α i + β j
(i) Simpan αˆ dan βˆ sebagai pengaruh utama (ii) Pilih nilai δˆkj
sebagai nilai awal yang ortonormal
Model Linier Terampat (GLM)
Langkah (2) Mengepas regresi baris K
η ij = v + α i + b j + ∑ γ ki d kj k =1
dengan b j = βˆ j dan d kj = δˆkj dari langkah I Simpan αˆ j dan γˆ ki
Model Linier Terampat (GLM) dengan OFFSET
Langkah ( 3) Mengepas regresi kolom K
ηij = v + ai + β j + ∑ ckiδ kj
Gunakan
βˆ j
dan δˆkj dari (3)
k =1
dengan a j = αˆ j dan c ki = γˆ ki dari langkah II,
Model Linier Terampat (GLM) dengan OFFSET
simpan βˆ j dan δˆkj
Langkah (4) Ortonormalisasi INTERAKSI KOLOM
TIDAK
Gram-Schmith
konvergen YA
Analisis Devians
BIPLOT GAMMI2
Interpretasi BIPLOT
Gambar 3.2 Algoritma pengepasan model GAMMI
37
5. Analisis Stabilitas Ketahanan Genotipe.
Informasi tentang stabilitas
ketahanan genotipe dapat diperoleh melalui konfigurasi Biplot GAMMI2. Biplot GAMMI2 menyajikan plot skor baris dan kolom (dalam hal ini genotipe × populasi hama atau genotipe × lokasi) secara bersama-sama (tumpang tindih).
Dengan memperhatikan Biplot secara keseluruhan,
kedekatan antar titik-titik baris kolom menunjukkkan interaksi dan ketakbebasan (asosiasi) diantara keduanya. Parameter asosiasi ditunjukkan oleh nilai singular (tergeneralisasi).
Titik baris (genotipe) tertentu yang
berdekatan dengan titik kolom (populasi hama atau lokasi) tertentu menunjukkan bahwa genotipe tersebut berasosiasi dengan populasi hama atau lokasi tertentu. Niliai singular yang kecil untuk sumbu GAMMI ke-i menunjukkan ketidakbermaknaan sumbu tersebut.
3.6
Hasil dan Pembahasan
3.6.1 Ketahanan Kedelai Terhadap Hama Daun: Model Log-Bilinier Keempat genotipe kedelai memberikan respon ketahanan daun yang berbeda terhadap lima jenis hama daun. Tabel 3.2 menyajikan rataan populasi kelima hama yang ditemui pada keempat varietas kedelai pada usia 14 hari setelah tanam. Dengan algoritma bolak-balik Gambar 1, model GAMMI menggunakan fungsi hubung logaritma natural dan sebaran Poisson. . Tabel 3.2 Rataan populasi lima jenis hama daun pada empat genotipe kedelai Genotipe IAC-100 IAC-80 W/80 Wilis
Jenis Hama Daun Bemissia Emproosca Agromyza Lamprosema Longitarsaus 0.50 1.75 2.25 0.50 1.75 3.00 2.75 1.00 1.75 3.25 3.50 4.00 1.25 2.00 2.00 4.00 3.00 1.00 1.75 4.00
Analisis devians disajikan pada Tabel 3.3 menunjukkan bahwa rataan residual devians adalah 0.0134; pada perhitungan sisaan berbasis Khi-kuadrat Pearson sebesar 0.0135.
Tabel 3.3 menunjukkan bahwa model GAMMI-2
memenuhi kelayakan, karena rasio rataan devians sumbu 2 signifikan pada nilaip<0.0541 F-tabel [4,2]. Nilai singular sumbu 1 dan 2 berturut adalah 1.739, 0.5927. Plot residual devians terhadap nilai dugaan model dan linear prediktor,
38
menunjukkan tidak adanya kelainan yang berarti. Plot antara working variate terhadap prediktor linier dapat mengindikasikan ketidaktepatan penggunaan fungsi hubung, jika plot ini tidak linier. Tidak ada penyimpangan pada plot ini (Gambar 3.3). Sehingga model GAMMI-2 dengan log-link dan distribusi Poisson tampak mengepas data dengan baik. Tabel 3.3 Analisis devians untuk data populasi hama daun Sumber Hama Daun Genotipe GAMMI 1 GAMMI 2 Residual Total
Derjat Bebas 4 3 6 4 2 19
Rataan Devians 1.0461 0.9453 0.6118 0.2369 0.0133 0.6140
Devians 4.1845 2.8359 3.6709 0.9477 0.0267 11.6656
Nilai-p 0.0126 0.0139 0.0215 0.0541
1 working variate
0.1
standardized residual
Rasio Rataan Devians 78.38 70.83 45.84 17.75
0.0
0
-0.1
-1 0
1
2
fitted value
3
4
-1
0 Linear Predictor
1
Gambar 3.3 Plot residual untuk data hama kedelai: Plot residual terstadardisasi terhadap nilai dugaan model GAMMI-2 log-link (kiri); Plot working variate terhadap prediktor linier (kanan). Biplot GAMMI-2 menyajikan informasi interaksi genotipe × hama. Genotipe W/80 tampak berpeluang untuk menjadi kandidat varietas yang relatif tahan terhadap semua jenis hama daun kecuali pada Emproasca, itupun hanya jika dibandigkan dengan varietas IAC-100 yang secara spesifik rentan terhadap Agromyza (Gambar 3.4). Biplot interaksi model log-bilinier dapat digunakan secara baik untuk menemukan pasangan genotipe kadelai dan pasangan populasi jenis hama yang mempunyai rasio odds satu atau log-rasio odds nol.
Pada data kita, ditemui
bahwa pasangan itu adalah genotipe W/80 dan IAC-80 terhadap hama Bemisia dan Lalat. Garis antar genotipe “hampir” tegak lurus dengan garis antar jenis
39
hama menunjukkan log-rasio odds “mendekati” nol. Tabel 1 dapat memverifikasi bahwa rasio odds antara keduanya mendekati 1.
Artinya W/80 dan IAC-80
mempunyai kesamaan, W/80 cenderung terserang Bemisia daripada Lalat, demikian pula dengan IAC-80 dalam skala (odd rasio) yang sama. -1
-0.5
0
0.5
1
1 W/80 0.5
Empro Lampro Bemisia
Agromyza 0
0 IAC -80
IAC -100
Wilis -0.5
Longitarsus
-1
Gambar 3.4 Biplot GAMMI-2 untuk interaksi hama daun dengan fungsi hubung logaritma
3.6.2 Kestabilan Gabah Isi Varietas Padi: Model Logit-Bilinier Percobaan dilakukan di 5 lokasi yaitu Jatibaru, Maranu, Maroangin, Paritdalam dan Talang. Analisis devians (Tabel 3.4) menunjukkan ketidak-berartian sumbu ketiga, karena tidak signifikan dengan nilai-p >0.08 pada F[10,8], hal ini sesuai dengan nilai singular ketiga yang relatif kecil. Nilai sigular untuk model dengan 3 Tabel 3.4 Analisis devians untuk data gabah isi Sumber Lingkungan Genotipe GAMMI 1 GAMMI 2 GAMMI 3 Residual Total
Derajat Bebas
Devians
Rataan Devians
4 11 14 12 10 8 59
311.529 239.878 82.789 42.716 17.907 5.007 699.827
77.8823 21.8071 5.9135 3.5597 1.7907 0.6259 11.8615
Satu Suku Multiplikatif Rasio Rataan Nilai-p Devians 61.18 0.0000 17.13 0.0000 4.65 0.0000 2.8 0.0037
Dua Suku Multiplikatif Rasio Rataan Nilai-p Devians 124.44 0.000 34.84 0.000 9.45 0.002 5.69 0.010 2.86 0.075
40
sumbu berturut-turut adalah 1.924, 1.329, 0.759. Dengan demikian model dengan 2 sumbu memenuhi kelayakan, karena rataan devians sumbu kedua signifikan dengan nilai-p≤0.01 pada F[12,18]. Biplot interaksi (Gambar 3.5) menunjukkan persentase gabah isi varietas E (Bio Xa-5) dan J (OBS. 1657) relatif stabil di keempat lingkungan. Beberapa varietas beradaptasi spesifik dengan lingkungan tertentu. Varietas B (S3254-2G21-2) dan D (S3382-2D-3-3) mempunyai nilai rataan gabah isi relatif tinggi di Maranu, varietas M (Memberamo), K (OBS 1658), dan C (B3254-2G-2-1-2) beradaptasi cukup baik di Jatibaru, varietas A (B10278B-MR-2-4-2), F (S33831D-PN-41-3-1), H (OBS 1656), dan G (Bio-Xa-7) beradaptasi cukup baik di tiga lokasi Maroangin, Talang, dan Paritdalam. Sementara varietas L (IR 64) tidak beradaptasi dengan baik di Jatibaru, tetapi masih mungkin beradaptasi di lokasi lain. 0.8
0.6
0.4
L -1.4
-1.2
B -1
-0.6
Maranu
-0.4
F A
0.2
0 -0.8
Paritdalam
-0.2
EJ 0
HTalangG Maroagin 0.2
0.4
0.6
-0.2
D
-0.4
KM
-0.6
C -0.8
Jatibaru
0.8
Kode A B C D E F G H J K L M
Galur Padi B10278B-MR-2-4-2 S3254-2G-21-2 B9154F-PN-1-1-4 S3382-2D-3-3 Bio Xa-5 S3383-1D-PN-41-3-1 Bio Xa-7 OBS. 1656 OBS. 1657 OBS. 1658 IR. 64 MEMBERAMO
-1
Gambar 3.5. Biplot interaksi data gabah isi model GAMMI-2 logit-link. Lokasi ditunjukkan dengan kotak, verietas padi dengan garis.
3.7 Simpulan Model AMMI Terampat (GAMMI) mengakomodir ketidaknormalan data untuk memperoleh dekomposisi interaksi secara lengkap, dengan memodelkan peluang kejadian. Dalam bidang pemuliaan tanaman manfaat sangat dirasakan untuk uji stabilitas/adaptabilitas genotipe pada pebuah indikator yang berdistribusi bukan Normal, namun diketahui distribusinya dalam keluarga eksponensial,
41
misalnya Poisson, atau Binomial, Gamma. Biplot GAMMI model Poisson dengan fungsi hubung logaritma memberikan tambahan informasi tentang rasio odds. Pada studi ketahanan genotipe kedelai terhadap hama daun, model GAMMI-2 berhasil menjelaskan bahwa Genotipe W/80 adalah kandidat varietas yang relatif tahan terhadap hampir semua jenis hama daun. IAC-100 rentan terhadap Lalat.
Genotipe W/80 dan IAC-100 terhadap hama Bemisia dan
Agromyza mempunyai log-rasio odds “mendekati” nol. Kestabilan varietas padi menurut persentase gabah isi, varietas Bio Xa-5 dan OBS. 1657 relatif stabil, varietas S3254-2G-21-2 dan S3382-2D-3-3 beradaptasi baik di Maranu, varietas Memberamo, OBS 1658, dan B3254-2G-2-1-2 beradaptasi cukup baik di Jatibaru, sedangkan varietas B10278B-MR-2-4-2, S3383-1D-PN-41-3-1, OBS 1656, dan Bio-Xa-7 beradaptasi cukup baik di tiga lokasi Maroangin, Talang, dan Paritdalam.
Sementara varietas IR 64 tidak
beradaptasi dengan baik di Jatibaru, tetapi masih mungkin beradaptasi di lokasi lain.
IV. PERBANDINGAN KONFIGURASI MATRIKS INTERAKSI: METODE PROCRUSTES
4.1
Pendahuluan Dua pendekatan dalam menangani ketaknornalan data pada pemodelan
bilinier telah dibicarakan pada bab-bab sebelumnya.
Bab 2 membicarakan
penggunaan transformasi Box-Cox untuk mengatasi pelanggaran asumsi yaitu ketaknormalan distribusi peubah respon pada AMMI.
Sedangkan bab 3
membicarakan model biliner dalam kelas pemodelan linier terampat (GAMMI). GAMMI mengakomodir ketaknormalan respon
melalui penetapan distribusi
respon dan fungsi hubung yang bersesuaian dengan distribusi peubah respon itu sendiri. Pendekatan transformasi bagaimanapun menemui kesulitan mana kala transformasi yang diinginkan tidak mudah diperoleh. Tujuan pemodelan statistika adalah
menyediakan
interpretasi
atas
fenomena
yang
dipelajari,
dan
menyatakannya dengan bahasa yag sesuai dengan bidang aplikasi. Karenanya, ada alasan lain untuk tidak melakukan transformasi data. Pada kondisi tertentu kesimpulan yang diperoleh dari data pada skala asal menjadi amat peting karena mudah dipahami jika diperoleh langsung dari data asal (McCullagh & Nelder, 1989). Sebaliknya, kesimpulan dari analisis pada data tertrasformasi tidak dapat secara langsung diterapkan pada data asal. Sementara itu, untuk memahami interpetasi model biliner pada kelas GLM membutuhkan landasan statistika lebih dalam dan pengetahuan tambahan tentang komputasi. Hal ini mungkin menimbulkan kesulitan lain bagi peneliti bidang terapan di luar statistika dan matematika. Perbandingan kedua pendekatan ini perlu dilakukan untuk menilai sejauh mana kedekatan hasil dari kedua pendekatan ini.
Tentu saja dengan tetap
memperhatikan kelebihan dan kekurangan masing-masing.
Perbandingan ini
dapat dilakukan pada matriks interaksi dugaan dari kedua pendekatan. Hal ini
43
sesuai dengan tujuan utama pemodelan bilinier, yaitu memodelkan pengaruh interaksi. Bab ini bertujuan membandingkan penggunaan pendekatan transformasi kenormalan pada model AMMI dengan pendekatan model GAMMI pada gugus data yang sama.
4.2
Kesesuaian Dua Konfigurasi Matriks: Metode Procrustes Analisis peubah ganda seringkali memberikan koordinat dari segugus titik
dalama ruang berdimensi banyak (multidimensi). Secara khusus hal ini diperoleh dari upaya merepresentasi data sebagai jarak antara titik-titik objek dalam ruang multidimensi tersebut. Salah satu diantaranya adalah analisis komponen utama ataupun biplot yang melibatkan konsep jarak (jarak Pitagoras ataupun Mahalanobis) didalamnya. Jarak antar titik tidak berubah dengan berubahnya titik asal (origin), tidak pula berubah bila sumbu koordinatnya diputar. Dua figur dalam ruang dimensi r dan masing-masing mewakili n titik dikatakan kongruen jika keduanya dibedakan oleh suatu transformasi yang kekar. Dua figur, X dan X*, dikatakan mempunyai bentuk yang sama jika keduanya dihubungkan oleh suatu transformasi kesamaan sehingga : X* = β X Γ + 1N τ' dimana | Γ | = 1, τ(rx1) dan β > 0 adalah skalar. (τ, β,Γ) merupakan komponen translasi, skala dan rotasi transformasi kesamaan dari X ke X*. Metode Procrustes Biasa (Ordinary Procustes Method) bertujuan untuk membandingkan dua konfigurasi titik yang mewakili n unit pengamatan yang sama. Pada prinsipnya, untuk melihat kesamaan bentuk dan ukuran dari dua konfigurasi, salah satu konfigurasi dibuat tetap, sementara konfigurasi lainnya ditransformasi sehingga cocok dengan konfigurasi yang pertama (Digby & Kempton , 1987). Menurut Digby &
Kempton (1987) ada tiga tipe transformasi yang
diperlukan : translasi, rotasi sumbu koordinat dan penskalaan yang dilakukan jika kedua konfigurasi mempunyai skala yang tidak sama.
44
Translasi adalah perpindahan paralel dari setiap titik pengamatan ke suatu titik asal yang baru. Secara aljabar, translasi ini dapat dinyatakan sebagai berikut: X* = XH dengan H matrik translasi, X adalah matriks data dan X* adalah matriks data setelah ditranslasi.
Rotasi adalah perputaran, titik ataupun sumbu koordinat. Pada metode Procrustes ini, rotasi yang diperbolehkan adalah rotasi sumbu koordinat. Pada dasarnya, rotasi ini adalah penggunaan suatu matriks ortogonal sebagai matriks transformasi. Jadi, jika suatu gugus pengamatan X ingin dirotasikan dengan suatu matriks rotasi Γ, X* = X Γ, maka matriks Γ tersebut haruslah memenuhi kedua sifat tersebut di atas, atau secara aljabar linear dapat dituliskan sebagai : Γ'Γ = I dan ΓΓ' = I Pada metode Procrustes, jenis perpindahan yang dipilih adalah perpindahan yang dapat meminimumkan jumlah kuadrat jarak antara tititk-titik pada konfigurasi yang dipindahkan terhadap titik-titik yang sesuai pada konfigurasi yang dibuat tetap (Digby & Kempton, 1987). Statistik R2 (R-kuadrat) adalah salah satu ukuran yang digunakan untuk menggambarkan kesamaan bentuk kedua konfigurasi yang dibandingkan. Nilai ini menunjukkan berapa persen pengamatan pada kedua konfigurasi yang dapat dianggap sama. Jika nilai ini sama dengan 1 (100 %), berarti kedua konfigurasi mempunyai bentuk yang sama.
Perbedaan yang terdapat sebelum teknik
Procrustes diterapkan hanya disebabkan karena rotasi, translasi atau penskalaan. Anggaplah kita memiliki dua konfigurasi yaitu A dan R. Konfigurasi A tetap sedangkan konfigurasi R ditransformasi menjadi Z, dengan menggunakan
ˆ , dan βˆ yang bisa meminimumkan metode kuadrat terkecil, ingin didapat, Γ jumlah kuadrat jarak (m2AR) titik-titik yang dipindahkan terhadap titik-titik yang sepadan pada konfigurasi yang dibuat tetap. Secara aljabar dituliskan: m2AR = tr ( (A-Z)’ (A-Z) ) Untuk meminimumkan nilai m2AR ini, akan lebih baik kalau kedua matriks
A dan R dipusatkan terlebih dahulu di titik asal. Matriks translasi dugaan dapat
45
^ ^ ~ ^ ~ diperoleh dengan menyelesaikan persamaan : ( A − A ) − β ( R − R ) Γ = 1 N τ ~ ~ dengan A dan R adalah matriks data terpusat.
Nilai β dan matriks rotasi Γ diperoleh dengan meminimumkan :
~ ~ ~ ~~ ~ ~~ ~~ tr(( AS − β R Γ)'( AS − β RΓ)) = tr( A' A) + β2tr(Γ' R' RΓ) − 2β tr( A' RΓ) Misalkan penguraian nilai singular (Singular Value Decomposition) dari
~ ~ A' R
didefinisikan :
~~ A' R = ULQ' maka dugaan nilai β, matriks Γ adalah: ^
Γ = QU ' . ^
Karena Q dan U adalah matriks ortogonal, maka matriks Γ juga merupakan matriks ortogonal, sehingga dapat digunakan sebagai matriks rotasi. Sedangkan penduga parameter skala adalah : ~ ~ ^ tr ( A ' R Γ ) β = ~ ~ tr ( R ' R ) ^
Matriks kesalahan adalah simpangan matriks dugaan terbaik Z terhadap matriks target, yaitu matriks A. Matriks kesalahan secara aljabar dapat ditulis dalam bentuk:
E = (A - Z) Dengan demikian, jumlah kuadrat galat ini adalah jumlah kuadrat unsur-unsur pada matriks simpangan. Jumlah Kuadrat Total (JKT) dan jumlah kuadrat galat (JKG) secara aljabar dapat dituliskan : JKT = tr (A’A) dan JKG = tr ((A-Z)’ (A-Z)) Sedangkan R2 yang merupakan suatu ukuran kesamaan kedua konfigurasi dapat dihitung dengan rumus : R2= 1 - JKG/JKT = 1 - tr ((A-Z)’ (A-Z))/tr (A’A) Pembandingan kedua gugus data dilakukan dengan melihat besarnya nilai 2
R.
Jika nilai R2 mendekati nilai 1 (100 %), berarti dua gugus data yang
dibandingkan memiliki kemiripan karakteristik.
46
Dalam GENSTAT, procrustes rotasi orthogonal adalah metoda yang paling umum digunakan, dan disajikan oleh The ROTATION Directive. Anggaplah bahwa ada dua satuan koordinat untuk n titik dengan r dimensi dalam n×r matriks X dan Y. Gugus X dijadikan acuan yang dianggap tetap, dan konfigurasi Y akan digeser dan diputar sedemikian sehingga diperoleh kesesuaian terbaik terhadap X. Di sini “terbaik” berarti meminimumkan penjumlahan dari
jarak kuadrat
antara titik-titik pada koordinat X dan koordinat “terbaik” setelah digeser dan diputar, titik-titik pada Y. Translasi terbaik (pergeseran titik orogin) membuat centroids untuk keduanya koordinat secara bersamaan; ini mudah dilaksanakan dengan translasi kedua-duanya sedemikian sehingga centroids mereka adalah di titik asal itu. Setelah translasi, dicari rotasi terbaik melalui penguraian nilai singular (Lawes Agricultural Trust, 2003).
4.3
Metodologi Dari dua bab terdahulu dijelaskan metode mengepasan model AMMI dan
GAMMI sehingga diperoleh hasil pemodelan interaksi. Langkah penelitian pada bab ini adalah sebagai berikut: 1. Pemodelan AMMI untuk data proporsi gabah isi padi dan populasi hama daun yang telah ditransformasi Box-Cox. 2. Pemodelan GAMMI logit-link untuk data asal proporsi gabah isi padi, dan model GAMMI log–link untuk data asal populasi hama daun kedelai. 3. Pembentukan matriks interaksi dugaan dari model AMMI dan model GAMMI.
Pembentukan matriks interaksi ini dapat dilakukan dengan
cara: a. Membentuk matriks skor genotipe dan matrik skor lingkungan dari model penuh (full model) b. Mengalikan matriks skor genotipe dan matriks skor lingkugan untuk memperoleh matriks interaksi dugan 4. Menghitung kesesuaian kedua matriks iteraksi dugaan dengan metode Procrustes menggunakan prosedur Procrustes Rotation pada GENSTAT (Lampiran 12).
47
4.4
Hasil Perbandingan Matriks Interaksi
4.4.1 Matriks Interaksi Ketahanan Kedelai Terhadap Hama Daun Model AMMI pada data hama daun yang ditransformasi dengan pangkat 0.66 melalui metode trasformasi box-cox menghasilkan matriks interaksi sebagai berikut: -0.527851
-0.062761
0.665758
-0.109114
0.033889
0.116444
-0.130709
-0.184108
-0.023206
0.221626
0.192549
0.441590
-0.134987
0.176737
-0.675950
0.218851
-0.248173
-0.346669
-0.044436
0.420517
Sedangkan model GAMMI Log-link data hama daun menghasilkan matriks interaksi sebagai berikut: 0.532780
0.037319
0.624311
-0.241579
0.112729
0.139683
-0.136263
-0.234720
0.004502
0.226799
0.194269
0.326580
-0.036568
0.246332
-0.730612
0.198829
-0.227636
-0.353022
-0.009255
0.391085
Perbandingan kedua matriks interaksi yang dihasilkan kedua metode ini menggunakan metode procrustes diperoleh nilai R kuadrat sebesar 98.73% Angka ini menunjukkan bahwa pada pendugaan matriks interaksi kedua metode ini sangat dekat, tidak banyak berbeda. Apakah ini berasal dari peran penggunaan transformasi Box-Cox, tidaklah sertamerta kita dapat katakan demikan. Sebab bila kita kita menggunakan AMMI secara langsung pada data asal diperoleh Rkuadrat procrustes sebasar 98.26%. Hal yang paling mungkin berperan dalam hal ini adalah karakter distribusi data rataan populasi hama mirip dengan sebaran Normal (Lampiran 8). Penggunaan AMMI model penuh tidak menemui masalah ketaknormalan, namun pada penentuan model AMMI terbaik (dua komponen) ditemui sisaan yang tidak menyebar Normal (Lampiran 3). Bila kita perhatikan sel baris petama kolom pertama kedua pada kedua matriks tersebut di atas, terlihat angka yang sama cukup besar (dibandingkan angka pada sel-sel lain) namun berbeda tanda. Secara geometris hal ini berarti pada dimensi tersebut titik ini berada pada posisi yang berlawanan sehingga menyebabkan perbedaan pada konfigurasi kedua matriks ini. Namun bila titiktitik lain relatif sama maka perbedaan ini menjadi tidak tampak atau tidak terdeteksi oleh metode procrustes, karena secara matetatis metode procrustes tidak
48
memperhatikan “tanda”. Karena itulah meskipun kedua matriks interaksi di atas sangat mirip, namun interpretasi kestabilan/ketahanan terhadap hama penyakit dapat saja berbeda.
4.4.2 Matriks Interaksi Kestabilan Gabah Isi Varietas Padi Melalui AMMI model penuh (4 komponen) pada data proporsi gabah isi yang ditransformasi dengan pangkat 7.80 menghasilkan matriks interaksi sebagai berikut: 0.014517
-0.150186
-0.004814
-0.021742
0.162217
-0.028690
-0.155001
-0.140138
0.093252
0.230564
-0.191356
-0.277336
0.270206
0.421639
-0.223137
0.312974
0.235850
0.174702
-0.353611
-0.369877
0.582736
-0.127614
-0.468470
0.104372
-0.090978
-0.315364
0.500658
-0.110342
-0.110522
0.035535
-0.073343
-0.162583
0.515172
-0.016845
-0.262382
-0.263813
0.317211
-0.310599
0.057525
0.199637
-0.035537
0.350965
0.051077
-0.070406
-0.296088
0.117565
-0.118566
-0.214731
0.371982
-0.156224
-0.312965
-0.160172
0.062789
0.082227
0.328082
0.193313
-0.253172
0.175077
-0.557899
0.442659
Matriks interaksi diatas diperoleh pada model penuh. Sedangkan matriks interaksi data asal proporsi gabah isi dengan model GAMMI Logit-link model penuh sebagai berikut: -0.079536
-0.126249
0.011454
0.387973
-0.193642
-0.318166
0.389463
0.009024
-0.133706
0.053385
0.553968
0.030956
0.198006
-0.110326
-0.672604
-0.075247
0.504607
-0.088826
-0.203903
-0.136630
0.046359
0.004622
-0.273107
0.355246
-0.133120
-0.117087
-0.107006
-0.101694
0.283432
0.042355
-0.128413
-0.499332
0.595015
-0.075319
0.108050
-0.015852
-0.209936
-0.246076
0.323054
0.148809
-0.141927
0.015831
0.217416
-0.165527
0.074208
0.404657
-0.112217
-0.442194
-0.219253
0.369007
-0.342932
0.217629
0.099554
-0.010763
0.036512
0.214146
-0.108284
0.021402
-0.430906
0.303642
49
Perbandingan kedua matriks interaksi dugaan pada data proporsi gabah isi, menunjukkan hasil berlawanan dengan sub-bab sebelumnya. Perbandingan kedua matriks interaksi yang dihasilkan kedua metode ini menggunakan metode procrustes diperoleh nilai R kuadrat sebesar 23.36%. Angka ini mengindikasikan ketidaksesuaian hasil dari kedua pendekatan. Uji kenormalan bagi data poporsi gabah isi menunjukkan ketidaknormalan, sementara bagi data yang ditransformasi menunjukkan Normal (lihat Gambar 2.3). Transformasi Box-Cox berhasil mengatasi ketidaknormalan sehingga AMMI dapat digunakan pada data ternormalkan secara sahih. Namun begitu, matriks interaksi dugaan hasil kedua metode menunjukkan perbedaan yang tidak dapat diabaikan. Hal ini menunjukkan bahwa perlu kehati-hatian dalam interpretasi AMMI data ternormalkan karena hasilnya sangat berbeda dengan GAMMI.
4.3 Simpulan Hasil AMMI pada pendekatan transfomasi Box-Cox pada data rataan proporsi (binomial) memberikan matriks interaksi dugaan yang berbeda dari model GAMMI logit-link.
Pada data rataan populasi hama (berdistribusi
Poisson), AMMI dengan transformasi Box-Cox tidak banyak berbeda dengan model GAMMI log-link. Namun perlu dicatat bahwa bentuk sebaran data ini sangat mirip dengan distribusi Normal. Tidak demikian halnya dengan data proporsi gabah isi, pendekatan transformasi Box-Cox pada model AMMI untuk data proporsi ini memberikan hasil yang berdeda dari model GAMMI logit-link. Bila distribusi data sangat mirip dengan sebaran Normal (simetrik) maka hasil AMMI dengan pendekatan transformasi Box-Cox tidak jauh berbeda dengan penggunan GAMMI. Sebaiknya pada data yang bukan Normal hasil kedua pendekatan ini sangat berbeda. Hal yang tidak kalah pentingnya adalah menyadari bahwa metode procrustes yang digunakan dalam perbandingan memeriksa kemiripan konfigurasi dua matriks dan tidak memperhatikan “tanda”.
V. KESIMPULAN DAN SARAN 5.1
Kesimpulan Dua pendekatan dapat dilakukan untuk menangani ketidaknormalan data
pada pemodelan bilinier. Transformasi kenormalan dilakukan untuk tetap bertahan pada model dengan metode pendugaannya yang telah mapan secara teori sehingga pengujian hipotesis dan interpretasinya pun tidak banyak perdebatan. Model AMMI dibangun dengan landasan teori pemodelan yang mapan, teknik komputasi yang sederhana, dan telah secara luas digunakan. Transformasi data dilakukan untuk semata-mata memperoleh asumsi kenormalan. Analisis AMMI kemudian dilakukan pada data hasil transformasi ini. Kita seolah menutup mata terhadap makna apa yang diberikan oleh transformasi pada interpretasi model AMMI. Pada memodelan terampat, GAMMI atau GLM secara umum, transformasi bukanlah tidak dilakukan. Justru transformasi menjadi hal terpenting dalam model linier terampat. Transformasi dalam model linier terampat dipilih berdasarkan distribusi data, karenanya identifikasi distribusi menjadi sangat penting. Transformasi inilah yang memodelkan data berdasarkan fungsi peluangnya melalui fungsi hubung, dan secara teori interpretasi pemodelan inipun diturunkan berdasarkan fungsi peluang ini. Dengan bilinier terampat (GAMMI), kita sedang pemodelkan peluang, sehingga interpretasinya berkenaan dengan perbandingan peluang, odds dan rasio odds. Namun di sisi lain, transformasi ini juga yang menyebabkan dibutuhkannya metode pendugaan parameter yang lain (likelihood) bukan pendugaan dengan Metode Kuadrat Terkecil (MKT) biasa. Konsekuensi lain, model bilinier terampat khususnya, membutuhkan komputasi yang tidak sesederhana biasanya. Bila kita memilih transformasi kenormalan sebagai upaya penanganan datadata bukan Normal pada pemodelan bilinier, kita dapat menggunakan transformasi Box-Cox dan kemudian memodelkannya dengan AMMI, bila distribusi data yang kita miliki mendekati simetrik, sangat mirip dengan sebaran Normal. Hal ini disebabkan karena hasil AMMI dengan pendekatan transformasi Box-Cox tidak jauh berbeda dengan penggunan GAMMI. Namun bila distribusi
51
data bukan Normal kedua pendekatan ini mungkin memberikan hasil yang sangat berbeda. Hasil AMMI pada pendekatan transfomasi Box-Cox pada data rataan proporsi (berdistribusi Binomial) memberikan matriks interaksi dugaan yang berbeda dari model GAMMI logit-link. Pada data populasi hama (berdistribusi Poisson), AMMI dengan transformasi Box-Cox tidak banyak berbeda dengan model GAMMI log-link. Model GAMMI mampu mengakomodir ketidaknormalan data untuk memperoleh dekomposisi interaksi secara lengkap, dengan memodelkan peluang kejadian. Dalam bidang pemuliaan tanaman manfaat sangat dirasakan untuk uji stabilitas/adaptabilitas genotipe pada pebuah indikator yang berdistribusi bukan Normal, namun diketahui distribusinya dalam keluarga eksponnsial, misalnya Poisson, atau Binomial, Gamma. Biplot GAMMI model Poisson dengan fungsi hubung logaritma memberikan tambahan informasi tentang rasio odds. Informasi tentang rasio odds pada model log-bilinier tidak dapat diperoleh pada model AMMI dari data ternormalkan. Ini menjadi kelebihan model GAMMI log-link dibanding model AMMI dengan transformasi kenormalan pada data berdistribusi Poisson. Demikianlah model AMMI terampat (GAMMI) mampu memberikan informasi sebagaimana model AMMI, dengan keluasan distribusi peubah respon.
5.2
Saran Manfaat model GAMMI tidak terbatas pada masalah pemuliaan tanaman.
Model-model peluang pada tabel dua arah secara umum dapat kita jumpai pada masalah-masalah kesehatan (epidemiologi), riset pemasaran, ataupun pada bidang keteknikan. Penerapan model bilinier terampat ini diharapkan membuka peluang pengembangan lebih lanjut.
52
DAFTAR PUSTAKA Aunuddin, 2005. Statistika: Rancangan dan Analisis. IPB Press, Bogor. Bartlet, M. S. 1949. Fitting A Straitght Line When Both Variables Are Subject To Error. Biometrics, 5:207-212. Box, G. E. P, Hunter, W. G, & Hunter J. S. 1978. Statistics for Experimenters: An Introduction to Design, Data Analysis, and Model Building. John Wiley & Sons, Inc. Canada. Crossa, J. 1990.
Statistical Analysis for Multilocation Trials.
Advance in
Agronomy, 44: 55-85. Digby, P.G.N. & Kempton, R.A. 1987. Multivariate Analysis of Ecological Communities. Chapman & Hall, London. Falguerolles, de A, 1996. Generalized Linear-Bilinear Models. An Abstract. Society of Computational Economics. 2nd International Conference on Computing and Finance.
Genewa, Switzerland, 26–28 June 1996.
http://www.unige.ch/ce/ce96/defalgue/defalgue.htm. [14 Juli 2005] Gabriel, K. R., 1998, Generalised Bilinear Regression. Biometrika. 85 (3):689700. Greenacre, M. J. 1984. Theory and Apllications of Correspondence Analysis. Academic Press. London. Jolliffe, I T. 1986. Principal Component Analysis. Springer-Verlag. New York Lawes Agricultural Trust, 2003. The Guide to GenStat® Release 7.1 Part 2:
Statistics. VSN International, Wilkinson House, Jordan Hill Road, Oxford, UK. Mattjik A. A. & Sumertajaya I. M. 2002.
Perancangan Percobaan dengan
Aplikasi SAS dan MINITAB. 2nd Ed. IPB Press. Bogor. Mattjik A. A., 2005.
Interaksi Genotipe dan Lingkungan dalam Penyediaan
Suumberdaya Unggul.
Naskah Orasi Ilmiah Guru Besar Biometrika.
Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Bogor. McCullagh, P. and Nelder, J. A. 1989. Chapman and Hall, London.
Generalized Linear Models. 2nd ed.
53
Rawling, J.O. Pantula S. G. & Dicky D. A, 1998. Applied Refression Analysis: A Research Tools. 2nd Ed. Sringer-Verlag, New York. Sumertajaya, I M. 1998. Perbandingan Model AMMI dan Regresi Linier untuk Menerangkan Pengaruh Interaksi Percobaan Lokasi Ganda. Tesis. Program Studi Statistika Sekolah Pascasarjana IPB, Bogor Tengkano, W & Soehardjan, M, 1993. Jenis Hama Utama pada Berbagai Fase Pertumbuhan Tanaman Kedelai, dalam S. Somaatmadja et al (eds.) Kedelai. Pusat Penelitian dan Pengembangan Tanaman Pangan. Bogor Van Eeuwijk, F A, 1995.
Multiplicative Interaction in Generalized Linear
Models. Biometrics, 51, 1017–1032
LAMPIRAN
55
Lampiran 1. Data pengamatan populasi hama daun kedelai pada umur 14 hari setelah tanam Genotipe
Ulangan
IAC-100
1 2 3 4 IAC-100 1 2 3 4 IAC-80 1 2 3 4 W/80 1 2 3 4 Wilis
Rataan IAC-80
Rataan W/80
Rataan Wilis
Rataan
Hama Daun Bemissia 0 1 1 0 0.5 4 2 2 4 3 3 3 2 6 3.5 6 5 1 4 4
Emproosca 2 2 2 1 1.75 5 3 2 1 2.75 6 4 3 3 4 3 3 3 3 3
Agomyza 1 2 4 2 2.25 2 1 1 0 1 2 1 1 1 1.25 0 0 2 2 1
Lamprosema Longitarsaus 1 0 1 2 0 2 0 3 0.5 1.75 3 4 2 3 1 2 1 4 1.75 3.25 1 3 3 2 2 2 2 1 2 2 2 4 3 4 1 5 1 3 1.75 4
Lampiran 2. Nilai lambda dugaan dan log-likelihood transformasi Box-Cox data populasi hama daun lambda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Lampiran
-0.99 -0.44 0.11 0.66 1.21 1.76 2.31 2.86 3.41 3.96 4.50 5.05 5.60 6.15 6.70 7.25 7.80 8.35 8.90 9.45 10.00
Box-Cox Likelihood -22.22 -16.28 -12.77 -11.67 -12.57 -14.95 -18.37 -22.53 -27.25 -32.41 -37.90 -43.68 -49.68 -55.87 -62.23 -68.72 -75.32 -82.03 -88.83 -95.70 -102.64
56
Lampiran 3. Plot sisaan model AMMI 2 data populasi hama daun ternormalkan. 2.0
Standardized residuals
7 6 5 4 3 2 1
1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0
0 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50
Standardized residuals
Fitted values
az
az Standardized residuals
2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0
1.75 1.50 1.25 1.00 0.75 0.50 0.25 0.00
-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
Normal plot
0.0
0.5
1.0
1.5
2.0
Half-Normal plot
Lampiran 4. Nilai lambda dugaan dan log-likelihood transformasi Box-Cox data proporsi gabah isi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Lampiran
lambda -0.99 -0.44 0.11 0.66 1.21 1.76 2.31 2.86 3.41 3.96 4.50 5.05 5.60 6.15 6.70 7.25 7.80 8.35 8.90 9.45 10.00
Box-Cox Likelihood 150.29 151.70 152.99 154.16 155.21 156.16 157.01 157.75 158.41 158.97 159.45 159.85 160.18 160.43 160.61 160.73 160.79 160.78 160.73 160.61 160.45
57
Standardized residuals
Lampiran 5. Diagnostik sisaan AMMI data gabah isi ternormalkan
20
15
10
5
2 1 0 -1 -2 -3
0 -3
-1
-2
0
1
2
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
3
Standardized residuals
Fitted values
pz
pz 3.0
Standardized residuals
2 1 0 -1 -2 -3
2.5 2.0 1.5 1.0 0.5 0.0
-2
-1
0
2
1
0.0
0.5
Normal plot
1.0
1.5
2.0
2.5
Half-Normal plot
Lampiran 6. Biplot AMMI1: KUI1 vs rataan proporsi gabah isi ternormalkan 0.5
Maroangin
0.4
C
G
0.3 Paritdalam
0.2
L
KUI1
0.1 M
0.0
A
B
Talang D H
-0.1
K
J F
-0.2
Jatibaru
E Maranu
-0.3 -0.4 0.3
0.4
0.5 Gabah Isi Padi
Lampiran
0.6
0.7
58
Lampiran 7. Biplot AMMI1: KUI1 vs rataan populasi hama daun ternormalkan
KUI1
1
IAC-100 Agromyza
Emproasca Longitarsus
0 IAC-80
Lamprosema
W/80 Wilis Bemissia -1 1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
Populasi Hama Daun
Lampiran 8. Karakteristik distribusi data hama daun
Descriptive Statistics Variable: a
0.5
1.5
2.5
3.5
Mean StDev Variance Skewness Kurtosis N
2.25000 1.13555 1.28947 0.153511 -1.05533 20
Minimum 1st Quartile Median 3rd Quartile Maximum
0.50000 1.37500 2.00000 3.18750 4.00000
Lampiran 9. Contoh perintah GENSTAT untuk transformasi Box-Cox YTRANSFORM [transform=powe;method=boxc;lower=0.99;upper=10]y=gbhisi;nbin=nY;\ save=bxc print bxc[1, 2, 3, 4]; variate Z calc Z=gbhisi**1.21 normtest [print=marg, critical]data=Z print Y, Z
Lampiran
59
Lampiran 10. Prosedur GAMMI pada GENSTAT 7 \next procedure PROCEDURE 'GAMMI' " Performs a generalized linear additive main effects and multiplicative interaction model analysis for row-by-COLUMN data; FAE 1/1/93" " with compliments to scaffold RJOINT of PWL by PK 1/4/93" " all rights reserved by F.A. van Eeuwijk & L.C.P. Keizer" " CPRO-DLO Wageningen 30-MAY-1996 test version" " Updated for full parameter names by LCPK 17/5/2005" " Updated for full model by AFHADI 21/8/2005" " Other procedures used; RCHECK" OPTION \ 'PRINT', "I: strings (model,summary,diagnostics,biplots,monitoring); output from procedure; default m,s,d,b"\ 'DISTRIBUTION', "I:string (normal,poisson,binomial,gamma, inversenormal);distribution for response;default n"\ 'LINK', "I: string (canonical,identity,log,logit,reciprocal, power,squareroot,probit,complementaryloglog); link function; default canonical"\ 'EXPONENT', "I: scalar; exponent for power link; default -2"\ 'DISPERSION', "I: scalar; dispersion parameter; default * for DISTRIBUTION=n,g,i or 1 for DISTRIBUTION=p,b"\ 'WEIGHTS', "I: variate; holding the weights for each unit"\ 'AXES', "I: scalar; number of multiplicative axes to be used"\ 'MAINEFFECTS', "I: text; substract ROW and/or COLUMN main effects before adding multiplicative terms"\ 'COVA_IMPL', "I: string; cova implemented before or after main effect or used for redundancy analysis"\ 'TOLERANCE', "I: scalar; the convergence criterion; default 0.00001"\ 'SEED', "I: scalar; to initialize the COLUMN scores"\ 'MAXCYCLE'; "I: scalar; maximum number of cycles; default 15"\ MODE =t,t,t,v,p,p,p,t,t,v,v,v;\ NVALUES =*,1,1,1,1,*,1,*,*,1,1,1;\ SET =n,y,y,y,n,n,y,y,y,y,y,y;\ VALUES =!t(MODEL,SUMMARY,DIAGNOSTICS,BIPLOTS,MONITORING),\ !t(NORMAL,POISSON,BINOMIAL,GAMMA,INVERSENORMAL),\ !t(CANONICAL,IDENTITY,LOGARITHM,LOGIT,RECIPROCAL,POWER,\ SQUAREROOT,PROBIT,COMPLEMENT),\ *,*,*,*,\ !t(ROW,COLUMN,BOTH,NONE),\ !t(BEFORE,AFTER,REDUNDANCY),\ *,*,*;\ DEFAULT =!t(MODEL,SUMMARY,DIAGNOSTICS,BIPLOTS),\ 'NORMAL','CANONICAL',-2,*,*,2,!t(BOTH),'AFTER',\ 0.00001,13132,15;\ LIST =y,(n)11 PARAMETER \ 'Y', "I: variate; variate to be analysed; no default"\ 'NBINOMIAL', "I: variate; variate of binomial totals; no default for DISTRIBUTION=b"\ 'ROW', "I: factor; the row factor; no default"\ 'COLUMN', "I: factor; the COLUMN factor; no default"\ 'COVARIATES', "I: pointer of variates; associated with the row factor"\ 'COVATYPE',"I: pointer of ROW or COL dummies; covas are associated with"\ 'ROWPARAMS', "O: pointer; to store estimates of the ROW means"\ 'COLPARAMS', "O: pointer; to store estimates of the COLUMN means"\ 'FITTEDVALUES', "O: variate; to store fitted values"\ 'RESIDUALS', "O: variate; to store residuals"\ 'DELRESIDUALS', "O: variate; to store deletion residuals"\ 'COOK', "O: variate; to store modified Cook's statistics"\ 'LEVERAGE', "O: variate; to store leverage values"\ 'WORKVARIATE', "O: variate; to store working variate"\ 'LINEARPREDICT',"O: variate; to store linear predictor"\
Lampiran
60 'BIPLOT'; SET DECLARED PRESENT TYPE
"O: pointer; to store R&C+R+C biplots sigma scaled"\ =y,n,y,y,n,n,n,n,n,n,n,n,n,n,n,n;\ =y,y,y,y,n,n,n,n,n,n,n,n,n,n,n,n;\ =y,y,y,y,n,n,n,n,n,n,n,n,n,n,n,n;\ =2('VARIATE','FACTOR'),'POINTER','POINTER',\ 2('POINTER'),7('VARIATE'),'POINTER' TEXT e; VALUES='FAULT message from procedure gammi: ' TEXT w; VALUES='WARNING message from procedure gammi: ' "**********************************************************************" " Deal with DISPERSION option " "prin [ipri=*;squa=y] 'check dispersion'" IF UNSET(DISPERSION) " Option not set " IF DISTRIBUTION.IN.!t(BINOMIAL,POISSON) SCAL [VALUE=1] disp ELSE SCAL [VALUE=*] disp ENDI ELSE IF DISPERSION>0 " Option set positive " SCAL [VALU=DISPERSION] disp ELSI DISPERSION==CONS('*') " Option set to * " SCAL [VALU=*] disp ELSE " Option set negative " EXIT [CONT=proc; EXPL=!t(#e,'DISPERSION must be positive or *')] ENDI ENDI "***********************************************************************" prin [ipri=*;squa=y] 'check weights' IF UNSET(WEIGHTS) " Option not set " VARI [nval=Y] weights CALC weights=1 DUMM [valu=NONE] WEIGHTS ELSE VARI weights ; WEIGHTS ENDI prin [ipri=*;squa=y] 'check weights' "when calculating df's take care for 0 weight's" "***********************************************************************" " Deal with NBINOMIAL parameter " "prin [ipri=*;squa=y] 'check nbinomial parameter'" IF UNSET(NBINOMIAL) EXIT [CONT=proc; EXPL=!t(#e,'NBINOMIAL parameter must be set')] \ DISTRIBUTION .EQS. 'BINOMIAL' " Assign a variate with values to NBIN: will be ignored " ASSI Y; NBINOMIAL ENDI "***********************************************************************" " Look for the canonical link of the specified distribution " "prin [ipri=*;squa=y] 'check cononical link'" SCAL ndist,nlink TEXT [VALUES=IDENTITY,LOGARITHM,LOGIT,RECIPROCAL,POWER,SQUAREROOT,PROBIT,\ COMPLEMENTARYLOGLOG] linkname CALC ndist = POSITION(DISTRIBUTION; !t(NORMAL,POISSON,BINOMIAL,\ GAMMA,INVERSENORMAL)) IF LINK.EQS.'CANONICAL' SCAL nlink; VALUE=ndist ELSE CALC nlink = POSITION(LINK; linkname) ENDI "***********************************************************************" " Get attributes of factors, particularly for labelling " "prin [ipri=*;squa=y] 'check attributes for labelling'" GETA [ATTR=nlevels,levels,labels] ROW,COLUMN; SAVE=pvf,pef
Lampiran
61 SCAL nvars,nenvs; VALUE=pvf['nlevels'],pef['nlevels'] GETA [ATT=nmv] pvf,pef; SAVE=ppvf,ppef "check for levels or labels" IF ppvf[1] GETA [ATT=decimals] pvf['levels']; SAVE=ppvf VARI Row; VALUES=pvf['levels']; DECI=ppvf['decimals'] FACT [LEVE=Row] Grow; VALU=pvf['levels'] ELSE TEXT Row; VALUES=pvf['labels'] TEXT Grow; VALU=pvf['labels'] ENDI IF ppef[1] GETA [ATTR=decimals] pef['levels']; SAVE=ppef VARI Column; VALU=pef['levels']; DECI=ppef['decimals'] FACT [LEVE=Column] Gcolumn;VALU=pef['levels'] ELSE TEXT Column; VALU=pef['labels'] TEXT Gcolumn; VALU=pef['labels'] ENDI TEXT [NVAL=1] variden,enviden,covviden,coveiden "dump hiet niet meer nodig door loop die de fits doet" DUMP [CHAN=chanenv;PRIN=iden] COLUMN DUMP [CHAN=chanvar;PRIN=iden] ROW EQUA [OLDF=!(-5,1,*)] chanenv,chanvar;variden,enviden "***********************************************************************" " Identify missing ROWs and COLUMNs (e.g. due to restrict) " "prin [ipri=*;squa=y] 'check missing ROWs and COLUMNs'" TABU & REST & CALC CALC
[CLAS=ROW] Y; NOBS=cv [CLAS=COLUMN] Y; NOBS=ce Column; !(#ce)>0 Row; !(#cv)>0 notmise,notmisv=nval(Column,Row) "Get number of not restricted" totnmis=nobs(Y/weights) "Available df's" "takes in account missing values in Y and those due to 0 weights" "***********************************************************************" "check on covar; Column cova's optionally fitted before main Column eff. with a maximum equaling column levels (poss. -1 for general mean); Row cova's may follow similar but adjusted for Column effects (=Rowlevels-1)" "A mirror analysis can be prefomed by transposing the input" VARI [nval=Y] eenvec "unity vector used as dummy and/or to fit mean" CALC eenvec=1 SCAL cdf,rdf;notmise,notmisv "column/row counters used for df calcs" SCAL mcdf[1...nenvs],mrdf[1...nvars];1 "individual main effects/coverdfs" "prin 'check met covariabelen'" IF UNSET(COVARIATES) ASSI eenvec; COVARIATES;1 ASSI eenvec; COVATYPE;1 scal covatal;1 POIN [valu=eenvec] covar SCAL thch,thrh,ccp,rcp;0 ELSE CALC covatal,cotyptal=nval(COVARIATES,COVATYPE) EXIT [CONT=JOB;EXPL=!t(#e,\ 'Pointer COVARIATE and COVATYPE must have same number of values')]\ covatal.ne.cotyptal CALC ctlev[1...covatal]=nlev(COVATYPE[1...covatal]) CALC cvvtal[1...covatal]=nval(COVARIATES[1...covatal]) CALC ctlctv[1...covatal]=ctlev[].EQ.cvvtal[] EXIT [CONT=JOB;EXPL=!t(#e,\ 'COVARIATE length must conform levels of corresp. factor')]\ vsum(ctlctv).ne.covatal "find out wich covariate belongs to column or row" CALC hch[1...covatal]=COVATYPE[1...covatal].IS.COLUMN CALC hrh[1...covatal]=COVATYPE[1...covatal].IS.ROW
Lampiran
62 "create index variate for column and row" VARI vhch,vhrh;VALU=!(hch[]),!(hrh[]) CALC vhch,vhrh=cum(vhch,vhrh)*(vhch,vhrh.ne.0) "determine presency of column/row covariate" CALC thch,thrh=VSUM(hch,hrh) "when present assign column and row covariates each to a pointer; when not present assign dummy eenvec to these pointers (used as fit-loop index parameter but skiped within the loop) and erect the full length covariate for analysis" IF thch.gt.0 POIN [nval=thch] chcova ASSI COVARIATES[#vhch];(chcova)#thch;1...thch CALC ccovar[1...thch] = \ NEWLEVELS(COVATYPE[#vhch];COVARIATES[#vhch]) ELSE POIN [valu=eenvec] chcova POIN [valu=eenvec] ccovar ENDI IF thrh.gt.0 POIN [nval=thrh] rhcova ASSI COVARIATES[#vhrh];(rhcova)#thrh;1...thrh CALC rcovar[1...thrh] = \ NEWLEVELS(COVATYPE[#vhrh];COVARIATES[#vhrh]) ELSE POIN [valu=eenvec] rhcova POIN [valu=eenvec] rcovar ENDI "calculate scalars used to skip elements as loop index parameter" CALC ccp,rcp=thch,thrh.ne.0 "correct scalars used as index for pointers; ensuring them being >0 to avoid trouble with nonexisting index for empty pointers" CALC thch,thrh=thch,thrh+(thch,thrh.eq.0) ENDI "***********************************************************************" "Temporary inclusion of main effects fitting order !!!!!" " to be deleted when module is up and running" MODE [DIST=#DISTRIBUTION; LINK=#LINK; EXPO=EXPONENT; DISP=disp; WEIG=weights]\ Y; NBIN=NBINOMIAL TERM COLUMN+ROW FIT [PRIN=*] ADD [PRIN=*] COLUMN ADD [PRIN=*] ROW " DROP [PRIN=*] ROW+COLUMN ADD [PRIN=*] ROW ADD [PRIN=A] COLUMN " "***********************************************************************" SCAL efftal;0 "scalar counting fitted effects" SCAL mas;1 "initial multiplicative AXES use in effects pointer" SCAL einp,ginp;0 "indicator if geno/environmental effects are present" SCAL gmean "scalar for general mean" TEXT [VALU='Total'] source "declaration of variates holding estimates" VARI [VALU=#nenvs(0)] E VARI [VALU=#nvars(0)] G VARI [NVAL=Y] voG,voE SCAL YE[1...thch] "column covariable effects" SCAL ZE[1...thrh] "row covariable effects" POIN [nval=1] gefp,refp,cefp "pointer to hold effects" ASSI (gmean)3;gefp,refp,cefp POIN voGp "pointer to maineffect offset" POIN voEp "pointer to maineffect offset" "**********************************************************************"
Lampiran
63 "Fitting general mean; keeping devi & df for accumulated table" MODE [DIST=#DISTRIBUTION; LINK=#LINK; EXPO=EXPONENT; DISP=disp; WEIG=weights;\ SAVE=laatst] Y; NBIN=NBINOMIAL FORM [VALU=eenvec] fform,fformeas,fformvas,fformc,fformr FIT [PRIN=*;CONS=O] #fform RKEE DEVI=devi[efftal]; DF=df[efftal];est=est CALC totdf[efftal]=notmise*notmisv-1 "calculate total df" IF df[efftal].ne.totdf[efftal] "not sure yet how to deal with" CALC totmis=totdf[efftal]-df[efftal] PRIN 'Specific ROW-COLUMN cells are restricted or missing !!!!!' ELSE SCAL totmis;0 ENDI "***********************************************************************" "***********************************************************************" "Fitting covar & main effects; keeping devi & df for accumulated table" "i= variates/factors to be fitted j= column or row factor to wich the fitted variate corresponds k= given choices for fitting the covariates l= possible choices at each stage of fitting m= index number for covariate n= type of effect to be fitted (cova,main,cova.main) o= corresponding identifier of covariate/factor use in summary table" FOR i=#ccp(ccovar[1...thch]),COLUMN,\ #rcp(rcovar[1...thrh]),ROW,\ #ccp(ccovar[1...thch]),\ #rcp(rcovar[1...thrh]);\ j=#ccp((COLUMN)#thch),COLUMN,\ #rcp((ROW)#thrh),ROW,\ #ccp((ROW)#thch),\ #rcp((COLUMN)#thrh);\ k=#ccp(COVA_IMPL),MAINEFFECTS,\ #rcp(COVA_IMPL),MAINEFFECTS,\ #ccp(COVA_IMPL),\ #rcp(COVA_IMPL);\ l=#ccp('BEFORE'),!T('COLUMN','BOTH'),\ #rcp('BEFORE'),!T('ROW','BOTH'),\ #ccp(!T('BEFORE','AFTER')),\ #rcp(!T('BEFORE','AFTER'));\ m=#ccp(1...thch),1,\ #rcp(1...thrh),1,\ #ccp(1...thch),\ #rcp(1...thrh);\ n=#ccp((1)#thch),2,\ #rcp((3)#thrh),4,\ #ccp((5)#thch),\ #rcp((6)#thrh);\ o=#ccp(chcova[1...thch]),COLUMN,\ #rcp(rhcova[1...thrh]),ROW,\ #ccp(chcova[1...thch]),\ #rcp(rhcova[1...thrh]); IF (k.IN.l) "check to include covariate/factor at this stage" CALC mindf[1,2]=(n,n.eq.1,3)*\ (mcdf[m],mrdf[m])*(vsum(mcdf,mrdf).gt.1) " (cova = 1df unless (rtot/ctot-1) or already fitted)" CALC mindf[1,2]=mindf[1,2]+(n,n.eq.2,4)*(vsum(mcdf,mrdf)-1) "main = rtot/ctot-1 corrected for covariates already fitted" CALC mindf[1,2]=mindf[1,2]+\ (n,n.eq.5,6)*(rdf,cdf-(mcdf[m],mrdf[m].eq.0)) "cova.main = complementary factor df corrected for not fitted covariate and/or maineffect" EXIT [CONT=FOR;EXPL=!t(#w,\ 'Not enough df to fit all requested terms')]\
Lampiran
64 (totdf[efftal]-vsum(mindf)-totmis).le.0 "rem: totmis indicates missing cells" IF (VSUM(mindf).gt.0) "if possible to include then correct dfs" "adjust pointers to hold effects !!!" CASE n POIN [valu=gefp[],YE[]] gefp POIN [valu=cefp[],YE[]] cefp POIN [valu=refp[],YE[]] refp OR POIN [valu=gefp[],E] gefp POIN [valu=cefp[],E] cefp CALC einp=1 POIN [valu=voE] voEp OR POIN [valu=gefp[],ZE[]] gefp POIN [valu=cefp[],ZE[]] cefp POIN [valu=refp[],ZE[]] refp OR POIN [valu=gefp[],G] gefp POIN [valu=refp[],G] refp CALC ginp=1 POIN [valu=voG] voGp ELSE prin 'How does the effects pointer has to look like ?' ENDC CALC mefftal,efftal=efftal,efftal+0,1 CALC totdf[efftal]=totdf[mefftal]-vsum(mindf) CALC mcdf[m],mrdf[m]=mcdf[m],mrdf[m]-(n,n.eq.1,3) CALC mcdf[1...nenvs],mrdf[1...nvars]=\ mcdf[1...nenvs],mrdf[1...nvars]-\ mcdf[1...nenvs],mrdf[1...nvars]*\ ((n)#nenvs,(n)#nvars.eq.(2)#nenvs,(4)#nvars) CALC cdf,rdf=cdf,rdf-(n,n.eq.2,4) "correct for main effects" CALC cdf,rdf=cdf,rdf-(n,n.eq.5,6) "correct for main.cova effects" DUMP [CHAN=chancove;PRIN=iden] o EQUA [OLDF=!(-5,1,*)] chancove;coveiden TEXT [VALU=#source,#coveiden] source fcla i;outt=iform fcla j;outt=jform IF (n.gt.4) "is it an cova.main type ?" FORM [VALU=#fform+#jform.#iform] fform ELSE "it is just an additive" FORM [VALU=#fform+#iform] fform ENDI IF (j.IS.ROW) IF (n.gt.4) FORM [valu=#fformc+#jform.#iform] fformc ELSE FORM [valu=#fformc+#iform] fformc ENDI ELSE IF (n.gt.4) FORM [valu=#fformr+#jform.#iform] fformr ELSE FORM [valu=#fformr+#iform] fformr ENDI ENDI FIT [PRIN=*;CONS=O] #fform RKEE DEVI=devi[efftal]; DF=df[efftal];ESTI=est ENDI ENDI ENDF "***********************************************************************"
Lampiran
65 "Calculating initial values for offset" " prin [squa=y] fform rdis [prin=es;save=laatst] " EQUA est;gefp IF einp CALC voE=NEWL(COLUMN;E) ENDI "***********************************************************************" "check on realistic number of multipl. axes after covariate/main effects" CALC haxes=vmin(!p(cdf,rdf)) "smallest side is maximum" IF haxes.lt.AXES CALC AXES=haxes PRIN [ipri=*;squa=y] w,\ 'Not enough df''''s; number of axes set to:',AXES;\ fiel=*,*,3;deci=0 ENDI "***********************************************************************" "prin [ipri=*;squa=y] 'Begin module'" "prin [ipri=*;squa=y] 'nvars',nvars,'nenvs',nenvs" "prin [ipri=*;squa=y] 'AXES=:',AXES" CALC SEED=URAN(SEED) "initialize random generator" CALC delta[1...AXES] = URAN(0;nenvs) "initialize COLUMN scores" "CALC delta[1...AXES]=delta[1...AXES]-mean(delta[1...AXES])" "probeersel" calc delta[1...AXES]=0 "DIT WERKT, maar geeft dit geen problemen ??" VARI [NVAL=nvars] gamma[1...AXES] "***********************************************************************" "prin [ipri=*;squa=y] 'check lege parameters (assign)'" IF UNSET(FITTEDVALUES) : ASSIGN fit ; FITTEDVALUES : ENDI IF UNSET(RESIDUALS) : ASSIGN residual; RESIDUALS : ENDI IF UNSET(DELRESIDUALS) : ASSIGN delres ; DELRESIDUALS : ENDI IF UNSET(COOK) : ASSIGN cook ; COOK : ENDI IF UNSET(LEVERAGE) : ASSIGN leverage; LEVERAGE : ENDI IF UNSET(WORKVARIATE) : ASSIGN workvar ; WORKVARIATE : ENDI IF UNSET(LINEARPREDICT) : ASSIGN lp ; LINEARPREDICT : ENDI IF UNSET(BIPLOT) : ASSIGN biplot ; BIPLOT ELSE CALC BIPLTAL=AXES*4 IF NVAL(BIPLOT)<>BIPLTAL \EXIT [CONT=proc;EXPL=!t(#e,\ \'Biplot pointer must have 4 variates per axis (R&C+R+C)')] prin [ipri=*;squa=yes]\ 'Biplot pointer has 4 variates per axis (R&C+R+C):',BIPLTAL,\ 'for',AXES,'axes';deci=0;fiel=1 POIN [modi=yes;nval=BIPLTAL] BIPLOT ENDI ENDI "***********************************************************************" VARI [NVAL=Y] vint[1...AXES],vdelta[1...AXES],vgamma[1...AXES] "redefine" SCAL cycle,tcycle,devmon[0]; 0 CALC axesmin=AXES-1 "prin [ipri=*;squa=y] 'Begin loop'" "***********************************************************************" IF AXES.GE.1 FOR m=1...AXES "buitenloop voor aantal assen" CALC mas=m CALC tcycle,cycle,mmin=tcycle,0,m+cycle,0,-1 FORM [valu=#fformc+ROW.vdelta[1...m]] fformeas FORM [valu=#fformr+COLUMN.vgamma[1...m]] fformvas POIN [VALU=refp[],gamma[1...m]] refpp
Lampiran
66 POIN [VALU=cefp[],delta[1...m]] cefpp " prin [squa=y] 'samengestelde poin' prin [squa=y] fformeas prin [squa=y] refpp prin [squa=y] fformvas prin [squa=y] cefpp " "***********************************************************************" FOR [NTIM=MAXCYCLE] CALC cycle = cycle+1 MODE [DIST=#DISTRIBUTION; LINK=#LINK; EXPO=#EXPONENT; \ DISP=disp; WEIG=weights ;OFFS=#voEp] Y; NBIN=NBINOMIAL " Form variate with current ROW sens relevant to each unit " " Avoid bug with restrictions in NEWLEVELS " REST delta[1...m] CALC vdelta[1...m] = NEWLEVELS(COLUMN;delta[1...m]) REST delta[1...m]; RESTRICT(Column) FIT [CONST=O; PRIN=*;NOME=alia] #fformeas RKEE EST=est; DEV=rdevmon[cycle] EQUA est; refpp "prin refpp[]" CALC G,gamma[1...m] = G,gamma[1...m]-MEAN(G,gamma[1...m]) CALC voG = NEWL(ROW;G) "orthogonalisatie" "bedoeling is GRAMM-SCHMIDT orthogonalisatie" "hier nog CHOLESKI ??" IF m.gt.1 for i=1...mmin;j=2...m model gamma[j]; fit=fitg FIT [CONST=o; PRIN=*] gamma[1...i] CALC gamma[j] = gamma[j] - fitg endf ENDI CALC normgamma[1...m] = SQRT(sum(gamma[1...m]**2)) CALC gamma[1...m] = gamma[1...m]/normgamma[1...m] REST gamma[1...m] CALC vgamma[1...m] = NEWL(ROW;gamma[1...m]) REST gamma[1...m];REST(Row) MODE [DIST=#DISTRIBUTION; LINK=#LINK; EXPO=#EXPONENT; \ DISP=disp; WEIG=weights ;OFFS=#voGp;SAVE=laatst] Y; NBIN=NBINOMIAL FIT [CONS=O; PRIN=*] #fformvas RKEE EST=est; DEV=cdevmon[cycle] EQUA est;cefpp "prin cefpp[]" CALC E,delta[1...m] = E,delta[1...m] - MEAN(E,delta[1...m]) CALC voE = NEWL(COLUMN;E) "orthogonalisatie" IF m.gt.1 for i=1...mmin;j=2...m MODE delta[j]; FIT=fitd FIT [CONST=o; PRIN=*] delta[1...i] CALC delta[j] = delta[j] - fitd endf ENDI CALC normdelta[1...m] = SQRT(SUM(delta[1...m]**2)) CALC delta[1...m] = delta[1...m]/normdelta[1...m] "***********************************************************************" CALC maxdiff= ABS(rdevmon[cycle]-cdevmon[cycle]) IF 'MONITORI' .IN. PRINT PRIN [ipri=*;squa=y] \ 'AXES:',m,'convergence cycle:',cycle,\ 'Deviance:',cdevmon[cycle],'Difference:',maxdiff;\ deci=*,0,*,0,*,4,*,4;fiel=*,2,*,3,*,12,*,12 ENDI
Lampiran
67 EXIT [CONT=FOR] maxdiff .LT. TOLERANCE "***********************************************************************" IF cycle==MAXCYCLE PRINT [IPRINT=*] '******** CONVERGENCE NOT ACHIEVED IN', \ cycle,'ITERATIONS'; FIELD=3; DEC=0 & [SQUASH=yes] 'Tolerance',TOLERANCE, \ 'Maximum difference in sensitivity at last iteration',maxdiff; \ FIELD=18,12,37,12 ENDIF ENDF "***********************************************************************" "prin gamma[1...m],delta[1...m]" CALC sgamma[m][1...m],sdelta[m][1...m]=gamma[1...m],delta[1...m] CALC sE[m],sG[m]=E,G CALC sgmean[m]=gmean "opslag per as" CALC mefftal,efftal=efftal,efftal+0,1 CALC devi[efftal]=cdevmon[cycle] CALC df[efftal]=df[mefftal]-(cdf+rdf-1) CALC cdf,rdf=cdf,rdf-1 CALC phi[m][1...m]=normdelta[1...m] " prin [squa=y] normdelta[1...m] prin [squa=y] normgamma[1...m] " IF 'MONITORI' .IN. PRINT TEXT [VALU='Monitor convergence graph'] gt VARI [nval=cycle] process;!(cdevmon[1...cycle]) VARI [valu=1...cycle] round;deci=0 GRAP [titl=gt] process;round;meth=l ENDI ENDF "***********************************************************************" "prin [ipri=*;squa=y] 'Einde loop'" "prin efftal" ENDI "***********************************************************************" "prin 'rcheck'" "Extract relevant details from last fit and use RCHECK" " RDIS [SAVE=laatst;PRIN=esti] prin refpp[],cefpp[],'dit moet kloppen met de estimates' " RKEE [SAVE=laatst] LINE=LINEARPREDICT;LEVE=LEVERAGE;\ FITT=FITTEDVALUES;RESI=RESIDUALS CALC RESIDUALS=Y-FITTEDVALUES "aanpassing residu zonder leverage etc" RCHECK [SAVE=laatst;PRIN=*;resi=DELRESIDUALS;cook=COOK] " residual,cook,leverage; halfnormal" CALC WORKVARIATE = LINEARPREDICT + (Y - FITTEDVALUES)/FITTEDVALUES PRIN [CHAN=asnum;IPRI=*;SQUA=Y] !(1...AXES);deci=0;fiel=2;just=l "***********************************************************************" TABU [CLASS=ROW,COLUMN; MARG=Y; PRIN=M] FITTEDVALUES "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!" PRIN sgmean[] PRIN Row,sG[1...AXES],sgamma[][] CORR [PRIN=c] sG[1...AXES],sgamma[][] PRIN Column,sE[1...AXES],sdelta[][] CORR [PRIN=c] sE[1...AXES],sdelta[][] prin phi[][] "!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!" "***********************************************************************" CALC rptal=1+AXES IF .NOT.UNSET(ROWPARAMS) POIN [MODI=Y;NVAL=#rptal] ROWPARAMS
Lampiran
68 CALC ROWPARAMS[1...rptal]=sG[AXES],sgamma[AXES][1...AXES] ENDI IF .NOT.UNSET(COLPARAMS) POIN [MODI=Y;NVAL=#rptal] COLPARAMS CALC COLPARAMS[1...rptal]=sE[AXES],sdelta[AXES][1...AXES] ENDI "***********************************************************************" "***********************************************************************" IF efftal.gt.0 CALC pefftal=efftal+1 CALC dfver[0...pefftal]=df[0],df[0...mefftal],df[efftal] - \ 0 ,df[1... efftal], 0 CALC deviver[0...pefftal]=devi[0],devi[0...mefftal],devi[efftal] - \ 0 ,devi[1... efftal], 0 ENDI "***********************************************************************" "prin [ipri=*;squa=y] 'Print diagnostics',PRINT" IF 'DIAGNOST' .IN. PRINT IF NOBS(RESIDUALALS).GT.0 "exact model without residuals" GRAP LINEARPREDICT,WORKVARIATE; LINEARPREDICT; meth=l,p GRAP [NROW=21; NCOL=61] RESIDUALS;FITTEDVALUES; symb=ROW GRAP [NROW=21; NCOL=61] RESIDUALS;LINEARPRLUES; symb=ROW GRAP [NROW=21; NCOL=61] RESIDUALS;FITTEDVALUES; symb=COLUMN GRAP [NROW=21; NCOL=61] RESIDUALS;LINEARPREDICT; symb=COLUMN CALC res2=RESIDUALS**2 TABU [m=y; class=ROW,COLUMN] res2; tot=devres PRIN [IPRI=*;SQUA=Y] 'Total residual:',devres ENDI ENDI "***********************************************************************" IF AXES.GT.1 CALC cagamma[1...AXES],cadelta[1...AXES] = \ sqrt(normdelta[1...AXES],normdelta[1...AXES])*\ gamma[1...AXES],delta[1...AXES] CALC grgamma[1...AXES],grdelta[1...AXES] = \ normdelta[1...AXES],normdelta[1...AXES]*\ gamma[1...AXES],delta[1...AXES] IF NVAL(BIPLOT) DELE [rede=yes] BIPLOT[1...BIPLTAL] CALC BIPLOT[1...BIPLTAL]=cagamma[1...AXES],cadelta[1...AXES],\ grgamma[1...AXES],grdelta[1...AXES] \REST BIPLOT[] ENDI "prin [ipri=*;squa=y] 'Print biplots'" IF ('BIPLOTS' .IN. PRINT) TEXT [valu=' Row-Column biplot sigma scaled 0.5-0.5'] rcgt TEXT [val=' Column biplot sigma scaled 1'] cgt TEXT [val=' Row biplot sigma scaled 1'] rgt FOR i=1...axesmin CALC iplus=i+1 FOR j=iplus...AXES CALC imin,iplus,jmin,jplus=i,AXES,j,AXES-(1,i,1,j) CONC [bpas] 'AXES',#asnum,' vs.',#asnum;\ widt=*,(0)#jmin,2,(0)#jplus,*,(0)#imin,2,(0)#iplus CONC [rctit] bpas,rcgt CONC [rtit] bpas,rgt CONC [ctit] bpas,cgt GRAP [titl=rctit;eq=sc] cagamma[j],cadelta[j],0; \ cagamma[i],cadelta[i],0; symb=Grow,Gcolumn,'+' GRAP [titl=rtit; eq=sc] grgamma[j],0; \ grgamma[i],0; symb=Grow,'+' GRAP [titl=ctit; eq=sc] grdelta[j],0; \ grdelta[i],0; symb=Gcolumn,'+' ENDF ENDF
Lampiran
69 ENDI ENDI "***********************************************************************" "prin [ipri=*;squa=y] 'Print model'" IF 'MODEL' .IN. PRINT PAGE SKIP [FILE=outp] 2 PRIN [IPRI=*;SQUA=Y]\ '*** GenerAlized Main effects and Multiplicative ***' PRIN [IPRI=*;SQUA=Y]\ '*** Interaction model analysis ***' SKIP [FILE=outp] 1 TEXT [NVAL=1] tlink EQUA [OLDF=!((-1)#nlink,1)] OLDS=!t(x,#linkname); NEWS=tlink PRIN [IPRI=*; SQUA=yes] \ 'Response variate ',!p(Y); FIELD=25,*; JUST=r,l & 'Weight variate ',!p(WEIGHTS); FIELD=25,*; JUST=r,l & 'Distribution ',DISTRIBUTION; FIELD=25,*; JUST=r,l & 'Dispersion ',disp; FIELD=25,*; JUST=r,l & 'Link function ',tlink; FIELD=25,*; JUST=r,l & 'Number of ROWs ',notmisv,'FROM',nvars;\ FIELD=25,8,5,5; DECI=0; JUST=r,l,l,l & 'Number of COLUMNs ',notmise,'FROM',nenvs;\ FIELD=25,8,5,5; DEC=0; JUST=r,l,l,l & 'COL COVARIATES ',thch;FIEL=25,3;DECI=0;JUST=r,l & 'ROW COVARIATES ',thrh;FIEL=25,3;DECI=0;JUST=r,l & 'Number of multipl.axes',AXES;FIEL=25,3;JUST=r,l;DECI=0 & 'Convergence criterion',TOLERANCE;FIELD=25,12; DECI=6; JUST=r,l & 'Number of iterations ',tcycle; FIELD=25,8; DEC=0; JUST=r,l ENDI "***********************************************************************" "prin [ipri=*;squa=y] 'Print summary'" IF 'SUMMARY' .IN. PRINT IF DISTRIBUTION.EQS.'NORMAL' TEXT head[1...4],inttext;\ VALUES='variance','s.s.','m.s.','v.r.',!t(('Ammi__')#AXES) ELSE TEXT head[1...4],inttext; \ VALU='deviance','deviance','mean dev.','dev. ratio',\ !t(('gamma')#AXES) ENDI CONC inttext,asnum;skip=*,1;widt=6,3 CALC sourlen=nval(source)-1+AXES+3 CALC maintal=efftal-AXES "source - first element (=total) + AXES + RESIDUAL +empty +TOTAL" TEXT [VALU=(' ')#sourlen] source2 EQUA [OLDF=!(-1,maintal,AXES,3)] \ !t(#source,#inttext,'Residual',' ','Total ');source2 CALC dfver[0...pefftal]=MVIN(dfver[0...pefftal];dfver[0...pefftal].eq.0) CALC mdev[0...pefftal]=deviver[0...pefftal]/dfver[0...pefftal] VARI deviance,dimension,meandev;\ !(deviver[1...pefftal],*,deviver[0]),\ !( dfver[1...pefftal],*, dfver[0]),\ !( mdev[1...pefftal],*,mdev[0]) FOR i=1...AXES CALC asno=maintal+i+1 CALC asrest=pefftal-asno+1 CALC devr[i]=meandev/\ (vsum(!p(deviver[asno...pefftal]))/\ vsum(!p( dfver[asno...pefftal]))) "tests op as-niveau's" CALC devr[i]=mvin(devr[i];!((0)#maintal,(0)#i,(1)#asrest,0,1)) ENDF SKIP [FILE=outp] 2
Lampiran
70 PRIN [IPRI=*] '*** Analysis of',head[1],'***'; FIELD=1 & 'Source','d.f.',head[2...3],(head[4])#AXES;\ FIELD=15,8,12,12,(12)#AXES & [SQUASH=yes; MISSING=' '] \ source2,dimension,deviance,meandev,devr[1...AXES]; \ FIEL=15,8,12,12,(12)#AXES;DEC=*,0,4,4,(2)#AXES;JUST=l,(r)3,(r)#AXES SKIP [FILE=outp] 5 ENDI "***********************************************************************" DELE [REDE=Y] "As many as you lay hold of" DUMM WEIGHTS;VALU=* "***********************************************************************" ENDPROCEDURE "GAMMI" "***********************************************************************"
Lampiran 11. Contoh Perintah GENSTAT untuk GAMMI return [clos=yes] text [valu='Bem',. . . ,'Lon'] labnema text [valu='IAC-100',. . . ,'Wils'] labgeno calc nnema,ngeno=nval(labnema,labgeno) unit [nval=20] fact [lev=nnema;labe=labnema] nema fact [lev=ngeno;lab=labgeno] geno gene geno,nema variate a read a ... (data) ... : GAMMI [dist=normal;link=ident;main=both;maxc=30;prin=mo,sum,bipl,diag;\ axes=3;seed=183639]\ a;nbin=*;row=geno;colu=nema;\ fitt=fit;resi=residual; bipl=bip prin bip[1,2] prin bip[3,4] GAMMI [dist=poisson;link=log;main=both;maxc=30;prin=mo,sum,bipl,diag;\ axes=3;seed=183639]\ a;nbin=*;row=geno;colu=nema;\ cook=cook;fitt=fit;resi=residual;workv=z; linearp=nu; bipl=bip prin bip[1,2] prin bip[3,4]
Lampiran 12. Perintah GENSTAT untuk Procrustes ROTATE [PRINT=rotations,residuals,sums; SCALING=yes; STANDARDIZE=centre,normalize;\ SUPPRESS=no] XINPUT=MX; YINPUT=MXX
Lampiran