II. TINJAUAN PUSTAKA
2.1 Percobaan Multilokasi Percobaan multilokasi merupakan serangkaian percobaan yang serupa di beberapa lokasi yang mempunyai rancangan percobaan dan perlakuan yang sama. Uji multilokasi untuk
varietas tanaman pangan membutuhkan minimal 16 set
percobaan dalam satu musim di 16 lokasi yang berbeda, atau 10 lokasi dengan dua musim (20 set percobaan) (Fahriza, 2008). Model linier untuk percobaan multilokasi dengan genotipe sebagai perlakuan adalah sebagai berikut:
y ijk = μ + τ i + ρ k(j) + γ j + δ ij + ε ijk dengan:
y ijk
= respon dari genotipe ke-i pada lokasi ke-j dalam kelompok ke-k
μ
= nilai rata-rata umum
τi
= pengaruh genotipe ke-i, i=1,2,….a
ρ k(j)
= pengaruh kelompok ke-k tersarang pada lokasi ke-j, k=1,2….r
γj
= pengaruh lokasi ke-j, j=1,2…b
δ ij
= pengaruh interaksi genotipe ke-i dengan lokasi ke-j
ε ijk
= pengaruh sisaan dari genotipe ke-i dalam kelompok ke-k yang dilakukan di lokasi ke-j
Tabel 2. 1. Analisis Ragam Model Acak (Faktor A dan Faktor B acak) Sumber keragaman
Derajat bebas (Db)
Jumlah kuadrat (JK)
Kuadrat tengah (KT)
τ
a-1
JKA
KTA
γ
b-1
JKB
KTB
δ Galat Total
(a-1)(b-1) ab(r-1) abr-1
JKAB JKG JKT
KTAB KTG
2
Nilai Harapan Kuadrat tengah E(KT)
σε2 + r σ δ 2 + br στ 2 σε2 + r σδ 2 + ar σγ2 σε2 + r σδ 2 σε2
F
E(KTA)/E(KTAB) E(KTB)/E(KTAB) E(KTAB)/E(KTG)
Tabel 2. 2. Analisis Ragam Model Campuran Sumber keragaman
Derajat bebas (Db)
τ γ
a-1 b-1
δ
(a-1)(b-1)
Galat Total
ab(r-1) abr-1
Jumlah kuadrat (JK)
Kuadrat tengah (KT)
JKA JKB
KTA KTB
JKAB
KTAB
JKG JKT
KTG
Nilai Harapan Kuadrat tengah E(KT)
σε2 + br στ 2 σε2 + r (b/(b-1)) σδ2 + ar(∑ βi2)/ (b-1) σε2 + r(b/(b-1)) σδ2 σε2
F
E(KTA)/E(KTG) E(KTB)/E(KTAB)
E(KTAB)/E(KTG)
2.2 Metode Bayes Metode Bayes merupakan salah satu metode pendugaan parameter yang
memanfaatkan informasi awal tentang parameter yang akan diduga (θ) yang biasa disebut sebagai informasi prior (π(θ)) dan informasi dari contoh (x). Informasi awal dan informasi contoh ini dikombinasikan membentuk suatu sebaran yang disebut sebagai sebaran posterior, yang merupakan sebaran dasar pengambilan keputusan atau pengujian dalam metode Bayes (Berger, 1985). Sebaran posterior θ jika diketahui x dilambangkan dengan π(θ|x) didefinisikan sebagai sebaran bersyarat θ jika data contoh x diketahui. Andaikan θ dan X memiliki fungsi kepekatan bersama: h( x, θ ) = π (θ ) f ( x | θ ) ,
dan X memiliki kepekatan marginal: m(x ) = ∫ f ( x | θ )dFπ (θ ) , θ
Maka untuk m(x) ≠ 0 dapat diperoleh sebaran posterior sebagai berikut:
π (θ | x ) =
h ( x, θ ) m( x )
2.2.1 Penentuan Sebaran Prior.
Dugaan parameter menggunakan pendekatan bayes membutuhkan informasi prior
mengenai
parameter-parameter
tersebut.
Informasi
prior
didapatkan
berdasarkan opini dari peneliti yang bersangkutan atau berdasarkan penelitian sebelumnya. Hal lain yang perlu diperhatikan dalam menentukan informasi prior ini adalah konjugasi, dimana posterior mudah didapatkan karena posterior memiliki bentuk (form) yang sama dengan prior (Liu, 2001). Sebaran prior pada parameter di 3
semua lingkungan didefinisikan sebagai sebaran normal dengan nilai tengah nol dan ragam sesuai dengan kondisi yang diinginkan (Edwards and Jannink, 2006). Sebaran prior berikut yang digunakan untuk komputasi dengan metode bayes pada model dengan interaksi:
μ ~ N (μ μ , σ μ2 ) ;
τ ~ N (μτ , σ τ2 ); γ ~ N (μ γ , σ γ2 ) ;
(
)
δ ij ~ N μ δ , σ δ2 ; ij
σ 2 ~ IG(α σ , β σ ) 2.2.2. Sebaran Posterior
Sebaran prior merefleksikan pengetahuan atau keyakinan peneliti tentang parameter, yang pada umumnya informasi ini tersedia (Moore, 1997). Sedangkan sebaran posterior merupakan refleksi dari perbaikan nilai parameter setelah dilakukan observasi contoh. Atau dengan perkataan lain, sebaran posterior merupakan kombinasi antara informasi awal tentang parameter dengan informasi tentang parameter tersebut yang dibawa oleh data observasi. Sebaran posterior merangkum informasi tentang semua nilai yang tidak pasti (termasuk parameter yang tidak terobservasi, hilang, latent, maupun data yang tidak terobservasi) dalam analisis bayes (Gelman, 2002). Data yang dibentuk sebagai likelihood digunakan sebagai bahan untuk memperbaharui informasi prior menjadi sebuah informasi posterior yang siap untuk digunakan sebagai bahan inferensia. Secara analitik, fungsi kepekatan posterior diperoleh dari perkalian antara prior dengan likelihood.
posterior ∝ likelihood × prior Sebaran untuk (Yijk |θ) adalah: ( y ijk | θ ) ~ N (η ij , σ 2 ) dengan η ij = μ + τ i + γ j + δ ij dan θ didefinisikan sebagai (μ ,τ i , γ j , δ ij , σ 2 ) . Sehingga didapat Likelihoodnya sebagai berikut:
(
)
(
)
L(θ ) = ∏ 2πσ 2
−1 2
ijk
= 2πσ 2
⎧ 1 (yijk − η ij )2 ⎫⎬ exp⎨− 2 ⎩ 2σ ⎭
− abr 2
⎧ 1 exp⎨− 2 ⎩ 2σ
∑ (y
− y ij . ) − 2
ijk
ijk
4
r 2σ
2
∑ (y ij
ij .
2⎫ − η ij ) ⎬ ⎭
Sebaran posterior bersama adalah (Liu,2001):
π (θ | y n ) ∝ L(θ ) × π μ (μ ) × π τ (τ ) × π γ (γ ) × π δ (δ ) × π σ (σ 2 ) 2
2⎫ ) − η ⎬ ij 2σ 2 ij ijk ⎭ ⎧⎪ 1 ⎫ ⎧⎪ 1 −1 2 2⎪ 2 −1 2 ( ) × × 2πσ μ2 − μ μ πσ τ i − μτ i exp⎨− 2 exp ⎬ ⎨− μ τ 2 2 i ⎪⎭ ⎪⎩ 2σ μ ⎪⎩ 2σ τ i
(
= 2πσ 2
(
)
− abr 2
∑ (y
− yij. ) − 2
ijk
(
)
(
× 2πσ γ2j ×
⎧ 1 exp⎨− 2 ⎩ 2σ
)
−1 2
( )
βα 1 Γ(α ) σ
⎧⎪ 1 exp⎨− γ j − μγ j 2 2 σ ⎪⎩ γj
α +1
(
⎫
∑ (y
r
)
(
) ⎪⎬ × (2πσ ) 2
⎪⎭
ij .
2
δ ij
−1 2
⎫
) ⎪⎬ 2
⎪⎭
⎧⎪ ⎫ 1 2⎪ − exp⎨− δ μ δ ij ⎬ ij 2 ⎪⎩ 2σ δ ij ⎪⎭
exp⎛⎜ − β ⎞⎟ σ⎠ ⎝
Sebaran posterior dari masing-masing parameter diperoleh dari perkalian antara prior dari parameter dengan likelihood (Liu, 2001). •
Sebaran posterior untuk μ ⎧
π (μ | τ i , γ j , δ ij , σ 2 ) ∝ exp⎨−
r
⎩ 2σ
2
⎧ r ∝ exp⎨− 2 ⎩ 2σ
∑ (y
ij .
ij
∑ (y
⎧⎪ 1 ⎫ 2⎫ (μ − μ μ )2 ⎪⎬ − η ij ) ⎬ × exp⎨− 2 ⎪⎩ 2σ μ ⎪⎭ ⎭ ⎧⎪ 1 ⎫ 2⎫ 2⎪ ( ) μ μ − μ ) ⎬ × exp⎨− − ⎬ μ 2 ⎪⎩ 2σ μ ⎪⎭ ⎭
ij .
ij
⎧ rabσ 2 + σ 2 ⎪ μ ∝ exp⎨− 2σ 2σ μ2 ⎪⎩
•
⎞ ⎟ ⎟ ⎠
2
⎫ ⎪ ⎬ ⎪⎭
Sebaran posterior untuk τi ⎧
π (τ i | μ , γ j , δ ij , σ 2 ) ∝ exp⎨−
r
⎩ 2σ
2
∑ (y
ij .
ij
⎧ rbσ 2 + σ 2 ⎪ τi ∝ exp⎨− 2σ 2σ τ2i ⎪⎩
•
⎛ rabσ μ2 yK + σ 2 μ μ ⎜μ − ⎜ rabσ μ2 + σ 2 ⎝
⎧⎪ 1 2⎫ − η ij ) ⎬ × exp⎨− τ i − μτ i 2 ⎪⎩ 2σ τ i ⎭
(
⎛ rbσ τ2i τˆi + σ 2 μτ i ⎜τ i − ⎜ rbσ τ2i + σ 2 ⎝
⎞ ⎟ ⎟ ⎠
2
⎫
) ⎪⎬ 2
⎪⎭
⎫ ⎪ ⎬ ⎪⎭
Sebaran posterior untuk γj ⎧
π (γ j | μ ,τ i , δ ij , σ 2 ) ∝ exp⎨−
r
2 ⎩ 2σ
∑ (y
ij .
ij
⎧ raσ 2 + σ 2 γj ⎪ ∝ exp⎨− 2σ 2σ γ2j ⎪⎩
5
⎧⎪ 1 2⎫ γ j − μγ j − η ij ) ⎬ × exp⎨− 2 ⎪⎩ 2σ γ j ⎭
(
⎛ raσ γ2j γˆ j + σ 2 μ γ j ⎜γ − ⎜ j raσ γ2j + σ 2 ⎝
⎞ ⎟ ⎟ ⎠
2
⎫ ⎪ ⎬ ⎪⎭
⎫
) ⎪⎬ 2
⎪⎭
•
Sebaran posterior untuk δij ⎧
π (δ ij | μ ,τ i , γ j , σ 2 ) ∝ exp⎨−
r
2 ⎩ 2σ
∑ (y
ij .
ij
⎧ rσ 2 + σ 2 δ ij ⎪ ∝ exp⎨− 2 2 ⎪ 2σ σ δ ij ⎩
•
⎧⎪ 1 2⎫ δ ij − μ δ ij − η ij ) ⎬ × exp⎨− 2 ⎪⎩ 2σ δ ij ⎭
(
2 ˆ 2 ⎛ ⎜ δ − rσ δ ij δ ij + σ μ δ ij ⎜ ij rσ δ2ij + σ 2 ⎝
⎞ ⎟ ⎟ ⎠
2
⎫
) ⎪⎬ 2
⎪⎭
⎫ ⎪ ⎬ ⎪ ⎭
Sebaran posterior untuk σ 2 ⎧
2⎫ − η ij ) ⎬ × π σ 2 σ 2 | α σ , β σ ⎩ 2σ ij ⎭ ⎡ abr 1 2⎤ ∝ IG ⎢ + α σ , β σ + ∑ ( y ijk − η ij ) ⎥ 2 ijk ⎦ ⎣ 2
π (σ 2 | μ ,τ i , γ j , δ ij ) ∝ exp⎨−
r
2
∑ (y
ij .
(
)
2.3. Gibbs Sampling Gibbs sampling adalah suatu teknik untuk membangkitkan peubah acak dari
sebaran (marjinal) secara tidak langsung, tanpa perlu menghitung fungsi kepekatannya (Casella & George, 1992). Dengan menggunakan teknik Gibbs sampling, kita dapat menghindari perhitungan yang sulit. Gibbs sampling merupakan salah satu metode untuk membangun algoritma Markov Chain Monte Carlo (MCMC). Algoritma MCMC diimplementasikan dengan cara mengambil contoh berulang-ulang dari p sebaran posterior bersyarat [θ1|θ2, ..., θp], ..., [θp|θ1, ..., θp−1] (Albert, 2007). Gibbs Sampling bisa diterapkan apabila distribusi probabilitas bersama (joint probability distribution) tidak diketahui secara eksplisit, tetapi distribusi bersyarat (conditional distribution) dari tiap-tiap variabel diketahui. Algoritma Gibbs sampling bisa dituliskan sebagai berikut: 1. Tentukan nilai awal θ 0 = (θ 1(0 ) , K , θ p(0 ) ) 2. Ulangi langkah berikut untuk l= 1,2,…,M Bangkitkan Θ1
(l +1)
dari f1 (θ1 | θ 2(l ) ,θ 3(l ) , K , θ p(l ) )
(l +1)
dari f 2 (θ 2 | θ 1(l +1) , θ 3(l ) , K , θ p(l ) )
(l +1)
dari f p (θ p | θ1(l +1) , θ 2(l +1) , K , θ p(l−+11) )
Bangkitkan Θ 2 M
Bangkitkan Θ p
{
3. Simpan nilai θ 1 , θ 2 ,K ,θ M
}
6
Fungsi kepekatan f,,f2,…,fp disebut distribusi bersyarat penuh yang digunakan untuk simulasi. Walaupun dalam dimensi tinggi semua simulasi adalah univariate. Masalah utama yang menjamin kesuksesan implementasi simulasi menggunakan MCMC dalah jumlah iterasi yang diperlukan sampai rantai markov mendekati kondisi stasioner (panjang periode burn-in). Sebanyak 100 – 1000 iterasi sudah cukup sebagai periode burn-in jika kita gunakan dugaan MKT atau
penduga
kemungkinan maksimum (PKM) sebagai nilai awal (Liu,2001). 2.4. Bias dan MSE Penduga parameter yang dihasilkan, diharapkan memiliki tingkat ketepatan
yang tinggi dimana secara rata-rata nilainya sesuai dengan nilai parameter. Penduga seperti ini disebut penduga tak bias. Bias dari penduga dapat diukur sebagai berikut
() ()
(Lebanon, 2006): Bias δˆ = E δˆ − δ . Ada hal yang lebih penting dalam mengukur kinerja penduga selain hanya dengan ketidakbiasan. Mean Square Error (MSE) merupakan salah satu indikator terpenting dalam mengevaluasi presisi dari suatu penduga. MSE dapat mengukur
error yang dihasilkan dari suatu penduga. Nilai MSE adalah sebagai berikut
()
(
)
()
()
2 MSE δˆ = E ⎛⎜ δˆ − δ ⎞⎟ = var δˆ + Bias 2 δˆ . ⎝ ⎠
2.5. Analisis AMMI Analisis AMMI merupakan gabungan dari sidik ragam pada pengaruh aditif
dengan analisis komponen utama pada pengaruh multiplikatif. Pengaruh multiplikatif diperoleh dari penguraian interaksi genotipe dengan lokasi menjadi komponen utama interaksi (KUI). Interpretasi analisis AMMI menggunakan biplot.
2.5.1. Pemodelan Analisis AMMI
Langkah awal untuk memulai analisis AMMI adalah melihat pengaruh aditif genotipe dan lokasi masing-masing menggunakan sidik ragam dan kemudian dibuat bentuk multiplikatif interaksi genotipe x lokasi dengan menggunakan analisis komponen utama. Bentuk multiplikatif diperoleh dari penguraian interaksi genotipe dengan lokasi menjadi komponen utama interaksi (KUI). Penguraian pengaruh interaksi genotipe dengan lokasi mengikuti persamaan sebagai: δij = λ vi1s j1 + ....+ λ vims jm + φij = 1 m
m
∑
n =1
λ n v in s jn + φ ij
7
dengan: m = banyaknya KUI yang nyata pada taraf 5%, sehingga persamaan model linier percobaan multilokasi dengan analisis AMMI menjadi: m yijk = μ + τi + ρk(j)+ γ j + ∑ n=1
λn vins jn + φij + εijk
dengan: y ijk
= respon dari genotipe ke-i pada lokasi ke-j dalam kelompok ke-k
μ
= nilai rata-rata umum
τi
= pengaruh genotipe ke-i, i=1,2,….g
ρ k(j) = pengaruh kelompok ke-k tersarang pada lokasi ke-j, k=1,2….r γj λn
= pengaruh lokasi ke-j, j=1,2…l = nilai singular untuk komponen bilinier ke-n, λ1 ≥ λ2 ≥ ... ≥ λm
v in
= pengaruh ganda genotipe ke-i melalui komponen bilinier ke-n
s jn
= pengaruh ganda lokasi ke-j melalui komponen bilinier ke-n
φij
= sisaan dari pemodelan linier
ε ijk = pengaruh sisaan dari genotipe ke-i dalam kelompok ke-k yang dilakukan di lokasi ke-j
n
= banyaknya KUI yang dipertahankan dalam model
2.5.2. Perhitungan Jumlah Kuadrat
Pengaruh aditif genotipe dan lokasi dihitung sebagaimana umumnya pada analisis ragam, tetapi berdasarkan pada data rataan per genotipe x lokasi. Pengaruh ganda genotipe dan lokasi pada interaksi diduga dengan z ij = y ij . − y i.. − y. j . + y...
sehingga jumlah kuadrat interaksi dapat diturunkan sebagai berikut: JK (GL) = r ∑ z ij2 = r ∑ ( yij. − yi.. − y. j. + y... )
2
i. j
= r teras( zz' )
8
Berdasarkan teorema pada aljabar matriks bahwa teras dari suatu matriks sama dengan jumlah seluruh akar ciri matriks tersebut, tr ( n An ) = ∑ λ i , maka jumlah i kuadrat untuk pengaruh interaksi komponen ke-n adalah akar ciri ke-n pada pemodelan bilinier tersebut (λn ) , jika analisis ragam dilakukan terhadap rataan per genotipe x lokasi. Jika analisis ragam dilakukan terhadap data sebenarnya maka jumlah kuadratnya adalah banyak ulangan kali akar ciri ke-n (r λ n ) . Pengujian masing-masing komponen ini dilakukan dengan membandingkannya terhadap kuadrat tengah galat gabungan.
2.5.3. Penguraian Nilai Singular
Penguraian nilai singular matriks dugaan pengaruh interaksi digunakan untuk menduga pengaruh interaksi genotipe x lokasi. Penguraian dilakukan dengan memodelkan matriks tersebut sebagai perkalian matriks : Z = U L A’ Dengan Z adalah matriks data terpusat, berukuran g x l; L adalah matriks diagonal akar dari akar ciri positif bukan nol dari Z’Z, berukuran m x m. Kolom-kolom matriks A adalah vektor ciri-vektor ciri dari matriks Z’Z, A merupakan matriks ortonormal; dan U berupa matriks ortonormal, dirumuskan sebagai : U = Z A L-1 2.5.4. Nilai Komponen AMMI
Pengaruh ganda genotipe ke-i diduga melalui unsur-unsur matriks A pada baris ke-i kolom ke-n, sedangkan penduga dari pengaruh ganda lokasi ke-j adalah 2 2 = ∑ s jn = 1 elemen matriks U pada baris ke-j kolom ke-n dengan kendala ∑ v in
untuk n= 1,2….,m
dan ∑i v in v ' = ∑ j s jn s ' = 0 untuk n ≠ n’. Unsur-unsur in jn
diagonal matriks L merupakan penduga untuk λ n . k
Skor komponen ke-n untuk genotipe ke-i adalah λ n v in dan untuk lokasi ke-j adalah λ n
1− k
s jn .
Penduga untuk interaksi genotipe dengan lokasi diperoleh dari
perkalian nilai komponen genotipe dan nilai komponen lokasi. Dengan mendefinisikan
Lk (0 ≤ k ≤ 1 ) sebagai matriks diagonal yang unsur-unsur
diagonalnya berupa elemen-elemen matriks L dipangkatkan k. Demikian juga untuk
9
matriks L1−k dan G = ULk serta H = AL1−k , maka hasil penguraian nilai singular dapat ditulis dalam bentuk : Z = GH
'
Sehingga dugaan nilai komponen untuk genotipe adalah kolom-kolom matriks G dan dugaan nilai komponen untuk lokasi adalah kolom-kolom matriks H. Nilai k yang digunakan pada analisis AMMI adalah ½.
2.5.5. Penentuan Banyaknya Komponen AMMI
Metode yang digunakan untuk menentukan banyaknya Komponen Utama Interaksi (KUI) yang dipertahankan dalam model AMMI (Gauch, 1988 dalam Mattjik 2000) yaitu : 1.Metode Keberhasilan Total (postdictive success) Metode ini berhubungan dengan kemampuan suatu model tereduksi untuk menduga data yang digunakan dalam membangun model tersebut. Banyaknya komponen AMMI sesuai dengan banyaknya sumbu KUI yang nyata pada uji-F analisis ragam. Untuk sumbu KUI yang tidak nyata digabungkan dengan sisaan. Metode ini diusulkan oleh Gollob (1986) yang selanjutnya direkomendasikan oleh Gauch (1988). Tabel analisis AMMI (Tabel 2.3) merupakan perluasan dari tabel penguraian jumlah kuadrat interaksi menjadi beberapa jumlah kuadrat KUI. Tabel 2. 3. Tabel analisis ragam AMMI Sumber Db
JK
Lingkungan
l-1
JKL
Blok(Lingk.)
l(r-1)
JKB
Genotipe
g-1
JKGen
Gen*Lingk.
(l-1)(g-1)
JK(L*G)
KUI-1
g+l-1-2(1)
JKKUI-1
KUI-2
g+l-1-2(2)
JKKUI-2
...................
..............
..............
KUI-m
g+l-1-2(m)
JKKUI-m
Sisaan
Pengurangan
JKSisaan
Galat gab.
l(g-1)(r-1)
JKG
Total
lgr-1
10
2.Metode Keberhasilan Ramalan (predictive success) Metode ini berhubungan dengan kemampuan suatu model dugaan untuk memprediksi data lain yang sejenis tetapi tidak digunakan dalam membangun model tersebut (data validasi). Penentuan banyaknya sumbu komponen utama dilakukan dengan validasi silang yaitu membagi data menjadi dua kelompok, satu kelompok untuk membangun model dan kelompok lain dipakai untuk validasi (menentukan kuadrat selisih). Teknik ini dilakukan berulang-ulang, pada tiap ulangan dibangun model dengan sumbu komponen utama. Banyaknya KUI terbaik adalah model dengan rataan akar kuadrat tengah sisaan (root means square different= RMSPD) terkecil.
∑ ∑ (xˆ g
RMSPD =
l
i =1 j =1
− x ij )
2
ij
g .l
2.5.6. Selang Kepercayaan Elips
Selang kepercayaan Elips adalah selang kepercayaan pada biplot dengan pusat (0,0) untuk identifikasi genotipe stabil. KUI2
KUI2 Tidak Stabil
Stabil r2
r2 r1
0.0
KUI1
r1
0.0
KUI1
Gambar1. 1. Biplot AMMI-2 Proses pembuatan elips menggunakan formulasi sebagai berikut : ri = ± λi
2(n − 1) Fp,n − p (α ) n (n − 2 )
dengan : ri
: panjang jari-jari, i=1 untuk jari-jari panjang, i=2 untuk jari-jari pendek
n
: banyaknya pengamatan (genotipe + lingkungan)
λi2
: akar ciri ke-i dari matriks koragam (S) skor komponen genotipe lingkungan 11
λi
: nilai singular dari matriks koragam (S) KUI1 dan KUI2
F2,n−2(α ) : nilai sebaran F dengan db1=2 dan db2=n-2 pada taraf
Sehingga rumus diatas dapat disederhanakan sebagai berikut : ri = ± λi
2(n − 1) F2, n − 2 (α ) n (n − 2)
12
α =5 %