---
BabXIVAnalisaVariance
KAT A KUNCI
analisa variance suatu metode untuk menguji hipotesis bahwa beberapa kelompok yang berbeda semuanya mempunyai rata-rata yang sarna. tabel ANOVA suatu tabel yang merangkum hasil dari perhitungan analisa variance analisa variance dua cara prosedur pengujian yang dapat diterapkan pada suatu tabel bilangan untuk menguji dua hipotesis; (1)tidak ada perbedaan yang signifikan diantara barisbaris; dan (2) tidak ada perbedaan yang signifIkan diantara kolom-kolom. PENGUJIANTERHAOAPKESAMAANOARI BEBERAPARATA-RATA Misalnya kita mengamati nilai-nilai suatu tes kemarnpuan khusus tiga kelompok berbeda yang masing-masing terdiri dari 10 orang. Hasilnya adalah sbb: kelompok a: 88,92,91,89,89,86,92,86,89,89 kelompok b: 91, 92, 85, 94, 93,87,87,92,91,89 kelompok c: 87,88,95,88,92,87,89,88,87,88 Nilairata-rata untuktigakelompok tersebutdekatsatusarnalain.Layakuntukmenganggap bahwa pada kenyatannya tidak ada perbedaan kemampuan diantara kelompok-kelompok, dan perbedaan yang terdapat pada nilai rata-rata terjadi semata-mata karena kebetulan. Misalnya kita meneliti nilai-nilai dari tiga kelompok yang berbeda dan hasilnya sebagai berikut: kelompok d: 87,94,91,89,89,84,92,86,89,89 kelompok e: 82,76,84,79,77,84,81,69,79,74 kelompok f: 69,79,67,64,65,69,69,64,72,66 Pada kasus ini narnpak jelas bahwa terdapat perbedaan kemarnpuan yang nyata diantara ketiga kelompok tersebut. Dengan kata lain, kita dapat menolak hipotesis bahwa perbedaan yang diarnati diantara kelompok-kelompok tersebut semata-mata terjadi karena kebetulan.
188
Dari kedua kejadian ini jelas bahwa terdapat perbedaan yang signiftkan diantara nilainilai rata-rata dari tiga kelompok dan ada yang tidak. Meskipun demikian, secara umum, sulit untuk mengatakan apakah perbedaan dari nilai-nilai tersebut signiftkan atau random. Kita perlu mempelajari metode barn, yaitu analisa variance. Misalnya kita mempunyai m
=3
kelompok (kelompok a, kelompok b, kelompok c), dan ada n orang pada masing-masing kelompok. Anggap bahwa kita tabu bahwa nilai kemarnpuan untuk masing-masing orang dalarn tiap kelompok merupakan distribusi tersebut sarna untuk ketiga kelompok. !la'adalah rata-rata yang tidak diketabui dari nilai tes kemarnpuan untuk kelompk a, 1\ adalah rata-rata dari kelompok b, dan !lcadalah rata-rata dari kelompok c. Tugas kita adalah menguji hipotesis nol:
Dengan kata lain, Hipotesis nol menyatakan bahwa nilai rata-rata untuk tiap kelompok sarna. Hipotesis altematif menyatakan bahwa nilai rata-rata adalah tidak sarna. Pertama-tama, yang harns dilakukan adalah menghitung a, b, c (rata-rata sarnpel uotuk tiap sarnpel). Jika a, b, c dekat satu sarna lain, akan menjadi lebih mudah bagi kita untuk menerima hipotesis bahwa !la' 1\, dan !lcadalah sarna. Kita dapat menghitung rata-rata x untuk semua bilangan:
a+b+c
-x=
a+b+c
= m
3
Kita dapat menghitung juga variance sampel (versi 2) untuk tiga rata-rata ini (kita menyebut variance itu S*2):
m-I Semakin besar S*2,semakin kecil kemungkinan kita untuk menerima hipotesis nol. Kita juga harns melihat variance sarnpel untuk masing-masing sarnpel: n
Sa*2
=L.1=1
(aI - a)2
n
Sb*2
n-I
=Li=1
(b.I - b)2
(c.I - C)2 SC*2
n-I
L n -I
untuk menghitung rata-rata dari tiga variance sarnpel (disebut S2): sa*2 + Sb*2 + SC*2 S*2 =
3 189 -
-
-
Semakin besar ketiga variance ini, semakin besar kemungkinan kita mendapati a, b, c menyebar, meskipun ketiganya berasal dari distribusi dengan rata-rata yang sama. Sebagai contoh, misalnya nilai pengarnatan dari a, b, dan c adalah 500, 400, dan 450. Jika sa2= Sb2= sc2= 1, kita tahu pasti bahwa sangat tidak mungkin a, b, dan c mempunyai nilai pengamatan yang berasal dari distribusi dengan rata-rata yang sarna. Sebaliknyajika gSa2= sc2= 10,000, cukup mungkin kita melihat a, b, dan c menyebar, meskipun hipotesis nolnya benar. Sehingga semakin besar S2,semakin besar kemungkinan kita menerima hipotesis nol. Kita akan menghitung statistik sbb (disebut F):
Jika nilai F besar, kita akan menolak hipotesis nol. Kita dapat menunjukkan bahwa jika hipotesis nol benar, maka statistik F akan mempunyai suatu distribusi F dengan derajat kebebasan m - 1 dan m(n - 1) (m adalah jumlah kelompok, dan n adalah jumlah anggota masing-masing kelompok). Distribusi F dijelaskan di bab 8, dan tabel A3-6 menunjukkan nilai untuk fungsi distribusi kumulatif. Pada contoh sebelumnya, kita mempunyai m = 3 dan n = 10. Jadi statistik F akan mempunyai derajat kebebaan 3 dan 27. Tabel A3-6 memperlihatkan bahwa statistik Fnya mempunyai kesempatan 95% untuk menjadi kurang dari 3.3. Oleh karena itu jika statistik F yang diarnati lebih besar dari 3.3, kita akan menolak hipotesis nol, jika tidak, kita akan menerima hipotesis nol. Pada contoh pertarna, statistik F adalah 4,133/6,693 = 0,6175..Seperti telah disebutkan di atas, kita harns menerima hipotesisnya. Pada contoh kedua, nilai F adalah 1061/16,996 = 62,426, jadi kita harns menolak hipotesisnya. PROSEDURUMUM UNTUKUJI ANAL/SAVARIANCE (diasumsikan bahwa anda mempunyai m kelompok, yang masing-:masingmempunyai n anggota) 1. Hitung rata-rata sarnpel untuk tiap kelompok: a= n b= n c= n 190
2.
Hitung rata-rata dari semua rata-rata:
- a + b + c+ ... x= m 3.
Hitung variance sampel dari rata-rata:
(a -x)2+(b -X)2+(C _X)2 S*2
= m -1
4.
Hitung variance sampel untuk tiap kelompok:
-2 -2 -2 (a(- a) + (~ - a) +... + (an- a) n-l
n-l
n-l 5.
Hitung rata-rata semua variance sampel:
m 6.
Hitung nitai statistik F:
F= 7. 8.
Lihat tabel A3-6 untuk mencari nitai kritis untuk distribusi F dengan derajat kebebasan m - 1 dan m (n - 1) Jika nitai yang diamati dari statistik F lebih besar dari nitai kritis, tolak hipotesis DOl.Jika tidak, terima hipotesis DOl.
191 -
-
--
YANG HARUS DIINGAT 1. Prosedur analisis variance digunakan UDtukmenguji apakah beberapa kelompok yang diarnati berasal dari distribusi yang mempunyai rata-rata yang sarna. 2. Dalarn analisa variance statistikF dapat dihitung. 3. Jika hipotesis nol benar dan rata-rata semua kelOmpokbenar-benar sarna,maka statistik F akan mempunyai distribusi F. 4. Jika nilai statistik F yang dihtiung lebih besar dari nilai kristis yang ditemukan pada tabelA3-6, maka hipotesis nol (dimana rata-rata dari masing-masing kelompok sarna) dttolak. SUM OF SQUARES Pendekatan analisa varaince dapat dipaharni lebih jauh lagi dengan melihat jumlah dari deviasi kuadrat (atau jumlah kuadrat). Misalkan kita mempunyai m kelompok, masingmasing dengan n anggota.Tiap kelompok diperlukan secara berbeda dalam beberap hal, dan tujuan kita akan untukmelihat apakah perlakuan tersebut benar-benarmenimbulkan beberapa perbedaan. Sebagai contoh, kita mempunyai kelompok orang yang diberi obat yang belainan. Kita akan menggunakan xij untuk lemabangkan anggota ke i dari kelompi ke j. Catat bahwa kita membutuhkan dua subscript untukmengidentifikasi tiap e1emen khusus. Sebagai contoh, jika kita mempunyai m = 3 kelompok dengan n = 5 anggota :
kip 1
kip 2
kip 3
16 13 36 29 38
38 21 36 39 26
19 14 17 15 12
Kita dapat melarnbangkan tiap e1emen seperti ini:
= 16 X21 = 13 = 36 = 29 = 18
Xli
X12
= 38
X31
=21 X32 =36
X41
X22
X51
X22
= 39 X52 = 26
X13 X23 X33
= 19 = 14 = 17
= 15 X53 = 12 X23
Untuk merumuskan jumlah dari semua item; kita perlu menggunakan dua sigma: n T=L
192
m L..Xl) 1=1j=1
Rumus ini dapat diuraikan seperti ini: n
+ X.I2 + ... + X.1m) T = L (X. 1l i=1
= XII+ Xl2+... + Xlm+ S21+ X22+ ... + X2m = Xnl + Xn2+ ... + Xnm
Untuk contoh kita tadi: T =16+19+ 13 + 21 + 36 + 36 + 29 + 39 + 18 + 26 + =349
14 + 17 + 15 + 12
Kita akan menggunakan x (x dengan dua garis) untuk melambangkan rata-rata dari semua elemen kita menyebutkan grand mean (rata-rata besar): T x -mn
=
n m ~ ~ x.. ""i=l ""j=l IJ
mn 349
-
= 23.267 untuk contoh kita
15 TOTAL SUM OF SQUARES Untuk tiap elemen dari daftar dapat dihitung berapa jarak elemen tersebut dari grand mean x : (jarak dari x..IJ ke x)
=Ix..IJ
xI
Setelah itu, kita akan mengkuadratkan jarak ini: xI (jarak dari x..ke ~
) = (x..~ - X)2 193 --
--
---
dan kemudian semua jarak kuadrat tersebut dijumlahkan: n
m
TIS = I
I(x..IJ X)2
1=1 j=1
Jumlah terse but kita sebut sebagai total sum of squares atau (TSS). Untuk kasus kita perhitungannya sbb:
TSS
=
(16-23,267)2+ (38-23,267)2+ (19-23,267) + (13-23,267)2+ (21-23,267)2+ (14 -23,267) + (36-23),267)2+ (36-23,267)2+ (17-23,267) + (29-23,267)2+ (39-23,267)2+ (15-23, 267) + (18-23,267)2+ (26-23,267)2+ (12-23,267) 1358,93
=
Kita akan melihat beberapa perbedaan sum of squares. Catat bahwa sum of squares adalah sarna dengan varaince tetapi tidak dibagi dengan n. Variance dihitung dari jumlah kuadrat rata-rata, tetapi kita akan melihat beberapa jenis lain sum of squares. Untuk menganalisis total sum of squares, kita perlu memecahkan menjadi dua bagian. Kita tahu bahwajika hipotesis nol benar, rata-rata populasi adalah sarnauntuk tiap kelompok dan penyimpangan tiap elemen dari grand mean hanya terjadi karena kebetulan. Sebaliknya jika rata-rata populasi berbeda, ada dua sebab mengapa elemen dapat menyimpan dari grand mean: (1) karena rata-rata kelompoknya berbeda dari rata-rata keseluruhan populasi, dan (2) karena adanya perbedaan kesempatan dalarn kelompoknya. Oleh karena itu, kita akan membagi total sum of squares menjadi dua bagian: bagian yang terjadi karena penyimpangan elemen-elemen individu dari rata-rata kelompok mereka, dan bagian bagian yang terjadi karena penyimpangan rata-rata kelompok dari grand mean. Kita dapat menuliskan formula TSS sebagai berikut: n
m
TSS = I I(x..1J- X)2 i=1 j=1 n
=
m
I I(x..IJ - XJ') - (X.J - x)]2 i=1 j=1
x
Kita akan menggunakan J. untuk mengartikan rata-rata sarnpel dari kelompok j. Kita tiak melakukan apa-apa tehadap rumus asal kita tetapi menambah dan mengurangi xj. Sekarang kita memiliki: n m
TSS = I I[(x..IJ- x.)2+ J (x.J- X)2+ 2(x.. 1J- x.)J (xj - x)] i=1j=1 194
Akan menjadi mudah bahwa jika penjumlahan ganda digantikan oleh persamaan terakhir, hasilnya selalu nol. Oleh karena itu yang tinggal: n
TSS
= I,
m
I,[(X..IJ - X?J + <X.X)2] J
;=1 j=1
Kita dapat membagi persamaan tersebut menjadi dua penjumlahan ganda: n
m
n
m
TSS =I, I,(X..X)2 1J X? J I, I,<X.J ;=1 j=1
;=1 j=1
Karena bagian yang terakhir tidak berhubungan dengan i, kita dapat mengganti penjumlahan W dengan mengalikannya dengan n: n
TSS
= I,
m
m
I,(X..IJ X J? n I,<x.J - X)2
;=1 j=1
j=1
ERROR SUM OF SQUARES Kita sekarang telah memecahkan total sum of squares menjadi dua komponen. Bagian pertama mewakili deviasi masing-masing elemen terhadap rata-rata kelompoknya. Kita menganggap perbedaan ini timbul karena faktor acak yang tidak diketahui (disebut statistical error), dan kita akan menyebut hal ini sebagai error sum of squares atau ERSS. n
TSS=I,
m
I,(x..-x? IJ
J
;=1 j=1
TREATMENT SUM OF SQUARES Bagian kedua dari total sum of squares mewakili deviasi rata-rata tiap kelompok. Kita menganggap deviasi ini timbul karena kepada tiap-tiap kelompok diberikan treatment yang berbeda, kita menyebut hal ini treatment sum of squares atau TRSS. m
T9S
=n
I,<x.J - X)2 j=1
Nampak bahwa TSS
= ERSS + TRSS. Semakin besar treatment sum of squares yang
terjadi; semakin kecil kemungkinan kita menerima hipotesis nol bahwa treatment tersebut tidak berpengaruh. VARIANCE RATA-RATA KUADRAT Tiap statistik sum of squares mempunyai hubungan dengan suatu angka yang disebut derajat kebebasan. Derajat kebebasan dari TRSS adalah m - I. Derajat kebebasan dari ERSS adalah m(n
- 1) (kita tambahkan
m dengan sum of squares yang berbeda untuki tiap sampel.
195 --
Tiap sum of squares mempunyai derajat kebebasan n - 1). Jika sum of squares dibagi dengan derajat kebebasannya hasilnya disebut rata-rata variance kuadrat (mean square variance).
TRSS (treatment mean square variance)
=
m- 1 ERSS
=
(error mean square variance)
m(n - 1) Jika kita membagi treatment mean square variance dengan error-eman square variance maka hasilnya sama persis dengan statistik F yang kita gunakan sebelumnya:
TRSS
m -1
F= ERSS m (n - 1) Untuk contoh kita, kita punya: m-l= 2 TRSS = 694,533 ERSS = 664,400 m(n - 1)= 12 694,533 2
F= 664,400 12
Jika hipotesis nol benar dan treatment tidak berpengaruh, maka statistik F akan punya distribusi F dengan derajat keOObasan2 dan 12. Nilai kritis untuk uji 5% adalah 3,9 sehingga dalam kasus ini kita menolak Hipotesis nol. TABEL ANOVA Informasi tentang pengujian tersebut dapat dirangkum dalam suatu taOOlyang dikenal dengan nama tabel ANOV A (anova merupakan kependekan dari analisa variance). Tabel ANOV A untui contoh kita adalah sbb:
196
sumber variasi
sum of squares
derajat kebebasan
mean square variance
rasio F
diantara rata-rata (treatment)
694,533
2
347,267
6,272
di dalam sampel (error)
664,400
12
55,367
total
1.368,933
14
Tabel tersebut memuat informasi tentang sum of squares, derajat kebebasannya, dan statistik F. Catat bahwa Total sum of squares mempunyai derajat kebebasan mn - 1 = 14, yang merupakan derajat kebebasan dari TRSS dan ERSS. Rumus umum untuk tabel ANOV A adalah sbb:
sumber variasi
sumo f squares
diantara rata-rata
m
TRSS =n L(x.-x)2 J n
ERSS
total
rasio F
TRSS
TRSS/(m-l)
1
m
= L Lm I
(error)
m-l
mean square variance
j=1
(treatment)
di dalam sampel
derajat kebebasan
m (n -1)
j=1
TSS=TRSS+ERRS
ERSS
m (n-l)
(x..IJ X.)2 J mn-l
ERSS/[m(n-l)
-
DUA PERTIMBANGAN DALAM PENGGUNAAN UJI ANALISIS VARIANS Ada dua hal yang hams diingat jika menggunakan uji analisa variance: Pertama, ingat bahwa model analisa variance mengasumsikan bahwa variance adalah sama untuk tiap kelompok. Jika anda mengobservasi variance sample untuk kelompok yang berbeda perbedaannya menyolok, maka pendekatan analisa variance menjadi tidak tepat untuk digunakan. Kedua, jika anda memutuskan untuk menolak hipotesis nol, jmaka anda hams yakin bahwa rata-rata dari kelompok tidak sama semuanya. meski-un demikian, anda tidak tabu 197
apakah semua rata-rata tersebut tidak sarna, atau mereka semua sarna tetapi hanya ada satu rata-rata yang berbeda, atau barangkali ada pola lain tertentu untuk rata-rata tersebut. Anda perlu untuk melakukan penelitian lebih lanjut untuk menentukan dengan tepat mengapa perbedaan tersebut terjadi.
ANALISA VARIANCE DENGAN UKURAN SAMPLE YANG TIDAK SAMA Mungkin terjadi jumlah sample yang kita miliki tidak semua sarna ukurannya. Untuk kasus. seperti ini rumus analisa variansnya menjadi lebih rumit, tetapi kita masih dapat menggunakan analisa sum of squares kita untuk memperluas penerapanmetrode tersebut.Misalnya kita mempunyai m sarnpel yang berbeda dengan nl elemen pada sampel 1, n2elemen pada sampel 2, dan seterusnya sarnpai nm elemen pada sarnpel m. Kita akan menuliskan Xijuntuk menggarnbarkan elemen kei dari sampel ke j. Jumlah elemen pada semua sarnpel akan dinarnakan N: N =nl + n2 + ...m+nm=
I j=1 nj
Kita dapat menghitung rata-rata untuk tiap kelompok:
l.
~ x..
IJ
1=1
x=j
n.
J
dan grand mean-nya
Im~l. x..IJ
j=II=1 X.= J
n. J
Perhatikan bahwa penjumlahan gandanya lebih rumit sekarang. Kita dapat menghitung total sum of squares-nya: o
TSS
=I
oj
I(x..lJ - 'X')2
j=1 i=1
dan kembali dapat memecah total sum of squares: o
TSS = I
oj
m
I(x.. IJ - X J.)2+ L n.J (X.. 1J- 'X')2
j=1 i=1
j=1
bagian yang pertarna adalah error sum of squares:
198
m
TSS
oj
= L L(X..IJ xJY j=1 i=1
yang mempunyai derajat kebebasan n - m. Bagian yang kedua adalah treatment sum of squares: m TRSS
= L (x..IJ- X)2 j=1
yang mempunyai derajat kebebasan m - 1. Dan sekarang kita dapat menghitung statistik F nya:
TRSS m-l
F= ERSS (N - m) yang mempunyai derajat kebebasan m - 1 pada pembilang dan N - m pada penyebut. YANG HARUS DIINGAT 1. Total sum of squares atau TSS) untuk suatu kelompok bilangan terdiri dari deviasi sum of squares semua elemen dari grand mean-nya. 2. Untuk analisa variance, total sum of squares dibagi menjadi dua: treatment sum of squares (TRSS) dan error sum of squares (ERSS) 3. TRSS menunjukkan efek dari perbedaan diantara kelompok-kelompok. 4. Hipotesis nol tentang tidak adanya perbedaan diantara kelompok-kelompok besar kemungkinan ditolak jika TRSSnya relatif lebih besar daripada ERSS 5. Hasil analisa variance dirangkum dalarn suatu tabel ANOVA (lihat hal. 281) ANAL/SA VARIANCEDUA CARA Misalnya jika ingin menguji efektivitas dari tiga jenis alat pengontrol polusi udara pabrik. Untuk melakukan uji tersebut kita harns memasang salah satu alat tersebut pada cerobong asap pabrik untuk periode uji selarna 1minggu. Enarnpabrikyang berbeda tersedia untuk pengujian. Pabrik-pabrik tersebut sangat mirip, tetapi kita tidak yakin bahwa pabrikpabrik tersebut benar-benar sarna. Oleh karena itu bukan merupakan pemikiran yang bagus untuk merencanakan pengujian sbb: Pasang alat a pada pabrik 1 dan 2 selama periode uji Pasang alat b pada pabrik 3 dan 4 selarna periode uji Pasang alat c pada pabrik 5 dan 6 selarna periode uji
199
Anggap bahwa pabrik 1 dan 2 menghasilkan lebih sedikit polusi daripada pabrik-pabrik yang lain. Pada kasus tersebut prosedur pengujian akan cenderung menjadikan alat a terlihat lebih baik daripada alat lainnya walaupun alat-alat tersebut semuanya sarna. Untuk lengkapnya kita harns memasang tiap alat selarna periode uji pada tiap pabrik. Tabel perhitungan polusi kita akan menjadi seperti ini:
Pabrik
Alat a
Alat b
Alat c
1 2 3 4 5 6
50,8 49,5 51,5 48,3 48,8 48,4
53,0 49,2 51,7 49,8 48,1 52,2
49,7 49,1 49,6 49,3 47.1 47,9
Kita dapat memulai dengan menganggap keenarn pabrik tersebut identik dan output polusi yang dihasilkan alat-alat tersebut mengikuti distribusi normal sbb: alat a rata-rata !la' variance a.2 alat b rata-rata 1-\"variance a2 alat c rata-rata !lc' variance a2
Sekarang kita dapat melakukan prosedur standar analisa variance untuk menguji hipotesis nol bahwa tidak ada perbedaan diantara alat-alat tersebut:
Tabel ANOV A-nya adalah sbb:
sumber variance
200
sum of squares
derajat kebebasan
mean square variance
rasio F
diantara rata-rata (treatment)
10,763
2
5,382
2,472
di dalarn sarnpel (error)
32,657
15
2,177'.
total
43,420
17
Nilai kritis 5 persen untuk distribusi F dengan derajat kebebasan 2 dan 15 adalah 2.68. Karena nilai yang diamati kurang dari nilai kritis, kita menerima hipotesis no1bahwa tidak ada perbedaan diantara a1at-alattersebut. Meskipun demikian,kita masih mempunyaikeraguan yang menganggu. Bagaimanajika pabrik-pabrik tersebut tidak identik? Bagaimanajika variasi data po1usiyang diamati terjadi karena adanya perbedaan pada pabrik-pabrik? Pada tabel ANOVAkita telah diasumsikan bahwa semua variasiyang tidak berasal dari perbedaan alat kontrol timbul karena kesalahan statistikal (statistical error) - yang random dan tidak kita ketahui sebabnya. Akan sangat membantu jika kita dapat menentukan berapa banyak variasi yang terjadi karena adanya perbedaan-perbedaan di pabrik. Pola pikir ini mengarahkan kita ke metode barn: analisa variance dua cara (two-way analysis of variance). Metode barn ini memberikan tambahan keuntungan: kita dapat menguji hipotesis bahwa pabrik-pabrik tersebut identik. Secara umum, anggap kita mempunyai m tingkat yang berbeda dari treatment jenis pertama dan n tingkat yang berbeda dari jenis treatment kedua. Pada kasus kita, treatment jenis pertama menggambarkan perbedaan pada alat kontrol polusi udara (jadi m =3) danjenis
treatment yang kedua menggambarkan perbedaan pabrik (jadi n = 6). Kita mempunyai seluruhnya mn tingkat kombinasi treatment yang mungkin, dan kita beranggapan punya satu observasi 6 = 18observasi (pada beberapa kasus anda akan mempunyai/membutuhkan lebih dari satu observasi per kemungkinan treatment, dan pada kasus lain mungkin tidak punya observasi untuk semua kemungkinan. Beberapa buku lanjutan dapat menerangkan apa yang harns dilakukan untuk kasus-kasus tersebut). Kita akan mengatur data dalam suatu aturan yang terdiri darim kolom dan n baris, digunkan xij untuk menunjukkan elemen dari baris ke i dan kolom ke j: tingkat m treatment pertama
1
2
m
1 tingkat n treatment kedu
2
n
Xom
Secara teori kita mengasumsikan bahwa tiap observasi berisi jumlah dari empat efek yang berbeda:
201
-----
---
--
--
---
dimana
J.L
melembangkan keseluruhan rata-rata, dan IJrimelambangkan efek khusus yang
terjadi pada kolom i pada semua observasi di kolom tersebut. Kita memberi r pada larnb~g J.Uitersebut untuk mengingatkan kita bahwa lambang tersebut mewakili kolom i (r =row kolom). Jika tingkat yang berbeda dari trearntnet kedua tidak mempunyai efek, maka semua efek (J.Uisarnpai J..U111) pada kolom ini menjadi nol. Misalkan pada contoh kita pabrik 1 menghasilkan polusi sedikit lebih besar daripada rata-rata dan pabrik 2 menghasilkan polusi sedikit lebih kecil daripada rata-rata. J.U" 1 akan merupakan bilangan positifp dan J.U"2 bilangan negatif. /lCjmelarnbangkan efek khusus pada kolom j. Jika ketiga alat pengontrol polusi tersebut sarna, maka /lC1 = /lC2= /lC3= O.Sebaliknya jika alat 1 mempunyai tingkat polusi yang lebih tinggi dari rata-rata, maka /lC1 akan positif.
=
Ada faktor misterius (selain alat dan pabrik yang mempengaruhi tingkat polusi. Kita lamban gkan random error e.. untuk memasukkan faktor-faktor lain tersebut ke dalarn I)
hitungan. Kita dapat menghitung grand mean dari semua observasi; n
m
L, L,x..I) i=l
j=l
x=
mn
dan menghitung total sum of squares: n
TSS
m
= L, L, (x..I) -
X)2
i=l j=l
BARIS, KOLOM DAN ERROR SUM OF SQUARES Sekarang kita membagi I:SS dalarn tiga bagian: bagian eek kolom (coloum), bagian efek baris (row), dan sisa bagian yang merupakan efek dari error. Kita menggunakan ROWSS untuk melambangkan row sum of squres, COLLSS untuk melambangkan column sum of squres, dan ERSS untuk melarnbangkan error sum of squares. Sehingga: TSS
=ROWSS
+ COLSS + ERSS
Rumus untuk column sum of squares pada dasarnya sarna dengan rumus untuk treatment sum of squares dengan analisis variance satu cara: m
COLSS = n L,(xn. -
X)2
i=l
Pada rumus ini Xijmelarnbangkan rata-rata dri semua elemen di kolom j. Rumus untuk Row~s tarnpak mirip: 202
_._n
ROWSS
= m L (xn. -
X)2
i=1
dimana Xriadalah rata-rata dari semua elemen di baris i. Jika pabrik-pabrik tersebut sangat identik, maka tidak ada alasan bagi rata-rata baris untuk berbeda secara signifIkan terhadap x, sehingga ROWSS akan kedl, COLSS memiliki derajat kebebasan m - I dan ROWSS mempunyai derajat kebebasan n - 1. Untuk mendapatkan error sum of squares, kita perlu mengurangi tiga bagian dari xif Kita akan menggunkan x untuk menaksir rata-rata populasi, Xij- x untuk menaksir efek khusus pada kolom j, dan xriuntuk menaksir efek pada baris i. Sehingga: n
m
ERSS = L L [(x... - x) - exn. - x)F IJ x - exCJ i=l j=1
ERSS mempunyai derajat kebebasan (m - 1) (n - 1) Sekarang kita dapat menghitung contoh kita. Kita perlu menghitung rata-rata tiap baris dan kolom: Pabrik
Alat a
Alat b
Alat c
rata-rata
1 2 3 4 5 6
50,8 49,5 51,5 48,3 48,8 48,4
53,0 49,2 51,7 49,8 48,1 52,2
49,7 49,1 49,6 49,3 47,1 47,9
51,167 49,267 49,267 49,133 48,000 49,500
49,55
50,677
48,783
49,667
'"
rata-rata
Grand mean x =49,667. Kini kita dapat menghitung: TSS = (50,8 - 49,667)2+ (53,0 - 49,667)2+ (49,7 - 49,677)2 + + + + +
(49,5 (51,5 (48,3 (48,8 (48,4
- 49,667)2 - 49,667)2 - 49,667)2 - 49,667)2 - 49,667)2
+ (49,2 + (51,7 + (49,8 + (48,1 + (52,2
- 49,667)2 - 49,667f - 49,667)2 - 49,667)2 - 49,667)2
+ (49,1 + (49,6 + (49,3 + (47,1 + (47,9
- 49,667)2 - 49,667)2 - 49,667)2 - 49,667)2 - 49,667)2
= 43,4 COLSS = 6 x [(49,55 - 49,667)2 + (50,667 - 49,667)2 + (48,783 = 10,8
- 49,667)2]
203
---
ROWSS
=3 x [(51,167 -49,667)2 + (49,267 - 49,667)2 + (50,933 - 49,667)2
+ (49,133 -
49,667)2 + (48 - 49,667)2 + (49,5 - 49,677)2]
= 21,3 ERSS
= 43,4 - 10,8 - 21,3 = 11,3
TABEL ANOVA DUA FAKTOR Sekarang kita dapat menyusun tabel ANOVA dua faktor. Tabel ANOVA dua faktor sangat mirip dengan tabel dengan satu faktor. Perbedaannya hanya terdapat pada sumbar variasi. Kita akan memasukkan sum of sq~ares untuk baris bersarna-sarna dengan derajat kebebasan dan variance rata-rata kuadrat (mean square variance). Tabel ANOV A Faktor
sumber variasi treatment efek 1: kolom (alat kontrol) treatment efek2: baris (pabrik) Error total
sum of squares
derajat kebebasan
mean square variance
rasio F
10,763
2
5,382
4,472
21,313
5
4,263
3,758
11,353
10 17
1,134
43,420
Catat bahwa total sum of squares dan sum of squares yang dihasilkan dari alat kontrol yang berbeda adalah sarna, seperti pada tabel ANOVA yang telah disajikan di depan. Perbedaannya adalah err.or sum of squares lebih kedl karena sebagian besar dari sum of squares yang lalu dulu dianggap error sekarang dianggap karena pengaruh pabrik yang berbeda. Kita sekarang punya dua nilai statistikF. Statistik F yang pertarnamenguji Hipotesis bahwa tidak ada perbedaan diantara kolom-kolom. Hal tersebut sarna dengan: (statistik F untuk kolom)
=
(kolom sum of squares )/(kolom SS drajat kebebasan) (error sum of squares)/(error SS derajat kebebasan)
204
=
COLSS m -1 ERSS (m - 1)(n - 1)
Statistik F yang kedua menguji hipotesis bahwa tidak ada perbedaan diantara baris-baris: (statistik F untuk baris)
=
(baris sum of squares)/(baris SS drajat kebebasan) (error sum of squares)/(error SS derajat kebebasan)
=
COLSS m- 1 ERSS (m - 1) (n - 1)
Ingat bahwa tabel ANOVA satu faktorkita menunjukkanbahwa tidak adaperbedaan diantara ketiga alat tersebut. Sekarang tabel dua faktor akan memberikan kita cerita yang lebih jelas. Statistik F untuk kolom mempunyai derajat kebebasan 2 dan to, dan nilai kritis 5% untuk tabel F adalah 4.1. Nilai yang terhitung lebih besar daripada nilai kritis sehingga kita dapat menolak hipotesis besar daripada nilaikritis sehingga kita dapat menolak hipotesis nol bahwa semua kolom sarna. Demikian juga, statistik F untuk baris mempunyai derajat kebebasah 5 dan to sehingga mempunyai nilai kritis 3.3. Oleh sebab itu kita dapat menolak hipotesis nol kedua, dan kita dapat menyimpulkan bahwa terdapat perbedaan diantara pabrik-pabrik. Masalah uji satu faktor timbul karena pabrik-pabrik itu sendiri ditarnbah dengan banyaknya variabilitas. Sementara itu kita melihat bahwa semua variabilitas tersebut adalah acak. Ada begitu banyak variabilitas yang acak yang mengaburkan fakta bahwa alat-alat tersebut benar-benar berbeda. Dengan menggunakan tabel dua faktor kita dapat memisahkan pengaruh pabrik yang berbeda dari pengaruh alat yang berbeda. Kita dapat menemukan rumus altematif untuk sum of squares yang lebih mudah untuk digunakan menghitung. ANAL/SA VARIANCE DUA CARA: 1.
Jadikan N =mn untuk nilai x, Txuntuk jumlah dari semua nilai dari x, Tx2 untuk jumlah dari kuadrat semua nilai x, Triuntukjumlah semua baris i, dan Tc;untukjumlah kolomj. n m n m T x= L LX.., TX2= L L X..2 IJ IJ ;=1j=1 ;=1 j=1 205
--
m
Tri= I,xjj, j;1
2.
Kemudian hitung n
Tr2 = I, Tn2 (sum ofSquares baris total) t=1 m
TCJ2
= I,T
2
CJ
(sum of squares kolom total)
j;1
3.
Sekarang gunakan rumus ini:
TSS
=T2-x
(TY N
T2C =n T2r =m
COLSS
ROWSS
(TY N (T)2 N T2
=T2x
ERSS
n
T2r
(T)2
m
N
- -+
Contoh untuk rangkuman rumus tersebut adalah sebagai berikut. Matriks data kita adalah sbb; Treatment pertama (3 tingkatan)
treatment kedua (5 tingkatkan)
I 2 3 4 5
1
2
3
18 56 46 100 28
14 59
16 53 50
48 90 31
95 25
Kita dapat melihat dengan jelas dari tabel tersebut bahwa terdapat lebih banyak variabilitas dalam baris-baris dibandingkan dengan dalamkolom-kolom, sehingga kita dapat lebih jauh menduga bagaimana hasil ANOVA-nya. Kita perlu menghitung jumlahnya: 206
1 2 3 4 5 jumlah
1
2
3
jumlah
18 56 46 100 28 248
14
16 53
48 168
59 48
50
144
90 31 242
95 25 239
285 84 729
Sehingga x = 729 Sekarang kita dapat menghitung: T c 2 = 2482 + 2422 + 2392 = 177.189 T r2
= 482 +
1442 + 2852 + 842 = 139.545
Kita juga perlu menghitung Tx2: T x2
= 182+ 142+ 162+ 562 + 592 + 532 + 462+ 482+ 502+ 1002+ 902+ 952 + 282 + 312 + 252. = 46.617
Sekarang kita dapat menggunakan rumus-rumus tersebut:
TSS
= 46.617
COLSS
=
7292 - 152
= 11.187,6
177.189
7292
- -
= 8,4
5
ROWSS
=
152 7292
139.545 -
= 11.085
-
3
152 177.189
ERSS
= 46.617-
139.545 -
5
3
7292 +=93,6 152
207 -
---
Tabel ANOVA-nya adalah sbb: sumber varisi
sum of squares
derajat kebebasan
mean square variance
rasio F
kolom Baris Error
8,4 1.085,6 93,6
2 4 8
4,2 2.771,4 11,7
0,359 236,872
total
11,187
14
Kita dapat melihat dengan jelas bahwa variasi diantara baris-baris adalah berarti sedangkan perbedaan diantara kolom-kolom tidak. YANG HARUS DIINGA T Prosedur analisa variance dua cara digunakan untuk menguji dua hipotesis mengenai susunan bilangan di bawah ini: Hipotesis Noll : tidak ada perbedaan berarti diantara kolom-kolom dalam susunan. Hipotesis No12: tidak ada perbedaan berarti diantara baris-baris dalam susunan.
208