BAB II
LANDASAN TEORI
2.1
Data Kategorik
Data statistik yang diperhatikan dalam setiap analisis atau penelitian pada umumnya memuat banyak variabel numerik maupun variabel kategorik. Sehingga analisis data juga dapat dilakukan dengan memakai kedua macam ukuran variabel tersebut. Akan tetapi, dengan mentransformasikan semua variabel numerik menjadi variabel kategorik (ordinal) maka kita akan mempunyai suatu data baru dengan semua variabel kategorik, yang akan disebut data kategorik. Manfaat atau keuntungan yang dapat diperoleh dengan memakai data kategorik antara lain:
a)
Ruang
yang diperlukan untuk
menyimpan data menjadi sangat
sempit/kecil dibandingkan dengan data aslinya atau data primernya b)
Waktu yang diperlukan untuk melakukan analisis data akan menjadi jauh lebih singkat daripada memakai data primer menjadi sangat kecil
c)
Akhirnya,
hasil
analisis
data
kategorik
dapat
dilakukan
atau
dipertanggungjawabkan atas dasar pemikiran sebagai berikut 1. Pada dasarnya, analisis statistik dilakukan dengan tujuan untuk mempelajari perbedaan atau kesamaan kelompok-kelompok individu yang dibentuk berdasarkan kategori sebuah variabel atau lebih, antara lain perbedaan proporsi (persentase), prevalensi atau insiden suatu peristiwa tertentu antara kelompok individu yang ditinjau. 2. mempelajari
asosiasi
ganda
antar
variabel
kategorik
dengan
menerapkan model log linier, atau model regresi logistik yang meliputi penerapan statistik Rasio Kesamaan atau Rasio Kecenderungan (RK) 3. Model asosiasi (korelasi) antara variabel kategorik, seperti model regresi logistik t dinyatakan telah mempunyai pola yang standard atau baku. Sehingga lebih mudah dapat dipahami dan diulang kembali dengan memakai berbagai macam data kategorik sesuai dengan bidangnya masing-masing.
Universitas Sumatera Utara
4. di pihak lain, kesimpulan yang diperoleh berdasarkan model asosiasi (empiris)
antara
variabel
numerik
kerap
kali
tidak
dapat
dipertanggungjawabkan, karena data yang dipakai pada umumnya bukanlah data yang sesuai.
Data sering terdiri dari sejumlah objek yang terhitung dengan atribut tertentu yang dimiliki oleh kategori-kategori tertentu yang disusun dalam tabel satu dimensi, dua dimensi, tiga dimensi atau bahkan dalam tabel berdimensi lebih tinggi lagi, biasanya disebut tabel kontingensi satu arah, dua arah dan tiga arah. Masing-masing dimensi atau arah berhubungan dengan sebuah klasifikasi dalam kategori-kategori yang menyajikan satu atribut.
Tabel satu arah, pengkategoriannya mungkin tidak relevan untuk setiap analisis statistik. Seseorang dapat memisalkan pernyataan yang dibuat-buat bahwa datanya merupakan sampel acak dan memperoleh sebuah perkiraan dari median atau rata-rata tetapi hasilnya tidak informatif atau sah karena datanya tidak dipilih secara acak, disini kurang pengacakan juga dapat menimbulkan pertanyaan bagaimana (dalam arti statistik) setiap kesimpulan populasi yang diterapkan. Pengujian ini sebenarnya bukan non parametrik jika pengujiannya mengenai sebuah parameter p yang merinci frekuensi terjadinya setiap angka. Ini adalah sebuah uji kecocokan dan goodness of fit test.
Tabel dua arah, sama formatnya tetapi berbeda dalam status logikanya. Datanya terdiri dari dua sampel bebas. Namun demikian dalam dua kasus tersebut masih digambarkan bahwa pembedaannya dapat diabaikan untuk ukuran sampel yang cukup yang besar, dan dapat digunakan uji untuk sampel besar yang sama tanpa memandang apakah pemilihannya menetapkan hanya jumlah keseluruhan yang akan diambil sampelnya dan kemudian mencatat jumlah masing-masing kelas. Pada suatu keadaan, kita hanya menetapkan total keseluruhannya pada keadaan lain kita menetapkan tabel keseluruhan dan total baris. Hal ini juga mungkin untuk menetapkan total keseluruhan dan total kolom, dan sama dengan pertukaran baris dan kolom. Pendekatan uji sampel besar untuk kebebasan antara klasifikasi baris dan kolom adalah sama pada seluruh
Universitas Sumatera Utara
keadaan tersebut, dan merupakan uji terpenting yang tergantung pada total baris dan kolom pengamatan. Uji sampel besar yang cocok digunakan adalah uji Q Cochran
Tabel multiarah, bila tabel dua arah dengan mudah disajikan pada kertas, tabel tiga arah atau lebih paling baik disajikan dengan subtabel-subtabel dan lebih dari satu penyajian selalu mungkin. Setelah data tersebut diberikan dalam tabel lebih baik untuk analisis selanjutnya dengan memasukkan tabel marginal yang ditunjukkan. Pembaca dapat menyusun data ini dengan susunan logika yang berbeda meskipun pengujian untuk kebebasan dapat diperluas dari tabel dua arah sampai multi arah, dan uji berpasangan mengenai kebebasan dapat digunakan, sehingga analisisnya biasanya tidak cukup( tidak efisien) dan kita sering tertarik dalam menguji dengan lebih mengembangkan hipotesis-hipotesis, atau bahkan serangkaian hipotesis.
Banyak eksperimen secara simultan mempelajari lebih dari dua independen variabel atau lebih dari dua faktor. Misalnya eksperimen bias melibatkan dua kategori atau dua tingkatan dari satu faktor, tiga kategori dari faktor yang kedua, 5 kategori atau lima tingkat dari faktor yang ketiga, dengan sejumlah n subjek yang ditarik secara acak dari masing-masing 2x3x5 kelompok eksperimen tersebut. Ekperimen seperti itu dikenal dengan nama ‘2x3x5 faktorial eksperimen’. Data yang diperoleh dari eksperimen seperti itu dapat dikonseptualisasikan sebagai kubus bertiga dimensi, yang terdiri dari 2 baris, 3 kolom dan 5 lapis, dengan masing-masing n subjek dari 30 sel yang berbeda dalam eksperimen tersebut.
Analisis dan interpretasi dari data yang dihasilkan dari eksperimen seperti itu adalah merupakan perluasan langsung dari analisis dan interpretasi dari klasifikasi dua arah. Dalam suatu eksperimen dua-faktor dengan n subjek dalam setiap sel, jumlah kuadrat total terbagi dalam empat bagian, yaitu: jumlah kuadrat antar baris, jumlah kuadrat antar kolom, jumlah kuadrat interaksi dan jumlah kuadrat sel dalam. Setiap jumlah kuadrat mempunyai sebuah angka yang menjadi angka derajat kebebasan. Jumlah kuadrat dibagi dengan angka derajat kebebasan untuk memperoleh taksiran variansi
Universitas Sumatera Utara
atau rata-rata kuadrat yang digunakan untuk menguji signifikansi pengaruh utama dan interaksi.
Umpamakan sejumlah eksperimen yang melibatkan sejumlah R tingkatan dari faktor pertama, sejumlah C tingkatan dari faktor kedua, dan sejumlah L tingkatan dari faktor ketiga. Jumlah sel menjadi sebanyak RxCxL yang disingkat menjadi RCL. Misalkan khusus dalam kasus ini kita mempunyai satu alat pengukuran untuk setiap kombinasi RCL, jumlah total hasil pengukuran menjadi N. data untuk lapis pertama dari angkaangka hasil pengukuran itu dapat dituliskan sebagai berikut:
Tabel 2.1 Tabel Data Untuk Lapis Pertama
Variabel 2
Variabel 1 L
1
2
3
...
C
Rata-rata baris
A
P
e 111
e 211
e 121
e 221
E 131
E 231
...
...
e 1C1
e 2C1
_
e
1.1
_
e
2.1
I e 311
e 321
E 331
...
e 3C1
_
e
S .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
e R11
e R 21
E R 31
...
e RC1
…
1
Jumlah
3.1
_
_
_
e .11
e .21
e .31
...
_
_
e .C1
e ..1
Universitas Sumatera Utara
Dalam subskrip di atas diidentifikasikan, yang pertama sebagai baris, yang kedua sebagai kolom dan yang ketiga sebagai lapis. Dengan demikian, misalnya e 321 _
menunjukkan observasi pada baris ketiga kolom kedua dari lapis pertama. e .11 adalah _
rata-rata dari kolom pertama dari lapis petama, sedang e ..1 rata-rata dari semua observasi yang ada pada lapis pertama.
Adapun notasi pada lapis kedua adalah sebagai berikut: Tabel 2.2 Tabel Data Untuk Lapis Kedua
Variabel 2
Variabel 1 L
1
2
3
...
C
Rata-rata baris
A
P
e 112
e 212
e 122
e 222
E 132
E 232
...
…
e 1C 2
e 2C 2
_
e
1.2
_
e
2.2
I e 312
e 322
E 332
...
e 3C 2
_
e
3.2
S .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
e R12
e R 22
E R 32
...
e RC 2
…
2
Jumlah
_
_
_
e .12
e .22
e .32
...
_
_
e .C 2
e ..2
Keterangan: C= Column (kolom) R=Row (baris) L= Layer (lapis)
Universitas Sumatera Utara
Demikian juga halnya dapat ditunjukkan lapis yang ketiga, keempat sampai lapis yang ke-L. secara umum erc1 menunjukkan yang menunjukkan hasil pengukuran baris yang ke-r, pada kolom yang ke-c dan pada baris yang ke-1.harus dipahami bahwa R menunjukkan angka dari baris, C merupakan angka dari kolom dan L merupakan angka dari lapis. Jumlah r menunjukkan baris yang ke-r, dimana r bias saja berupa angka 1, 2,…R. demikian juga dengan c dan 1 menunjukkan kolom yang ke c dan lapis yang ke-1.
_
Rata-rata dari semua RCL= N adalah Χ ... jumlah kuadrat simpangan total dari ratarata umum tadi dapat dituliskan: R
C
L
r =1
c =1
l =1
∑∑∑
2.2
( X rcl − X ...) 2
Analisis Berdasarkan Tabel IxJxK
Berdasarkan data trivariat (V1, V2,V3) dengan berbagai skala ukuran, selalu dapat dibentuk tabel berdimensi tiga, termasuk tabel 2x2x2. Dengan sendirinya langkah pertama yang harus dilakukan adalah mentransformasikan atau mengubah ketiga variabel yang ditinjau menjadi variabel kategorik, berdasarkan kriteria yang disepakati atau ditentukan.
Disini akan diperhatikan tiga variabel satu-nol, dimana simbol Y dipakai untuk menyatakan variabel tak bebas atau variabel respon dan kedua variabel lainnya sebagai variabel bebas yang akan dinyatakan dengan simbol X 1 dan X 2 . Penentuan variabel tak bebas dan variabel bebas diantara komponen trivariat (V1,V2,V3) haruslah didukung oleh landasan teori dan substansi, karena pola asosiasi antar variabel ditentukan secara teoritis. Dipihak lain, secara statistik koefisien asosiasi atau korelasi antara variabel selalu dapat dihitung walaupun variabel tersebut tidak berasosiasi secara substansi. Sehingga, analisis statistika berdasarkan data trivariat mempunyai tujuan antara lain untuk menentukan model kuantitatif atau model
Universitas Sumatera Utara
statistik yang sesuai dengan pola hubungan teoritis antar ketiga variabel yang ditinjau, yang akan disebut model teoritis.
2.3
Ukuran Asosiasi Berdasarkan Tabel 2x2x2
2.3.1 Selisih Prevalensi atau Proporsi Bersyarat Tabel berikut menunjukkan suatu bentuk tabel 2x2x2. tabel ini menyajikan banyaknya observasi menurut variabel X 1 ,X 2 dan Y yang masing-masing merupakan variabel satu- nol. Perhatikanlah tabel ini mempunyai empat buah baris dan dua buah kolom dan banyaknya observasi dalam tiap-tiap sel dinyatakan dengan simbol O ijk untuk setiap i, j dan k sama dengan satu atau nol
Tabel 2.3 Banyaknya Responden Menurut Variabel X 1 , X 2 dan X 3 Variabel Y X 1 =1
Y=1
Y=0
Jumlah
X 2 =1
0 111
0 110
0 11+
X 2 =0
0101
0 100
0 10+
.
.
.
.
.
.
.
.
.
.
.
.
X 2 =1
0 011
0 010
0 01+
X 2 =0
0 001
0 000
0 00+
Jumlah
0 + +1
0 + +0
N=0 + + +
Universitas Sumatera Utara
Sebenarnya tabel ini menggambarkan ruang bedimensi –tiga (kubus) dengan sumbu X 1 , X 2 dan Y, yang dibagi menjadi 8 (2x2x2) buah kubus kecil yang membentuk delapan buah sel yang dikemukakan di atas.
2.4
Model Log Linier
Dalam kategorik bivariat dimana diperoleh nilai statistik Chi-kuadrat dari pearson (Pearson Chi-Kuadrat) dan Rasio Kesamaan. Akan tetapi untuk mempelajari pola asosiasi ganda berdasarkan data trivariat atau lebih harus diterapkan Model Log Linier, terlebih-lebih jika model yang ditinjau secara teoritis menunjukkan hubungan antara demikian banyaknya variabel. Model statistik Model Log Linier akan dipakai untuk mempelajari apakah data sampel yang akan dipakai mendukung atau tidak mendukung model asosiasi ganda yang dihipotesiskan dinyatakan atau diasumsikan berlaku untuk ketiga variabel yang ditinjau.
Analisis yang lebih terinci mengenai tabel kontingensi tiga dimensi atau yang biasanya menggunakan pengujian pasangan yang tidak sederhana dari kebebasan yang dapat dilakukan pada bagian-bagian dari tabel-tabel dua arah. Sejumlah besar dari model-model yang berbeda adalah mungkin dan teknik analitik yang modern sering didasarkan pada model log-linier. Dalam sebuah buku dasar-dasar statistik, hal ini cocok hanya untuk memberikan pengenalan singkat untuk model dan pengujian, dan dijelaskan dengan satu contoh sederhana. Teknik-teknik analitik adalah data diskrit yang analog dengan analisis varians untuk data kontinu. Pembaca yang belum kenal dengan analisis varians model linier untuk rancangan percobaan dengan struktur percobaan faktorial mungkin sulit untuk mengikuti bagian ini, tetapi diharapkan sebuah penjelasan yang mendasar akan memberikan beberapa indikasi tentang kekuatan model linier sebagai sebuah alat analitik. Penerapan yang lebih sulit dari metode ini membutuhkan pengetahuan yang luas mengenai statistik dan tersedianya program komputer yang cocok.
Misalkan { mijk } merupakan frekuensi harapan, dugalah semua mijk >0 dan misalkan
η ijk = log mijk . Tanda dot dibawah merupakan rata-rata, seperti: η . jk = (∑ i η ijk ) / I Di dapatkan:
Universitas Sumatera Utara
µ = η ... λix = η i.. − η ... ,
λYj = η . j . − η ... ,
λZk = η ..k − η ...
λijXY = η ij . − η i.. − η . j . + η ...
λikXZ = η i.k − η i.. − η ..k + η ... λYZjk = η . jk − η . j . − η ..k + η ... XYZ λijk = η ijk − η ij . − η i.k − η . jk + η i.. + η . j . + η ..k − η ...
Jumlah semua parameter di atas sama dengan nol, yaitu:
∑λ i
x i
XYZ = ∑ λYj = ∑ λZk = ∑ λijXY = ∑ λijXY = ... = ∑ λijk =0 j
k
i
j
k
Sehingga bentuk umum model log linier untuk tabel kontingensi tiga dimensi, adalah: XYZ log mijk = µ + λiX + λYj + λZk + λijXY + λikXZ + λYZjk + λijk
Dalam hal pengujian ini juga sama dengan analisis variansi tiga dimensi. Beberapa model log linier untuk tabel tiga dimensi: Model log-linier
simbol
log mijk = µ + λiX + λYj + λZk
(X,Y,Z)
log mijk = µ + λiX + λYj + λZk + λijXY
(XY,Z)
log mijk = µ + λiX + λYj + λZk + λijXY + λYZjk
(XY,YZ)
log mijk = µ + λiX + λYj + λ Zk + λijXY + λYZjk + λikXZ
(XY,YZ,XZ)
XYZ log mijk = µ + λiX + λYj + λ Zk + λijXY + λYZjk + λikXZ + λijk
(XYZ)
Universitas Sumatera Utara
Untuk menunjukkan model log-linier kita cari bentuk marginal dan partialnya dengan menggunakan odds ratios. X-Y tabel marginal {π ij + } dengan (I-1)(J-1) odds ratios, bentuknya:
θ ijXY =
π ij + π i +1, j +1.+ , π i +1, j , + π i , j +i , +
1 ≤ i ≤ I − 1,1 ≤ j ≤ J − 1
Dengan k dalam Z, hubungan odds ratiosnya:
θ ij ( k ) =
π ijk π i +1, j +1,k , π i , j +1,k π i +1, j ,k
1 ≤ i ≤ I − 1,1 ≤ j ≤ J − 1
Menunjukkan hubungan X-Y. Sama halnya antara X dan Y didapatkan dari (I-1)(K-1) Odds ratios {θ i ( j ) k } untuk setiap J pada Y, dan hubungan antara Y dan Z didapatkan dari (J-1)(K-1) odds ratios { θ (i ) jk } untuk setiap I pada X. Untuk tabel tiga dimensi log mijk dalam log odds ratios, didapat:
1 8
XYZ λ111 = log(
θ11(1) 1 θ1(1)1 1 θ (1)11 ) = log = log 8 θ1( 2 )1 8 θ ( 2 )11 θ11( 2)
XYZ XYZ Dengan jumlah nol batasannya {λijk } adalah nol ketika odds } . Masing-masing {λijk
ratios antara dua variabel sama dengan tiga variabel. Bentuk umumnya XYZ {λijk = 0} dalam tabel 2x 2x K, ketika θ11(1) = ... = θ11( k ) , sehingga:
1 4
λ11XY = log θ11( k ) untuk k=1…K
Seperti dalam kasus dua dimensi parameternya sebanding pada log odds ratios. Model Log linier dapat dikenal dengan menggunakan hubungan odds ratios. Dalam hal hubungan
independent
antara
X
dan
Y
equivalent
terhadap
{θ ij ( k ) = 1i = 1,..., I − 1, j = 1,..., J − 1, k = 1,..., K }
Universitas Sumatera Utara
Kenudian kita berikan satu keadaan yang cukup terhadap X-Y odds ratios menjadi sama dalam tabel parsial seperti pada tabel marginal. Ketika keadaan sama kita dapat mempelajari gabungan X-Y dengan cara menyederhanakan menyelesaikan dimensi Z. selanjutnya, Z akan menjadi variabel tunggal atau multidimensi.
θ ijXY = θ ij (1) = θ ij ( 2 ) = .. = θ ij ( k ) , 1 1 ≤ i ≤ I − 1,1 ≤ j ≤ J − 1
θ i ( j ) k = 1,
1 ≤ i ≤ I − 1,1 ≤ j ≤ J − 1,1 ≤ k ≤ K − 1
θ (i ) jk = 1,
1 ≤ i ≤ I − 1,1 ≤ j ≤ J − 1,1 ≤ k ≤ K − 1
Dengan kata lain, gabungan marginal da parsial X-Y disamakan jika Z dan X bebas (i.e, disimbolkan dengan (XY,YZ)terikat), atau jika Z danY bebas (i.e, bentuknya (XY,XZ)terikat)
2.4.1 Penerapan Model Log Linier Data Trivariat Dalam sebuah tabel kontingensi dua dimensi, nilai harapan eij untuk sel ij dengan hipotesis kebebasan atau tidak ada asosiasi adalah eij =
(ni + )(n+ j ) N
ini selanjutnya
mengikuti e11e22 = (n1+ n+1 n2+ n+ 2 ) / N 2 = e12 e21 yaitu bahwa produk silang atau diagonal adalah sama, atau
e11e22 =1 e12 e21
Sifat perkalian dan harapan untuk kebebasan ini dapat dibandingkan dengan sifat harapan aditif bila tidak ada interaksi dalam model liniernya. Sebenarnya ada ~
kesamaan model-model jika kita mengambil logaritma eij dan menulis x = ln eij ini merupakan dasar model log linier karena persamaan
Universitas Sumatera Utara
e11e22 = 1 adalah sebuah kondisi yang diperlukan untuk kebebasan, maka selanjutnya e12 e21 setiap hipotesis yang menyebutkan ketergantungan menyatakan sebuah hubungan yang lebih umum
e11e22 =1 e12 e21
k≠1
Dengan mengambil logaritmanya kita mempunyai analog model yang berinteraksi. Perluasan untuk tabel tiga dimensi, modelnya dapat diperluas untuk tabel r x c dan lebih penting untuk tabel multi arah. Pertama, kita membuat perluasan dari model linier untuk tiga faktor masing-masing dengan dua level dalam konteks analisis varians. Pengukuran interaksi telah diperkenalkan dalam model dua faktor yang disebut sebuah orde pertama atau kadang-kadang disebut sebuah interaksi dua faktor. Jika kita mempunyai tiga faktor masing-masing pada dua level, kita dapat menyajikan ~
hasil yang diharapkan dalam sebuah perluasan yang jelas dari notasi x ijk i, j, k = 1,2 .
Jika kita mempertimbangkan dua faktor pertama pada level pertama dari faktor ketiga (ditunjukkan dengan k=1) kita akan mempunyai sebuah interaksi pertama antara
faktor 1 dan faktor 2 pada level tetap faktor 3 ini jika x111 + x 221 − x121 − x 211 = Ι, Ι ≠ 0 sebagai tambahan, jika kita mempunyai sebuah interaksi orde pertama antara faktor 1 ~
~
dan faktor 2 pada level kedua dari faktor 3 ( k= 2 ), ini menyatakan x 112 + x ~
x
212
~
222 - x 122 -
= J, J=0. jika I ≠ J kita katakana tidak ada interaksi orde kedua antara ketiga
faktor. Jika I ≠ J kita katakan tidak ada sebuah interaksi orde kedua atau orde ketiga. Jika I= J= 0 mempunyai model tidak ada interaksi. Dalam konteks dari model ~
log-linier dimana kita tulis x
ijk
=ln eijk dimana eijk adalah harapan untuk level ke-i
klasifikasi 1, untuk level ke-j klasifikasi 2, untuk level ke-k klasifikasi 3, model dengan tidak ada interaksi berhubungan dengan kebebasan dan eijk menjadi:
(e111e221 ) (e112 e222 ) = =1 (e121e211 ) (e122 e212 )
Universitas Sumatera Utara
Ketergantungan dapat menjadi orde pertama atau kedua (ditunjukkan untuk interaksi orde pertama atau kedua dalam model log-linier). Untuk interaksi model pertama:
(e111e221 ) (e112 e222 = =k (e121e211 ) (e122 e212 ) Dimana k ≠ 1 , dan untuk model interaksi orde kedua:
(e111e221 ) (e112 e222 ) ≠ (e121e211 ) (e122 e212 )
Model log-linier mengizinkan pengujian untuk menentukan apakah data dapat menjadi cocok digambarkan oleh beberapa model tertentu. Untuk contoh ilustrasi, kita mengikuti prosedur yang relevan untuk pengujian model interaksi orde pertama. Dalam kasus dalam sebuah tabel kontingensi tiga dimensi, penduga maksimum ^
likelihood dari eijk , yang akan dinotasikan dengan e
ijk
harus memenuhi kondisi:
(ẽ 111 ẽ 221 )/(ẽ 121 ẽ 211 )= (ẽ 112 ẽ 222 )/(ẽ 122 ẽ 212 )
^
Dengan batasan bahwa e
ijk
harus juga jumlah untuk total marginal yang diamati
setiap akhiran. Pada umumnya, penduga maksimum likelihood hanya dapat diperoleh dengan metode yang berulang-ulang( salah satunya dikenal dengan iterative scaling procedure); akan tetapi dalam kasus khusus dari tabel tiga dimensi dengan model ^
interaksi orde pertama, perhitungan pertama adalah langsung. Sekali e
ijk
telah
dihitung, statistik T atau T 1 untuk tabel tiga dimensi digunakan untuk pengujian nyata. T 1 sering lebih disukai karena dari sifat aditif tertentu yang memungkinkan terbagi kedalam komponen-komponen, analog dengan cara yang dilakukan untuk jumlah kuadrat orthogonal dalam analisis varians.
Suatu penelitian yang meneliti tiga faktor ( X, Y dan Z ) yang masing-masing dicobakan dalam berbagai tingkatan. Faktor X dalam x tingkatan, faktor Y dalam y
Universitas Sumatera Utara
tingkatan dan faktor Z dalam z tingkatan. Percobaan tersebut merupakan percobaan faktorial xxyxz. Dengan demikian banyak perlakuan yang dicobakan adalah t=xyz. Andaikan bahwa tiap perlakuan diulang dengan ulangan yang sama sebanyak n (ukuran contohnya n). tentu saja pada percobaan demikian, data yang diperoleh akan beragam yang dapat dikaitkan dengan tingkat masing-masing faktornya. Dengan demikian dapat dituliskan: X ijkl = µ + α i + β j + Γk + (αβ ) ij + (αΓ) ik + ( βΓ) jk + (αβ Γ) ijk + ε ijkl
Dengan: X ijkl = pengamatan ke 1 (1=1,2,…,n) untuk faktor X yang ke i (i=1,2,…,n), faktor Y yang ke j (j=1,2,…,b), dan faktor z yang ke k (k=1,2,…,c)
µ=
rata-rata
αi =
pengaruh faktor X yang ke i
β j = pengaruh faktor Y yang ke j Γk =
pengaruh faktor Z yang ke k
(αβ ) ij = interaksi faktor X yang ke i dengan faktor Y yang ke j
(αΓ) ik = interaksi faktor X yang ke i dengan faktor Z yang ke k ( βΓ) jk = interaksi faktor Y yang ke j dengan faktor Z yang ke k ( αβ Γ) ijk = interaksi faktor X yang ke i, faktor Y yang ke j dengan faktor Z yang ke k
ε ijkl = sesatan pengamatan yang bersangkutan
Penduga masing-masing komponen dalam model di atas diduga dengan cara yang sama seperti yang sudah biasa dilakukan. Penduga yang didapat adalah:
^
−
µ = X ... ^
_
_
α i = X i.. − X ... ^
_
_
_
_
β j = X . j . − X ... _
Γ k = X ... − X ....
Universitas Sumatera Utara
^
_
_
_
_
^
_
_
_
( αβ ) ij = X ij . − X i.. − X . j . − X ... __
( αΓ) ik = X i.k − X i.. − X .k . − X ... _
^
_
_
_
( βΓ) jk = X . jk − X . j . − X .k . − X ... _
^
_
_
_
_
_
_
_
( αβ Γ) ijk = X ijk − X ij . − X i.k . − X . jk + X i.. − X . j . − X .k . − X ... ^
_
_
ε jkl = X ijkl − X ...
Berbagai penduga ini dengan mudah dapat kita peroleh apabila kita lihat pola untuk mendapatkannya. Penduga pengaruh suatu tingkat suatu faktor merupakan selisih antara rerata tingkat faktor tersebut dengan rata-rata keseluruhan data. Perhatikan notasinya yang ternyata berupa satu indeks saja yang lainnya titik ( i atau j atau k saja, yang lainnya berupa titik) dan pengurangnya mempunyai indeks yang berupa titik semua. Pada interaksi dua faktor, penduganya didapat dengan jalan mengurangi ratarata gabungan tingkat kedua faktornya dengan rata-rata tingkat masing-masing faktor dan kemudian ditambah dengan rata-rata keseluruhan data. Menyimak indeksnya, penduga interaksi dua faktor ini didapat dengan jalan mengurangi rata-rata yang berindeks dua ( i dan j, i dan k, atau j dan k sedangkan lainnya berupa titik) dengan rata-rata yang berindeks satu yang persis dengan indeks duanya dan kemudian ditambah rata-rata keseluruhan data yang semua indeksnya berupa titik.
Seperti halnya dengan analisis varian yang terdahulu, berbagai jumlah kuadrat didapat tidak dengan menggunakan berbagai penduga diatas tetapi dalam bentuk yang telah disederhanakan terlebih dahulu. Untuk jumlah kuadrat X
_
JKX
_
= Σ( X i.. − X ...) 2 _ 2
_
_ 2
_ 2
_
_ 2
= yzn Σ X i.. − 2 yzn X ...Σ X i.. + xyzn X ... = yzn Σ X i.. − xyzn X ....
Universitas Sumatera Utara
_
_
Karena Σ X i.. = x X ... sehingga
JKX = Σ
dengan FK =
X i2.. − FK yzr
X 2 ... xyzn
perhatikan bahwa JKX didapat dengan menjumlahkan kuadrat jumlah masing-masing tingkat faktor X (dijumlah terhadap i) yang dibagi dengan sesuatu yang besarnya sama dengan batas indeks yang berubah menjadi titik. Dalam hal ini indeks yang berubah menjadi titik adalah j, k, dan l yang mempunyai batas nilai y, z dan n. perhatikan bahwa rumus untuk jumlah kuadrat ini bertalian dengan rumus untuk penduganya. Penduga untuk pengaruh X yang ke i adalah rata-rata dengan indeks i ( yang lainnya berupa titik) dikurangi dengan rata-rata dengan semua indeksnya berupa titik rumus JKX juga mempunyai indeks i yang dikurangi dengan sesuatu yang tanpa indeks, yaitu FK. Maka dengan mudah diperoleh JKY dan JKZ, sebagai berikut:
JKY = Σ
JKZ = Σ
X .2j . yzr
− FK
X ..2k . − FK yzr
Sekarang akan kita lihat bagaimana penyederhanaan jumlah kuadrat interaksi dua faktor. Kita akan simak terlebih untuk interaksi antara X dan Y: −
_
_
_
JKXY = ΣΣ( X ij .. − X i.. − X . j . + X ...) 2
Yang apabila disederhanakan akan diperoleh: X ij2.
_ 2 X .2j . X i2.. JKXY = ΣΣ − Σi −Σj + xy X ... zn. yzn xzn
Universitas Sumatera Utara
Dalam kaitannya dengan rumus untuk penduganya, lihat keterkaitan antara rumus penduga dan jumlah kuadrat suatu komponen. Rumus penduga komponen interaksi XY didapat dengan mengurangi rata-rata berindeks dua ( yaitu i dan j untuk X dan Y) dengan rata-rata berindeks satu untuk X dan berideks satu untuk Y, dan akhirnya ditambah dengan rata-rata yang semua indeksnya berupa titik ( tidak berindeks). Penyederhanaan lebih lanjut akan menghasilkan:
JKXY = ΣΣ
X ij2.. zn
− FK − JKX − JKY
Perhatikan bahwa jumlah kuadrat interaksi X dan Y didapat dengan menjumlahkan semua jumlah pada kombinasi X dan Y yang dibagi dengan sesuatu yang merupakan nilai batas indeks yang berupa titik dalam hal ini indeks yang berupa titik adalah untuk k dan l yang mempunyai batas z dan n sehingga sebagai pembagi adalah zn, dikurangi dengan faktor koreksi dan dikurangi lagi dengan jumlah kuadrat faktorfaktor yang menyusun interaksinya.
Jumlah kuadrat interaksi tiga faktornya didapat dari: _
_
_
_
_
_
_
_
JKXYZ = ΣΣΣ X ijk − X ij . − X i.k − X . jk + X i.. + X . j . + X ..k − X ...) 2
Yang apabila disederhanakan akan menghasilkan:
ΣΣΣ
JKXYZ =
X ijk2 n
− ΣiΣ j
X ij2.
X .2jk X 2j .. X i2.k X i2.. − ΣiΣk − Σ jΣk + Σi +Σj zn yn xn yzn xzn
_ 2 X ..2k + Σk − xyzn X xyn
JKXYZ = ΣΣΣ
X ijk2 n
− JKX − JKY − JKZ − JKXY − JKXZ − JKYZ
Derajat bebas berbagai jumlah kuadrat diatas dapat dengan mudah diperoleh dengan memperhatikan beberapa kali pengkuadratan yang kita jumlahkan dan kurangkan. Untuk faktor X, kita mengkuadrat a kali yang dijumlahkan dan mengkuadratkan
Universitas Sumatera Utara
sekali untuk memperoleh faktor koreksi yang kemudian kita gunakan untuk mengurangi. Dengan demikian derajat bebas X adalah ( x-1). Analogi dengan X adalah untuk Y dan Z.
Untuk interaksi dua faktor, XY misalnya kita mengkuadratkan sebanyak xy kali yang kemudian kita jumlahkan, kemudian dikurangi dengan FK (yang diperoleh dengan sekali mengkuadratkan) dan dikurangi lagi dengan JKX dan JKB yang mempunyai derajat bebas (x-1) dan (y-1). Dengan demikian derajat bebas XY adalah:
xy-1-(x-1)-(y-1)=(x-1)(y-1)
dengan cara yang sama kita dapatkan bahwa interaksi XZ mempunyai derajat bebas (x-1)(z-1) dan interaksi YZ mempunyai derajat bebas (y-1)(z-1). Derajat bebas interaksi tiga faktor XY pun diperoleh dengan cara yang sama. Suku pertama pada rumus jumlah kuadrat XYZ menunjukkan bahwa kita harus mengkuadratkan xyz kali, sedangkan derajat bebas suku-suku pengurangannya telah kita ketahui. Dengan demikian derajat bebas untuk interaksi XYZ adalah: xyz-1-(x-1)(y-1)-(x-1)(z-1)-(y-1)(z-1)-(x-1)-(y-1)-(z-1) yang telah disederhanakan akan berubah menjadi (x-1)(y-1)(z-1) hasil-hasil perhitungan di atas dapat disusun dalam suatu tabel anava.
Universitas Sumatera Utara