17
BAB 2
LANDASAN TEORI
2.1 Analisis Regresi
Salah satu tujuan analisis data adalah untuk memperkirakan/memperhitungkan besarnya efek kuantitatif dari perubahan suatu kejadian terhadap kejadian lainnya. Setiap kebijakan (policy), baik dari pemerintah maupun swasta, selalu dimaksudkan untuk mengadakan perubahan (change). Sebagai contoh, Pemerintah menambah jumlah pupuk agar produksi padi meningkat, Pemerintah menaikkan gaji pegawai negeri agar prestasi kerja mereka meningkat dan lain sebagainya. Untuk keperluan evaluasi/penilaian suatu kebijaksanaan mungkin ingin diketahui besarnya efek kuantitatif dari perubahan suatu kejadian terhadap kejadian lainnya. Kejadian-kejadian tersebut untuk keperluan analisis bisa dinyatakan didalam perubahan nilai variabel. Untuk analisis dua kejadian (events) digunakan dua variabel X dan Y. Teknik Statistika untuk memeriksa dan memodelkan hubungan diantara variabel-variabel disebut Analisis Regresi.
2.1.1 Regresi Linear Sederhana
Regresi linear sederhana adalah suatu prosedur untuk mendapatkan hubungan matematis dalam bentuk suatu persamaan antara variabel dependen tunggal dengan variabel independen tunggal. Hubungan antara variabel dependen dan variabel independen ini dapat dirumuskan ke dalam suatu bentuk hubungan fungsional sebagai berikut: Yi = a + bX i untuk i = 1, 2, ..., n
Universitas Sumatera Utara
18
Dengan: Yi = variabel terikat ke-i Xi = variabel bebas ke-i a = intersep (titik potong kurva terhadap sumbu Y) b = kemiringan (slope) kurva linear
Dalam membuat keputusan, selalu ada resiko yang disebabkan oleh adanya kesalahan (error). Risiko hanya bisa diperkecil dengan memperkecil kesalahan (minimized error → minimized risk). Dengan memperhitungkan kesalahan pengganggu
ε , maka bentuk persamaan linear menjadi sebagai berikut: Yi = a + bX i + ε Dengan : a dan b adalah konstanta yang diestimasi
ε adalah kesalahan pengganggu (disturbance’s error) ε i = Yi - Yˆi disebut juga sisa yang terkandung galat yang sifatnya acak dan penyimpangan model dari keadaan sesungguhnya.
Dalam praktek, untuk melihat hubungan antara X dan Y, dikumpulkan pasangan data (X,Y) sebagai suatu observasi, misalnya sebagai berikut: X 1 , X 2 ,..., X i ,..., X n Y1 , Y2 ,..., Yi ,...., Yn digambar pada sistem koordinat tegak lurus hasilnya disebut diagram titik atau diagram pencar. Dapat dilihat pada gambar 2.1. Y
X Gambar 2.1 Diagram Pencar
Universitas Sumatera Utara
19
Garis lurus yang terdapat pada diagram pencar pada gambar 2.1 yang memperlihatkan adanya hubungan antara kedua variabel disebut garis regresi atau garis perkiraan, dan persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar disebut persamaan regresi yang merupakan suatu variabel matematika yang mendefenisikan hubungan antara dua variabel.
2.1.2 Metode Kuadrat Terkecil
Untuk mendapatkan garis regresi yang paling baik yaitu garis regresi yang memiliki deviasi atau kesalahan terkecil, maka digunakan metode kuadrat terkecil. Metode kuadrat terkecil ialah suatu metode untuk menghitung β 0 dan β1 , sedemikian sehingga kesalahan kuadrat memiliki nilai terkecil. Dengan bahasa metematika, dinyatakan sebagai berikut: Yi = β 0 + β1 X i + ei , i = 1, 2, …, n ei = Yi − ( β 0 + β1 X i ) = kesalahan pengganggu ∑ ei = ∑[Yi − ( β 0 + β1 X i )]2 = jumlah kesalahan kuadrat 2
Jadi metode kuadrat terkecil adalah metode untuk menghitung β 0 dan β1 sedemikian rupa sehingga
∑e
2 i
= terkecil (minimum). Caranya ialah dengan
membuat turunan parsial (partial differential) dari
∑e
2 i
mula-mula terhadap β 0
kemudian terhadap β1 kemudian menyamakannya dengan nol. ∂ ∑ ei2 ∂β 0
∂ ∑ ei2 ∂β1
= 2∑ [Yi − ( β 0 + β1 X i )](−1) = 0 ⇒ ∑ Yi = β 0 n + β1 ∑ X i
.... (2.1)
= 2∑ [Yi − ( β 0 + β1 X i )](− X i ) = 0 ⇒ ∑ X i Yi = β 0 ∑ X i + β1 ∑ X i2 …. (2.2)
Persamaan (2.1) dibagi dengan n ⇒
∑Y
i
n
=
β0n n
+ β1
∑X
i
n
⇒ Y = β 0 + β1 X
Sehingga β 0 = Y − β1 X
Universitas Sumatera Utara
20
Masukkan β 0 ke persamaan (2.2)
∑ Yi ∑ Xi 2 β β β Y X X X X Y ( ) = − + ⇒ = − ∑ ∑ ∑ 1 1 1 i i i i i i n n X i ∑Y i (∑ X i )2 ∑ − β1 + β1 ∑ X i2 ∑ X iYi = n n
∑X Y
∑ X i + β1 ∑ X i2
(∑ X i )2 ∑ X i ∑ Yi 2 β1 = ∑ X i Yi − ∑ X i − n n Sehingga
β1 =
∑ X Y − ∑ X ∑ Y / n = n∑ X Y − ∑ X ∑ Y n∑ X − (∑ X ) ∑ X − (∑ X ) / n i i
i
i
i i
2
2 i
i
i
i
2
2 i
i
2.1.3 Uji Kelinearan dan Keberartian Regresi Setelah menaksir persamaan regresi, masalah berikutnya adalah menilai baik buruknya model regresi dengan data. Jadi diperlukan ukuran tentang kecocokan data. Analisis regresi adalah alat statistik yang dapat digunakan untuk mengetahui derajat hubungan linear antara satu variabel dengan variabel lain. Umumnya analisis korelasi digunakan dalam hubungannya dengan analisis regresi untuk mengukur ketepatan garis regresi dalam menjelaskan (explaining) variasi nilai variabel dependen. Ukuran statistik yang dapat menggambarkan hubungan antara suatu variabel dengan variabel lain adalah koefisien determinasi (R2) dan koefisien korelasi (r). Koefisien determinasi adalah salah satu nilai statistik yang dapat digunakan untuk mengetahui apakah ada hubungan pengaruh antara dua variabel. Perhatikan kesamaan berikut: ( yi − y ) = ( yˆ i − y ) + ( yi − yˆ i ) Variasi
regresi
sisa
Bila ruas kiri dan kanan dikuadratkan dan kemudian dijumlahkan maka diperoleh n
n
i =1
i =1
∑ ( yi − y ) 2 = ∑{( yˆ i − y ) + ( yi − yˆ i )}2 n
n
n
i =1
i =1
i =1
= ∑ ( yˆ i − y ) 2 + ∑ ( y i − yˆ i ) 2 + 2∑ ( yˆ i − y )( y i − yˆ i ). …..(2.3)
Universitas Sumatera Utara
21
Perkalian yang terakhir pada persamaan (2.3) penulisan i = 1 dan n pada ∑ dihilangkan sehingga menjadi
∑ ( yˆ
i
− y )( y i − yˆ i ) = ∑ yˆ i ( y i − yˆ i ) − y ∑ ( y i − yˆ i ).
Bagian kedua ruas kanan sama dengan nol karena menurut (2.1)
∑(y
i
− yˆ i ) = ∑ ( y i − a − bxi ) = 0
Bagian pertama ruas kanan juga sama dengan nol karena menurut (2.2)
∑ yˆ ( y i
i
− yˆ i ) = ∑ (a + bxi )( y i − yˆ i )
= a ∑ ( yi − yˆ i ) + b∑ ( yi − yˆ i ) xi = 0 + b ∑ ( yi − a − bxi ) xi = 0, Jadi persamaan dapat ditulis kembali sebagai berikut n
∑(y i =1
i
n
n
i =1
i =1
− y ) 2 = ∑ ( yˆ i − y ) 2 − ∑ ( y i − yˆ i )
JKT
JKR
…. (2.4)
JKS
Persamaan (2.4) adalah persamaan dasar dalam Analisis Regresi dan Analisis Variansi. Ruas kiri disebut jumlah kuadrat total (JKT) atau jumlah variasi total dan menyatakan jumlah penyimpangan y disekitar nilai rata-ratanya. Bagian pertama ruas kanan disebut jumlah kuadrat regresi (JKR) dan ini adalah variasi respons disekitar nilai rata-ratanya ( y ) . Bagian kedua ruas kanan disebut jumlah kuadrat galat (sisa) dan disingkat JKS. Bagian ini mengukur sisa dari variasi total (JKT) yang tidak dapat diterangkan oleh x, atau bagian yang sifatnya acak. Jadi dengan demikian dapat pula ditulis sebagai berikut: JKT = JKR + JKS Variasi Total = Variasi karena Regresi + Variasi karena Sisa. Sifat penjumlahan (aditif) seperti ini banyak dijumpai dalam statistika, dan ini tidak hanya berlaku untuk bentuk kuadrat tapi juga untuk derajat kebebasannya. Jika pengaruh X terhadap Y besar maka diharapkan JKR cukup besar dibandingkan dengan JKS. Bila JKR besar maka JKS kecil dan sebaliknya, sedangkan JKT tetap. Dengan demikian JKT dapat dijadikan pembanding untuk menentukan besar kecilnya JKR atau JKS.
Universitas Sumatera Utara
22
Dari definisi 2
R =
∑ ( yˆ ∑(y
i
− y) 2
i
− y)
2
=
JKR JKS
Dengan: R2 disebut koefisien korelasi dua arah atau koefisien penentu (determinasi). Karena 0 ≤ JKR ≤ JKT , maka tentunya 0 ≤ R 2 ≤ 1 . Jadi R2 dapat mengukur kecocokan data dengan model makin dekat R2 dengan 1 makin baik kecocokan data dengan model dan sebaliknya, makin dekat R2 dengan 0 makin jelek kecocokan tersebut. y
yi − y
y
y i − yˆ i
yˆ = a + bx
yˆ i − y
x Gambar 2.2 Menguraikan variasi menurut unsurnya
2.1.4 Pendekatan Melalui Analisis Variansi Dari persamaan (2.4) dapat dilihat penguraian jumlah kuadrat total atas kedua komponennya, jumlah kuadrat regresi dan jumlah kuadrat galat. Tujuan utama penguraian bukanlah untuk menghitung R2, tetapi merupakan langkah awal yang sangat penting dalam menelaah komponen jumlah kuadrat total. Untuk menentukan apakah pengaruh suatu peubah bebas X besar atau kecil terhadap respon Y diperlukan pembanding yang baku, yang tidak dipengaruhi baik buruknya model yang digunakan. Pembanding baku tersebut adalah penaksir tak bias dari σ 2 , variansi ε.
Universitas Sumatera Utara
23
Disamping
JKT
dapat
diuraikan
atas
kedua
komponennya,
derajat
kebebasannya dapat diuraikan juga. Sifat penjumlahan (aditif) ini merupakan salah satu keunggulan dari metode kuadrat terkecil. Tabel 2.1 Tabel Analisis Variansi Regresi Sederhana Sumber
JK (Jumlah
dk(Derajat
RK(Rataan
F
Variasi
Kuadrat)
Kebebasan)
Kuadrat)
hitung
Regresi
JKR = ∑ (Yˆi − Y ) 2
Sisa
JKS =
∑ (Y
Total
JKT =
∑ (Y
i
i
− Yˆi ) 2 −Y )
2
2 1
1
s =JKR/1
n-2
s 2 = JKS/(n-2)
s12 s
n-1
Tabel 2.1 Memperlihatkan bentuk umum tabel analisis variansi (ANAVA) untuk regresi linear sederhana. Kolom keempat menunjukkan jumlah kuadrat dibagi dengan derajat kebebasannya, untuk regresi dan sisa. Andaikan hipotesis yang akan diuji adalah H0 : β = 0 H1 : β ≠ 0 Yang pada dasarnya hipotesis nol ini mengatakan bahwa variasi dalam Y diakibatkan oleh fluktuasi acak yang tidak tergantung pada nilai X dengan kata lain X tidak mempengaruhi respons Y. Bila hipotesis nol ditolak yaitu bila nilai Statistik F hitungan melebihi nilai kritis Fα (1, n-2) maka disimpulkan bahwa terdapat jumlah variasi yang berarti dalam responY yang disebabkan atau diterangkan oleh model yang dipandang benar, yaitu fungsi linear. Bila statistik F berasal dalam daerah penerimaan maka disimpulkan bahwa data tidak memberikan cukup dukungan kepada model yang dianggap benar.
Universitas Sumatera Utara
24
2.2 Pengertian Dasar Penyimpangan dan Ragam Sebagai contoh misalkan dilakukan penelitian lapangan melalui survei sehingga hasil sampel yang diperoleh meliputi N individu. Individu tersebut dapat berupa perorangan, rumah tangga, industri kecil, atau wilayah dan lainnya. Masing-masing individu dinyatakan dengan huruf I yang menunjukkan individu ke-i dalam sampel. Informasi yang diperoleh dari setiap individu memberikan nilai-nilai pengamatan Y adalah: Y1, Y2, Y3, …, Yn. Dapat dilihat gambar 2.3 yaitu satu contoh mengenai berbagai hasil pengamatan yang diperoleh dari individu pertama sampai dengan ke- N. Y 5 -
Y =3,36
4 3 2 1 0
1
2
3
4
5
6
7
8
9
10
11
(individu)
Gambar 2.3 Contoh pengamatan dalam bentuk nilai rata-rata Langkah pertama yang harus dilakukan yaitu memilih model apa yang akan digunakan. Model tersebut bisa berupa nilai rata-rata, median, modus dan lainnya ataupun yang lebih rumit mengikuti suatu pola tertentu secara linear ataupun nonlinear. Pada gambar 2.3 diambil suatu contoh dalam bentuk nilai rata-rata hitung,
Y , dari seluruh pengamatan. Model ini akan menggambarkan dengan sempurna pola yang terdapat dalam kenyataan bila masing-masing individu dalam sampel memberikan nilai yang persis sama besarnya dengan nilai rata-rata tersebut. Dengan demikian seberapa besar penyimpangan yang terjadi antara nilai pengamatan dan nilai yang terkandung dalam model dihitung dari nilai rata-rata digambarkan dengan menguraikan setiap nilai pengamatan menjadi
Universitas Sumatera Utara
25
Yi = Y + (Yi − Y )
i = 1,2,3, …, N
…. (2.5)
Dimana (Yi − Y ) memberikan besaran nilai penyimpangan sehingga menggambarkan naik turunnya (fluktuasi) hasil pengamatan terhadap model dan menunjukkan seberapa jauh model yang dipakai tidak mampu menjelaskan kenyataan yang ada. Arah panah ke bawah berarti penyimpangan yang negatif sedangkan arah ke atas menunjukkan penyimpangan yang positif. Persamaan (2.5) mempergunakan suatu model yang sederhana nilai rata-rata
Y . Dalam bentuk umumnya persamaan tersebut dapat dinyatakan sebagai berikut : Yi = Yˆ + (Yi − Yˆ )
i = 1,2,3, …, N
Pengamatan = Cocokan + Residual
Yˆ merupakan model yang menggambarkan prediksi atau dugaan (estimasi) yang disebut juga dengan fitted values. Nilai Yˆ dapat berupa suatu titik fungsi linear atau nonlinear, Sedangkan ( Yi − Yˆ ) menunjukkan besarnya penyimpangan atau residual. Berdasarkan definisi dapat dilihat dengan jelas bahwa residual merupakan sisa dari hasil pengamatan yang belum dapat dijelaskan oleh suatu model tertentu. Dalam Analisis Regresi, yang menjadi tujuan utama adalah membuat jumlah kuadrat sisa atau residu, JKS =
∑ (Y
i
− Yˆ ) 2 sekecil mungkin agar dicapai suatu pemecahan
persoalan dalam bentuk besaran dan arah pengaruh peubah bebas terhadap peubah tak bebas. Oleh karena itu terdapat keterkaitan yang erat antara banyak peubah bebas dan JKS. Semakin banyak peubah bebas dalam suatu persamaan regresi, JKS akan cenderung mengecil dengan kata lain semakin besar kemampuan model dalam menjelaskan keragaman peubah tak bebas. Tujuan yang sama pada Analisis Regresi itulah menjadi arah pokok dalam pendekatan Analisis Ragam meskipun dilihat dari sudut pandang yang lain. Analisis Ragam mencoba membuat semua residu mengacak (random). Dalam keadaan demikian, keragaman peubah tak bebas tidak bisa dijelaskan lebih lanjut oleh kofaktor dan atau faktor lain kecuali dari yang sedang dalam pertimbangan.
Universitas Sumatera Utara
26
2.3 Analisis Ragam (ANAVA) Analisa Ragam (Analysis of Variance) merupakan metode yang digunakan untuk menganalisis atau menguraikan keragaman total data menjadi komponen-komponen sumber keragaman. Dalam analisis variansi yang paling sederhana, dipergunakan satu peubah tak bebas. Persyaratan utama yang harus dipenuhi berkaitan erat dengan skala pengukuran. Peubah tak bebas paling tidak harus dapat diukur dalam bentuk skala interval. Sedangkan peubah bebas dapat berupa peubah nonmetrik (peubah yang tidak dapat diukur) atau sebagai gabungan antara peubah nonmetrik dengan peubah metrik (peubah yang dapat diukur). Peubah bebas yang nonmetrik lebih dikenal sebagai faktor, sementara peubah metrik disebut sebagai kofaktor. Bila keseluruhan peubah bebas tersebut hanya terdiri atas kofaktor, maka analisa yang dipakai adalah Analisa Regresi. Analisa Regresi sederhana memecahkan permasalahan yang hanya mengandung satu kofaktor saja. Bila lebih dari satu kofaktor, pemecahan tersebut ditangani oleh Analisa Regresi Ganda (Multiple Regression Analysis). Akan tetapi bila keseluruhan peubah bebas adalah faktor, maka analisa yang digunakan pada dasarnya adalah Analisa Variansi (Analysis of Variance). Jika yang menjadi perhatian utama terletak pada apakah ada kemungkinan pengaruh satu faktor terhadap peubah tak bebas, maka pembahasan ini disebut dengan Analisa Variansi Satu Arah (One - Way Classification Analysis of Variance), jika pada dua faktor analisanya dilakukan dengan Analisa Variansi Dua Arah
(Two - Way
Classification Analysis of Variance).
2.3.1 Analisis Variansi Klasifikasi Satu Arah Di dalam klasifikasi satu arah melibatkan sebuah faktor penentu. Populasi yang berbeda ini diklasifikasikan menurut perlakuan atau grup yang berbeda dan dianggap saling bebas dan berdistribusi normal dengan rataan µ1 = µ 2 = ... = µ I dan variansi
σ 2 . Istilah perlakuan digunakan secara umum dengan arti berbagai klasifikasi, apakah itu kelompok, adukan, penganalisis, pupuk yang berbeda, atau berbagai daerah disuatu negara. dan variansi
Universitas Sumatera Utara
27
Ingin dicari metode yang sesuai untuk menguji hipotesis: H0 : µ1 = µ 2 = ... = µ I H1 : tidak semua µ i = 0 Misalkan y ij menyatakan pengamatan ke j dalam perlakuan ke i dan Ti menyatakan jumlah semua pengamatan dalam sampel dari perlakuan ke i, yi menyatakan rataan semua pengamatan dalam sampel dari perlakuan ke i, T.. jumlah semua nI pengamatan, dan y.. rataan semua nI pengamatan. Tiap pengamatan dapat ditulis dalam bentuk yij = µi + ε ij ,
….(2.6) Tabel 2.2 k sampel acak Perlakuan 1
2
I
y11
y 21
y I1
y12
y 22
y1n
y2n
Jumlah
T1 .
T2.
T I.
Rataan
y1.
y2 .
yI .
yI 2 y In T..
y..
Dengan ε ij menyatakan penyimpangan ke j pada sampel ke i dari rataan perlakuan padanannya. Suku ε ij menyatakan galat acak yang peranannya sama dengan suku galat dalam model regresi. Bentuk lain dari persamaan (2.6) diperoleh dengan mengganti µ i = µ + α i , dengan kendala
I
∑α i =1
i
= 0 dipenuhi.
Jadi dapat ditulis : yij = µ + α i + ε ij
Universitas Sumatera Utara
28
Bila µ menyatakan rataan keseluruhan dari semua µ i ; yakni I
µ=
∑µ i =1
i
I
Dengan:
α i disebut sebagai efek atau pengaruh perlakuan ke i. Hipotesis nol bahwa rataan populasi sama dan lawan tandingan bahwa paling sedikit dua dari rataan ini tidak sama diganti dengan hipotesis yang setara, H0 : α 1 = α 2 = ... = α I = 0 H1 : tidak semua α i = 0 . Uji yang dipakai didasarkan pada perbandingan dua taksiran bebas dari kesamaan variasi populasi σ 2 . Kedua taksiran tersebut diperoleh dengan menguraikan I
total variasi data, diusahakan oleh penjumlahan ganda
n
∑∑ ( y i =1 j =1
ij
− y..) 2 menjadi dua
komponen. Teorema 2.1 Identitas Jumlah Kuadrat I
n
∑∑ ( y i =1 j =1
I
ij
I
n
− y..) 2 = n∑ ( y i . − y..) 2 + ∑∑ ( y ij − y i .) 2 . i =1
i =1 j =1
Bukti I
n
∑∑ ( y i =1 j =1 I
I
ij
n
− y..) 2 = ∑∑ [( y i . − y..) + ( y ij − y i .)]2 i =1 j =1
n
= ∑∑ [( y i . − y..) 2 + 2( y i . − y..)( y ij − y i .) + ( y ij − y i .) 2 ] i =1 j =1 I
n
I
n
I
n
= ∑∑ ( y i . − y..) 2 + 2∑∑ ( y i . − y..)( y ij − y i .) + ∑∑ ( y ij − y i .) 2 . i =1 j =1
i =1 j =1
i =1 j =1
Universitas Sumatera Utara
29
Suku yang ditengah sama dengan nol, karena n
n
n
n
j =1
j =1
j =1
∑ ( yij − yi .) = ∑ yij − nyi . = ∑ yij − n
∑y j =1
n
ij
= 0.
Jumlah yang pertama tidak mengandung indeks j, jadi dapat ditulis I
n
I
∑∑ ( y . − y..)
2
i
i =1 j =1
2
= n∑ ( y i . − y..) . i =1
Sehingga I
n
∑∑ ( y i =1 j =1
I
2
I
n
− y..) = n∑ ( y i . − y..) + ∑∑ ( y ij − y i .) 2 2
ij
i =1
i =1 j =1
Agar memudahkan penggunaannya maka suku identitas jumlah kuadrat akan ditandai dengan lambang berikut: I
JKT =
n
∑∑ ( y i =1 j =1
ij
− y..) 2 = jumlah kuadrat total
I
JKA = n∑ ( y i . − y..) 2
= jumlah kuadrat perlakuan
i =1
I
JKG =
n
∑∑ ( y i =1 j =1
ij
− y i .) 2 = jumlah kuadrat galat
Identitas jumlah kuadrat dapat dituliskan: JKT = JKA + JKG. Identitas jumlah kuadrat menyatakan bahwa variasi antar perlakuan dan dalam perlakuan dijumlahkan menjadi jumlah kuadrat total. Akan tetapi, pemahaman lebih mendalam dapat diperoleh dengan menyelidiki nilai harapan dari JKA dan JKG. Kemudian akan diturunkan taksiran variasi yang merumuskan rasio yang akan digunakan untuk menguji kesamaan dari rataan populasi.
Universitas Sumatera Utara
30
Perlu dibandingkan ukuran variansi antara perlakuan yang sesuai dengan variansi dalam perlakuan agar dapat ditemukan perbedaan yang berarti dalam pengamatan akibat pengaruh perlakuan. Perhatikan nilai harapan jumlah kuadrat perlakuan. I
Teorema 2.2 E(JKA) = (I-1) σ 2 + n∑ α i2 i =1
Bukti Bila JKA dipandang sebagai peubah acak yang nilai-nilainya berubah bila percobaan diulang beberapa kali, maka dapat ditulis: I
JKA = n∑ ( y i . − y..) 2 . i =1
Dari model : yij = µ + α i + Eij Diperoleh yi. = µ + α i + Ei . y.. = µ + E .., karena
I
∑α i =1
i
= 0. Jadi
I
JKA = n∑ (α i + Ei . − E ..) 2 i =1
dan
I
I
I
i =1
i =1
i =1
E(JKA) = n∑ α i2 + n∑ E ( Ei2 .) − nIE ( E 2 ..) + 2n∑ α i E ( Ei .)
Karena Eij merupakan peubah bebas dengan rataan nol dan variansi σ 2 , maka diperoleh : E ( Ei2 .) =
σ2 n
E ( E 2 ..) =
,
σ2 nI
,
E ( Ei .) = 0
I
sehingga
E ( JKA) = n∑ α i2 + Iσ 2 − σ 2 i =1
I
= ( I − 1)σ 2 + n∑ α i2 i =1
Universitas Sumatera Utara
31
Salah satu taksiran σ 2 yang didasarkan pada I-1 derajat kebebasan diberikan oleh Rataan Kuadrat Perlakuan s12 =
JKA . I −1
Bilo H0 benar dan tiap α i pada teorema 2.2 sama dengan nol, maka
JKA 2 E =σ 1 I− Dan s12 merupakan taksiran σ 2 yang tak bias. Akan tetapi, bila H1 yang benar, maka I
n∑ α i2
JKA 2 E = σ + i =1 I −1 I −1
dan s12 menaksir σ 2 ditambah suatu suku tambahan mengukur variasi akibat pengaruh yang sistematik. Taksiran σ 2 yang kedua dan bebas dari hipotesis, didasarkan pada I(n-1) derajat kebebasan, ialah rumus yang dikenal, yaitu Rataan Kuadrat Galat s 2 =
JKG I (n − 1)
Identitas jumlah kuadrat tidak saja menguraikan keragaman total data, tetapi juga jumlah semua derajat kebebasan. Dengan perkataan lain nI - 1 = I – 1 + I(n-1). Bila H0 benar, rasio
f =
s12 s2
Merupakan suatu nilai peubah acak F yang berdistribusi F dengan derajat kebebasan I-1 dan I(n-1). Karena s12 menaksir lebih σ 2 bila H0 salah, maka diperoleh uji ekasisi dengan daerah kritis selutuhnya terletak disebelah ujung kanan fungsi distribusi.
Universitas Sumatera Utara
32
Hipotesis nol ditolak pada taraf keberartian α bila f > f α [ I − 1, I (n − 1)] Perhitungan masalah analisis varianasi diringkas dalam bentuk tabel seperti pada tabel 2.3. Tabel 2.3 Analisis Variansi untuk klasifikasi satu arah
Sumber
Jumlah
Derajat
Rataan
Variasi
Kuadrat
Kebebasan
Kuadrat
Perlakuan
JKA
I-1
JKA s = I −1
Galat
JKG
I(n-1)
s2 =
Total
JKT
nI-1
2 1
f Hitungan
s12 s2
JKG I (n − 1)
2.3.2 Analisis Variansi Klasifikasi Dua Arah Analisis Variansi klasifikasi dua arah merupakan pengembangan atau perluasan dari analisa dengan satu arah. Anava klasifikasi dua arah membahas tentang keragaman dalam satu peubah tidak bebas Y yang ditimbulkan oleh keragaman dua faktor. Seperti digambarkan dalam tabel 2.4.
Universitas Sumatera Utara
33
Tabel 2.4 Klasifikasi dua arah Perlakuan
Blok 1
2
1
y11
y12
2
y 21
y 22
I
y I1
yI 2
Jumlah
T.1
Rataan
y.1
Jumlah Rataan ...
J
…
y1J
T1.
y1 .
… y2J
T2.
y2 .
yI .
...
y IJ
T I.
T.2
…
T.J
T..
y. 2
…
y. J
y..
Dengan: yi . = rataan pengamatan untuk perlakuan ke i y. j = rataan pengamatan dalam blok ke j
y.. = rataan keseluruhan ij pengamatan Ti. = jumlah pengamatan untuk perlakuan ke i T.j = jumlah pengamatan dalam blok ke j
T .. = jumlah keseluruhan ij pengamatan. Rata-rata rataan populasi perlakuan ke i, µi , didefenisikan sebagai J
µi . =
∑µ j =1
ij
J
Rata-rata rataan populasi blok ke j, µ . j , didefenisikan sebagai I
µ. j =
∑µ i =1
ij
I
Universitas Sumatera Utara
34
Dan rata-rata rataan keseluruhan µ , didefenisikan sebagai I
µ=
J
∑∑ µ i =1 j =1
ij
IJ
Untuk menentukan apakah ada bagian variasi dalam pengamatan yang diakibatkan oleh perbedaan dalam perlakuan, dilakukan uji H 0 : µ1 . = µ 2 . = ... = µ I . = µ H 1 : tidak semua µ i. = 0 dan untuk menentukan apakah ada variasi yang diakibatkan oleh perbedaan blok dilakukan uji H 0 : µ .1 = µ .2 = ... = µ . J = µ , H 1 : tidak semua µ .j = 0 Tiap pengamatan dapat dituliskan dalam bentuk y ij = µ ij + ε ij
dengan ε ij mengukur penyimpangan nilai amatan y ij dari rataan populasi µij . Bentuk persamaan yang lebih disukai diperoleh dengan penggantian
µij = µ + α i + β j Dengan α i menyatakan pengaruh perlakuan ke i dan β j menyatakan pengaruh blok ke j. Dianggap bahwa pengaruh perlakuan dan blok aditif. Jadi dapat ditulis y ij = µ + α i + β j + ε ij
Model ini mirip dengan klasifikasi satu arah, perbedaan utamanya adalah adanya pengaruh blok β j . Konsep dasarnya mirip sekali dengan klasifikasi satu arah kecuali disini pengaruh tambahan akibat blok harus diperhitungkan dalam analisis karena sekarang variasi dikendalikan secara sistematis dalam dua arah.
Universitas Sumatera Utara
35
Bila sekarang dikenakan pembatasan bahwa I
∑ α i = 0 dan i =1
J
∑β j =1
j
=0
Maka, J
µi . =
∑ (µ + α j =1
i
I
+ βj) = µ + αi
J
dan µ . j =
∑ (µ + α i =1
I
i
+ βj)
= µ +βj
Hipotesis nol bahwa i rataan perlakuan µi . sama, dan karena itu sama dengan µ dengan menguji hipotesis H 0 : α 1 = α 2 = ... = α I = 0, H i : tidak semua α i = 0 Begitu juga hipotesis nol bahwa j rataan blok µ . j sama, setara dengan menguji hipotesis H 0 : β1 = β 2 = ... = β J = 0 H 1 : tidak semua β j = 0 Tiap uji pada perlakuan akan didasarkan pada perbandingan taksiran-taksiran bebas untuk variasi populasi bersama σ 2 . Taksiran ini diperoleh dengan memisahkan jumlah kuadrat total data menjadi tiga bagian dengan menggunakan identitas berikut. Teorema 2.3 Identitas Jumlah Kuadrat I
J
I
J
i =1
j =1
∑∑ ( yij − y..) 2 = J ∑ ( yi . − y..) 2 + I ∑ ( y. j − y..) 2 i =1 j =1
I
J
+ ∑∑ ( y ij − y i . − y. j + y..) 2 i =1 j =1
Universitas Sumatera Utara
36
Bukti I
J
J
I
∑∑ ( yij − y..) 2 = ∑∑ [( yi . − y..) + ( y. j − y..) + ( yij − yi . − y. j + y..)]2 i =1 j =1
i =1 j =1
J
I
I
J
I
J
= ∑ ∑ ( y i . − y..) 2 + ∑∑ ( y. j − y..) 2 + ∑∑ ( y ij − y i . − y. j + y..) 2 i =1 j =1
i =1 j =1
I
i =1 j =1
J
+ 2∑∑ ( y i . − y..)( y. j − y..) i =1 j =1 I
J
+ 2∑∑ ( y i . − y..)( y ij − y i . − y. j + y..) i =1 j =1 I
J
+ 2∑∑ ( y. j − y..)( y ij − y i . − y. j + y..) . i =1 j =1
Suku perkalian silang semuanya sama dengan nol. Jadi I
J
I
J
i =1
j =1
∑∑ ( yij − y..) 2 = J ∑ ( yi . − y..) 2 + I ∑ ( y. j − y..) 2 i =1 j =1
I
J
+ ∑∑ ( y ij − y i . − y. j + y..) 2 i =1 j =1
Identitas jumlah kuadrat dapat dituliskan dengan lambang persamaan JKT = JKA + JKB + JKG Dengan : I
JKT =
J
∑∑ ( y i =1 j =1
ij
− y..) 2 = jumlah kuadrat total
I
JKA = J ∑ ( y i . − y..) 2 = jumlah kuadrat perlakuan i =1 J
JKB = I ∑ ( y. j − y..) 2 = jumlah kuadrat blok j =1
I
JKG =
J
∑∑ ( y i =1 j =1
ij
− y i . − y. j + y..) 2 = jumlah kuadrat galat
Universitas Sumatera Utara
37
Dengan mengikuti cara kerja seperti diuraikan pada teorema 2.2 yaitu bila jumlah kuadrat tersebut ditafsirkan sebagai fungsi peubah acak bebas, maka dapat y11 , y12 ,..., y IJ ditunjukkan bahwa nilai harapan jumlah kuadrat perlakuan, blok, dan galat adalah, I
E(JKA) = ( I − 1)σ 2 + J ∑ α i2 i =1
J
E(JKB) = (J-1) σ 2 + I ∑ β j2 j =1
E(JKG) = (I-1)(J-1) σ 2 . Salah satu taksiran σ 2 didasarkan pada I-1 derajat kebebasan, adalah s12 =
JKA I −1
Bila pengaruh perlakuan α 1 = α 2 = ... = α I = 0 , maka s12 merupakan taksiran tak bias dari σ 2 . Akan tetapi, bila pengaruh perlakuan tidak semuanya nol, maka I
J ∑ α i2
JKA 2 E = σ + i =1 1 I I −1 −
dan s12 akan secara berlebihan menaksir σ 2 . Taksiran kedua σ 2 , didasarkan atas J-1 derajat kebebasan, diberikan oleh s 22 =
Taksiran
JKB . J −1
s22
merupakan taksiran tak bias dari
σ2
bila pengaruh blok
β1 = β 2 = ... = β J = 0. Bila pengaruh blok tidak semuanya nol, maka: J
I ∑ β j2
JKB j =1 2 E =σ + J −1 J −1
Universitas Sumatera Utara
38
Dan s 22 akan secara berlebihan menaksir σ 2 . Taksiran ketiga dari σ 2 , didasarkan pada (I-1)(J-1) derajat kebebasan dan bebas dari s 2 , diberikan oleh
s2 =
JKG , ( I − 1)( J − 1)
Yang tidak bias, terlepas apakah kedua hipotesis nol benar atau salah. Untuk menguji hipotesis nol bahwa pengaruh perlakuan semuanya sama dengan nol, dengan menghitung rasio:
s12 f1 = 2 , s Yang merupakan nilai peubah acak F1 yang berdistribusi F dengan derajat kebebasan I-1 dan (I-1)(J-1) bila hipotesis nol benar. Hipotesis nol ditolak pada taraf keberartian
α bila f1 > f α [ I − 1, ( I − 1)( J − 1)]. Untuk menguji hipotesis nol bahwa pengaruh blok semuanya sama dengan nol, dengan menghitung rasio:
f2 =
s22 , s2
Yang merupakan nilai peubah acak F2 yang berdistibusi F dengan derajat kebebasan J-1 dan (I-1)(J-1) bila hipotesis nol benar. Perhitungan Anava untuk klasifikasi dua arah disajikan dalam tabel 2.5.
Universitas Sumatera Utara
39
Tabel 2.5 Analisis Variansi Klasifikasi Dua Arah Sumber
Jumlah
Derajat
Variasi
Kuadrat Kebebasan
Rataan
F
Kuadrat
Hitunga n
Perlakuan
JKA
I-1
s12 =
JKA I −1
f1 =
s12 s2
Blok
JKB
J-1
s 22 =
JKB J −1
f2 =
s 22 s2
Galat
JKG
(I-1)(J-1)
Jumlah
JKT
IJ-1
s2 =
JKG ( I − 1)( J − 1)
2.3.3 Analisis Variansi Klasifikasi Dua Arah dengan Interaksi Klasifikasi dua arah dengan interaksi mencakup uji hipotesa tentang pengaruh baris, kolom dan interaksi antara baris dan kolom. Untuk menentukan rumus klasifikasi dua arah dengan pengamatan yang berulang dalam rancangan acak lengkap, pandang K sebagai replikasi pada tiap kombinasi perlakuan faktor A diamati pada I taraf dan faktor B pada J taraf. Pengamatan dapat disajikan dalam suatu matriks yang barisnya menyatakan taraf faktor A sedangkan kolomnya menyatakan taraf faktor B. Tiap kombinasi perlakuan menentukan suatu sel dalam matriks. Jadi terdapat IJ sel, masing-masing berisi K pengamatan. Seluruh IJK pengamatan diperlihatkan pada tabel 2.6.
Universitas Sumatera Utara
40
Tabel 2.6 Klasifikasi Dua Arah dengan Interaksi Faktor A
Faktor B (kolom)
(baris)
1
1
y111
y121 … y1J 1
y112
y122 … y1J 2
y11K
y12 K
y 211
y 221 … y2 J 1
y 212
y 222 … y2 J 2
y21K
y22 K
I
yI 11
yI 21 … yIJ 1
yI 12
yI 22
… yIJ 2
y I 1K
yI 2 K … yIJK
Jumlah
y.1.
y.2.
Rataan
y.1 .
2
2
…
Jumlah
Rataan
y1..
y1..
y 2..
y 2..
y I ..
y I ..
J
… y1JK
… y2 JK
y. 2 .
… …
y.J . y .J .
y…
y…
Pengamatan pada sel ij membentuk sampel acak berukuran n dari suatu populasi yang dianggap berdistribusi normal dengan rataan µij dan variansi σ 2 . Semua populasi yang banyaknya IJ dianggap mempunyai variansi yang sama. Tiap pengamatan dalam tabel 2.6 dapat ditulis dalam bentuk yijk = µij + ε ijk ,
Universitas Sumatera Utara
41
Dengan ε ijk mengukur penyimpangan pengamatan nilai y ijk pada sel ke ij dari rataan populasi µ ij . Bila γ ij menyatakan pengaruh interaksi antara faktor A taraf ke i dan faktor B taraf ke j, α i pengaruh faktor A, β j pengaruh faktor B dan µ rataan keseluruhan, maka dapat ditulis
µij = µ + α i + β j + (γ )ij sehingga yijk = µ + α i + β j + (γ )ij + ε ijk Yang akan dikenakan pembatasan I
∑α i =1
i
J
I
J
j =1
i =1
j =1
= 0, ∑ β j = 0, ∑ (γ )ij = 0, ∑ (γ )ij = 0
Ketiga hipotesis yang akan diuji adalah: H 0 : α 1 = α 2 = ... = α I = 0 H 1 : tidak semua α i = 0 H 0 : β1 = β 2 = ... = β J = 0 H 1 : tidak semua β j = 0 H 0 : (γ )11 = (γ )12 = ... = (γ ) IJ = 0 H 1 : tidak semua (γ ) ij = 0 Tiap uji ini akan didasarkan pada perbandingan taksiran σ 2 yang bebas diperoleh dengan menguraikan jumlah kuadrat data menjadi empat bagian dengan menggunakan kesamaan (identitas) berikut. Teorema 2.4 Identitas Jumlah Kuadrat I
J
K
I
J
i =1
j =1
∑∑ ∑ (yijk − y...) 2 = JK ∑ ( yi .. − y...) 2 + IK ∑ ( y. j. − y...) 2 i =1 j =1 k =1
I
J
+ K ∑∑ ( yij . − yi .. − y. j . + y...) 2 i =1 j =1
I
J
K
+ ∑∑∑ ( yijk − yij .) 2 . i =1 j =1 k =1
Universitas Sumatera Utara
42
Identitas jumlah kuadrat dapat dituliskan dengan lambang persamaan JKT = JKA + JKB +JK(AB) + JKG Derajat kebebasannya menurut kesamaan IJK - 1 = (I-1) + (J-1) + (I-1)(J-1) + IJ(K-1). Bila tiap jumlah kuadrat pada sebelah kanan kesamaan jumlah kuadrat dibagi dengan derajat kebebasannya, maka diperoleh keempat statistik yaitu s12 =
JK ( AB) JKG JKA 2 JKB , s2 = , s2 = , s32 = ( I − 1)( J − 1) IJ ( K − 1) I −1 J −1
Semua taksiran variansi ini adalah taksiran σ 2 yang bebas dengan syarat bahwa tidak ada pengaruh α i , β j dan (γ ) ij . Bila jumlah kuadrat dipandang sebagai fungsi dari peubah acak bebas Y111, Y112, …, YIJK maka I
JKA E ( S12 ) = E =σ2 + I − 1
JK ∑ α i2 i =1
I −1 J
JKB E ( S 22 ) = E =σ2 + J − 1
IK ∑ β j2 i =1
J −1 I
J
K ∑∑ (γ )ij2
JK ( AB) = σ 2 + i =1 j =1 E ( S32 ) = E ( I − 1)( J − 1) ( I − 1)( J − 1) JKG E (S 2 ) = E =σ2 IJ ( K − 1) Dari rumus dengan mudah dapat disimpulkan bahwa keempat taksiran σ 2 tidak bias bila H0 (hipotesis nol) benar.
Universitas Sumatera Utara
43
Untuk menguji hipotesis nol bahwa pengaruh perlakuan semuanya sama dengan nol, dengan menghitung rasio:
f1 =
s12 , s2
Yang merupakan nilai peubah acak F1 yang berdistribusi F dengan derajat kebebasan I-1 dan IJ(K-1) bila hipotesis nol benar. Hipotesis nol ditolak pada taraf keberartian
α bila f1 > f α [ I − 1, IJ ( K − 1)]. Untuk menguji hipotesis nol bahwa pengaruh blok semuanya sama dengan nol, dengan menghitung rasio:
f2 =
s 22 s2 ,
Yang merupakan nilai peubah acak F2 yang berdistibusi F dengan derajat kebebasan J-1 dan IJ(K-1) bila hipotesis nol benar. Hipotesis ini ditolak pada taraf keberartian
α bila
f 2 > f α [( J − 1, IJ ( K − 1)]. Untuk menguji hipotesis H0 bahwa pengaruh
interaksi semuanya nol, maka:
f3 =
s32 s2
yang merupakan nilai peubah acak F3 yang berdistribusi F dengan derajat kebebasan (I-1)
(J-1)
dan
IJ(K-1)
bila
H0
benar.
Adanya
interaksi
bila
f 3 > f α [( I − 1)( J − 1), IJ ( K − 1)]. Perhitungan mengenai masalah Anava untuk klasifikasi dua arah dengan interaksi disajikan dalam
tabel 2.7.
Universitas Sumatera Utara
44
Tabel 2.7 Analisis Variansi untuk klasifikasi dua arah dengan interaksi Sumber Variasi
Jumlah Kuadrat
Derajat Kebebasan
A (baris)
JKA
I-1
B (kolom)
JKB
J-1
Rataan Kuadrat
f hitung
Pengaruh utama
Interaksi
JK(AB)
(I-1)(J-1)
S12 =
JKA I −1
S 22 =
JKB J −1
S 32 =
JK ( AB) ( I − 1)( J − 1)
S2 =
JKG IJ ( K − 1)
AB
Sisa Total
JKG
IJ(K-1)
JKT
IJK-1
f1 =
f2 =
S12 S2
S 22 S2
S 32 f3 = 2 S
Jumlah Kuadrat diperoleh dengan membentuk tabel jumlah berikut: Tabel 2.8 B A
Jumlah 1
2
…
J
1
y11.
y12.
…
y1 j .
2
y 21.
y 22.
…
y2 j.
I
y I 1.
y I 1. …
y IJ
y I ..
Jumlah
y.1.
y.2. …
y. J .
y…
y1 .. y 2 ..
Universitas Sumatera Utara