ANALISIS FAKTOR (FACTOR ANALYSIS)
PENDAHULUAN Analisis faktor: mengkaji hubungan internal dari gugus variabel Data: peubah-peubah yang dianalisis berkorelasi tinggi didalam grupnya sendiri dan berkorelasi rendah dengan yang berbeda grup Tujuan: untuk mempelajari beberapa sifat yang mendasar namun tidak dapat terobservasi kuantitasnya Tokoh: Charles Spearman yang mengemukakan dalil bahwa korelasi internal dapat diwakili dengan menggunakan sebuah peubah atau faktor yang dinamakan dengan faktor g. Selanjutnya faktor ini dikenal sebagai faktor ’kepintaran umum’ (general intelegence)
FORMULASI MODEL FAKTOR Misal vektor acak X dengan p komponen memiliki rataan µ dan matriks peragam (covariance) Σ. Pada umumnya model analisis faktor adalah: X1 - µ1 = l11F1 + l12F2 + … +l1mFm + ε1 X2 - µ2 = l21F1 + l22F2 + … +l2mFm + ε2 : : :
Xp - µp = lp1F1 + lp2F2 + … +lpmFm + εp
FORMULASI MODEL FAKTOR (lanjutan)
Dalam bentuk matriks: (X - µ) = L F + ε (px1)
(pxm)
(mx1)
(px1)
Keterangan: µ = vektor rataan L = matriks konstanta yang tidak diketahui nilainya (loading factor) F = vektor acak ε = vektor unsur galat (faktor khusus)
FORMULASI MODEL FAKTOR (lanjutan)
Dengan asumsi: E(F) = 0, E(ε) = 0 Cov(F) = E(FF’) = I Cov(ε) = E(ε ε’) = ψ = diag(ψ1, ψ2,…, ψp) F dan ε saling bebas Cov(ε,F) = E(ε,F) = 0
FORMULASI MODEL FAKTOR (lanjutan)
Struktur
peragam
dari
model faktor orthogonal: Cov(X) = LL’ + ψ atau var(Xi) = l2i + … + l2im + ψ i cov(Xi,Xk) = li1 lk1 + … + lim lkm Cov(X,F) = L atau cov(Xi,Fj) = lij
FORMULASI MODEL FAKTOR (lanjutan)
Pembuktian struktur peragam: Cov(X-µ) = cov(L F+ε) .1 = cov(L F)+cov(ε)+2cov(L F+ε) = L cov(F) L’+ ψ +2L cov(L F+ε) = L L’+ ψ Cov(X,F) = cov(L F+ε ; F) .2 = cov(L F ; F)+cov(ε ; F) = L cov(F) = L (korelasi antara X dengan faktor)
FORMULASI MODEL FAKTOR (lanjutan)
Komunalitas ke-i merupakan bagian dari ragam peubah ke-i yang dapat dijelaskan oleh m faktor umum. hi2 = li12 + li22 + … + lim2 dan σii = hi2 + ψi ; I = 1,2, …,p
PERMASALAHAN Ada tiga hal penting yang menjadi pokok permasalahan dalam analisis faktor, yaitu: Mengidentifikasi struktur Menduga parameter (loading faktor dan ragam sistematik Interpretasi faktor
PENDUGAAN PARAMETER Metode Metode non-iteratif
Metode komponen utama Metode faktor utama Analisis Citra Analisis faktor kanonik non-iteratif
Metode iteratif
Metode Metode Metode Metode
kemungkinan maksimum kuadrat terkecil tak terboboti komponen utama iteratif Harris analisis faktor alpha
KONSEP PENDUGAAN Metode Komponen Utama
Misalkan R adalah matriks korelasi contoh berukuran pxp, karena matriks R simetrik dan definit positif maka bisa dituliskan sebagai berikut: R = Γ Λ Γ’ dengan: Λ= diag(λ1,λ2,…λp) dan λ1>λ2>…>λp>0 adalah akar ciri dari matriks R, serta Γ Γ’= Γ’ Γ =Ip Γ= matriks orthogonal pxp yang kolom-kolomnya adalah vektor ciri matriks R yaitu, T1,T2,…,Tp yang berpadanan dengan vektor ciri λ1,λ2,…,λp
Metode Komponen Utama (lanjutan) Misalkan k adalah banyaknya komponen utama yang dipilih, maka matriks L^ didefinisikan sebagai berikut:
(pxp)
L^ = |√λ1Γ1|√λ2Γ2|…|√λkΓk| R didekati dengan L^ L^ ‘=Σki=1λiΓiΓi’ dimana Γi adalah kolom ke-i pada matriks Γ
Metode Komponen Utama (lanjutan) Matriks diagonal ragam khusus ψ diduga dengan ψ ^, yaitu matriks diagonal yang unsurnya diambil dari R= L^ L^ ‘
1 h1 0 ... 0 2 ˆ 0 1 h2 0 2 0 1 h p 0 2
.
. .
Metode Komponen Utama (lanjutan) Ukuran kebaikan suai dari model faktor adalah sebagai berikut: RMS_overall = √(1/p(1-p))Σip=1Σjp=1resij2 Semakin kecil nilai RMS_overall mengindikasikan kebaikan suai yang tinggi. Model terbaik berdasarkan kriteria ini adalah jika diperoleh RMS-overall < 0.05 dengan banyaknya faktor bersama yang paling sedikit.
ILUSTRASI Data harga saham terdiri dari n=100 harga mingguan dengan p=5 saham. Dengan menggunakan metode AKU didapatkan dua komponen utama. Secara spesifik penduga loading faktor adalah koefisien komponen utama (vektor ciri dari R) dibandingkan dengan akar kuadrat dari akar ciri yang bersesuaian.
Tabel pendugaan loading faktor,komunalitas dan total proporsi keragaman yang dijelaskan dari setiap faktor untuk m=1 dan m=2 Solusi satu faktor
Variabel
F1 Allied Chemical DuPont Union Carbide Exxon Texaco
~2 ~ i 1 hi
Solusi dua faktor
F1
F2
~2 ~ i 1 hi
.1
0.783
0.39
0.783
-0.217
0.34
.2
0.773 0.794 0.713 0.712
0.40 0.37 0.49 0.49
0.773 0.794 0.713 0.712
-0.458 -0.234 0.472 0.524
0.19 0.31 0.27 0.22
0.571
0.733
.3
.4 .5
Total proporsi kumulatif keragaman yang dapat dijelaskan
0.571
Proporsi untuk total keragaman dengan menggunakan solusi dua faktor lebih besar daripada hanya menggunakan satu faktor. Faktor pertama merepresentasikan kondisi ekonomi secara umum dan dapat disebut faktor pasar. Faktor kedua merupakan kontras antra saham perusahaan kimia dengan saham perusahaan minyak (pada faktor perusahaan kimia memiliki loading negatif yang relatif besar dan perusahaan minyak memiliki loading positif yang relatif besar). Dengan demikian faktor kedua dapat disebut faktor industri karena sebagai pembeda harga saham di industri yang berbeda.
Komunalitas Dengan m=2, Matriks residual untuk solusi 2 faktor adalah
~2 ~ 2 ~ 2 2 2 hi 11 12 (0.783) (0.217 ) 0.66 0.127 0.164 0.069 0.017 0 0.127 0 0 . 122 0 . 055 0 . 012 ~~ ~ R L L ' 0.164 0.122 0 0.019 0.017 0 0.232 0.069 0.055 0.019 0.017 0.012 0.017 0.232 0
Metode Kemungkinanan Maksimum Metode kemungkinan maksimum (MKM) mengasumsikan bahwa matriks ragam-peragam atau matriks korelasi semua peubah bersifat non-singular. Fungsi kepekatan bagi S adalah: L(S)=c S e dengan c adalah konstanta. Sehingga log-likelihood dari L dan ψ, jika Σ = LL’ + ψ adalah:
n 1 2
n 1 p 1 2 2
n 1 tr ( 1 S ) 2
n 1 1 1 ln c {tr[( LL' ) S} ln | ( LL' ) S |]} 2
Penduga kemungkinan maksimum bagi L dan ψ diperoleh dengan memaksimumkan persamaan diatas dengan kendala k(k-1)/2 persyaratan keunikan (Johnson&Wichern,1998).
Penentuan banyaknya faktor bersama Uji Nisbah Kemungkinan (likelihood ratio test) Hipotesis nol yang diuji pada uji nisbah kemungkinan ini adalah: H0: Σ = LL’+ψ, r(L)=k diketahui
Misalkan , Ldan = L L + adalah penduga kemungkinan maksimum bagi L, ψ dan Σ, jika H0 benar, maka nilai maksimum untuk log dari fungsi kemungkinannya adalah: ^
Uji Nisbah Kemungkinan (likelihood ratio test): (lanjutan)
ln LH 0
n 1 1 1 c tr S S ln S S 2 *
n 1 c p 2 *
Statistik uji nisbah kemungkinan yaitu
LH 0 2 ln 2 ln L
Menyebar khi-kuadrat dengan
db 1
LH 0 Jadi, hipotesis nol ditolak jika 2 ln L
2
p k 2 p k
2 ; db 1 2 p k 2 p k
Penentuan banyaknya faktor bersama (lanjutan)
Akaike’s information Criterion(AIC) Statistik AIC untuk model dengan k faktor didefinisikan sebagai berikut: AIC(k)=-2ln L(k)+[2p(k+1)-k(k-1)] Model berfaktor k dengan k adalah nilai yang berpadanan dengan AIC (k) yang paling kecil dianggap sebagai model terbaik
Data harga saham dianalisa kembali dengan menggunakan metode maksimum likelihood dengan tetap memakai dua model faktor
Komunalitas dengan menggunakan metode maksimum likelihood adalah: 2 2 2 ˆ ˆ ˆ hi i1 i 2 (0.684) 2 (0.189) 2 0.50
Matriks residualnya adalah: 0.005 0.004 0 0.005 0 0.003 R Lˆ Lˆ ' 0.004 0.003 0 0.024 0.004 0.031 0,004 0.000 0.004
0.024 0.004 0.004 0.000 0.031 0.004 0 0.000 0.000 0
Tabel pendugaan faktor loading, komunalitas, ragam khusus dan total proporsi keragaman contoh yang dapat dijelaskan Variabel
Maksimum likelihood Penduga faktor
Allied Chemical DuPont Union Karbide Exxon Texaco
~2 ~ i 1 hi
Komponen utama Penduga faktor
~2 ~i 1 hi
.1
0.684
0.189
0.50
0.783
-0.217
0.34
.2
0.694 0.681
0.517 0.248
0.25 0.47
0.773 0.794
-0.458 -0.234
0.19 0.31
0.621 0.792
-0.073 -0.442
0.61 0.18
0.713 0.712
0.412 0.524
0.27 0.22
0.485
0.598
0.571
0.733
.3
.4 .5
Total proporsi kumulatif keragaman contaoh yang dapat dijelaskan
Interpretasi Elemen matriks residual pada maximum likelihood lebih kecil dari pada matriks residual pemfaktoran komponen utama. Total proporsi kumulatif keragaman pada faktor komponen utama lebih besar dibandingkan faktor maximum likelihood. Maka tidak mengherankan bila kriteria pemfaktoran komponen utama lebih dipilih. Loading yang didapatkan dari analisis faktor komponen utama berhubungan dengan komponen utama yang mengoptimumkan keragaman.
Lanjutan … Pada solusi maximum likelihood semua variabel pada faktor pertama memiliki loading yang positif dan relatif besar. Faktor tersebut disebut faktor pasar. Faktor loading yang kedua memiliki tanda yang konsisten dengan kontras atau faktor industri, tapi magnitudonya relatif kecil dibeberapa kasus. Mungkin dapat diidentifikasikan bahwa faktor ini adalah pembandingan antara DuPont dan Texaco
ROTASI FAKTOR Dipergunakan untuk memudahkan interpretasi Merupakan transformasi ortogonal dari loading factors L*= LT dimana TT’=T’T=I Beberapa jenis transformasi yaitu, varimax, oblique, quartimax, dan lain-lain
ROTASI FAKTOR (lanjutan)
Rotasi Varimax Merupakan rotasi yang paling sering dipergunakan pada aplikasi. Merupakan transformasi ortogonal yang diperoleh dengan cara memaksimumkan: p * 2 2 p l 2 2 1 1 l ij ij p i 1 hi j 1 p i 1 hi k
ROTASI FAKTOR (lanjutan)
Rotasi Oblique Digunakan apabila transformasi ortogonal terhadap matriks loading faktor menghasilkan faktor yang masih sulit diinterpretasikan.
ROTASI FAKTOR (lanjutan)
Rotasi quartimax Transformasi ortogonal dengan tujuan memperoleh * 4
yang memaksimumkan
l
i
ij
j
L Adalah matriks loading faktor yang ingin ditransformasi menggunakan matriks ortogonal sehingga
menjadi
1 Pk i
L* L
1 * 4 l ij j Pk i
Mencapai maximum.
1 * 2 l ij j Pk i
1 * 4 * 2 l l ij ij j Pk i
Data harga saham dianalisa kembali dengan menggunakan metode maksimum likelihood dengan tetap memakai dua model faktor
Komunalitas dengan menggunakan metode maksimum likelihood adalah: 2 2 2 hˆi ˆ i1 ˆ i 2 (0.684) 2 (0.189) 2 0.50
Matriks residualnya adalah: 0.005 0.004 0 0.005 0 0.003 R Lˆ Lˆ ' 0.004 0.003 0 0.024 0.004 0.031 0,004 0.000 0.004
0.024 0.004 0.004 0.000 0.031 0.004 0 0.000 0.000 0
Tabel pendugaan faktor loading, komunalitas, ragam khusus dan total proporsi keragaman contoh yang dapat dijelaskan Variabel
Maksimum likelihood Penduga faktor
F1 Allied Chemical DuPont Union Karbide Exxon Texaco
F2
Komponen utama Penduga faktor
~ ~i 1 hi 2
~
~i 1 hi 2
F1
F2
.1
0.684
0.189
0.50
0.783
-0.217
0.34
.2
0.694 0.681
0.517 0.248
0.25 0.47
0.773 0.794
-0.458 -0.234
0.19 0.31
0.621 -0.073 0.792 -0.442
0.61 0.18
0.713 0.712
0.412 0.524
0.27 0.22
0.571
0.733
.3
.4 .5
Total proporsi kumulatif keragaman contaoh yang dapat dijelaskan
0.485
0.598
Interpretasi Elemen matriks residual pada maximum likelihood lebih kecil dari pada matriks residual pemfaktoran komponen utama. Total proporsi kumulatif keragaman pada faktor komponen utama lebih besar dibandingkan faktor maximum likelihood. Maka tidak mengherankan bila kriteria pemfaktoran komponen utama lebih dipilih. Loading yang didapatkan dari analisis faktor komponen utama berhubungan dengan komponen utama yang mengoptimumkan keragaman.
Lanjutan … Pada solusi maximum likelihood semua variabel pada faktor pertama memiliki loading yang positif dan relatif besar. Faktor tersebut disebut faktor pasar. Faktor loading yang kedua memiliki tanda yang konsisten dengan kontras atau faktor industri, tapi magnitudonya relatif kecil dibeberapa kasus. Mungkin dapat diidentifikasikan bahwa faktor ini adalah pembandingan antara DuPont dan Texaco