Factor Analysis Siana Halim Subhash Sharma, Applied Multivariate Techniques, John Willey & Sons, 1996
Pendahuluan `
` `
Seorang manajer pemasaran dari perusahaan pakaian ingin mengetahui apakah terdapat hubungan antara patriotisme dan sikap (attitude) pembeli terhadap produk domestik dan produk buatan asing. Presiden dari perusahaan-perusahaan yang termasuk dalam a a Fortune o tu e 500 ingin g mengukur e gu u image age dari a pe perusahaanusa aa perusahaan tersebut. Seorang manajer penjualan ingin mengukur tingkat bakat ((aptitude) p ) dari ppara p penjualnya. j y
Setiap permasalah di atas membutuhkan „timbangan“ atau alat ukur terhadap p berbagai g macam konsep p ((Misalnya y attitude, i d image, i sales l aptitude, i d patriotisme) i i ) Factor analysis merupakan salah satu teknik yang dapat digunakan uuntuk tu membuat e buat skala s a a untuk u tu mengukur e gu u konsep-konsep o sep o sep sepe seperti t di atas.
Konsep dasar dan terminologi dalam Factor Analysis Andaikan kita memiliki nilai siswa untuk mata pelajaran : Matematics, Physics, Chemistry, English, History, French Asumsikan bahwa nilai mereka merupakan fungsi dari intelegensia secara umum dan sebagai tambahan bakat (aptitude) mereka terhadap mata pelajaran tersebut. Misalnya M = 0.8 I + Am; P = 0.7 I + Ap C = 0.9 I + Ac ; E = 0.6 I + Ae H = 0.5 I + Ah;
F = 0.65 I + Af
•Koefisien-koefisien di atas disebut sebagai pattern loadings •Variable disebut sebagai Indicator atau measure dari I •Karena konsep dari tingkat Intelegensia memiliki responsibilitas terhadap korelasi di antara Indicator dan tidak dapat diobservasi secara langsung langsung, maka I ini disebut sebagai common atau latent factor, atau disebut juga sebagai unobservable construct.
1. Total Variance dari setiap indicator dapat didekomposisi menjadi 2 komponen : •
•
Variance yang berhubungan dengan I, nilainya = kuadrat dari pattern loading;Variance ini disebut sebagai Communality Variance yang berhubungan dengan Aj, Aj nilainya = variance dari variable dikurangi Communality; Variance ini disebut sebagai unique atau specific error variance
2. Korelasi antara sebarang indicator dengan latent factor disebut sebagai structure loading atau loading dan biasanya nilainya = pattern loading. (mungkin tidak benar untuk 2 atau lebih faktor)
Kuadrat dari structure loading disebut sbg shared variance antara indicator dan faktor. Biasanya nilai Communality digunakan untuk menentukan apakah sebuah indicator baik atau tidak. tidak Semakin tinggi nilai communality maka indicator tsb semakin reliable. 3. Korelasi antara dua indicator merupakan hasil kali dari faktor loading yang bersesuaian.
Pattern loading : M
P
C
E
H
F
0.8 0.7 0.9 0.6 0.5 0.65
Model dua faktor M = 0.80 Q + 0.20 V + Am P = 0.70 Q + 0.30 V + Ap C = 0.60 Q + 0.30 V + Ac E = 0.20 Q + 0.80 V + Ae H = 0.15 0 15 Q + 0.82 0 82 V + Ah F = 0.25 Q + 0.85 V + Af
Interpretasi dari tabel di atas 1.
Dapat dilihat bahwa communality ataupun shared variances dari variable E,, H dan F terhadapp factor V jjauh lebih besar bila dibandingkan terhadap factor Q. Yaitu 90.24% ((0.640+0.672 +0.723)/2.255) dari total communality dari V terhadap variable E H dan F. E, F
2.
Secara sama dapat dilihat bahwa factor Q memiliki 92.20% ((0.64+0.49+0.36)/1.616) ((0.64 0.49 0.36)/1.616) dari total communalitynya terhadap variable M,P dan C.
Model untuk lebih dari 2 factor X1 =λ11 ξ1 + λ12 ξ2 + … + λ1m ξm + ε1 X2 =λ λ21 ξ1 + λ22 ξ2 + … + λ2m 2 ξ m + ε2 .
Xp =λ λp1 ξ1 + λp2 ξ2 + … + λpm ξm + εp
Pada persamaan di atas intercorrelasi antara p indicator dijelaskan oleh m common faktor. Biasanya diasumsikan bahwa m < p dan jumlah unique factor akan sama dengan jumlah indicator. Jika m factor tidak saling berkorelasi maka factor model dikatakan sebagai orthogonal model, tetapi jika m factor ini saling berkorelasi, maka factor model dikatakan sebagai oblique model
Factor Indeterminacy 1. Factor rotation problem Factor Analysis memiliki banyak ppenyelesaian, y , ppermasalahan ini disebut sebagai factor indeterminacy karena adanya masalah rotasi atau factor rotation problem. p Untuk menentukan model maka pilihlah penyelesaian yang memiliki interpretasi yang paling mungkin dapat diterima.
2. Estimation of communality problem Masalah ini terjadi karena untuk mengestimasi pattern, structure loading dan shared variance dibutuhkan estimasi dari communality untuk tiap variable. TETAPI untuk mengestimasi communality tersebut dibutuhkan nilai estimasi dari loadings. Di sini terjadi circularity.
M = 0.667 0 667 Q - 0.484 0 484 V + Am P = 0.680 Q - 0.343 V + Ap C = 0.615 Q - 0.267 V + Ac E = 0.741 Q + 0.361 V + Ae H = 0.725 Q + 0.412 V + Ah F = 0.812 Q + 0.355 V + Af
Objective dari Factor Analysis 1. 2. 3. 4. 5.
Identifikasi jumlah common factor terkecil yang paling dapat menjelaskan korelasi antara indicator. Id ifik i melalui Identifikasi, l l i factor f rotations, i f factor solution l i yang paling dapat diterima/ masuk akal Estimasi pattern dan structure loadings, communalities, dan unique i variances i d i indicators. dari i di t Memberikan interpretasi dari common factor(s) Jika diperlukan, estimasi dari factor s
Principal Component Factoring (PCF) ` ` `
Langkah awalnya adalah memberikan estimasi communality awal. Dalam PCF diasumsikan bahwa estimasi awal dari communality untuk seluruh variable sama dengan satu. Selanjutnya, digunakan PCA pada nilai estimasi communality yang merupakan diagonal dari matriks k l i korelasi.
PCF dengan Minitab dan Interpretasinya `
`
Pada dasarnya PCF adalah PCA hanya sama, pada PCF diasumsikan bahwa •
nilai estimasi dari communalities = 1.
•
tidak terdapat unique factors dan
•
jumlah komponen = jumlah factors
Selanjutnya diharapkan bahwa beberapa komponen akan memiliki proporsi variance yang cukup besar, komponenkomponen inilah yang dianggal sebagi common factors
Rotation `
`
Varimax : objectivenya adalah memiliki satu factor structure dimana nilai tiapp variable loads tinggi gg hanya y pada satu faktor saja. Faktor-faktor yang dirotasi saling tegak lurus (orthogonal) Q Quartimax i : objectivenya b adalah d l h mendapatkan d k pattern loading sdh ` `
Seluruh variable memiliki nilai loading yang cukup tinggi pada satu faktor Setiap variable seharusnya memiliki nilai loading yang tinggi pada satu faktor dan nilai loading yang mendekati nol pada faktor-faktor yang lain.
PCA vs Factor Analysis `
`
Objective dari PCA adalah mereduksi jumlah variable menjadi j beberapa p komponen p s.d.h tiap-tiap p p komponen p membentuk variable baru. Objective dari Factor Analysis adalah mencari atau mengidentifikasi faktor-faktor faktor faktor pokok (underlying factor) atau latent construct yang dapat menerangkan interkorelasi diantara variable-variable.