TINJAUAN PUSTAKA
Data Disagregat dan Agregat Berdasarkan cara pengumpulannya, data dapat dibedakan atas data internal dan data eksternal. Data internal berasal dari lingkungan sendiri sedangkan data eksternal berasal dari lingkungan luar. Menurut cara mendapatkannya, data dapat berupa data primer dan data sekunder. Data primer adalah data yang dihimpun, disusun, diolah, dan disajikan sendiri oleh peneliti sedangkan data sekunder adalah data yang dikutip dari sumber lain yang memiliki data primer. Data sekunder dapat berupa disagregat dan agregat. Data agregat merupakan hasil manipulasi mikrodata (elemen data) dari data disagregat melalui penjumlahan elemen data yang memiliki kriteria khusus (Thomas, 2001). Definisi lain yang dikemukakan oleh Thomas adalah data agregat merupakan sebuah himpunan data yang diperoleh dari hasil manipulasi data yang memiliki hubungan khusus satu sama lain melalui proses yang sama. Dari definisi di atas, suatu data agregat dapat merupakan himpunan data baru yang diperoleh melalui penjumlahan sejumlah data yang memiliki kriteria yang sama kemudian dicari rata-ratanya. Data agregat dari suatu penelitian misalnya terdiri dari m provinsi
sebagai gambaran objek dan p mata kuliah
sebagai gambaran peubah dari sejumlah n mahasiswa dihasilkan dengan mencari rata-ratanya. Hasilnya merupakan agregasi dari nilai mutu mata kuliah yang dikelompokkan pada satu provinsi. Secara matematis data ini digambarkan sebagai matriks
?
? ? , matriks inilah yang kemudian dianalisis.
Dengan melihat pengertian data agregat di atas, yaitu himpunan data yang merupakan hasil dari penjumlahan sejumlah data yang memiliki kriteria yang sama dengan mengambil rata-rata dari hasil penjumlahan, maka data disagregat merupakan data asal tanpa melakukan proses manipulasi terhadap datanya. Secara matematis kita mendapatkan matriks berukuran
? ? ?,
matriks ini kemudian
dianalisis dan hasilnya ditransformasi menjadi matriks berukuran
?
? ?? . Matriks
inilah yang kemudian dibandingkan dengan hasil analisis data agregat.
Analisis Biplot Analisis biplot merupakan suatu upaya untuk memberikan peragaan secara grafis dari matriks data ? dalam suatu plot dengan menumpang tindihkan vektorvektor baris matriks ? (gambaran objek) dengan vektor-vektor yang mewakili
kolom matriks ? (gambaran peubah). Dari peragaan ini diharapkan diperoleh
gambaran tentang peubah, objek, serta keterkaitan antara objek-objek dengan peubah-peubahnya. Analisis biplot diperkenalkan oleh Gabriel pada tahun 1971. Landasan analisis ini ialah bahwa setiap matriks n x p yang berpangkat r [r = min {n,p}] dapat digambarkan secara pasti dalam ruang berdimensi r. Bagi matriks yang berpangkat r dan ingin digambarkan dengan baik dalam ruang berdimensi k [k = r], dilakukan dengan pendekatan optimum dengan suatu matriks berpangkat k berdasarkan kuadrat norma (Frobenius) perbedaan terkecil antara keduanya. Dari matriks hasil pendekatan terbaik tersebut digambarkanlah konfigurasi objek dan peubah dalam ruang berdimensi k. Untuk memudahkan pemahaman masalah ini, dapat diambil k = 2, sehingga pendekatan tersebut dapat digambarkan dalam bidang (dua dimensi). Dengan
peragaan secara grafik dari analisis biplot ini dapat diperoleh
informasi antara lain : 1 Kedekatan antar objek. Objek–objek yang memiliki posisi berdekatan mempunyai kemiripan antar keduanya. 2 Keragaman peubah. Peubah yang memiliki keragaman kecil digambarkan dengan vektor peubah yang pendek, sedangkan peubah yang memiliki tingkat keragaman yang besar digambarkan dengan vektor peubah yang panjang. 3 Korelasi antar peubah. Karena peubah digambarkan sebagai garis berarah, dua peubah memiliki korelasi positif apabila sudut antara kedua peubah lancip sedangkan apabila sudut kedua peubah membentuk sudut tumpul menunjukkan korelasi yang negatif, dan sudut 900 menunjukkan tidak ada korelasi. 4 Keterkaitan peubah dengan objek. Objek yang letaknya sepihak dengan arah peubah, menunjukkan objek tersebut nilainya di atas rata-rata, jika berlawanan nilainya di bawah rata-rata, apabila hampir di tengah berarti nilainya mendekati rata-rata.
Analisis biplot didasarkan pada dekomposisi nilai s ingular (DNS) atau singular value decomposition (SVD) dari matriks data yang sudah terkoreksi ? ?? ?
terhadap rata-ratanya. Misal matriks
adalah matriks data asal kemudian
dikoreksi terhadap nilai rata-ratanya maka diperoleh matriks .
?
? ? ???
?
? ? ? ? ? ?? )
(1)
di mana ? ? ? adalah matriks yang semua unsurnya bernilai 1. Matriks koragam (S) dari matriks X adalah :
?
? ??
? ?? ?
? ??
(2)
Sedangkan matriks korelasi (? ) dari matriks ? adalah : ?? ?
di mana ?
? ? ??
diagonal utama
? ???? ? ?
? ? ??
?
?
?
? ??? ? ???
? ?
? ? ?? ?? ? ? ??
? = ???G? ?? ?
?g ?
?
? ???
?? ? ? G ?? ?
g ?? ? g ?? ? ? G g ?
(3)
? adalah matriks diagonal dengan unsur
; i=1, 2, …, p (Johnson dan Wichern, 2002). Unsur ??? pada
(3) merupakan cosinus sudut ? yang menunjukkan korelasi antara peubah ke-i dan ke-j yaitu : cos(?) = rij
Berdasarkan dekomposisi nilai s ingular matriks ? ? ? dengan pangkat r = p
= n dapat dinyatakan sebagai
? ? ??? ?
(4)
Matriks U dan A merupakan matriks ortonormal kolom, di mana? ? ? ? ? ? ? ?
?? . Matriks A adalah matriks yang kolom-kolomnya merupakan eigenvektor? ?
yang berpadanan dengan eigennilai ?i dari matriks ? ? ? ? ? ? ?? ? ?? ? ?g ?? ? ? Matriks U adalah matriks yang kolom-kolomnya merupakan eigenvektoreigenvektor yang berpadanan dengan eigennilai-eigennilai dari matriks ? ? ??
? ? ?
???
???
???
?
?g ?
? ?? ? ??
? ??
?
(5)
Matriks L adalah matriks diagonal yang unsur-unsur diagonalnya merupakan akar dari
eigennilai-eigennilai
tak
nol
? ?? atau
matriks
? ? ?,
yaitu
L
=???? ?? ?? ?? ? ? ?g ?? ? ? ?, di mana nilai-nilai ? ? memenuhi sifat ? ?? ? ? ? ? ? ? ? ? ? ? > 0 dan ? ? disebut nilai singular (Mardia et al., 1979). Dengan mendefinisikan ? ? ? ???? ? ? ??
?
??? ? ? ? ?g ?? ? ? ? ?? ? ? ? ? ?
???? ?? ?? ? ? ? ? ? ? ? ? ? ? ?g ?? ? ? ? ? ? ? ??• ??•? ? ? ? ? ? ???• ? ? ? ? ? ? maka: ? ?
? ? ????
?
=? ? ? ? ? ? ? ? ? ? ? ? =? ? ? ?
?
?
(6)
dan elemen ke-(i,j) dari matriks X dapat ditulis: ? ?? ? ? ? ?? ?
(7)
? ? ? merupakan vektor baris ke-i dari matriks G, i = 1, 2,…, n dan ? ? ? merupakan vektor baris ke-j dari matriks H, mempunyai r elemen.
j = 1, 2,…, p di mana vektor ? ? ??• ? ?
Untuk menggambarkan X pada ruang berdimensi k < r dapat didekati dengan suatu matriks berpangkat k, yaitu: ? ?? ?? ? ? ? ?? ? ? ?? ?
? ? ? ?? ? ? ??? ? ?? ? ???? ?? ? ??? ? ?
(8)
Biasanya digunakan k = 2, sehingga koordinat-koordinat G dan H dapat digambarkan dalam ruang berdimensi 2 (Lipkovich dan Smith, 2002). Nilai-nilai ? dapat digunakan pada kisaran [0,1], dengan pengambilan nilai
a tertentu yaitu a = 0 dan a = 1 akan berimplikasi pada interpretasi tertentu pada biplot. a. Jika a = 0, maka G = U dan ? ? = ? ? ? , akibatnya: ? ?? ? ?? ? ?? ??? ? ?? ? ? ? ?? ?
? ? ? ?? ? ? ??
?
?
?
(9)
? ?? ? ? ??
Berarti hasil perkalian ? ?? ? ? ? ?? ? ? ?? ?? , yaitu penggandaan titik antara vektor hi
dan hj akan memberikan gambaran koragam antara peubah ke-i dan ke-j. Panjang vektor ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? menggambarkan keragaman peubah ke-i .
Korelasi antara peubah ke-i dan ke-j dijelaskan oleh cosinus sudut antara hi dan hj, yaitu: ???? ?
?
? ?? ? ?
? ? ? ?? ? ? ? ? ??
? ? ?? ? ? ??
(10)
? ???
di mana rij adalah korelasi antara peubah ke-i dengan ke-j. Berdasarkan sudut yang dibentuk antara vektor hi dan hj, korelasi antara peubah xi dan xj dapat dijelaskan sebagai berikut: 1. Jika ? mendekati 0 korelasi positifnya semakin besar, jika ? = 0, korelasi sama dengan 1. 2. Jika ? mendekati p korelasi negatifnya semakin besar, jika ? = p, korelasi sama dengan -1 3. Jika ? mendekati p/2, korelasi positif dan negatifnya semakin kecil jika ? = p/2 tidak berkorelasi. Selain itu, jika X berpangkat p maka,
?
?? ? ? ? ? ? ?? ? ? ?? ? ? ? ? ? ? ?? ? ? ? ?? ? ? ? ? ? ?? ? ? ? ? ?,
berarti kuadrat jarak
Euclid antara vektor gi dan gj pada biplot sebanding dengan kuadrat jarak Mahalanobis antara vektor xi dan xj (Siswadi dan Suharjo, 1999). b. Jika a = 1, maka ? = ? ? dan ? ? ? ? ? ? ???? ? ?
? ? ? ? ? ? akibatnya:
? ? ? ? ?? ? ? ??? ? ? ? ? ? ? ? ?? ? ?
? ? ? ?? ? ?
(11)
? ???
Untuk kasus ini, ?
?
?? ? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? ?
(12)
artinya jarak Euclid antara xi dan xj akan sama dengan jarak Euclid antara gi dan gj. Selain itu, koordinat-koordinat gi masing-masing merupakan skor komponen utama pada analisis komponen utama. Jika a = 1 untuk objek, maka ? = ? ? ? = ? ? , dan a = 0 untuk peubah, maka
? = AL1-a = AL. Koordinat gi merupakan plot komponen utama, dan hj merupakan gambaran keragaman peubah ke-j, namun tidak berlaku hubungan antara posisi relatif titik-titik gi dan hj pada biplot dengan informasi tentang besaran objek ke-i pada peubah ke-j atau xij ? ? ? ?? ? (Ardana dan Siswadi, 2005).
Untuk a ? (0,1), maka interpretasi pada korelasi serta jarak Euclid dan
Mahalanobis tidak berlaku, sedangkan posisi relatif gi dan hj masih mencerminkan besaran objek ke-i pada peubah ke-j ? ? ?? ? ? ? ?? ? ? . Ukuran Kesesuaian Biplot Untuk mengukur tingkat kesesuaian data, peubah dan objek dari matriks data digunakan ukuran kesesuaian dari Gabriel. Menurut Gabriel (2002), biplot tidak hanya sebagai pendekatan matriks data ?
dengan menggunakan matriks ? ? ? ,
tetapi juga koragam dan korelasi antar peubah, serta bentuk dan kemiripan antar objek. Hasil perkalian ? ? ? sebagai pendekatan dari matriks ? ? ? diperoleh ragam
koragam dan korelasi antar peubah, sedangkan matriks ? ? ? pendekatan bagi ? ? ? diperoleh ukuran kemiripan antar objek. Selanjutnya Gabriel mengemukakan
ukuran kesesuaian biplot (Goodness of Fit of Biplot) sebagai ukuran pendekatan, dalam bentuk sebagai berikut: 1
2
Kesesuaian data: ? ? ?? ?? ? ? ? ?
Kesesuaian peubah
?? ? ? ? ? ? ? ??
? ? ?? ? ? ?? ? ? ? ?
3 Kesesuaian objek
? ? ?? ? ??? ? ? ? ?
(13)
?? ?? ? ? ??? ?? ? ? ? ? ??
?? ??
?? ? ? ? ?? ? ? ? ?
?? ? ??
(14)
??? ?? ? ? ? ? ? ?
?? ? ? ? ? ?? ? ??
(15)
?? ?? ? ? ? ? ? ??? ?? ? ?? ? ??
Untuk melihat kesesuaian konfigurasi dua matriks data dicari dengan analisis Procrustes. Analisis Procrustes merupakan suatu
analisis untuk
membandingkan dua (atau lebih) konfigurasi n-titik berdasarkan pengaturan dan penyesuaian
posisi
(Sibson,
1978).
Analisis
Procrustes
mendasarkan
pengukurannya pada perbedaan norma matriks konfigurasi G(X,Y) = ? ? ? ? ? ? = ?
?s s ?? ?? ? ? ?? ? ? ?? G
Dalam analisis Procrustes dikenal tiga transformasi yaitu translasi, rotasi
dan dilasi.
1. Translasi Translasi diartikan sebagai proses pemindahan seluruh titik dengan jarak yang tetap dan arah yang sama. Penyesuaian optimum
dengan translasi dapat
diperoleh dengan menghimpitkan sentroid (titik berat) di titik pusat yang sama yaitu titik asal. ? ?? ?? ? ? ? ?? ? ?? ? ? ? ? ? ? ? ? ? ?? ? ? =Y? ? ? ??
? ?? ? ?? ? ? ? ? ? ? ? ? ? ? ?
? s ?? ? ? ?? ? ? ??? ? ?
? ? dan ? ?
berturut - turut adalah konfigurasi ?
dan ? setelah ditranslasi,
sedangkan ? ? dan ? ? masing – masing adalah sentroid ? dan ? .
Norma kuadrat perbedaan minimum dua konfigurasi setelah penyesuaian
dengan translasi adalah: ? ?? ?? ? ? ? ?? ? ?? ? ?
? ?? ?? ? ? s ??? ? s ?? ? ? ?? ? ?? ? ? ?? ? ? ?? ?? ? ? ? ??? ? ?? ?
? ?
s ??? ? ? ?? ?
j = 1, 2, …, p
???
(16)
=? s ??? ? ? ?? ?
2 . Rotasi Rotasi adalah proses pemindahan seluruh titik dengan sudut yang tetap tanpa mengubah jarak setiap titik, tanpa sentroidnya. Transformasi dengan rotasi dapat dilakukan dengan menggandakan matriks dengan suatu matriks ortogonal. Rotasi ? ? terhadap ? ?
dilakukan dengan menggandakan matriks ? ? dengan matriks
ortogonal ? sehingga konfigurasi ? ? setelah rotasi diberikan oleh ? ? ? .
Norma kuadrat perbedaan kedua konfigurasi setelah penyesuaian dengan
rotasi ialah: ? ?? ? ?? ? ? ? ??? ?? ?? ? ?? ? ? ?? Secara aljabar, norma kuadrat perbedaan setelah penyesuaian dengan rotasi dapat ditulis sebagai berikut: ? ?? ? ?? ? ? ? ? ?? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? ?? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
= tr?? ? ? ? ?? ? ?? ?? ? ? ? ?? ? ? ?? ?? ? ? ? ? ? ??
(17)
Untuk meminimumkan nilai ? ?? ? ?? ? ? ? perlu dipilih matriks ortogonal ? yang memaksimumkan ?? ?? ? ? ? ? ? ? ?. Nilai ?? ?? ? ? ? ? ? ?? akan maksimum jika dipilih ? ? ??
?
dengan ? ? ? ? ? ? ? ? ? ? yang diperoleh dari dekomposisi nilai singular.
3. Dilasi Dilasi adalah pembesaran/pengecilan jarak setiap titik dalam konfigurasi terhadap sentroidnya. Penyesuaian dilasi ? ? ? terhadap ? ?
dilakukan dengan menggandakan
konfigurasi ? ? ? dengan suatu scalar c. Konfigurasi setelah transformasi dengan dilasi diberikan oleh ?? ? ? .
Norma kuadrat perbedaan kedua konfigurasi setelah penyesuaian dengan
dilasi ialah: ? ?? ? ?? ? ? ? ? ??? ?? ?? ? ??? ? ? ?? Secara aljabar, norma kuadrat perbedaan setelah penyesuaian dengan rotasi dapat ditulis sebagai berikut: ? ?? ? ??? ? ? ? ? ?? ?? ? ? ? ?? ?? ? ? ??? ? ? ?? ? ? ? ??? ? ? ??? ? ?? ?? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? ? ?? ? ? ?
? ?? ?? ? ? ? ?? ? ? ? ?? ?? ? ? ? ?? ? ? ? ?? ?? ? ? ?? ? ? ?
(18)
Untuk meminimumkan ? ?? ? ??? ? ? ?, maka c dipilih sebagai berikut: ?=
? ?? ? ? ?? ? ? ? ? ? ?? ? ? ? ? ? ?
Dengan menyubstitusikan c ke dalam persamaan (2.8) diperoleh norma kuadrat perbedaan yang minimum yaitu:
? ?? ? ??? ? ? ? ? ?? ?? ? ? ? ?? ?
?
?? ? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ?
(19)
Untuk memperoleh posisi yang paling sesuai sehingga kedua matriks menjadi semakin dekat dilakukan penyesuaian seperti di atas. Ukuran kesesuaian dua konfigurasi menggambarkan kedekatan antara dua matriks. Ukuran kesesuaian dirumuskan sebagai:
?
? ?? ?
? ?? ? ??? ? ? ?
?? ? ? ? ? ? ?
? ?
?
? x 100 %
(20)
Nilai R2 berkisar antara 0 – 100 %, semakin dekat ke 100 %, semakin dekat dua konfigurasi tersebut.