KAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI
FAJRIANZA ADI NUGRAHANTO
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk Peubah-Peubah yang Berkorelasi adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, April 2014 Fajrianza Adi Nugrahanto NIM G14090014
ABSTRAK FAJRIANZA ADI NUGRAHANTO. Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk Peubah-Peubah yang Berkorelasi. Dibimbing oleh KUSMAN SADIK dan YENNI ANGRAINI. Analisis Komponen Utama (AKU) merupakan salah satu teknik peubah ganda yang pada umumnya digunakan untuk mereduksi dimensi data. AKU menggunakan matriks ragam-peragam sebagai informasi awal analisisnya. Perubahan nilai pada matriks ragam-peragam dapat mengubah skor AKU yang dihasilkan. Salah satu kondisi yang dapat menyebabkan perubahan ini adalah adanya pengaruh noise pada data. Kondisi tersebut telah diteliti oleh Tsakiri dan Zurbenko (2011), dengan hasilnya menunjukkan bahwa terdapat perbedaan dari skor AKU ketika data dipengaruhi oleh noise. Penelitian ini dilakukan untuk melihat pengaruh noise pada data dengan peubah-peubah yang saling berkorelasi. Hasil penelitian menunjukkan bahwa noise memberikan pengaruh yang besar pada hasil AKU untuk nilai koefisien korelasi tertentu. Kata kunci: analisis komponen utama, korelasi, matriks ragam-peragam, noise
ABSTRACT FAJRIANZA ADI NUGRAHANTO. Study on Effect of Noise on Principal Component Analysis for Correlated Variables. Supervised by KUSMAN SADIK and YENNI ANGRAINI. Principal Component Analysis (PCA) is one of multivariate techniques that generally used for dimension reduction. PCA uses covariance matrices as initial information. Change in values of those matrices can result in different PCA scores. One of conditions that can cause the change is noise presence, which was studied by Tsakiri and Zurbenko (2011). It showed that PCA results will be different when the data were affected by noise. This study was conducted to see the effect of noise on PCA results for data with correlated variables. The results showed that noise have greater influence on PCA results for certain correlation coefficient values. Keywords: correlation, covariance matrices, noise, principal component analysis
KAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI
FAJRIANZA ADI NUGRAHANTO
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014
Judul Skripsi : Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk Peubah-Peubah yang Berkorelasi Nama : Fajrianza Adi Nugrahanto NIM : G14090014
Disetujui oleh
Dr Ir Kusman Sadik, MSi Pembimbing I
Yenni Angraini, SSi, MSi Pembimbing II
Diketahui oleh
Dr Ir Anang Kurnia, MSi Ketua Departemen
Tanggal Lulus:
PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa taβala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini ialah pengaruh noise terhadap matriks ragam-peragam, dengan judul Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk Peubah-Peubah yang Berkorelasi. Terima kasih penulis ucapkan kepada Bapak Dr Ir Kusman Sadik, MSi dan Ibu Yenni Angraini, SSi MSi selaku pembimbing. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, dan teman-teman Statistika 46 atas segala doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat.
Bogor, April 2014 Fajrianza Adi Nugrahanto
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
1
TINJAUAN PUSTAKA
2
Pengaruh Noise terhadap Nilai Akar Ciri dan Vektor Akar Ciri METODE
2 4
Bahan
4
Tahapan Analisis
4
Tahapan Penentuan Parameter
6
HASIL DAN PEMBAHASAN Hasil Simulasi Pertama
8 8
Hasil Simulasi Kedua
16
SIMPULAN DAN SARAN
18
Simpulan
18
Saran
18
DAFTAR PUSTAKA
18
LAMPIRAN
19
RIWAYAT HIDUP
32
DAFTAR TABEL 1 Matriks ragam-peragam 50 0
2 Nilai | | matriks 50 3 4 5 6 7 8
0 pada 0, 0.1, 0.2, β¦ , 0.9 25
7
0 untuk seluruh nilai 25 Selisih nilai vektor akar ciri matriks 50 17.68 dan 75 17.68 17.68 25 17.68 37.5 Nilai matriks 50 17.68 dan 75 17.68 untuk 17.68 25 17.68 37.5 0
0.1, 0.2, β¦ , 0.9 Nilai β| | matriks 50 0 dan 75 0 pada 0 25 0 37.5 0.1, 0.2, β¦ , 0.9 Vektor akar ciri pertama dan kedua matriks 50 0 pada 0 25 0.1, 0.2, β¦ , 0.9 Parameter simulasi modifikasi nilai konstanta Nilai | | matriks 50 0 pada kondisi | | ! untuk 0
30
0.1, 0.11, β¦ , 0.25 9 Nilai vektor akar ciri data bangkitan 10 Nilai akar ciri dan % proporsi keragaman kumulatif data bangkitan
9 9 10 11 12 14 15 17 17
DAFTAR GAMBAR 1 2 3 4 5 6 7
Proses pembuatan matriks simulasi Grafik untuk 1,2 Grafik | | untuk 1,2 Grafik dengan berbagai nilai rasio ! β Grafik besaran nilai rotasi vektor akar ciri Grafik dengan berbagai nilai # Grafik pada kondisi simulasi | | $ | | !
!
8 10 11 13 13 14 dan 16
DAFTAR LAMPIRAN 1 2 3 4 5 6 7 8 9 10
Syntax simulasi untuk nilai | | Syntax simulasi untuk nilai Syntax simulasi untuk nilai rotasi vektor akar ciri Syntax pembangkitan data regresi Daftar nilai parameter untuk simulasi pada kondisi | | $ ! Daftar nilai parameter untuk simulasi pada kondisi | | $ ! dengan modifikasi nilai konstanta (#) Daftar nilai parameter untuk simulasi pada kondisi | | $ ! dan kondisi | | ! Hasil simulasi pada kondisi | | $ ! Hasil simulasi pada kondisi | | $ ! dengan modifikasi nilai konstanta (#) Hasil simulasi pada kondisi | | $ ! dan kondisi | |
!
19 21 23 25 26 27 28 29
30 31
PENDAHULUAN Latar Belakang Analisis Komponen Utama (AKU) merupakan salah satu teknik peubah ganda yang banyak diterapkan dalam berbagai bidang. Analisis ini pada umumnya digunakan untuk mereduksi dimensi dari data sehingga menjadi lebih sederhana (Johnson dan Wichern 1988). AKU menggunakan informasi dari matriks ragamperagam atau matriks korelasi untuk membuat beberapa kombinasi linear dari peubah-peubah awal. Kombinasi linear ini yang kemudian disebut sebagai komponen utama. Komponen-komponen utama tersebut kemudian dipilih sedemikian rupa sehingga banyaknya komponen utama yang dipilih lebih sedikit dibandingkan dengan banyaknya peubah awal yang ada. Joliffe (2002) menjelaskan bahwa nilai komponen utama dari AKU dapat berubah pada kondisi tertentu. Pengujian sensitifitas dan stabilitas untuk nilai komponen utama ini telah dilakukan untuk berbagai kondisi, salah satunya adalah ketika terjadi perubahan pada keragaman data. Krzanowski (1984) menyatakan bahwa komponen utama hanya dapat diinterpretasikan dengan baik apabila nilai skornya stabil untuk perubahan nilai akar ciri yang kecil. Pengujian yang telah dilakukan menunjukkan bahwa nilai skor komponen utama menjadi tidak stabil ketika suatu nilai akar ciri % berubah sebesar & pada kondisi nilai % dan % saling berdekatan. Tsakiri dan Zurbenko (2011) melakukan pengujian yang sama terhadap stabilitas komponen utama ketika terdapat pengaruh noise pada data. Statistical noise merupakan sebuah istilah yang merujuk kepada keragaman yang tidak dapat dijelaskan dari sebuah data (Tsakiri dan Zurbenko 2011). Secara umum, statistical noise ditemukan pada data riil dalam bentuk galat (error) atau residual. Berdasarkan Pirker (2009), nilai pencilan atau amatan berpengaruh juga dapat dikatakan sebagai statistical noise. Terdapatnya noise pada data dapat mempengaruhi hasil dari AKU, terutama untuk nilai skor komponen utama. Hasil penelitian Tsakiri dan Zurbenko (2011) dengan menggunakan kondisi vektor data yang saling bebas menunjukkan bahwa apabila suatu matriks ragam-peragam dengan perbedaan nilai akar ciri yang lebih kecil dari besarnya noise digunakan pada AKU, maka hasil yang didapat dari analisis tersebut akan sangat berbeda jauh dengan hasil analisis tanpa adanya noise. Dalam penelitian ini, akan dilakukan simulasi terkait pengaruh noise terhadap AKU dengan menggunakan vektor data yang memiliki korelasi. Hasil dari simulasi yang dilakukan akan dibandingkan dengan teorema yang dikemukakan dari hasil penelitian Tsakiri dan Zurbenko (2011).
Tujuan Penelitian Tujuan dari penelitian yang akan dilakukan adalah mengkaji hasil simulasi terkait pengaruh noise terhadap analisis komponen utama untuk data dengan peubah-peubah yang berkorelasi.
2
TINJAUAN PUSTAKA Pengaruh Noise terhadap Nilai Akar Ciri dan Vektor Akar Ciri Tsakiri dan Zurbenko (2011) mengemukakan tiga buah teorema yang berkaitan dengan pengaruh noise terhadap nilai akar ciri dan vektor akar ciri untuk analisis komponen utama. Didefinisikan ' sebagai ( x 1 vektor acak yang berasosiasi dengan matriks peragam β) . Didefinisikan juga ' ' * + sebagai vektor acak yang memiliki noise, dengan + merupakan vektor noise acak yang berasosiasi dengan matriks peragam β! . Matriks peragam yang berasosiasi dengan ' adalah β) . Dekomposisi spektral dari matriks peragam β) diberikan oleh β) , * , * β¦ * % % ,%
(1)
dengan , , β¦ , % merupakan nilai akar ciri dari β) yang memenuhi $ $ β¦ $ % , dan - , . , β¦ , / merupakan vektor akar ciri yang berasosiasi dengan nilai-nilai akar ciri tersebut. Norma dari matriks peragam β) didefinisikan sebagaiβ) , dengan merupakan nilai akar ciri terbesar dari matriks peragam β) . Didefinisikan juga norma dari suatu vektor acak ( x 1 sebagai ' 0', '1/ 03 * 3 * 4 * 3% 1/
(2)
Teorema 1 Teorema pertama menyebutkan bahwa apabila didefinisikan 0 , 1, β¦ , 0% , % 1 sebagai dekomposisi spektral dari β' yang memenuhi pertidaksamaan | | $ ! untuk 1,2, β¦ , ( 1 dengan β! ! . Maka dekomposisi spektral dari β' , yaitu 0 , 1, β¦ , 0% , % 1 , memenuhi kondisi:| | 5 ! dan 5 ! untuk 1,2, β¦ , (. a. Pembuktian |67 67 | 5 8.+ Didefinisikan + 0& & β¦ &% 1, sebagai suatu vektor noise yang berasosiasi dengan matriks ragam-peragam Ξ£: . Diasumsikan 0 , 1, 0 , 1, β¦ , 0% , % 1 adalah pasangan akar ciri dan vektor akar ciri dari matriks ragam-peragam dengan noise, β) . Berdasarkan definisi Ξ£; Ξ» , akan didapat: | | |Ξ£; Ξ£; | 5 Ξ£; Ξ£; Ξ£: ! . Perubahan nilai terbesar akar ciri dengan noise dan nilai terbesar akar ciri tanpa noise tidak akan melebihi nilai ! , sehingga | | 5 ! . Matriks ragam-peragam β) dapat didekomposisi sebagai Ξ£; , * Ξ£=> dan matriks ragam-peragam β) dapat didekomposisi sebagai Ξ£; , * Ξ£=> . β) akan diasumsikan sebagai sebuah operator. Perbedaan dari nilai akar ciri kedua dapat diestimasi sebagai berikut: | | |Ξ£=> Ξ£=> | 5 Ξ£=> Ξ£=> ?Ξ£:,=> ? !,%> 5 ! , sehingga dapat disimpulkan | | 5 ! .
3 Proses selanjutnya adalah menunjukkan bahwa |% % | 5 ! . Matriks ragam-peragam β) dapat didekomposisi sebagai Ξ£; , * β¦ * %> %> ,%> * Ξ£ dan matriks ragam-peragam β) dapat didekomposisi sebagai Ξ£; , * β¦ * %> %> , %> * Ξ£ , sehingga perbedaan antara nilai akar ciri ke-( didapat dengan: |% % | |Ξ£ Ξ£ | 5 Ξ£ Ξ£ ?Ξ£:, ? !, 5 ! . Pada akhirnya, dapat disimpulkan bahwa | | 5 ! . b. Pembuktian 7 7 5 78+ Penentuan kondisi selisih vektor eigen akan dibagi menjadi tiga kasus yang didasarkan dari persamaan * + . Kasus pertama adalah apabila vektor noise memiliki arah yang sama dengan . Selisih vektor eigen dengan noise dan vektor eigen tanpa noise dalam kasus ini adalah sama dengan !@ , sehingga | | !@ 5 ! , dengan ! merupakan nilai standar deviasi dari komponen noise dengan panjang maksimum. Kasus kedua adalah apabila vektor noise tegak lurus dengan . Berdasarkan teorema Phytagoras dan persamaan (2), perbedaan antara vektor akar ciri dengan noise dan vektor akar ciri tanpa noise dapat diestimasi berdasarkan D DEF DE sin # ?E@ ? 5 , dengan # merupakan sudut antara vektor H F/H H F/H F
G DE@ I
G DE I
akar ciri dengan noise dan vektor akar ciri tanpa noise. Kasus ketiga adalah apabila arah vektor noise tidak sama maupun tegak lurus dengan . Perbedaan antar vektor akar ciri dengan noise dan vektor akar DE ciri tanpa noise dapat diestimasi berdasarkan sin # . H F/H G DE I
Akibat dari adanya ketiga kasus ini adalah nilai norma dari perbedaan vektor akar ciri dengan noise dan vektor akar ciri tanpa noise tidak akan melebihi ! , | | 5 ! . Pemeriksaan lebih lanjut akan menghasilkan ! dan dengan mengetahui bahwa maxMMN + ! , dapat disimpulkan bahwa 5 ! . Penentuan selisih vektor eigen kedua dari ketiga kasus di atas dimulai dengan cara memproyeksikan vektor pada bidang yang tegak lurus terhadap , yang kemudian akan disebut sebagai proj0 1. Berdasarkan persamaan (2), maka dapat disimpulkan bahwa: proj0 1 * proj0 1 5 proj0 1 * proj0 1 5 2 ! . Dari bagian sebelumnya, diketahui bahwa | | $ ! berlaku untuk semua 1,2, β¦ , ( 1, sehingga dapat ditunjukkan dengan induksi matematika bahwa 5 ! berlaku untuk seluruh 1,2, β¦ , (. Diasumsikan bahwa kondisi sebelumnya dipenuhi untuk sebanyak S dan perbedaan antara vektor eigen dengan noise dan vektor eigen tanpa noise ditentukan oleh pertidaksamaan N N 5 S ! . Maka akan diperoleh N N N proj0N 1 * proj0N 1 N 5 N proj0N 1 * proj0N 1 1 N 5 S ! * ! 0S * 11 ! dengan proj0TN merupakan proyeksi N pada bidang yang tegak lurus terhadap N . Dari hasil ini dapat disimpulkan bahwa pertidaksamaan untuk perbedaan antara vektor eigen dengan noise dan vektor eigen tanpa noise, 5 ! , berlaku untuk seluruh 1,2, β¦ , (.
4 Teorema 2 Teorema kedua menyebutkan bahwa apabila didefinisikan U , V sebagai komponen utama ke-i dari matriks peragam β' dan | | $ ! untuk 1,2, β¦ , ( 1. Maka panjang dari komponen utama dengan noise, U , dapat ditentukan oleh pertidaksamaan: U 5 0 1/ * ! untuk 1,2, β¦ ( dan perbedaan antara U dengan U dapat didefinisikan oleh 5 ! untuk 1,2, β¦ , (. Pembuktian teorema ini diperoleh dengan melakukan langkah sebagai berikut. Didefinisikan Var0YY 1 Ξ»Y , maka nilai norma dari komponen utama / / pertama dengan noise didapat dari: Y 0Ξ» 1/ ?V; ? 5 ?V; ? * / / ?V : ? 5 0Ξ» 1/ * Ο: , dengan V; merupakan matriks yang berisikan nilai standar deviasi dari peubah-peubah tanpa noise. Berdasarkan teorema 1 dan induksi matematika, panjang dari komponen utama ke- ( dengan noise didapat berdasarkan: Y= 0Ξ»= 1/ 5 0Ξ»= 1/ * Ο: Teorema 3 Teorema ketiga menyebutkan bahwa x didefinisikan sebagai vektor acak dengan matriks peragam β' dan didefinisikan juga β | | untuk 1,2, β¦ , ( 1 . Jika vektor acak noise + dengan matriks peragam β+ yang memenuhi β! ! terdapat pada vektor acak ' sehingga 0 11 ! | | ! untuk 1,2, β¦ , ( 1 , maka ruang akar ciri akan bersifat asymptotically invariant, sedangkan nilai dari vektor akar ciri di dalam ruang tersebut akan berubah secara signifikan.
METODE Bahan Data yang digunakan dalam penelitian ini adalah data populasi berupa matriks ragam-peragam dengan dimensi 2 x 2 yang disimulasikan dengan fungsi yang terdapat di dalam piranti lunak statistika R 2.15.1.
Tahapan Simulasi Tahapan analisis yang dilakukan dalam penelitian ini meliputi dua simulasi. Simulasi pertama merupakan simulasi yang bertujuan untuk membandingkan hasil simulasi pada kondisi data dengan peubah-peubah yang berkorelasi dengan teorema yang dikemukakan oleh Tsakiri dan Zurbenko (2011). Simulasi kedua merupakan simulasi yang bertujuan untuk melihat pengaruh noise terhadap hasil analisis komponen utama pada data bangkitan. Data bangkitan yang digunakan dalam simulasi kedua merupakan data bangkitan untuk analisis regresi.
5 Simulasi pertama Tahapan simulasi yang dilakukan untuk mencapai tujuan dari simulasi pertama adalah sebagai berikut: a. b. c. d.
e. f. g. h. i.
Menentukan nilai ragam ( \ , ! ) untuk membuat matriks noise dengan antar noise bersifat saling bebas. , ! ). Menentukan nilai ! , yaitu max( \ Membuat matriks noise ( β! ) berdasarkan poin [a]. Menentukan nilai ragam ( , ) serta koefisien korelasi ( ) untuk membuat matriks ragam-peragam populasi awal. Nilai ragam vektor dengan ] > 1 ditentukan oleh persamaan: (3) ^ 0^>1 # _ 0] 21 ` ! a dengan nilai # berupa # $ ! Membuat matriks ragam-peragam data populasi (β) ) berdasarkan poin [d]. Membuat matriks ragam-peragam data noise ( β) *) dengan cara menjumlahkan β) dengan β! . Menghitung nilai akar ciri () dan vektor akar ciri () untuk setiap matriks β) *dan β) . Menghitung nilai 7 7 , yaitu vektor akar ciri, 1,2 untuk setiap pasang matriks (β) *, β) ). Mengulang proses dari poin [a]-[h] untuk nilai koefisien korelasi () yang berbeda. Nilai yang digunakan adalah 0.1-0.9 dengan peningkatan sebesar 0.01.
Simulasi kedua Tahapan simulasi yang dilakukan untuk mencapai tujuan dari simulasi kedua adalah sebagai berikut: a. b.
c. d. e. f. g. h. i.
Membangkitkan peubah bebas V ~ c0100,151 , V ~ c015,31 , Vd ~ c040,51 dan Vf ~ c070,101 dengan masing-masing S 1000. Membangkitkan nilai galat (noise) & berdasarkan sebaran peluang normal dengan parameter tertentu ( & ~ c00,11 , & ~ c02,51 dan & ~ c05,811. Menentukan nilai parameter regresi gh 10, g 0.5, g 1.2, gd 0.9, gf 0.75. Membangkitkan nilai U berdasarkan persamaan (4) U 10 * 0.5V * 1.2V * 0.9Vd * 0.75Vf (4) Membangkitkan nilai U berdasarkan persamaan (5) U 10 * 0.5V * 1.2V * 0.9Vd * 0.75Vf * & (5) Melakukan analisis komponen utama untuk gugus peubah V , V , Vd , Vf , U . Melakukan analisis komponen utama untuk gugus peubah V , V , Vd , Vf , U . Membandingkan hasil analisis berdasarkan poin [f] dan [g]. Mengulang tahapan simulasi [d]-[h] untuk nilai & dengan parameter sebaran yang berbeda.
6 Tahapan Penentuan Parameter Tahapan penentuan parameter merupakan tahapan yang dilakukan untuk menentukan nilai dari parameter yang digunakan dalam simulasi pertama. Parameter yang digunakan dalam simulasi pertama meliputi matriks ragamperagam populasi, matriks noise dan matriks simulasi. Matriks ragam-peragam populasi Matriks ragam-peragam populasi merupakan matriks ragam-peragam yang menggambarkan karakteristik dari data populasi. Matriks ini berdimensi 2 3 2. Penentuan dimensi dilakukan berdasarkan dari hasil simulasi pendahuluan. Matriks ragam-peragam dengan dimensi lebih dari 2 x 2 tidak mampu memenuhi kondisi awal yang disyaratkan oleh teorema untuk beberapa nilai koefisien korelasi, sedangkan matriks ragam-peragam dengan dimensi 2 x 2 mampu memenuhi kondisi awal yang disyaratkan untuk seluruh nilai koefisien korelasi, sehingga dipilih matriks ragam-peragam dengan dimensi 2 x 2 untuk digunakan dalam simulasi. Matriks ragam-peragam populasi dibentuk dari suatu matriks ragamperagam yang memiliki nilai di luar diagonal utama berupa nol. Pembuatan matriks ini adalah dengan cara menentukan terlebih dahulu nilai-nilai ragam setiap peubah, yaitu nilai-nilai pada diagonal utama matriks. Nilai-nilai ini ditentukan dengan menggunakan persamaan (3). Nilai konstanta ( # ) dengan kondisi simulasi | | $ ! menggunakan nilai # yang lebih besar atau sama dengan ! . Nilai pada kolom diagonal utama ke-1 pada matriks ditentukan secara subjektif agar nilai pada kolom diagonal terakhir tidak bernilai negatif maupun nol. Hal ini dilakukan karena nilai ragam tidak dapat bernilai negatif dan apabila nilai ragam adalah nol, maka nilai peragam akan juga bernilai nol untuk semua nilai koefisien korelasi. Seluruh nilai konstanta dan matriks ragamperagam populasi awal yang digunakan dalam simulasi dapat dilihat pada Lampiran 5. Pada penelitian ini, nilai-nilai di luar diagonal utama (peragam) pada matriks ragam-peragam populasi menjadi salah satu fokus penelitian. Nilai peragam akan berubah sesuai dengan besarnya nilai koefisien korelasi antar dua peubah, sehingga matriks ragam-peragam populasi yang digunakan dalam penelitian akan memiliki nilai peragam yang berbeda-beda disesuaikan dengan nilai koefisien korelasi yang diinginkan dengan tetap menggunakan nilai diagonal utama yang sama. Penentuan nilai peragam ini dilakukan dengan menggunakan persamaan (6). ijkl
ll
. l
, m 1, 2 n m
(6)
dan ll merupakan akar kuadrat dari nilai diagonal utama pada kolom ke- dan kolom ke- m . Sebagai contoh kasus, matriks ragam-peragam populasi awal 50 0 pada 0.1, 0.2, β¦ , 0.9 dapat dilihat pada Tabel 1. Dalam simulasi 0 25 yang dilakukan, nilai di luar diagonal utama pada matriks ragam-peragam populasi awal 50 0 akan disesuaikan untuk nilai koefisien korelasi 0.1 - 0.9 0 25 dengan peningkatan sebesar 0.01 ( 0.10, 0.11, 0.12, β¦ , 0.91, sehingga akan
7 terdapat 81 matriks ragam-peragam yang berbeda. Setiap peningkatan sebesar 0.01 akan meningkatkan nilai di luar diagonal utama sebesar 0.353. Tabel 1 Matriks ragam-peragam 50 0
0 pada 25
0, 0.1, 0.2, β¦ , 0.9
Matriks RagamPeragam
Matriks RagamPeragam
50 0 0 25
0.5
50 17.68 17.68 25
0
0.1
50 3.53 3.53 25
0.6
50 21.21 21.21 25
0.2
50 7.07 7.07 25
0.7
50 24.75 24.75 25
0.3
50 10.61 10.61 25
0.8
50 28.28 28.28 25
0.4
50 14.14 14.14 25
0.9
50 31.82 31.82 25
Matriks noise Matriks noise merupakan matriks ragam-peragam yang menggambarkan karakteristik dari noise. Matriks noise memiliki dimensi 2 3 2, yang disesuaikan dengan dimensi matriks ragam-peragam populasi. Matriks ini dibentuk dengan menentukan terlebih dahulu nilai terbesar pada diagonal utamanya. Nilai terbesar ini kemudian akan dijadikan sebagai nilai ! . Nilai-nilai diagonal utama lainnya akan ditentukan secara subjektif dengan memperhitungkan agar setiap elemen diagonal utama tidak memiliki nilai yang sama, bernilai nol maupun negatif. Hal ini dilakukan karena apabila elemen diagonal utama bernilai sama, maka komponen utama yang dihasilkan oleh matriks ragam-peragam dengan noise dan tanpa noise akan sama sehingga nilai selisihnya akan sama dengan nol. Seluruh matriks noise yang digunakan memiliki ! yang bernilai setengah dari nilai ! , yang dimaksudkan untuk mempermudah simulasi. Nilai-nilai di luar diagonal utama akan diisi dengan nilai nol yang bertujuan untuk memenuhi asumsi, yaitu bahwa antar noise tidak terdapat korelasi (saling bebas). Seluruh matriks noise yang digunakan dapat dilihat pada Lampiran 5. Matriks simulasi Matriks simulasi merupakan matriks yang dibentuk dengan menjumlahkan matriks ragam-peragam populasi dengan matriks noise. Hasil dari penjumlahan ini akan menghasilkan suatu matriks ragam-peragam yang telah berubah keragamannya dikarenakan telah ditambahkan aspek noise. Salah satu contoh kasus proses pembuatan matriks ini dapat dilihat pada Gambar 1 yang
8 menggunakan matriks matriks ragam-peragam populasi awal 50
0.5 dan matriks noise 25 0
50 17.68
17.68 25
0 12.5
+
Matriks ragam-peragam populasi
0
.
25 0
0 12.5
=
Matriks noise
75 17.68
0 dengan 25
17.68 37.5
Matriks simulasi
Gambar 1 Proses pembuatan matriks simulasi
HASIL DAN PEMBAHASAN Hasil Simulasi Pertama Pembahasan simulasi pertama terdiri atas tiga sub pembahasan, yaitu hasil simulasi pada kondisi | | $ ! , hasil simulasi dengan modifikasi nilai konstanta ( # ), dan hasil simulasi pada kondisi | | ! . Seluruh pembahasan simulasi pertama akan mengacu kepada teorema pertama mengenai pengaruh noise yang dikemukakan oleh Tsakiri dan Zurbenko (2011). Hasil simulasi pada kondisi |67 67- | $ 8.+ Bagian pertama dari pembahasan hasil simulasi ini merupakan pembahasan hasil simulasi pada kondisi | | $ ! dengan menggunakan parameter yang telah ditentukan. Simulasi ini dilakukan dengan tujuan untuk melihat pengaruh noise pada hasil analisis komponen utama ketika data yang digunakan merupakan data dengan peubah-peubah yang berkorelasi. Parameter-parameter yang digunakan dalam bagian simulasi ini telah disesuaikan dengan kondisi yang dibutuhkan agar teorema berlaku. Hasil akhir dari simulasi ini kemudian akan dibandingkan dengan teorema yang ada. Langkah awal yang dilakukan dalam simulasi ini adalah pemeriksaan awal nilai | | pada matriks ragam-peragam populasi untuk nilai koefisien korelasi yang berbeda. Pemeriksaan ini dilakukan agar kondisi yang dibutuhkan oleh teorema, yaitu | | $ ! , terpenuhi. Sebagai contoh kasus, pada Tabel 2 dapat dilihat nilai | | yang didapat dari matriks ragam-peragam awal 50 0 , dengan nilai | | yang didapat selalu lebih besar dari ! untuk 0 25 setiap nilai koefisien korelasi, sehingga syarat awal teorema telah terpenuhi. Langkah berikutnya dari simulasi ini adalah menjalankan proses simulasi untuk mendapatkan nilai | | dan untuk seluruh nilai . Tahapan penghitungan nilai dimulai dengan menghitung selisih antara vektor akar ciri matriks ragam-peragam simulasi dengan vektor akar ciri matriks ragamperagam tanpa noise, yaitu matriks ragam-peragam populasi. Salah satu contoh kasus perhitungan nilai vektor akar ciri dan nilai selisihnya dapat dilihat pada Tabel 3 yang menggunakan matriks tanpa noise 50 17.68 , yaitu matriks 17.68
25
9 ragam-peragam populasi awal 50 0
0 25
dengan = 0.5, dan matriks simulasi
(matriks ragam-peragam populasi dengan noise) 75
17.68
Tabel 2 Nilai | | matriks 50 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.20 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28 0.29
| |
25.98 26.18 26.40 26.64 26.89 27.16 27.44 27.74 28.05 28.38 28.72 29.08 29.44 29.82 30.22 30.62 31.03 31.46 31.89 32.33
0.30 0.31 0.32 0.33 0.34 0.35 0.36 0.37 0.38 0.39 0.40 0.41 0.42 0.43 0.44 0.45 0.46 0.47 0.48 0.49
0
| |
32.79 33.25 33.72 34.20 34.68 35.18 35.68 36.19 36.70 37.22 37.75 38.28 38.82 39.36 39.91 40.47 41.02 41.59 42.15 42.73
0.50 0.51 0.52 0.53 0.54 0.55 0.56 0.57 0.58 0.59 0.60 0.61 0.62 0.63 0.64 0.65 0.66 0.67 0.68 0.69
17.68 .. 37.5
0 untuk 25
seluruh nilai
| |
43.30 43.88 44.46 45.05 45.64 46.23 46.83 47.43 48.03 48.64 49.24 49.85 50.47 51.08 51.70 52.32 52.94 53.57 54.19 54.82
Tabel 3 Selisih nilai vektor akar ciri matriks 75 dan 50
17.68
17.68 25
17.68
0.70 0.71 0.72 0.73 0.74 0.75 0.76 0.77 0.78 0.79 0.80 0.81 0.82 0.83 0.84 0.85 0.86 0.87 0.88 0.89 0.90
| |
55.45 56.08 56.72 57.35 57.99 58.63 59.27 59.91 60.56 61.20 61.85 62.49 63.14 63.79 64.44 65.10 65.75 66.40 67.06 67.72 68.37
17.68 37.5
Nilai Vektor Akar Ciri Vektor Akar Ciri Ke-1 Vektor Akar Ciri Ke-2 dengan tanpa dengan tanpa selisih selisih noise noise noise noise -0.929 -0.888 0.041 0.369 0.460 0.091 -0.369 -0.460 0.091 -0.929 -0.888 0.041 Tahapan berikutnya adalah menghitung nilai norma dari masing-masing selisih vektor akar ciri. Penghitungan nilai norma selisih vektor akar ciri ini menggunakan persamaan (2). Nilai untuk 0.1, 0.2, β¦ , 0.9 dengan matriks noise 25 0 dan matriks ragam-peragam populasi awal 50 0 dapat 0 12.5 0 25 dilihat pada Tabel 4.
10 Tabel 4 Nilai matriks 50
17.68
untuk 0.1, 0.2, β¦ , 0.9
17.68 25
dan 75
17.68
7 7
1 0.045 0.077 0.094 0.100 0.099 0.096 0.090 0.085 0.079
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
17.68 37.5
Total
2 0.045 0.077 0.094 0.100 0.099 0.096 0.090 0.085 0.079
0.090 0.154 0.188 0.200 0.198 0.192 0.180 0.170 0.158
0.15 0.10 Deviasi 0.05 0.00
0.00
0.05
Deviasi
0.10
0.15
Hasil dari simulasi yang dilakukan menunjukkan bahwa nilai | | yang didapat untuk 1,2 selalu lebih kecil dari nilai ! , serta nilai untuk 1,2 juga selalu lebih kecil dari nilai ! . Hal ini menunjukkan bahwa teorema tetap berlaku untuk data dengan dua peubah yang berkorelasi. Sebagai contoh kasus, pada Gambar 2 dan 3 dapat dilihat hasil dari simulasi ini untuk matriks ragam-peragam awal 50 0 dengan matriks noise 25 0 . Gambar 2 0 25 0 12.5 menunjukkan hasil simulasi untuk nilai . Dari Gambar 2 dapat dilihat bahwa nilai akan naik dimulai dari = 0.1 sampai 0.56 kemudian turun dimulai dari 0.57 sampai 0.9. Gambar 3 menunjukkan hasil simulasi untuk nilai | | . Garis lurus ( ) menunjukkan nilai | | , sedangkan garis putus-putus ( ) menunjukkan nilai ! . Garis lurus pada Gambar 3 selalu berada di bawah garis putus-putus, sehingga dapat disimpulkan bahwa | | 5 ! 1,2.
0.2
0.4
0.6
0.8
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
Korelasi Koefisien Korelasi 01
Gambar 2 Grafik untuk 1,2
0.8
30 25 20 15
Deviasi
0
5
10
15 0
5
10
Deviasi
20
25
30
11
0.2
0.4
0.6
0.8
0.2
0.4
Korelasi Koefisien Korelasi 01
0.6
0.8
Korelasi Koefisien Korelasi 01
| |
| |
Gambar 3 Grafik | | untuk 1,2 Pada bagian hasil simulasi ini, di samping pembahasan mengenai perbandingan antara hasil simulasi dan teorema, akan dibahas juga mengenai beberapa hal lain terkait dengan hasil simulasi yang didapat. Pembahasan pertama yaitu mengenai grafik | | . Pada Gambar 3 dapat dilihat bahwa nilai | | akan berkurang nilainya ketika nilai koefisien korelasi data semakin besar, sedangkan nilai | | akan bertambah ketika nilai koefisien korelasi data semakin besar. Hal ini disebabkan karena penjumlahan nilai | | untuk 1,2 akan bernilai sama dengan penjumlahan nilai diagonal utama pada matriks noise yang digunakan, atau secara matematis dapat dituliskan sebagai β| | β ! . Nilai β ! yang tetap untuk seluruh nilai koefisien korelasi akan membuat nilai | | membesar ketika nilai | | semakin menurun. Salah contoh kasus untuk pembahasan ini dapat dilihat pada Tabel 5 yang menggunakan matriks ragam-peragam awal 50 0 dan matriks noise 25 0 . 0
25
0
Tabel 5 Nilai β| | matriks 50 dan 75 0
0 37.5
0
0 25
pada 0.1, 0.2, β¦ , 0.9
| |
| |
o| |
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
24.84 24.43 23.90 23.36 22.87 22.44 22.07 21.76 21.50
12.66 13.07 13.60 14.14 14.63 15.06 15.43 15.74 16.00
37.5 37.5 37.5 37.5 37.5 37.5 37.5 37.5 37.5
12.5
12 Pembahasan kedua yaitu pada Gambar 2 dapat dilihat bahwa grafik akan memiliki bentuk dan nilai yang sama dengan grafik . Hal ini disebabkan karena penggunaan data dengan peubah sebanyak dua akan menghasilkan dua komponen utama yang bernilai sama tetapi berbeda tanda positif dan negatif serta posisinya. Pada Tabel 6 dapat dilihat nilai kedua komponen utama untuk matriks ragam-peragam awal 50 0 pada berbagai nilai 0 25 koefisien korelasi. Kondisi ini berlaku baik untuk matriks ragam-peragam awal maupun matriks ragam-peragam dengan noise, sehingga nilai dari kedua matriks tersebut akan sama untuk seluruh komponen utama.
Tabel 6 Vektor akar ciri pertama dan kedua matriks 50 0 0 25 pada 0.1, 0.2, β¦ , 0.9
0.1
0.990 0.137 0.4 0.137 0.990
0.912 0.411 0.7 0.411 0.912
0.852 0.524 0.524 0.852
0.2
0.967 0.254 0.5 0.254 0.967
0.888 0.460 0.8 0.460 0.888
0.838 0.546 0.546 0.838
0.3
0.939 0.345 0.6 0.345 0.939
0.868 0.496 0.9 0.496 0.868
0.826 0.563 0.563 0.826
Pembahasan ketiga adalah pembahasan mengenai pengaruh rasio antara nilai ! dan nilai ragam terbesar dari matriks ragam-peragam populasi awal ( 1. Pada Lampiran 5 dapat dilihat nilai rasio ini untuk seluruh parameter yang digunakan. Hasil simulasi menunjukkan bahwa semakin besar rasio antara nilai ! dan nilai akan mengakibatkan semakin besarnya nilai . Hal ini dapat dilihat dari keempat grafik pada Gambar 4. Masing-masing grafik menggambarkan nilai rasio yang berbeda. Pembahasan keempat yaitu pembahasan mengenai besarnya rotasi yang terjadi antara komponen utama yang mengandung noise dengan komponen utama tanpa noise. Grafik dari besarnya rotasi ini akan memiliki bentuk yang sama dengan grafik . Hal ini disebabkan karena perubahan nilai pada komponen utama disebabkan karena adanya rotasi dari vektor akar ciri, sehingga perubahan nilai komponen utama dan besarnya rotasi akan saling berhubungan. Semakin besar rotasi yang terjadi, maka akan semakin besar pula perubahan nilai komponen utama. Gambar 5 menunjukkan besarnya rotasi yang terjadi untuk matriks ragam-peragam awal 50 0 dengan matriks noise 25 0 . 0
25
0
12.5
Hasil simulasi dengan modifikasi nilai konstanta (p) Bagian kedua dari simulasi dilakukan dengan melakukan modifikasi nilai konstanta (#1 dalam pembentukan matriks ragam-peragam awal. Terdapat dua kondisi modifikasi nilai konstanta yang digunakan dalam simulasi ini, yaitu nilai konstanta yang lebih besar dari nilai konstanta kontrol ( # $ # ) dan nilai konstanta yang lebih kecil dari nilai konstanta kontrol (# #1. Nilai-nilai
0.15 0.10 Deviasi 0.05 0.00
0.00
0.05
Deviasi
0.10
0.15
13
0.2
0.4
0.6
0.8
0.2
0.4
Korelasi Koefisien Korelasi 01
!β
0.6
0.8
Korelasi Koefisien Korelasi 01
!β
0.05
Deviasi
0.10
0.15
0.3
0.00
0.00
0.05
Deviasi
0.10
0.15
0.2
0.2
0.4
0.6
0.8
0.2
0.4
Korelasi Koefisien Korelasi 01
!β
0.6
0.8
Korelasi Koefisien Korelasi 01
!β
0.4
0.5 !β
0
2
4
Theta
6
8
10
Gambar 4 Grafik dengan berbagai nilai rasio
0.2
0.4
0.6
0.8
Koefisien Korelasi 01 Korelasi
Gambar 5 Grafik besaran nilai rotasi vektor akar ciri konstanta yang digunakan selengkapnya dapat dilihat pada Lampiran 6. Bagian simulasi ini dilakukan dengan tujuan untuk melihat pengaruh perubahan hasil komponen utama ketika nilai konstanta diubah dengan tetap memperhatikan kondisi yang diperlukan agar teorema terpenuhi. Pada bagian simulasi ini, nilai dari matriks ragam-peragam populasi awal 50 0 akan diubah sesuai dengan nilai # yang dipakai. Penentuan nilai # 0 25 untuk kedua kondisi dilakukan secara subjektif agar dapat mempermudah simulasi. Pada Tabel 7 dapat dilihat kondisi simulasi yang digunakan sebagai contoh kasus.
14 Tabel 7 Parameter simulasi modifikasi nilai konstanta a
Garis
a b c
Kondisi simulasi
# $ # #
Matriks
25b
50 0 0 25
26a
27a 28a
# # #
a
Garis
Matriks
25b
50 0 0 25
50 0 0 24
24c
50 0 0 26
50 0 0 23
23a
50 0 0 27
50 0 0 22
22a
50 0 0 28
Bentuk garis mengacu kepada grafik pada Gambar 6 Nilai konstanta ini dijadikan sebagai kontrol 0 Matriks noise yang digunakan adalah 20 0 10
0.08 0.06
0.07
Deviasi
0.06 0.05
0.05
0.04
0.04
0.03
Deviasi
0.07
0.09
0.08
0.10
Hasil simulasi pada Gambar 6 menunjukkan bahwa kedua kondisi modifikasi yang digunakan mampu memberikan hasil yang berbeda. Pada kondisi (# $ #), nilai yang didapat akan semakin kecil ketika nilai konstanta dibuat lebih besar, sedangkan pada kondisi (# #1, nilai yang didapat akan semakin besar ketika nilai konstanta dibuat lebih kecil. Dari hasil simulasi ini dapat disimpulkan bahwa di bawah pengaruh noise, hasil analisis komponen utama yang didapat akan lebih baik apabila selisih nilai ragam pada matriks ragam-peragamnya semakin besar.
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
# $ #
0.8
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
# #
Gambar 6 Grafik dengan berbagai nilai #
0.8
15 Hasil simulasi pada kondisi |67 67- | 8.+ Bagian ketiga dari simulasi dilakukan dengan mencoba kondisi simulasi yang tidak mendukung kondisi yang dibutuhkan agar teorema terpenuhi, yaitu kondisi | | ! . Hasil dari kondisi simulasi ini akan dibandingkan dengan kondisi yang memenuhi teorema, yaitu | | $ ! . Simulasi ini dilakukan dengan tujuan untuk melihat dampak dari tidak terpenuhinya kondisi awal dari teorema untuk hasil analisis komponen utama. Seluruh parameter yang digunakan dalam bagian simulasi ini dapat dilihat pada Lampiran 7. Langkah awal yang dilakukan dalam simulasi ini adalah pemeriksaan awal nilai pada matriks ragam-peragam populasi untuk nilai koefisien korelasi yang berbeda. Pemeriksaan ini dilakukan agar matriks ragam-peragam awal tidak memenuhi syarat awal teorema. Sebagai contoh kasus, pada Tabel 9 dapat dilihat nilai yang didapat dari matriks ragam-peragam awal 50 0 dengan matriks noise 25 0
0
0 12.5
30
. Kondisi yang harus dicapai agar teorema tidak terpenuhi adalah | | 25 . Nilai pada Tabel 8 menunjukkan bahwa kondisi yang dibutuhkan agar teorema tidak terpenuhi hanya dapat tercapai hingga nilai 0.19 , sehingga dalam simulasi ini nilai yang digunakan dimulai dari 0.001 sampai 0.191 dengan peningkatan sebesar 0.005. Tabel 8 Nilai | | matriks 50 0 pada kondisi 0 30 | | ! untuk 0.1, 0.11, β¦ , 0.25 | |* | |* 0.10 21.45* 0.18 24.38* 0.11 21.74* 0.19 24.83* 0.12 22.05* 0.20 25.30* 22.39* 0.21 25.78* 0.13 0.14 22.75* 0.22 26.28* 0.15 23.13* 0.23 26.78* 0.16 23.53* 0.24 27.31* 0.17 23.95* 0.25 27.84* Langkah berikutnya adalah menjalankan simulasi untuk mendapatkan nilai | dan untuk 1,2 pada kondisi | | ! dan | | $ ! . Hasil simulasi menunjukkan bahwa nilai untuk kondisi | | ! selalu lebih kecil dari nilai ! walaupun matriks ragam-peragam awal yang digunakan tidak memenuhi syarat dari teorema. Perbandingan nilai untuk kedua kondisi yang berbeda menunjukkan bahwa kondisi | | ! memiliki nilai yang lebih besar dibandingkan kondisi | | $ ! . Salah satu hasil simulasi ini dapat dilihat pada Gambar 7 dengan matriks ragam-peragam awal 50 0 (kondisi 0 25 | | $ ! ) berasosiasi dengan garis lurus ( ) dan matriks ragam-peragam awal 50 0 (kondisi | | ! ) berasosiasi dengan garis putus-putus
|
0
30
( ). Matriks noise yang digunakan adalah 25 0
0 . 12.5
0.06 0.00
0.02
0.04
Deviasi
0.08
0.10
16
0.00
0.05
0.10
0.15
Korelasi Koefisien Korelasi 01
Gambar 7 Grafik pada kondisi simulasi | | $ | | !
!
dan
Hasil Simulasi Kedua Bagian simulasi ini dilakukan untuk melihat pengaruh noise pada data yang dibangkitkan dari sebaran normal. Data yang dibangkitkan merupakan data yang digunakan dalam analisis regresi. Peubah yang digunakan yaitu empat peubah bebas dan satu peubah tak bebas serta banyak data yang dibangkitkan adalah seribu data. Keempat peubah bebas dibangkitkan berdasarkan sebaran normal dengan V ~ c0100,151 , V ~ c015,31 , Vd ~ c040,51 dan Vf ~ c070,101 . Peubah tak bebas dibangkitkan dalam dua bentuk, yaitu peubah tak bebas dengan adanya pengaruh noise dan peubah tak bebas tanpa adanya pengaruh noise. Peubah tak bebas tanpa adanya pengaruh noise dibentuk berdasarkan persamaan (4), sedangkan peubah tak bebas dengan adanya pengaruh noise dibentuk berdasarkan persamaan (5). Analisis komponen utama kemudian dilakukan untuk empat gugus peubah, yaitu gugus AKU 1 untuk peubah qV , V , Vd , Vf , U r, gugus AKU 2 untuk peubah qV , V , Vd , Vf , U r dengan & ~ c00,11 , gugus AKU 3 untuk peubah qV , V , Vd , Vf , U r dengan & ~ c02,51, dan gugus AKU 4 untuk peubah qV , V , Vd , Vf , U r dengan & ~ c05,81. Hasil analisis komponen utama ini dapat dilihat pada Tabel 9 dan 10. Pengaruh noise pada analisis komponen utama dalam kasus data bangkitan ini pada umumnya meliputi perubahan nilai vektor akar ciri, tetapi ketika nilai noise semakin besar (kasus AKU 4), posisi vektor akar ciri tersebut juga dapat berubah (perubahan pada tanda positif dan negatif). Besarnya % proporsi keragaman secara kumulatif tidak mengalami perubahan yang signifikan pada data yang dikenakan pengaruh noise, tetapi dengan semakin besarnya nilai noise, nilai % proporsi keragaman kumulatif dari beberapa komponen utama pertama akan berkurang.
17 Tabel 9 Nilai vektor akar ciri data bangkitan Vektor akar ciri ke- Gugus 1 2 3 4
5
AKU 1
0.743 0.033 0.055 0.223 0.628
-0.559 -0.031 -0.106 -0.721 -0.394
-0.227 -0.162 -0.735 -0.494 -0.371
-0.150 -0.786 -0.496 -0.218 -0.258
-0.248 -0.595 -0.447 -0.372 -0.496
AKU 2
0.741 0.033 0.056 0.224 0.629
-0.562 -0.031 -0.108 -0.718 -0.396
-0.230 -0.161 -0.725 -0.503 -0.376
-0.150 -0.779 -0.506 -0.218 -0.259
-0.243 -0.605 -0.450 -0.366 -0.488
AKU 3
0.709 0.034 0.061 0.225 0.665
-0.610 -0.031 -0.111 -0.665 -0.414
-0.262 -0.152 -0.594 -0.612 -0.425
-0.167 -0.585 -0.693 -0.250 -0.297
-0.167 -0.796 -0.389 -0.265 -0.344
-0.652 -0.034 -0.064 -0.225 -0.720
-0.684 -0.030 -0.110 -0.579 -0.428
-0.277 -0.123 -0.418 -0.736 -0.437
-0.149 -0.320 -0.868 -0.225 -0.267
-0.085 -0.938 -0.236 -0.146 -0.188
& ~ c00,11
& ~ c02,51
AKU 4
& ~ c05,81
Tabel 10 Nilai akar ciri dan % proporsi keragaman kumulatif data bangkitan Vektor akar ciri ke- Nilai Gugus 1 2 3 4 5
AKU 1 AKU 2 AKU 3 AKU 4
313.76 313.76 322.07 339.28
133.17 133.51 138.19 145.74
36.40 36.87 42.12 50.48
12.16 12.21 13.97 16.92
0.00 0.23 4.23 6.71
% proporsi keragaman kumulatif
AKU 1 AKU 2 AKU 3 AKU 4
63.32 63.18 61.87 60.68
90.20 90.07 88.41 86.75
97.55 97.49 96.51 95.77
100.00 99.95 99.19 98.80
100.00 100.00 100.00 100.00
18
SIMPULAN DAN SARAN Simpulan Hasil simulasi menunjukkan bahwa teorema mengenai pengaruh noise yang dikemukakan oleh Tsakiri dan Zurbenko (2011) berlaku untuk kondisi data dengan dua peubah yang berkorelasi. Nilai norma selisih vektor akar ciri akan mengalami kenaikan dimulai dari 0.1 hingga 0.57 , kemudian akan mengalami penurunan hingga 0.9 . Nilai konstanta yang digunakan dalam pembentukan matriks ragam-peragam awal akan mempengaruhi besarnya nilai . Nilai konstanta yang memiliki perbandingan yang lebih besar terhadap besaran noise akan membuat nilai semakin kecil. Penggunaan kondisi simulasi yang tidak mendukung syarat awal teorema menghasilkan hasil simulasi dengan karakteristik yang sama tetapi dengan nilai yang lebih besar dibandingkan dengan penggunaan kondisi simulasi yang mendukung syarat awal teorema. Saran Penelitian ini dapat dilanjutkan dengan menambahkan berbagai kondisi simulasi baik pada matriks ragam-peragam awal maupun matriks noise sehingga didapat hasil yang lebih baik.
DAFTAR PUSTAKA Johnson RA, Wichern DW. 1988. Applied Multivariate Statistical Analysis. 2nd Ed. New Jersey (US): Prentice-Hall. Joliffe IT. 2002. Principal Component Analysis. 2nd Ed. New York (US): Springer-Verlag. Krzanowski WJ. 1984. Sensitivity of Principal Components. J R Statist Soc B. 46(3):558-563. Pirker, Clemens. 2009. Statistical Noise of Valuable Information: The Role of Extreme Cases in Marketing Research [dissertation]. Germany: University of Innsbruck. Tsakiri KG, Zurbenko IG. 2011. Effect of Noise in Principal Component Analysis. J Stat Math. 2(2):40-48.
19 Lampiran 1 Syntax simulasi untuk nilai | | fp <- function(diag.pop,diag.noi,w) #diag.pop, vektor berisi nilai diagonal utama matriks populasi #diag.noi, vektor berisi nilai diagonal utama matriks noise #w, indeks nilai akar ciri (dalam simulasi ini, w=1 atau w=2) { n <- 2 rho <- 0.1 temp <- NULL
#dimensi matriks (n x n) #nilai koefisien korelasi awal #tempat penyimpanan nilai deviasi nilai akar ciri
#pembentukan matriks populasi for(l in 1:81) { mat.elm <- NULL #tempat penyimpanan nilai elemen matriks ct <- 1 #counter for(i in 1:n) { for(j in 1:n) { if(i==j) { mat.elm[ct] <- 0 ct <- ct + 1 } else { mat.elm[ct] <- rho*sqrt(diag.pop[i])*sqrt(diag.pop[j]) ct <- ct + 1 } } } mat.pop diag(mat.pop)
<- matrix(mat.elm,n,n) <- diag.pop
#pembentukan matriks noise mat.noi <- matrix(rep(0,n*n),n,n) diag(mat.noi) <- diag.noi #pembentukan matriks simulasi mat.sim <- mat.pop + mat.noi #penghitungan nilai akar ciri eig.sim <- eigen(mat.sim) eig <- eigen(mat.pop) eig.val.sim <- eig.sim$values eig.val <- eig$values #penghitungan nilai selisih akar ciri eig.dev <- abs(eig.val.sim[w] - eig.val[w]) temp <- c(temp,eig.dev) rho <- rho + 0.01 }
#nilai koefisien korelasi baru
#pembuatan grafik trhld <- diag.noi[1] #nilai ! up.lim <- trhld + 5 #batas nilai atas sumbu-y pada grafik rho.list <- seq(0.1,0.9,by=0.01)
20 plot(rho.list,temp,type="l",col=2,lwd=4,xlab="Koefisien Korelasi",ylab="Deviasi",ylim=c(0,up.lim)) abline(h=trhld,lwd=4,col=4) }
21 Lampiran 2 Syntax simulasi untuk nilai fp <- function(diag.pop,diag.noi,w) #diag.pop, vektor berisi nilai diagonal utama matriks populasi #diag.noi, vektor berisi nilai diagonal utama matriks noise #w, indeks vektor akar ciri (dalam simulasi ini, w=1 atau w=2) { n <- 2 rho <- 0.1 temp <- NULL
#dimensi matriks (n x n) #nilai koefisien korelasi awal #tempat penyimpanan nilai norma
#pembentukan matriks populasi for(l in 1:81) { mat.elm <- NULL #tempat penyimpanan nilai elemen matriks ct <- 1 #counter for(i in 1:n) { for(j in 1:n) { if(i==j) { mat.elm[ct] <- 0 ct <- ct + 1 } else { mat.elm[ct] <- rho*sqrt(diag.pop[i])*sqrt(diag.pop[j]) ct <- ct + 1 } } } mat.pop diag(mat.pop)
<- matrix(mat.elm,n,n) <- diag.pop
#pembentukan matriks noise mat.noi <- matrix(rep(0,n*n),n,n) diag(mat.noi) <- diag.noi #pembentukan matriks simulasi mat.sim <- mat.pop + mat.noi #penghitungan vektor akar ciri eig.sim <- eigen(mat.sim) eig <- eigen(mat.pop) eig.vec.sim <- eig.sim$vectors eig.vec <- eig$vectors #penghitungan nilai norma selisih vektor akar ciri dev <- abs(eig.vec.sim[,w]) - abs(eig.vec[,w]) temp <- c(temp, sqrt(sum(dev^2))) rho <- rho + 0.01 }
#nilai koefisien korelasi baru
22 #pembuatan grafik up.lim <- 0.15 #batas nilai atas sumbu-y pada grafik rho.list <- seq(0.1,0.9,by=0.01) plot(rho.list,temp,type="l",col=2,lwd=4,xlab="Koefisien Korelasi",ylab="Deviasi",ylim=c(0,up.lim)) }
23 Lampiran 3 Syntax simulasi untuk nilai rotasi vektor akar ciri fp <- function(diag.pop,diag.noi) #diag.pop, vektor berisi nilai diagonal utama matriks populasi #diag.noi, vektor berisi nilai diagonal utama matriks noise { n <- 2 rho <- 0.1 temp.dev <- NULL temp.norm <- NULL
#dimensi matriks (n x n) #nilai korelasi awal #penyimpanan nilai deviasi vektor akar ciri #penyimpanan nilai norma
#pembentukan matriks populasi for(l in 1:81) { mat.elm <- NULL #tempat penyimpanan nilai elemen matriks ct <- 1 #counter for(i in 1:n) { for(j in 1:n) { if(i==j) { mat.elm[ct] <- 0 ct <- ct + 1 } else { mat.elm[ct] <- rho*sqrt(diag.pop[i])*sqrt(diag.pop[j]) ct <- ct + 1 } } } mat.pop diag(mat.pop)
<- matrix(mat.elm,n,n) <- diag.pop
#pembentukan matriks noise mat.noi <- matrix(rep(0,n*n),n,n) diag(mat.noi) <- diag.noi #pembentukan matriks simulasi mat.sim <- mat.pop + mat.noi #penghitungan vektor akar ciri eig.sim <- eigen(mat.sim) eig <- eigen(mat.pop) eig.vec.sim <- eig.sim$vectors eig.vec <- eig$vectors #penghitungan nilai rotasi rot <- sum(eig.vec.sim[,1] * eig.vec[,1]) temp[l] <- acos(rot)*180/pi rho <- rho + 0.01 }
#nilai koefisien korelasi baru
24 #pembuatan grafik up.lim <- 10 #batas nilai atas sumbu-y pada grafik rho.list <- seq(0.1,0.9,by=0.01) p plot(rho.list,temp,type="l",col=2,lwd=4,xlab="Koefisien Korelasi",ylab="Theta",ylim=c(0,up.lim)) }
25 Lampiran 4 Syntax pembangkitan data regresi set.seed(1000) #pembentukan peubah penjelas x1 <- rnorm(1000,100,15) x2 <- rnorm(1000,15,3) x3 <- rnorm(1000,40,5) x4 <- rnorm(1000,70,10) #pembentukan nilai noise e <- rnorm(1000,5,8) #pembentukan peubah respon y <- 10 + 0.5*x1 + 1.2*x2 + 0.9*x3 + 0.75*x4 y.noi <- 10 + 0.5*x1 + 1.2*x2 + 0.9*x3 + 0.75*x4 + e #penghitungan nilai skor komponen utama pca <- matrix(c(x1,x2,x3,x4,y1),1000,5) pca.noi <- matrix(c(x1,x2,x3,x4,y.noi),1000,5) v1 <- var(pca) v2 <- var(pca.noi) eigen(v1) eigen(v2)
26 Lampiran 5 Daftar nilai parameter untuk simulasi pada kondisi | | $
Rasio dan
Matriks Ragam-Peragam Populasi Awal
Matriks Noise
# = 25 ! = 10
50 0 0 25
10 0 0 5
0.2
# = 25 ! = 15
50 0 0 25
15 0 0 7.5
0.3
# = 25 ! = 20
50 0 0 25
20 0 0 10
0.4
# = 25 ! = 25
50 0 0 25
25 0 0 12.5
0.5
# = 50 ! = 20
100 0 0 50
20 0 0 10
0.2
# = 50 ! = 30
100 0 0 50
30 0 0 15
0.3
# = 50 ! = 40
100 0 0 50
40 0 0 20
0.4
# = 50 ! = 50
100 0 0 50
50 0 0 25
0.5
# dan
!
!
!
27 Lampiran 6 Daftar nilai parameter untuk simulasi pada kondisi | | $ dengan modifikasi nilai konstanta (#) Parameter simulasi pada kondisi # $ # Matriks Ragam-Peragam Populasi Awal Matriks Noise 1
2
3
0 5
50 0 a 0 25
50 0 0 21
50 0 0 17
50 0 0 13
20 0 0 10
50 0 a 0 25
50 0 0 24
50 0 0 23
50 0 0 22
20 0 0 10
100 0 a 0 50
100 0 0 41
100 0 0 32
100 0 0 23
40 0 0 20
100 0 a 0 50
100 0 0 47
100 0 0 44
100 0 0 41
10 0
a
Matriks kontrol
4
Parameter simulasi pada kondisi # # Matriks Ragam-Peragam Populasi Awal Matriks Noise 1
2
3
0 5
50 0 a 0 25
50 0 0 29
50 0 0 33
50 0 0 37
20 0 0 10
50 0 a 0 25
50 0 0 26
50 0 0 27
50 0 0 28
20 0 0 10
100 0 a 0 50
100 0 0 59
100 0 0 68
100 0 0 77
40 0 0 20
100 0 a 0 50
100 0 0 53
100 0 0 56
100 0 0 59
10 0
a
Matriks kontrol
4
!
28 Lampiran 7 Daftar nilai parameter untuk simulasi pada kondisi | | $ dan kondisi | | !
# , #
a
Matriks Ragam-Peragam Populasi Awal | | | | $ ! !
!
Matriks Noise
# = 25 # = 20
50 0 0 25
50 0 0 30
25 0 0 12.5
# = 25 # = 15
50 0 0 25
50 0 0 35
25 0 0 12.5
# = 25 # = 10
50 0 0 25
50 0 0 40
25 0 0 12.5
# = 50 # = 40
100 0 0 50
100 0 0 60
50 0 0 25
# = 50 # = 30
100 0 0 50
100 0 0 70
50 0 0 25
# = 50 # = 20
100 0 0 50
100 0 0 80
50 0 0 25
Nilai # berasosiasi dengan matriks ragam-peragam pada kondisi | | $ ! , sedangkan nilai # berasosiasi dengan matriks ragam -peragam pada kondisi | | !
a
29 Lampiran 8 Hasil simulasi pada kondisi | | $ Matriks ragam-peragam populasi awal : 0 20
30 Deviasi
0
10
20
30 20 0
10
Deviasi
0 50
40
40 0
40
Matriks noise :
100 0
!
0.2
0.4
0.6
0.8
0.2
Korelasi Koefisien Korelasi 01
0.4
0.6
0.8
Korelasi Koefisien Korelasi 01
| | 0.15 0.10 Deviasi 0.05 0.00
0.00
0.05
Deviasi
0.10
0.15
| |
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
0.8
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
0.8
30 Lampiran 9 Hasil simulasi pada kondisi | | $ konstanta (#)
!
dengan modifikasi nilai
Parameter simulasi modifikasi nilai konstanta a
Garis
a b
# # Matriks #
50b
100 0 0 50
50b
100 0 0 50
53a
100 0 0 47
47c
100 0 0 53
56a
100 0 0 44
44a
100 0 0 56
59a
100 0 0 41
41a
100 0 0 59
Bentuk garis mengacu kepada grafik pada gambar di bawah Nilai konstanta ini dijadikan sebagai kontrol 0 Matriks noise yang digunakan adalah 40 0 20
0.08 0.06
0.07
Deviasi
0.06 0.05
0.05
0.04
0.04
0.03
Deviasi
0.07
0.09
0.08
0.10
c
Kondisi simulasi # $ # Matriks Garisa #
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
# $ #
0.8
0.2
0.4
0.6
Korelasi Koefisien Korelasi 01
# #
0.8
31 Lampiran 10 Hasil simulasi pada kondisi | | $ |
!
dan kondisi |
Grafik
Matriks noise
0.10
Deviasi
25 0 0 12.5
0.00
50 0 b 0 40
0.05
50 0 a 0 25
0.15
0.20
Matriks ragamperagam awal
!
0.00
0.05
0.10
0.15
0.06
Deviasi
0.04 0.00
100 0 b 0 60
50 0 0 25
0.02
100 0 a 0 50
0.08
0.10
0.12
Koefisien Korelasi 01 Korelasi
0.00
0.05
0.10
0.15
Deviasi 0.00
100 0 b 0 70
50 0 0 25
0.05
100 0 a 0 50
0.10
0.15
Koefisien Korelasi 01 Korelasi
0.00
0.05
0.10
Koefisien Korelasi 01 Korelasi
a
Matriks ini berasosiasi dengan garis ( Matriks ini berasosiasi dengan garis (
b
) )
0.15
32
RIWAYAT HIDUP Penulis merupakan putra pertama dari pasangan Bapak Budi Suharjo dan Ibu Rina Bogidarmanti yang dilahirkan di kota Bogor pada tanggal 10 Mei 1991. Penulis mengenyam pendidikan di Sekolah Menengah Atas Negeri 1 Bogor sebelum diterima di Departemen Statistika IPB pada tahun 2009. Selama menjadi mahasiswa penulis aktif dalam berbagai kegiatan, di antaranya adalah menjadi anggota Himpunan Profesi Gamma Sigma Beta Statistika IPB, mengikuti kegiatan PKM dan menjadi juara pertama pada kompetisi Bank Mandiri Risk Management Goes To Campus