PROPERTY DAN PERDAGANGAN SEBAGAI SEKTOR DOMINAN PADA DATA BURSA SAHAM DENGAN Principal Component Analysis (PCA) Oleh : Hanna A Parhusip, Deva Widyananto a a a us p, e a dya a to1 da dan Bernadeta Desinova Kr e adeta es o a 2 Program Studi Statistika Matematika Fakultas Sains dan Matematika (FSM) Universitas Kristen Satya Wacana (UKSW) (www uksw edu) Universitas Kristen Satya Wacana (UKSW) (www.uksw.edu) 1mahasiswa S1, matematika – FSM – UKSW 2mahasiswa S1, matematika – FSM – UKSW
Masalah
Data dengan variabel banyak dapat membingungkan dalam formulasi masalah pada suatu model matematika Oleh karena itu diperlukan cara memilih variabel yang dominan untuk mereduksi banyaknya variabel.
METODE : PCA (Principal Component Analysis)
Pada makalah ini dibahas tentang cara memilih sektor ‐ Pada makalah ini dibahas tentang cara memilih sektor ‐ sektor saham domina yang ada di Indonesia. Data diambil dari Bursa Efek Jakarta ( BEJ ) dan menggunakan data pada b l bulan Januari 2008 sampai dengan Januari 2010. d
Principal Component Analysis Secara aljabar PCA j merupakan suatu kombinasi linear p khusus untuk p variabel random X1, . . . , Xp. Secara geometri, kombinasi linear menyatakan pemilihan sistem koordinat baru yang diperoleh dari merotasi sistem koordinat baru yang diperoleh dari merotasi sistem mula‐mula X1, . . . , Xp sebagai sumbu‐sumbu koordinat. Sumbu koordinat yang baru sangat tergantung dari matriks kovariansi. (atau matrik d k k ( k korelasi). Matriks kovariansi pada makalah ini disimbolkan dan haruslah positif tegas (positive p g (p definite). Istilah ini dijelaskan pada Definisi 1.
Definisi 1: (Peressini,1988) (Peressini 1988) aij Misalkan sebuah matriks simetri Misalkan sebuah matriks simetri a positif tegas (definite nn maka matriks positive) jika dan hanya jika semua nilai positive) jika dan hanya jika semua nilai eigennya positif . Untuk negatif tegas didefinisikan secara analog didefinisikan secara analog. ij
Teorema 1. (halaman 358, Johnson and Wichern, 2007) Sebutlah matriks X Sebutlah matriks X = [X1, . . . , Xp] Xp] adalah matriks adalah matriks yang vektor‐vektor kolomnya adalah vektor random (dianggap berdistribusi normal) yang mempunyai matriks kovariansi (simetris dan positif tegas (positive definite)) dengan nilai eigen dan sebutlah vektor eigen yang bersesuaian untuk setiap 1 vektor eigen yang bersesuaian untuk setiap 2 ... p 0 1 2 ... p 0 adalah yang saling ortogonal. Komponen prinsip ke‐i adalah e1 ,,...,,e p T Yi ei X e1i X1 e21 X 2 ... e pi X p ,
i= 1,2,...,p
(1.a)
Dengan pemilihan ini g p T Var (Yi ) ei ei i , ii =1,2,...,p V 12
(1 b) (1.b)
T T Cov Yi , Yk = e i e k 0, ei ek 0. (1.c)
Bukti : (halaman 358, Johnson and Wichern, 2002) .
METODE PENELITIAN • Data : data saham Januari 2008 – 2010. Data setiap vektorvektor kolom dianggap sebagai variabel random yang berdistribusi normal. • Menyusun matriks kovariansi • Menghitung M hit nilai il i eigen i d dan vektor kt eigen i V Vektor kt eigen i sebagai penyusun koefisien pada komponen prinsip. • Menyatakan variabel prinsip sebagai kombinasi linear dari variabel mula-mula • Menentukan koefisisen korelasi antara komponen prinsip dan variabel mula mula dengan persamaan
T Yi ei X e1i X1 e21X 2 ... epi X p
4. ANALISA DAN Tabel PEMBAHASAN 4. Matriks kovariansi (S) 4. Matriks S1
S2
S3
S4
S5
S6
S7
S8
0.0251
0.0292
0.0285
0.0229
0.0250
0.0287
0.0010
0.0227
0.0292
0.0471
0.0445
0.0420
0.0402
0.0354
0.0011
0.0268
0 0285 0.0285
0 0445 0.0445
0 0644 0.0644
0 0397 0.0397
0 0382 0.0382
0 0346 0.0346
0 0047 0.0047
0 0280 0.0280
0.0229
0.0420
0.0397
0.0398
0.0363
0.0286
0.0034
0.0213
0.0250
0.0402
0.0382
0.0363
0.0356
0.0303
0.0024
0.0232
0.0287
0.0354
0.0346
0.0286
0.0303
0.0346
0.0031
0.0256
0.0010
0.0011
0.0047
0.0034
0.0024
0.0031
0.0357
0.0008
0.0227
0.0268
0.0280
0.0213
0.0232
0.0256
0.0008
0.0238
Tampak bahwa matriks kovariansi S adalah matriks simetris. Kita dapat mencari nilai eigen sebagaimana ditunjukkan pada Bab 2 dan dengan menggunakan bantuan MATLAB maka nilai eigen bantuan MATLAB maka nilai eigen adalah adalah 1 2
3 4
5
6
7
8
0.2312 0.0358 0.0191 0.0154 0.0029 0.0008 0.0006 0.0003 Sedangkan vektor eigen untuk tiap nilai eigen
diperoleh berturut‐turut ditunjukkan tiap kolom pada p j p p Tabel 5 dan dapat ditunjukkan bahwa vektor eigen tersebut saling ortonormal.
Tabel 5. Nilai 5. Nilai Vektor eigen untuk data Tabel data Tabel 3 u1
u2
u3
0.4043
0.6699
0.1841
0.6881 ‐0.6881
0.3835
‐0.2473 0.2473 ‐0.0466 0.0466
0.0070
0.0086
0.0249
0.5947
‐0.0871 ‐0.3955
u4
u5
‐0.1714 ‐0.2206 0.3426
u6
u7
u8
0.4298
‐0.0566
0.2965
‐0.0002 0.0002 ‐0.0703 0.0703
0.4402
‐0.0667 ‐0.5731 ‐0.6643
0.0763
0.4683
0.1113
0.5286
‐0.2029
0.0152
0.3861
0.0760
0.3240
0.0055
‐0.0212
0.3800
‐0.0487 ‐0.5485 ‐0.2184 ‐0.5459 ‐0.1750
0.4399
‐0.0096
0.3562
‐0.0402 0 0402
‐0.0354 ‐0.2525 0 0456 0.0456
0.8242 0 0044 0.0044
0 0324 0.0324
0 0360 0.0360
0 1035 0.1035
0 9910 0.9910
0 0336 0.0336
‐0.0635 ‐0.1726 ‐0.1445
0.8043
‐0.2987
0.3585
‐0.0563
0.2785
Oleh karena itu komponen p prinsip p p adalah Y1 0 .4043 X 1 0 .6881 X 2 0 .0070 X 3 0 .5947 X 4 0 .0354 X 5 0 .0487 X 6 0 .0402 X 7 0 .0635 X 8 Y 2 0 .6699 X 1 0 .3835 X 2 0 .0086 X 3 0 .0871 X 4 0 .2525 X 5 0 .5485 X 6 0 .0456 X 7 0 .1726 X 8 Y 3 0 .1841 X 1 0 .2473 X 2 0 .0249 X 3 0 .3955 X 4 0 .8242 X 5 0 .2184 X 6 0 .0044 X 7 0 .1445 X 8 Y 4 0 .1714 X 1 0 .0466 X 2 0 .0667 X 3 0 .1113 X 4 0 .0760 X 5 0 .5459 X 6 0 .0324 X 7 0 .8043 X 8 Y5 0 .2206 X 1 0 .3426 X 2 0 .5731 X 3 0 .5286 X 4 0 .3240 X 5 0 .1750 X 6 0 .0360 X 7 0 .2987 X 8 Y 6 0 .4298 X 1 0 .0002 X 2 0 .6643 X 3 0 .2029 X 4 0 .0055 X 5 0 .4399 X 6 0 .1035 X 7 0 .3585 X 8 Y 7 0 .0566 X 1 0 .0703 X 2 0 .0763 X 3 0 .0152 X 4 0 .0212 X 5 0 .0096 X 6 0 .9910 X 7 0 .0563 X 8 Y8 0 .2965 X 1 0 .4402 X 2 0 .4683 X 3 0 .3861 X 4 0 .3800 X 5 0 .3562 X 6 0 .0336 X 7 0 .2785 X 8
Yi Dapat ditunjukkan bahwa dan saling bebas linear , Yj i,j=1,..,8. Oleh karena itu sebagaimana disebutkan pada Bab 2 diperoleh bahwa Cov( diperoleh bahwa Cov( , ) = 0. ) = Y0i Yj
Untuk selanjutnya korelasi antara antara komponen prinsip pertama dan variabel mula‐mula berturut‐turut adalah t d i b l l l b t tt t d l h
Y , X 1
1
Y , X 1
4
Y , X 1
7
e11 1 s11 e41 1 s 44
e21 1 s 77
= 0.0442;
= 0.0301;
= 0.9931;
Y , X 1
2
e21 1 = 0.0419; s 22
Y , X 1
5
Y , X 1
8
e51 1 s55
= 0.2132;
Y , X 1
3
Y , X 1
6
e31 1 s33
= 0.0027
e21 1
= 0.3266
s 66
e21 1 s88
= 0.8682
X8 X7 Karena nilai korelasi variabel ( properti ) dan X8 X7 ( perdagangan ) dekat dengan 1, maka variabel dan sebagai variabel yang paling berpengaruh terhadap nilai saham variabel yang paling berpengaruh terhadap nilai saham.
Kesimpulan dan Saran Pada makalah ini ini telah ditunjukkan analisa variabel dengan menggunakan Principal Component Analysis untuk 8 variabel mengenai sektor – sektor yang memiliki nilai sahan cukup tinggi Variabel tersebut memiliki nilai sahan cukup tinggi. Variabel tersebut adalah pertanian, industri dasar, aneka industri, barang konsumsi, keuangan, pertambangan, properti, dan perdagangan. Seluruh variabel diuji untuk mendapatkan variabel yang dominan. Diperoleh bahwa properti dan perdagangan adalah variabel yang dominan yang adalah variabel yang dominan yang ditunjukkan dengan variansi terbesar melalui Principal Component Analysis.