STATISTIK PENGUJI KESTABILAN BARISAN MATRIKS KORELASI
DISERTASI Karya tulis sebagai salah satu syarat Untuk memperoleh gelar doktor dari Institut Teknologi Bandung
Oleh Erna Tri Herdiani NIM : 30104007
INSTITUT TEKNOLOGI BANDUNG 2008
STATISTIK PENGUJI KESTABILAN BARISAN MATRIKS KORELASI
Oleh
Erna Tri Herdiani NIM : 30104007
Institut Teknologi Bandung
Menyetujui Tim Pembimbing Tanggal : 15 Mei 2008
Ketua
____________________________ (Prof. Dr. Maman A. Djauhari)
Anggota
________________________ (Dr. Irawati)
iii
Katakanlah, “Wahai Allah yang mempunyai kerajaan, Engkau berikan kerajaan kepada orang yang Engkau kehendaki dan Engkau cabut kerajaan dari orang yang Engkau kehendaki, Engkau muliakan orang yang Engkau kehendaki dan Engkau hinakan orang yang Engkau kehendaki, Di tangan-Mu-lah segala kebajikan. Sesungguhnya Engkau mahakuasa atas segala sesuatu. Engkau masukkan malam ke dalam siang dan Engkau masukkan siang ke dalam malam. Engkau keluarkan yang hidup dari yang mati dan Engkau keluarkan yang mati dari yang hidup. Dan Engkau beri rezeki kepada siapa yang Engkau kehendaki tanpa hisab. (QS. Ali Imran :26-27)
Karya tulis ini dipersembahkan untuk Suamiku, Muhammad Arafah Kube Anak-anakku, Muhammad Fathi Farhat Arafah, Muhammad Al Fatih Arafah, Azizah Sayyidah Arafah dan Muhammad Al Kindi Arafah
v
ABSTRAK STATISTIK PENGUJI KESTABILAN BARISAN MATRIKS KORELASI Oleh Erna Tri Herdiani NIM:30104007 Kemampuan memonitor kestabilan barisan matriks korelasi merupakan hal yang amat penting baik dari segi aplikasi maupun dari segi teori. Berdasarkan literatur, sejak satu dekade terakhir, masalah kestabilan tersebut dapat dijumpai dalam spektrum bidang ilmu yang amat luas, mulai dari bisnis tanah milik, bisnis perumahan (real estate), bisnis asset, manajemen risiko, pasar ekuitas, pasar saham, pasar global hingga bisnis finansial dan ekonomi secara umum dan bahkan komputasi paralel. Sedangkan dari segi teori, dasar-dasarnya sudah dimulai sejak tujuh dekade yang lalu dan terus berkembang hingga tahun-tahun terakhir. Dari segi teori, kriteria yang digunakan umumnya adalah kriteria Likelihood Ratio Test (LRT). Statistik-statistik yang paling populer dan banyak dijumpai dalam aplikasi, yang dibangun dengan menggunakan kriteria LRT, adalah statistik Box, statistik Kullback, statistik Jennrich, statistik Fisher dan statistik Schott. Kepopulerannya terletak pada kemudahan penerapannya dan keefektifannya. Namun, pengujian berdasarkan LRT menghadapi kendala yang amat besar yakni hanya cocok untuk matriks korelasi yang berukuran kecil karena melibatkan perhitungan determinan dan invers matriks. Disertasi ini memperkenalkan suatu metode pemonitoran kestabilan barisan matriks korelasi yang bebas dari kendala tersebut di atas. Proses pemonitoran dilaksanakan dengan menggunakan pendekatan Multivariate Statistical Process Control (MSPC) di mana pengujian hipotesis kesamaan dua matriks korelasi dilakukan berulang-ulang. Statistik penguji yang diusulkan dalam disertasi ini didasarkan kepada apa yang kami sebut vektor variansi variabel-variabel standar (VVVS) sebagai ukuran dispersi multivariat di mana seluruh variabel yang terlibat berupa variabel standar. Agar VVVS dapat diimplementasikan dalam kajian inferensi, dalam disertasi ini terlebih dahulu akan diselidiki distribusi asimtotik sampel VVVS di bawah asumsi kenormalan. Selanjutnya akan diselidiki kesensitifan VVVS dengan membandingkannya terhadap statistik yang paling populer dan banyak digunakan yakni statistik Jennrich. Hasil eksperimen melalui simulasi menunjukkan bahwa statistik yang kami usulkan memiliki tingkat kesensitifan yang lebih baik. Di samping itu, ia memiliki tingkat kompleksitas komputasi yang jauh lebih rendah daripada statistik Jennrich.
Kata kunci : Generalized variance, matriks komutasi, matriks korelasi, matriks kovariansi, operator vec, variansi vektor.
i
ABSTRACT A STATISTICAL TEST FOR TESTING THE STABILITY OF A SEQUENCE OF CORRELATION MATRICES By Erna Tri Herdiani NIM: 30104007 The ability to monitor the stability of a sequence of correlation matrices is very important in application as well as in theoretical studies. We can see in literature that, since the last decade, that problem can be found in a wide spectrum from property business, real estate, asset business, risk management, equity market, stock market, global market and general financial and economic businesses until parallel computation. Theoretically, the theoretical basis already exists since seven decades ago and it continued until last years. In general, the criterion used in this study is the so-called likelihood ratio test (LRT). The most popular and widely used statistics, constructed based on LRT, are Box statistic Kullback statistic, Jennrich statistic, Fisher statistic and Schott statistic. The popularity lies in the easiness of their applications. However, they are not apt for correlation matrices of large dimension. It is caused by the fact that those statistics involve the computation of determinant of correlation matrix and the inversion of a certain matrix. This dissertation introduces a method to monitor the stability of an independent sequence of correlation matrices. The monitoring process will be conducted using Multivariate Statistical Process Control (MSPC) approach where the equality of two correlation matrices is tested repeatedly. For that purpose we propose a statistical test which we call vector variance of standardized variables (VVSV) as a measure of multivariate dispersion when all variables are standardized. In order to use it in inference studies, in this dissertation we derive the asymptotic distribution of sample VVSV in normality assumption. Furthermore, we show that, in general, the power of VVSV statistic is better than the most popular statistic, i.e., Jennrich statistic. Another advantage of VVSV statistic is that its computational complexity is lower than Jennrich statistic. If the latter involves the inversion of two matrices, the former is only the sum of square of all elements of correlation matrices.
Keywords:
Generalized variance, commutation matrix, correlation matrix, covariance matrix, vec operator, vector variance.
ii
PEDOMAN PENGGUNAAN DISERTASI
Disertasi Doktor yang tidak dipublikasikan terdaftar dan tersedia di Perpustakaan Institut Teknologi Bandung, dan terbuka untuk umum dengan ketentuan bahwa hak cipta ada pada pengarang dengan mengikuti aturan HaKI yang berlaku di Institut Teknologi Bandung. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau peringkasan hanya dapat dilakukan seijin pengarang dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya.
Memperbanyak atau menerbitkan sebagian atau seluruh disertasi haruslah seijin Direktur Program Pascasarjana, Institut Teknologi Bandung.
iv
UCAPAN TERIMA KASIH
Bismillahirrahmanirrahim Segala puji dan syukur kami panjatkan ke khadirat Allah SWT karena atas kehendak dan karunia_Nya disertasi ini dapat diselesaikan.
Penulis dapat mengikuti Program S3 dan menyelesaikan penulisan disertasi ini, salah satunya karena mendapat izin dan restu dari suami tercinta Muhammad Arafah Kube. Ia telah memberikan dorongan moril ataupun materil. Sehingga penulis menghaturkan rasa hormat dan terima kasih yang sebesar-besarnya.
Dalam menyelesaikan disertasi ini, penulis mengucapkan banyak terima kasih kepada Bapak Prof. Dr. Maman A. Djauhari sebagai ketua promotor yang telah banyak memberikan bimbingan, motivasi dan nasehat yang sangat berharga buat penulis dan kepada anggota promotor yaitu Dr. Irawati yang telah mendampingi penulis dengan sabar dan telah memberikan nasehat yang sangat berharga buat penulis.
Semoga Allah SWT memberikan Rahman dan Rahim_Nya kepada kedua orang tua penulis, Mamah dan Empap, atas segala pengorbanannya yang tulus ikhlas. Begitu pula kepada Nenek Maccini (alm) beserta Teh Erni, Aa Dede dan Teh Wati, Bi Iyet, Bibi-bibi, mang-mang, tante, om, nenek-nenekku dan kakak-kakak semuanya yang telah mendukung penulis serta Eli.
Terima kasih penulis sampaikan kepada Rektor Universitas Hasanuddin dan Dekan FMIPA Universitas Hasanuddin beserta staf dosen dan karyawan yang telah memberikan dorongan moril demi kelancaran studi penulis, serta kepada seluruh jajaran di Program Studi Matematika, FMIPA, Institut Teknologi Bandung yang telah memberikan dorongan moril dan materil kepada penulis.
vi
Penulis juga berterima kasih kepada:
Dr. Janson Naiborhu sebagai Ketua Program Magister dan Doktor Prodi Matematika atas nasehat, dorongan dan bantuan-bantuan lainnya. Hal itu sangat membantu dalam pelaksanaan penelitian ini.
Tim Pembaca dan Tim Penguji, Dr. Sutawanir Darwis, Prof. Dr. Hendra Gunawan, Prof. Drs. Suryo Guritno, M.Stat., Ph.D, Dr. Dudung Muhally Hakim, Dr. Eng. Zaki Su’ud, Dr. Doddy Sutarno dan Dr Asep Saepudin atas kritik dan saran serta kesediaannya menjadi pembaca, penguji pada ujian tertutup dan penyanggah pada ujian terbuka.
Rekan-rekan Mahasiswa S3, putra maupun putri khususnya yang berada di ruang 207: Bu Hasma, Yuni, Titi, Tita dan Lyra, teman-teman yang berada di Belanda dan Australia yang
telah membantu penulis dalam mencari literature, serta penulis memiliki teman-teman seperjuangan Teh Endah, Teh Damki, Teh Entin,Teh Maya, Teh Lina, Teh Tuti, Teh Nur, dan Teh Iin sebagai teman diskusi dan saling bertaushiah yang menyenangkan, terima kasih atas kebersamaan, do'a, dan seluruh bantuannya dalam bentuk apapun. Semuanya itu, turut mempercepat proses penyelesaian disertasi ini.
Terima kasih penulis ucapkan pula kepada Departemen Pendidikan Nasional melalui Bantuan Beasiswa Pendidikan Pasca Sarjana (BPPs) yang telah membiayai pendidikan program doktor ini, Biro Kerja Sama Luar Negeri Departemen Pendidikan Nasional dan Pendidikan Tinggi atas Program DP2M yang telah memberikan dukungan materil dalam publikasi konferensi international.
Semua yang telah diberikan kepada penulis sungguh amatlah berharga, semoga Allah SWT dapat memberikan balasan yang lebih baik atas semua kebaikan yang telah diberikan kepada penulis. Amin.
Bandung, 15 Mei 2008 Penulis
vii
DAFTAR ISI
Halaman ABSTRAK ………………………………………………………………………
i
ABSTRACT …………………………………………………………………….
ii
PEDOMAN PENGGUNAAN DISERTASI ……………………………………
iv
UCAPAN TERIMA KASIH ……………………………………………………
vi
DAFTAR ISI ........................................................................................................
viii
DAFTAR GAMBAR ...........................................................................................
xi
DAFTAR TABEL ...............................................................................................
xiv
DAFTAR SINGKATAN ....................................................................................
xv
DAFTAR LAMBANG ........................................................................................
xvi
Bab I
Pendahuluan
1
I.1. Latar Belakang Masalah .......................................................
1
I.2. Permasalahan dan Tujuan Penelitian ....................................
3
I.3. Hasil Penelitian .....................................................................
4
I.4. Sistematika Penulisan ...........................................................
4
viii
Bab II
Bab III
Bab IV
Bab V
Bab VI
Tinjauan Pustaka
6
II.1. Pengujian Kesamaan Dua Matriks Korelasi .......................
7
II.2. Pengujian Kestabilan Barisan Matriks Korelasi .................
8
II.2.1 Statistik M-Box ........................................................
9
II.2.2 Statistik Jennrich ......................................................
10
II.3 Masalah yang Hendak Diteliti ............................................
11
Komentar terhadap Distribusi vec ( R )
13
III.1 Distribusi vec ( R ) ………………………………………
13
III.2 Pendekatan bagi Matriks Korelasi......…………………..
14
III.3 Mean dan Variansi vec ( R ) ............................................
17
III.3.1 Mean vec ( R ) .......................................................
23
III.3.2 Variansi vec ( R ) .................................................
24
Ukuran Dispersi Multivariat
26
IV.1 Vektor Variansi Variabel-Variabel Standar ....................
26
IV.2 Distribusi Asimtotik VVVS Sampel .............................
27
Komputasi Variansi VVVS
35
V.1 Rumusan Alternatif Variansi VVVS .................................
36
V.2 Kualitas Pendekatan Distribusi VVVS Sampel.................
39
Analisis Kesensitifan
46
VI.1 Kuasa Statistik VVVS ...................................................
47
VI.2 Kuasa Statistik Jennrich ...............................................
49
VI.3 Ilustrasi Perbandingan Kuasa Kedua Statistik ................
51
VI.3.1 Untuk p=2 ............................................................
51
VI.3.2 Untuk p=3 ...........................................................
55
VI.3.3 Untuk p=4 ...........................................................
59
VI.3.4 Untuk p=5 ...........................................................
62
ix
Bab VII
VI.3.5 Untuk p=10 ...........................................................
66
VI.3.6 Untuk p=15 ...........................................................
69
VI.4 Hasil Simulasi ..................................................................
72
Contoh Aplikasi
74
VII.1 Pendekatan MSPC .........................................................
74
VII.2 Penaksiran Parameter ....................................................
75
VII.3 Contoh ..........................................................................
76
VII.3.1 Pengujian melalui Sttistik VVVS dengan pendekatan MSPC ............................................
76
VII.3.2 Pengujian melalui Statistik M-Box .................
79
VII.3.3 Pengujian melalui Statistik Jennrich ...............
80
VII.4 Catatan ........................................................................
81
Bab VIII
Diskusi Hasil Simulasi
82
Bab IX
Kesimpulan dan Arah Penelitian ke Depan
84
V.1. Kesimpulan ..................................................................
84
V.2. Arah Penelitian ke Depan ............................................
85
DAFTAR PUSTAKA ………………………………………………….…
86
RIWAYAT HIDUP PENULIS ……………………………………….....
91
x
DAFTAR GAMBAR Halaman
Gambar V.1
NP Plot dan QQ Plot dari distribusi VVVS sampel dengan p=3..................................................................................
40
Gambar V1.1. Kuasa statistik VVVS dan statistik Jennrich untuk p = 2 dan n = 5 ……………………………………………………….......
52
Gambar V1.2. Kuasa statistik VVVS dan statistik Jennrich untuk p = 2 dan n = 10 ………………………………………………………….
53
Gambar VI.3. Kuasa statistik VVVS dan statistik Jennrich untuk p = 2 dan n = 15 ……………………………………………………….....
53
Gambar VI.4. Kuasa statistik VVVS dan statistik Jennrich untuk p = 2 dan n = 20 ……………………………………………………….....
54
Gambar VI.5. Kuasa statistik VVVS dan statistik Jennrich untuk p = 2 dan n = 50 ……………………………………………………….....
54
Gambar VI.6. Kuasa statistik VVVS dan statistik Jennrich untuk p = 2 dan n = 100 ………………………………………………………...
55
Gambar VI.7. Kuasa statistik VVVS dan statistik Jennrich untuk p = 3 dan n = 5 …………………………………………………………...
56
Gambar VI.8. Kuasa statistik VVVS dan statistik Jennrich untuk p = 3 dan n = 10 ………………………………………………………......
56
Gambar VI.9. Kuasa statistik VVVS dan statistik Jennrich untuk p = 3 dan n = 15 ………………………………………………………......
57
Gambar VI.10. Kuasa statistik VVVS dan statistik Jennrich untuk p = 3 dan n = 20…………………………………………………………...
57
Gambar VI.11. Kuasa statistik VVVS dan statistik Jennrich untuk p = 3 dan n = 50 …………………………………………………………..
58
Gambar VI.12. Kuasa statistik VVVS dan statistik Jennrich untuk p = 3 dan n = 100 …………………………………………………………..
xi
58
DAFTAR GAMBAR (lanjutan) Halaman Gambar VI.13. Kuasa statistik VVVS dan statistik Jennrich untuk p = 4 dan n = 5 …………………………………………………………..
59
Gambar VI.14. Kuasa statistik VVVS dan statistik Jennrich untuk p = 4 dan n = 10 …………………………………………………………..
60
Gambar VI.15. Kuasa statistik VVVS dan statistik Jennrich untuk p = 4 dan n = 15 …………………………………………………………..
60
Gambar VI.16. Kuasa statistik VVVS dan statistik Jennrich untuk p = 4 dan n = 20 …………………………………………………………..
61
Gambar VI.17. Kuasa statistik VVVS dan statistik Jennrich untuk p = 4 dan n = 50 …………………………………………………………..
61
Gambar VI.18. Kuasa statistik VVVS dan statistik Jennrich untuk p = 4 dan n = 100 …………………………………………………………..
62
Gambar VI.19 Kuasa statistik VVVS dan Statistik Jennrich untuk p = 5 dan n = 5 …………………..………………………………………..
63
Gambar VI.20. Kuasa statistik VVVS dan Statistik Jennrich untuk p = 5 dan n = 10 …………………………………………………………..
63
Gambar VI.21. Kuasa statistik VVVS dan statistik Jennrich untuk p = 5 dan n = 15 …………………………………………………………..
64
Gambar VI.22. Kuasa statistik VVVS dan statistik Jennrich untuk p = 5 dan n = 20 …………………………………………………………..
64
Gambar VI.23. Kuasa statistik VVVS dan statistik Jennrich untuk p = 5 dan n = 50 …………………………………………………………..
65
Gambar VI.24. Kuasa statistik VVVS dan statistik Jennrich untuk p = 5 dan n = 100 ……………………………..…………………………..
65
Gambar VI.25. Kuasa statistik VVVS dan statistik Jennrich untuk p = 10 dan n = 50 …………………………………………………………..
66
Gambar VI.26. Kuasa statistik VVVS dan statistik Jennrich untuk p = 10 dan n = 100 …………..……………………………………………..
xii
67
DAFTAR GAMBAR (lanjutan) Halaman Gambar VI.27. Kuasa statistik VVVS dan statistik Jennrich untuk p = 10 dan n = 150 …………………………………………… ..…………..
67
Gambar VI.28. Kuasa statistik VVVS dan statistik Jennrich untuk p = 10 dan n = 200 …………………………………………………………..
68
Gambar VI.29. Kuasa statistik VVVS dan statistik Jennrich untuk p = 10 dan n = 250 …………………………………………………………..
68
Gambar VI.30. Kuasa statistik VVVS dan statistik Jennrich untuk p = 10 dan n = 300 …………………………………………………………..
69
Gambar VI.31. Kuasa statistik VVVS dan statistik Jennrich untuk p = 15 dan n = 50 …………………………………………………………..
70
Gambar VI.32. Kuasa statistik VVVS dan statistik Jennrich untuk p = 15 dan n = 100 …………………………………………………………..
70
Gambar VI.33. Kuasa statistik VVVS dan statistik Jennrich untuk p = 15 dan n = 150 …………………………………………………………..
71
Gambar VI.34. Kuasa statistik VVVS dan statistik Jennrich untuk p = 15 dan n = 200 …………………………………………………………..
71
Gambar VI.35. Kuasa statistik VVVS dan statistik Jennrich untuk p = 15 dan n = 250 …………………………………………………………..
72
Gambar VI.36. Kuasa statistik VVVS dan statistik Jennrich untuk p = 15 dan n = 300 …………………………………………………………..
72
Gambar VII.1. Bagan kontrol VVVS Sampel untuk proses produksi dudukan kabel tegangan tinggi ...................................................................
xiii
79
DAFTAR TABEL
Halaman
()
Tabel III.1
Perbandingan R dengan Pendekatannya Rˆ ....................................
19
Tabel VI.1
Kuasa statistik VVVS (Z) dan Statistik Jennrich (J) untuk p = 2 .....
51
Tabel VI.2
Kuasa statistik VVVS (Z) dan statistik Jennrich (J) untuk p = 3 .....
55
Tabel VI.3
Kuasa statistik VVVS (Z) dan statistik Jennrich (J) untuk p = 4 ….
59
Tabel VI.4
Kuasa statistik VVVS (Z) dan statistik Jennrich (J) untuk p = 5 ….
62
Tabel VI.5
Kuasa statistik VVVS (Z) dan statistik Jennrich (J) untuk p = 10 ...
66
Tabel VI.6
Kuasa statistik VVVS (Z) dan statistik Jennrich (J) untuk p = 15 …
69
Tabel VII.1
Matriks kovariansi sampel …………………………………………
77
Tablel VII.2
Nilai dari VVVS sampel ...................................................................
78
Tabel VII.3
Berbagai statistik dalam statistic M-Box …………………………..
80
xiv
DAFTAR LAMBANG
Lambang
Makna Pemakaian pertama pada halaman
R
Matriks korelasi sampel .......................................................
4
P
Matriks korelasi populasi ......................................................
4
DA
Matriks diagonal dengan elemen diagonalnya adalah elemen diagonal dari matriks A .........................................................
4
Norm • .................................................................................
4
p
Banyaknya variabel ..............................................................
4
n
Ukuran sampel ......................................................................
4
Tr (•)
Trace matriks • ....................................................................
4
⊗
Perkalian kronecker ..............................................................
4
vec(•)
Vektor kolom yang menyatakan matriks • .........................
4
Kpp
Matriks komutasi berukuran p2 × p2....................................
4
I p2
Matriks identitas berukuran p2 × p2 ....................................
4
G ei
Vektor kolom ke-i matriks identitas I p ................................
4
G X
Vektor acak .........................................................................
6
Σ
Matriks kovariansi populasi ...............................................
6
S
Matriks kovariansi sampel ................................................
6
rij
Elemen ke- (i, j ) matriks korelasi sampel R .....................
6
ρ ij
Elemen ke- (i, j ) matriks korelasi sampel P .....................
6
•
xvi
DAFTAR LAMBANG (Lanjutan)
Lambang
Makna Pemakaian pertama pada halaman
J
Statistik Jennrich ...............................................................
7
d ⎯⎯ →
Konvergen dalam distribusi ...............................................
8
χ2
Fungsi distribusi Chi Square ..............................................
8
α
Tingkat kebermaknaan .......................................................
8
df
Derajat kebebasan .............................................................
8
M
Statistik M-Box .................................................................
9
Ff1 , f2
Fungsi distribusi F dengan derajat kebebasan f1 dan f2 .....
9
:
Perkalian Hadamard ..........................................................
10
Γ
Matriks kovariansi vec(R ) ................................................
13
(
G
N p2 0 ,Γ
)
G Distribusi normal berdimensi p2 dengan vektor mean 0
dan matriks kovariansi Γ .................................................
13
var ( • )
Variansi • .........................................................................
25
µX
Mean variabel X ...............................................................
29
p ⎯ ⎯→
Konvergen dalam peluang ...............................................
29
→
Konvergen ........................................................................
29
∂
Turunan parsial ................................................................
29
σ X2
Variansi dari variabel X ..................................................
29
xvii
DAFTAR SINGKATAN
Singkatan
Kepanjangan
Pemakaian pertama pada halaman
MSPC
Multivariate Statistical Process Control ..............................
1
VVVS
vektor variansi variabel-variabel standar ...............................
2
VV
variansi vektor .......................................................................
2
GV
Generalized Variance ...........................................................
2
DK
determinan matriks kovariansi .............................................
2
FMCD
Fast Minimum Covariance Determinant …………...............
2
LRT
Likelihood Ratio Test ……………………………………….
3
NP Plot
Normal Probability Plot ........................................................
39
QQ Plot
Quantile-Quantile Plot ..........................................................
39
BKA
Batas Kontrol Atas ................................................................
74
BKB
Batas Kontrol Bawah ............................................................
74
xv