DISTRIBUSI KUADRAT JARAK MAHALANOBIS KLASIK : KAJIAN LITERATUR DAN SIMULASI
Diajukan sebagai syarat mengikuti sidang Sarjana Matematika Program Studi Matematika Institut Teknologi Bandung
Disusun oleh : Abdullah 10103076
PROGRAM STUDI MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI BANDUNG 2008
LEMBAR PENGESAHAN
DISTRIBUSI KUADRAT JARAK MAHALANOBIS KLASIK : KAJIAN LITERATUR DAN SIMULASI
Disusun Oleh : Abdullah 10103076
Telah disetujui dan disahkan Sebagai Tugas akhir Sarjana Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Bandung
Bandung, Mei 2008
Prof. Maman A. Djauhari Dosen Pembimbing
i
Abstrak
ABSTRAK
Tugas Akhir ini mengemukakan hasil studi literatur dan kajian simulasi tentang distribusi kuadrat jarak Mahalanobis klasik (non robust). Bedasarkan distribusi tersebut, titik kritis atau nilai cut-off dalam pendeteksian kehadiran satu buah outlier dapat ditentukan. Kajian simulasi dimaksudkan untuk mengamati sejauh mana kecocokan antara kajian teoritis yang diperoleh dari literatur dan hasil eksperimen berdasarkan sejumlah data acak yang dibangkitkan dari distribusi normal multivariate standar.
Abdullah - 10103076
ii
Abstract ABSTRACT
This final project is propose the result of literately study and simulations about the distribution of classical squared Mahalanobis distances (non robust). Based on the distribution, critical point or cut off value in single outlier detection can be identified. The simulations are meaning for monitoring how far the fitness among of theoretical study which get from literature and the result of experiment based on a number of random data which generated from standardized multivariate normal distribution.
Abdullah - 10103076
iii
Prakata
PRAKATA
Alhamdulillaahi rabbil ‘aalamiin. Segala puji penulis sanjungkan kehadirat Allah SWT atas kasih dan sayang-Nya yang tak terbatas. Dan hanya karena rahmat dan RidlaNya lah buku tugas akhir ini dapat terselesaikan. Tugas akhir ini berjudul “ Distribusi Kuadrat Jarak Mahalanobis Klasik : Kajian Literatur dan Simulasi ” . Skripsi ini membahas tentang bagaimana menyajikan data yang bersih dari outlier dengan menggunakan metode klasik. Diangkatnya masalah ini sebagai skripsi tugas akhir karena susahnya melakukan pendeteksian outlier untuk data multivariat ( khususnya p > 2 ) dan karena metode ini merupakan metode paling awal dalam pendeteksian outlier. Dalam menyelesaikan skripsi tugas akhir ini, penulis mendapatkan dukungan serta bantuan baik secara moril maupun materil. Oleh karena itu penulis ingin mengucapkan terima kasih kepada : 1. Abah dan Umi, yang dengan cintanya telah membesarkan penulis hingga saat ini. Membimbing dan memberikan pendidikan terbaik. 2. Prof Maman A. Djauhari, dosen pembimbing Tugas Akhir yang telah memberikan begitu banyak ilmunya, dari yang awalnya tidak mengenal materi topic tugas akhir sedikit pun sampai bisa tahu dan bisa mengaplikasikannya. Dan terima kasih juga atas segala motivasi dan tekanan yang sering bapa berikan karena itu telah merubah sedikit demi sedikit karakter saya yang dulu malas-malasan.
Abdullah - 10103076
iv
Prakata
3. Dr. Sutawanir Darwis dan Bu Hanni Garminia yang telah meluangkan waktunya untuk menjadi dosen penguji seminar Tugas Akhir. 4. Dr. Janny Lindiarni sebagai dosen wali penulis yang telah memberikan dukungan dan nasehat selama penulis. 5. Dosen – dosen di program studi Matematika yang telah banyak memberikan ilmunya kepada penulis. 6. Bu Diah selaku staf Tata Usaha program studi matematika ITB yang telah banyak membantu penulis. 7. Obed dan Soleh yang telah rela membantu abah dan umi selama penulis tidak dapat membantu mereka. Husen dan adik-adik kecilku yang lainnya yang telah mendoakan penulis walaupun kadang sambil becanda. 8. Casimin, teman seperjuangan di ITB saat susah dan senang dan atas segala toleransi dan kesabarannya selama 3 tahun satu kost-an terus. 9. Bahtiar, Yun yun, Tisha dan Eka, teman seperjuangan dalam tugas akhir ini yang telah bekerja bersama-sama menyelesaikan tugas akhir dengan penulis. 10. Teman – teman matematika 2003 yang telah memberikan dukungandukungan selama penulis kuliah. 11. Semua pihak yang telah membantu penulis untuk menyelesaikan tugas akhir ini yang tidak dapat disebutkan satu persatu.
Abdullah - 10103076
v
Prakata
Penulis menyadari bahwa tugas akhir ini masih jauh dari sempurna, oleh karena itu, saran dan kritik tetap penulis harapkan. Akhir kata penulis harapkan tugas akhir ini berguna bagi para pembaca.
Bandung, April 2008
Penulis
Abdullah - 10103076
vi
Daftar Isi
DAFTAR ISI Abstrak………………………………………………………………………………….i Abstract…………………………………………………………………………………ii Prakata.............…………………………………………………………………………iii Daftar Isi……………………………………………………………………………….vi
BAB I PENDAHULUAN 1.1 Latar Belakang………………………………………………………………………1 1.2 Tujuan……………………………………………………………………………….2 1.3 Sistematika Pembahasan…………………………………………………………….2
BAB II Kajian Literatur 2.1 Jarak Mahalanobis…………………………………………………………………..4 2.2 Algoritma metode jarak Mahalanobis klasik…………….…………………………8 2.3 Distribusi Kuadrat Jarak Mahalanobis……………………………………………...9 2.4 Titik kritis (cut-off) ...................................................................…………………...11
BAB III Kajian Simulasi 3.1 Kajian simulasi tentang efektifitas pengujian 1 outlier ………......……………….12 3.2 Kajian simulasi tentang distribusi pendekatan kuadrat jarak Mahalanobis……….19 3.3 Kajian simulasi tentang cut-off distribusi pendekatan…………………………….22
BAB IV APLIKASI JARAK MAHALANOBIS 4.1 Pendeteksian Outlier k…………………………………………………………….42
A. Algoritma membangkitkan data acak……………………………………..42 B. Algoritma menghitung kuadrat jarak Mahalanobis………………………..45 C. Algoritma untuk mendeteksi outlier………………………………………50
Abdullah - 10103076
Daftar Isi
BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan………………………………………………………………………..54 5.2 Saran……………………………………………………………………………....55 LAMPIRAN A…………………………………………………………………….....56 LAMPIRAN B………………………………………………………………….........83 LAMPIRAN C……………………………………………………………………...116 DAFTAR PUSTAKA……………………………………………………………....123
Abdullah - 10103076
vii