PERBANDINGAN METODE HOTELLING, MVE DAN WD DALAM PENDETEKSIAN PENCILAN PADA GRAFIK KENDALI ROBUST PEUBAH GANDA
ADI PRANATA
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2017
PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA* Dengan ini saya menyatakan bahwa tesis berjudul “Perbandingan Metode Hotelling, MVE dan WD dalam Pendeteksian Pencilan pada Grafik Kendali Robust Peubah Ganda” adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Januari 2017
Adi Pranata G151130341
* pelimpahan hak cipta atas karya tulis dari penelitian kerjasama dengan pihak luar IPB harus didasarkan pada perjanjian kerjasama yang terkait
RINGKASAN ADI PRANATA. Perbandingan Metode Hotelling, MVE dan WD dalam Pendeteksian Pencilan pada Grafik Kendali Robust Peubah Ganda. Dibimbing oleh KUSMAN SADIK dan ERFIANI. Pengendalian kualitas merupakan metode yang digunakan untuk memonitor kualitas produk dan mendeteksi permasalahan yang terjadi pada proses produksi.. Alat bantu yang digunakan dalam pengendalian kualitas adalah grafik kendali. Berdasarkan karakteristik yang diamati, grafik kendali dibedakan menjadi grafik kendali peubah tunggal dan peubah ganda. Salah satu grafik peubah ganda yang sering digunakan adala grafik kendali T2 Hotelling. Namun grafik tersebut memiliki kelemahan yaitu tidak sensitif terhadap pencilan. Permasalahan tersebut dapat diatasi dengan cara menggunakan grafik kendali robust dalam mendeteksi pencilan. Dalam penelitian ini, dilakukan perbandingan grafik kendali robust untuk mendeteksi pencilan pada data dengan karakteristik yang salig berkorelasi maupun tidak berkorelasi. Grafik kendali tersebut adalah Minimum Vollume Ellipsoid (MVE) dan Weighted Mean Vector and Mean Square Successive (WD). Metode tersebut dianggap sebagai metode yang paling sensitif dalam mendeteksi pencilan. Parameter perbandingan grafik kendali yang digunakan adalah signal probability. Hasil penelitian ini menunjukkan bahwa grafik MVE merupakan grafik kendali yang robust terhadap pencilan dan tepat diterapkan pada data yang tidak berkorelasi sedangkan pada data berkorelasi, grafik WD merupakan grafik yang tepat diterapkan. Sensitifitas grafik kendali robust peubah ganda baik pada data yang berkorelasi maupun tidak berkorelasi, dipengaruhi oleh banyaknya karakteristik, proporsi pencilan serta hubungan antar karakteristik Kata kunci : grafik kendali peubah ganda, pencilan, robust, signal probability.
SUMMARY ADI PRANATA. Comparison of Hotelling, MVE and WD Method for Detecting Outlier in Robust Multivariate Control Chart. Supervised by KUSMAN SADIK dan ERFIANI. Quality control is a method used to monitor the product quality and detect problems happened during production process. Tool used in controlling quality is control charts. Based on the characteristics, control charts are differentiated into univariate control chart and multivariate control chart. One of common used multivariate control chart is T2 Hotelling chart but is not sensitive with outlier. This problem can be overcome by robust control chart to detect outliers. This study compares MVE method with WD method, considering that both methods are applied for outlier data in correlated or uncorrelated data by comparing signal probability of each method. Both methods are known best applicable to detect outliers. The result showed that MVE chart is the best control chart applied in uncorrelated data and WD chart is most sensitive to detect outlier in correlated data. Control chart sensitivity is affected by number characteristics, outlier proportion and ype of data. Keywords : multivariate control chart, outliers, robust, signal probability.
© Hak Cipta Milik IPB, Tahun 2017 Hak Cipta Dilindungi Undang-Undang Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan IPB Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB
PERBANDINGAN METODE HOTELLING, MVE DAN WD DALAM PENDETEKSIAN PENCILAN PADA GRAFIK KENDALI ROBUST PEUBAH GANDA
ADI PRANATA
Tesis sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada Program Studi Statistika
SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2017
Penguji Luar Komisi pada Ujian Tesis : Dr Farit M. Afendi, MSi
Judul Tesis : Perbandingan Grafik Kendali Hotelling, MVE dan WD dalam Pendeteksian Pencilan pada Grafik Kendali Robust Peubah Ganda Nama : Adi Pranata NIM : G151130341
Disetujui oleh Komisi Pembimbing
Dr Kusman Sadik, MSi Ketua
Dr Ir Erfiani, MSi Anggota
Diketahui oleh
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr Ir I Made Sumertajaya, MS
Dr Ir Dahrul Syah, MScAgr
Tanggal Ujian :
Oktober 2016
Tanggal Lulus :
PRAKATA Puji dan syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan hidayah-Nya, sehingga penulis dapat menyelesaikan proposal penelitian yang berjudul “Perbandingan Metode Hotelling, MVE dan WD dalam Pendeteksian Pencilan pada Grafik Kendali Robust Peubah Ganda”. Keberhasilan penulisan proposal ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai pihak. Terima kasih penulis ucapkan kepada Bapak Dr Kusman Sadik, M.Si dan Ibu Dr Ir Erfiani, M.Si selaku pembimbing yang telah banyak memberi bimbingan, arahan, serta saran kepada penulis. Ucapan terima kasih juga penulis sampaikan sebesar-besarnya kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan kerjasamanya selama ini. Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga penulis ucapkan kepada Ayah Djuwari, Ibu Suciati tercinta yang telah membesarkan dan mendidik penulis dengan penuh kasih sayang, Agus Hari Hadi, Sri Astuti, Thisya dan Angen yang selalu memberikan doa dan semangatnya kepada penulis. Tidak lupa, penulis ucapakan terima kasih kepada teman-teman Statistika 2013 atas bantuan dan kebersamaannya selama ini. Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.
Bogor, Januari 2017
Adi Pranata
DAFTAR ISI DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
1 PENDAHULUAN Latar Belakang Tujuan Penelitian Manfaat Penelitian
1 1 2 2
2 TINJAUAN PUSTAKA Pengendalian Kualitas Peubah Ganda Grafik Kendali T2 Hotelling Grafik Kendali T2 Minimum Volume Ellipsoid (MVE) Grafik Kendali T2 Weighted Mean Vector and Successive Differences (WD) Pengujian Normal Peubah Ganda Penentuan Batas Kendali Perbandingan Kinerja Grafik Kendali Mendeteksi Pencilan
2 2 4 6 7 10 11 12 12
3 METODE PENELITIAN Data Metode Analisis
13 13 14
4 HASIL DAN PEMBAHASAN Mendeteksi Pencilan Pengujian Normal Peubah Ganda Penentuan Batas Kendali Perbandingan Kinerja Grafik Kendali
16 16 17 18 19
5 SIMPULAN DAN SARAN Simpulan Saran
22 22 23
DAFTAR PUSTAKA
24
LAMPIRAN
25
RIWAYAT HIDUP
35
DAFTAR TABEL 1 2 3 4
Rancangan Simulasi Perbandingan Kinerja Grafik Kendali Hasil Pendeteksian Pencilan pada Beberapa Rancangan Simulasi Hasil Uji Normal Peubah Ganda pada Beberapa Rancangan Simulasi Hasil Simulasi Batas Kendali dengan Karakteristik Tidak Berkorelasi dan korelasi 5 Signal Probability Grafik Kendali WD, MVE dan Hotelling Data Tidak Berkorelasi 6 Signal Probability Grafik Kendali WD, MVE dan Hotelling Data Berkorelasi
14 17 18 18 19 21
DAFTAR GAMBAR 1 Diagram Alir Penelitian 2 Perbandingan Signal Probability Data Tidak Berkorelasi p=3 Proporsi Pencilan=5%, p=3 Proporsi Pencilan=10%, p=5 Proporsi Pencilan=5% dan p=5 Proporsi Pencilan 10% 3 Perbandingan Signal Probability Data Berkorelasi p=3 Proporsi Pencilan=5%, p=3 Proporsi Pencilan=10%, p=5 Proporsi Pencilan=5% dan p=5 Proporsi Pencilan=10%
16
20
21
DAFTAR LAMPIRAN 1 Hasil Uji Pendeteksian Pencilan 2 Hasil Pendeteksian Pencilan pada Beberapa Rancangan Simulasi 3 Hasil Uji Normal Peubah Ganda
25 27 34
1
1 PENDAHULUAN Latar Belakang Pengendalian kualitas merupakan metode yang digunakan untuk memonitor kualitas produk dan mendeteksi permasalahan yang terjadi pada proses produksi. Pada proses produksi yang sama, suatu produk diharapkan memiliki karakteristik sedekat mungkin dengan produk lain atau ragam antar produk kecil. Pada kenyataan, dihasilkan produk yang berbeda antara satu dengan yang lain. Apabila pengendalian kualitas diterapkan dengan baik maka penyebab keragaman dalam proses produksi dapat diketahui sehingga dapat segera diperbaiki untuk mendapatkan produk yang homogen serta proses yang terkendali. Alat bantu yang digunakan dalam pengendalian kualitas adalah grafik kendali. Penerapan grafik kendali pada proses produksi bertujuan untuk memonitor keragaman suatu produk dengan cepat. Menurut skala pengukuran data, grafik kendali dibedakan menjadi grafik kendali atribut dan variabel. Menurut Montgomery (2013), grafik kendali atribut merupakan grafik kendali yang digunakan pada karakteristik dengan data skala nominal dan ordinal sedangkan grafik kendali variabel digunakan untuk memonitor karakteristik dengan skala interval dan rasio. Grafik kendali variabel dapat diterapkan pada data peubah tunggal maupun peubah ganda. Grafik kendali peubah tunggal merupakan grafik kendali yang hanya mempertimbangkan satu karakteristik untuk diamati. Grafik kendali peubah ganda merupakan grafik kendali yang digunakan untuk mengamati beberapa karakteristik secara bersamaan terhadap suatu produk (Pan dan Chen 2011). Salah satu grafik kendali peubah ganda yang umum digunakan adalah grafik kendali T2 Hotelling. Apabila grafik kendali T2 Hotelling dibandingkan dengan grafik kendali peubah ganda lain seperti grafik kendali MCUSUM maupun MEWMA, grafik kendali T2 Hotelling lebih mudah diterapkan karena memiliki prosedur perhitungan yang sederhana. Namun, grafik kendali T2 Hotelling memiliki kelemahan, menurut Chenouri et al (2007) grafik kendali T2 Hotelling tidak sensitif mendeteksi pencilan. Menurut Abu-Shawiesh et al (2014), pencilan dapat berdampak besar dalam pendugaan paramater sehingga menghasilkan proses yang tidak terkendali. Sullivan dan Woodall (2000) dan Vargas (2003) melakukan perubahan terhadap grafik kendali T2 Hotelling agar robust terhadap pencilan. Vargas (2003) merekomendasikan pembentukan grafik kendali T2 dengan metode minimum volume ellipsoid (MVE). Metode MVE merupakan metode yang efektif dalam mendeteksi pencilan dengan cara membentuk suatu elipsoid terkecil yang dapat mencakup sebagian titik pengamatan. Namun, metode tersebut sulit diterapkan karena komputasi untuk mencari penduga titik tidak mudah serta prosedur perhitungan penduga titik tidak terjamin berasal dari data yang paling tepat. Pan dan Chen (2011) memperkenalkan metode weighted mean vector and mean square successive differences (WD) sebagai salah satu metode yang robust terhadap munculnya beberapa permasalahan seperti terdapat pencilan maupun tren pada data. Metode tersebut merupakan metode yang menggabungkan antara metode successive differences dan MVE. Metode WD dianggap lebih mudah diterapkan dalam mendeteksi pencilan yaitu
2
dengan cara memboboti penduga rata-rata populasi dan memodifikasi perhitungan matrik variance-covariance. Pencilan dapat muncul pada proses produksi yang mengamati beberapa karakteristik, baik muncul secara bersamaan, membentuk suatu pola tertentu maupun secara acak. Hal tersebut dapat mengganggu proses produksi karena pencilan dapat menyebabkan kesalahan pengambilan keputusan. Mengatasi hal tersebut diperlukan grafik kendali yang tepat untuk mendeteksi pencilan. Pada penelitian kali ini, mengambil topik membandingkan metode T2 Hotelling, MVE dan WD dan pada data dengan beberapa karakteritik yang saling berkorelasi maupun tidak. Penelitian ini diharapkan dapat memperoleh grafik kendali yang robust terhadap pencilan sehingga sensitif mendeteksi pencilan. Grafik T2 Hotelling digunakan sebagai dasar pembanding antara grafik kendali yang sensitif mendeteksi pencilan maupun tidak. Data simulasi digunakan agar data dibangun sesuai dengan tujuan penelitian
Tujuan Penelitian Tujuan dari penelitian ini adalah membandingkan sensitifitas grafik kendali robust peubah ganda T2 Hotelling, MVE dan WD dalam mendeteksi pencilan pada data dengan karakteristik yang saling berkorelasi maupun tidak.
Manfaat Penelitian Penelitian ini bermanfaat bagi pengguna grafik kendali untuk menggunakan grafik kendali peubah ganda yang tepat apabila mengandung pencilan yang terjadi selama proses produksi.
2 TINJAUAN PUSTAKA Pengendalian Kualitas Peubah Ganda Berdasarkan jumlah karakteristik kualitas yang diukur, grafik kendali dibedakan menjadi dua jenis, yaitu grafik kendali peubah tunggal dan ganda. Grafik kendali peubah tunggal merupakan grafik kendali yang berfungsi untuk memonitor pergerakan satu karakteristik kualitas sedangkan grafik kendali peubah ganda digunakan untuk memonitor dua atau lebih karakteristik kualitas secara bersamaan, baik yang saling berkorelasi maupun yang tidak berkorelasi (Pan dan Chen 2011). Tujuan utama pembentukan grafik kendali, baik pada peubah tunggal maupun ganda adalah untuk mendeteksi kemunculan akibat keragaman produksi, seperti pergerakan rata-rata produksi, pencilan, maupun kasus lain yang menyebabkan suatu proses produksi tidak terkendali (Abu-Shawiesh et al 2014). Sama seperti grafik kendali peubah tunggal yang berlandaskan pada distribusi normal, grafik kendali peubah ganda dibentuk dengan mengasumsikan bahwa data produksi menyebar normal peubah ganda, dapat dinotasikan:
3
𝑿 ~𝑁𝑝 (𝝁, 𝚺) Keterangan: 𝑿 m 𝑝 𝝁 𝚺
= matrik hasil pengamatan produksi yang berukuran (m x p) = banyaknya titik pengamatan = banyaknya karakteristik yang diukur = vektor rata-rata populasi, berukuran (p x 1) = matrik variance-covariance yang berukuran (p x p)
Hasil pengamatan produksi pada karakteristik ke-p dan amatan ke-m dinotasikan dalam 𝑥𝑗𝑘 , ditulis dalam bentuk matrik sebagai berikut: 𝑥11 𝑥21 𝑿= [ ⋮ 𝑥𝑚1
𝑥12 𝑥22 ⋮ 𝑥𝑝2
⋯ ⋯ ⋱ ⋯
𝑥1𝑝 𝑥2𝑝 ] ⋮ 𝑥𝑚𝑝
𝜇1 𝜇 𝝁 = [ 2] ⋮ 𝜇𝑝 𝜎11 𝜎 𝚺 = [ 12 ⋮ 𝜎1𝑝
𝜎12 𝜎22 ⋮ 𝜎2𝑝
⋯ ⋯ ⋱ ⋯
𝜎1𝑝 𝜎2𝑝 ] ⋮ 𝜎𝑝𝑝
Rumus yang digunakan dalam pembentukan grafik kendali mengacu pada distribusi normal peubah ganda, yaitu menggunakan vektor rata-rata dan matrik variance-covariance. Begitu pula dengan pembentukan batas kendali yang didasarkan pada pembentukan selang kepercayaan. Luasan daerah yang dibatasi oleh batas kendali 3σ sebesar 99.7% sedangkan 2σ sebesar 95%. Pada pengendalian kualitas, proses pengendalian kualitas dibedakan menjadi 2 fase, yaitu Fase I dan Fase II. Fase I merupakan fase pembentukan grafik kendali beserta batas kendali menggunakan data masa lampau sedangkan Fase II merupakan fase memonitor proses produksi dengan menggunakan batas kendali yang telah dibentuk pada Fase I (Chenouri et al 2007). Pembentukan grafik kendali pada Fase I mengasumsikan bahwa data berasal dari proses yang terkendali. Suatu proses produksi dikatakan terkendali apabila menghasilkan suatu kualitas produk yang memiliki spesifikasi sedekat mungkin dengan produk lain atau homogen dan hanya mengandung galat yang bersifat acak. Apabila pada Fase I pembentukan grafik kendali berasal dari data produksi yang tidak terkendali, maka dilakukan dengan pendeteksian penyebab proses produksi tidak terkendali, menghilangkan titik pengamatan yang menyebabkan proses produksi tidak terkendali, kemudian membangun kembali grafik kendali. Rangkaian proses tersebut dapat mengakibatkan batas kendali berubah serta mengurangi keakuratan dalam mendeteksi perubahan proses produksi yang dilakukan pada Fase II (Chenouri et al 2007). Salah satu penyebab proses tidak terkendali pada Fase I adalah munculnya pencilan, sehingga dapat dikatakan bahwa
4
Fase I merupakan fase untuk mendeteksi pencilan pada peubah ganda, mengenali akar permasalahan dan memperbaiki sumber data (Mohammadi et al 2010). Salah satu cara untuk mengatasi pelanggaran asumsi pada Fase I adalah dengan menerapkan pengendalian kualitas yang robust. Pengendalian kualitas yang robust merupakan suatu metode yang mengakomodasi adanya keanehan data, mengidentifikasi pencilan dan juga secara otomatis menanggulangi pencilan yang berpengaruh terhadap proses pengendalian kualitas, salah satunya saat membentuk grafik kendali. Suatu grafik kendali dikatakan robust apabila batas kendali tidak terpengaruh oleh perubahan kecil maupun besar dari suatu titik pengamatan sehingga dapat dijadikan dasar keputusan dalam strategi perbaikan yang dilakukan. Apabila grafik kendali tidak sensitif, terdapat kemungkinan bahwa terdapat pencilan yang tidak terdeteksi. Hal tersebut berdampak pada kesalahan pengambilan keputusan pada tindakan perbaikan dan proses produksi tidak terkendali. Grafik Kendali 𝐓 𝟐 Hotelling Grafik kendali T 2 Hotelling pertama kali diperkenalkan oleh Harold Hotelling. Konsep dasar grafik kendali ini adalah untuk memantau proses produksi pada beberapa karakteristik, baik yang berkorelasi maupun tidak. Grafik kendali T2 Hotelling diformulasikan berdasarkan statistik uji t yang digeneralisir. Misal 𝑿 mengikuti sebaran 𝑁𝑝 (𝝁, 𝚺) dengan elemen matriks 𝑿 adalah 𝑥𝑗𝑘 , maka titik T 2 dari observasi tunggal (n=1), adalah: ′
𝑇𝑗2 = [𝒙𝒋 − 𝒙̅ ] 𝑺−𝟏 [𝒙𝒋 − 𝒙̅ ]
(1)
Struktur data dinotasikan sebagai berikut: 𝑥̅1 𝑥̅ ̅ = [ 2] 𝒙
⋮
𝑥̅𝑝
𝑆11 𝑆 𝑺 = [ 12 ⋮ 𝑆1𝑝
dengan
𝑆12 𝑆22 ⋮ 𝑆2𝑝
⋯ ⋯ ⋱ ⋯
𝑆1𝑝 𝑆2𝑝 ] ⋮ 𝑆𝑝𝑝
𝑚
1 𝑥̅ 𝑘 = ∑ 𝑥𝑗𝑘 𝑚 𝑗=1
(2)
5
𝑚
1 𝑆𝑖𝑘 = ∑(𝑥𝑗𝑖 − 𝑥̅𝑖 )(𝑥𝑗𝑘 − 𝑥̅𝑘 ) (𝑚 − 1)
(3)
𝑗=1
merupakan penduga vektor rata-rata dan matrik variance-covariance yang diperoleh dari metode maximum likelihood estimator (MLE). Keterangan: 𝑇𝑗2 𝒙𝒋 ̅ 𝒙
𝑺 𝑥𝑗𝑘 𝑥̅ 𝑘
𝑆𝑖𝑘 𝑚 𝑝
= titik T 2 pada pengamatan ke-j, 𝑗 = 1,2, … , 𝑚 = vektor pengamatan ke-j, 𝑗 = 1,2, … , 𝑚 = vektor rata-rata contoh = matrik variance-covariance contoh = pengamatan pada karakteristik ke-k dan amatan ke-j, 𝑘 = 1,2, … , 𝑝; 𝑗 = 1,2, … , 𝑚 = rata-rata karakteristik ke-k, 𝑘 = 1,2, … , 𝑝 = kovarian antara karakteristik ke-i dan ke-k, 𝑖 = 1,2, … , 𝑝; 𝑘 = 1,2, … , 𝑝 dan i≠k, apabila i=k maka disebut dengan ragam = banyaknya titik pengamatan = banyaknya karakteristik yang diamati
Beberapa hal yang perlu diperhatikan untuk mendapatkan titik T 2 Hotelling antara lain: 1. Data pada pengamatan tunggal dipastikan menyebar normal dengan melakukan pengujian normalitas. 2. Rata-rata tiap karakteristik yang diamati dan matrik variance-covariance contoh dihitung sebagai dasar perhitungan titik T 2 Hotelling. Kelebihan dari grafik ini adalah memonitor beberapa karakteristik dengan cepat dan mudah diterapkan, namun tidak robust terhadap pencilan. Artinya apabila terdapat nilai yang menyimpang jauh dari pengamatan, rata-rata contoh tersebut bias. Demikian pula dengan matrik variance-covariance yang dihasilkan, Hubert dan Engelen (2007) menjelaskan bahwa pencilan berdampak signifikan terhadap matrik variance-covariance dan penduga paramater yang ingin dihasilkan pada proses produksi. Oleh karena itu, penduga matrik variance-covariance yang robust terhadap pencilan dibutuhkan untuk menghasilkan penduga yang tidak bias dan konsisten. Salah satu strategi yang dilakukan untuk mengatasi data pencilan pada kasus peubah tunggal adalah dengan mensubstitusi rata-rata contoh dan simpangan baku dengan median dan median absolute deviation yang lebih robust terhadap pencilan. Sedangkan pada kasus peubah ganda, penanganan data pencilan dilakukan dengan cara mengganti penduga lokasi dan skala dengan penduga yang lebih robust terhadap pencilan (Abu-Shawiesh et al 2014).
6
Grafik Kendali 𝐓 𝟐 Minimum Volume Ellipsoid (MVE) MVE diperkenalkan oleh Vargas (2003) merupakan salah satu metode yang digunakan dalam membentuk grafik kendali peubah ganda yang robust. Konsep dasar MVE adalah mencari volume ellipsoid yang terkecil dan mampu menjangkau paling tidak setengah dari m titik pengamatan. Perhitungan titik T 2 MVE adalah sebagai berikut: ′
̅𝑴𝑽𝑬 ] ̅𝑴𝑽𝑬 ] 𝑺−1 𝑇 2𝑀𝑉𝐸,𝑗 = [𝒙𝒋 − 𝒙 𝑴𝑽𝑬 [𝒙𝒋 − 𝒙
(4)
Struktur data dinotasikan sebagai berikut:
̅𝑴𝑽𝑬 = [ 𝒙
𝑥̅ 𝑀𝑉𝐸 1 𝑥̅ 𝑀𝑉𝐸 2
⋮
]
𝑥̅ 𝑀𝑉𝐸 𝑝
𝑺𝑴𝑽𝑬
𝑆11 𝑆 = [ 12 ⋮ 𝑆1𝑝
𝑆12 𝑆22 ⋮ 𝑆2𝑝
dengan 𝑥̅𝑀𝑉𝐸,𝑘 =
1 ∑𝑚 𝑗=1 𝑤𝑗
⋯ ⋯ ⋱ ⋯
𝑆1𝑝 𝑆2𝑝 ] ⋮ 𝑆𝑝𝑝
𝑚
∑ 𝑤𝑗 𝑥𝑗𝑘
(5)
𝑗=1 𝑚
𝑆𝑀𝑉𝐸,𝑖𝑘
1 = 𝑚 ∑ 𝑤𝑗 (𝑥𝑖𝑘 − 𝑥̅ 𝑀𝑉𝐸,𝑖 )(𝑥𝑗𝑘 − 𝑥̅𝑀𝑉𝐸,𝑗 ) (6) ∑𝑗=1 𝑤𝑗 − 1 𝑗=1
Keterangan: 𝑇 2𝑀𝑉𝐸,𝑗 𝒙𝒋 ̅𝑴𝑽𝑬 𝒙 𝑺𝑴𝑽𝑬 𝑥𝑗𝑘
𝑚 p
= titik T 2 pada pengamatan ke-j, 𝑗 = 1,2, … , 𝑚 = vektor pengamatan ke-j, 𝑗 = 1,2, … , 𝑚 = vektor rata-rata contoh untuk grafik MVE = matrik variance-covariance contoh untuk grafik MVE = pengamatan pada karakteristik ke-k dan amatan ke-j, 𝑘 = 1,2, … , 𝑝; 𝑗 = 1,2, … , 𝑚 = rata-rata karakteristik ke-k, 𝑘 = 1,2, … , 𝑝 = kovarian antara karakteristik ke-i dan ke-k, 𝑖 = 1,2, … , 𝑝; 𝑘 = 1,2, … , 𝑝 dan i≠k, apabila i=k maka disebut dengan ragam = banyaknya titik pengamatan = banyaknya karakteristik yang diamati
𝑤𝑗
= pembobot ke-j= {
𝑥̅𝑀𝑉𝐸,𝑘 𝑆𝑀𝑉𝐸,𝑖𝑘
1, 𝑅𝐷(𝒙𝒋 )≤√χ2p,0.975 0, lainnya
7
′
𝑅𝐷(𝒙𝒋 ) = √[𝒙𝒋 − 𝒙̅ 𝒖 ] 𝑺−𝟏 ̅ 𝒖 ] , dengan 𝑗 = 1, … , 𝑚 𝒖 [ 𝒙𝒋 − 𝒙
̅𝒖 𝒙
=𝑝+1 diperkenalkan oleh Rousseeuw dan Zomeren (1990) 𝑚+𝑝+1 = diperkenalkan oleh Rousseeuw dan Zomeren (1990) 2 = vektor rata-rata dari u titik pengamatan
𝑺𝒖
= matrik variance-covariance dari u titik pengamatan
𝑢 ℎ
Beberapa hal yang perlu diperhatikan untuk mendapatkan titik T 2 MVE adalah: 1. Memilih secara acak sejumlah u titik pengamatan dari m titik pengamatan dan menghitung nilai 𝑅𝐷(𝒙𝒋 ) dan memilih urutan nilai 𝑅𝐷(𝒙𝑗 ) yang ke h (𝑚𝑗2 ). 2. Menghitung nilai 𝑽𝑗 = 𝑚𝑗2 ∗ 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑛 𝑺𝑢 . 3. Mengulangi langkah 1 dan 2 hingga ditemukan nilai 𝑽𝑗 yang paling minimum 4. Menghitung titik T 2 MVE dari data dengan 𝑽𝑗 minimum. Menurut Pan dan Chen (2011) metode MVE dapat mendeteksi pencilan dengan baik, namun komputasi metode tersebut sulit dilakukan dan sejumlah titik u yang terpilih tidak menjamin berasal dari proses yang terkendali. Grafik Kendali 𝐓 𝟐 Weighted Mean Vector and Mean Square Successive Differences (WD) Pan dan Chen (2011) memperkenalkan metode baru yang dapat menyederhanakan komputasi metode MVE. Metode tersebut adalah Weighted Mean Vector and Mean Square Successive Differences (WD). Berikut titik T 2 WD: ′
2 ̅𝑾𝑫 ], ̅𝑾𝑫 ] 𝑺−𝟏 𝑇𝑊𝐷 = [𝒙𝒋 − 𝒙 𝑾𝑫 [𝒙𝑗 − 𝒙
(7)
Struktur data dinotasikan sebagai berikut:
̅𝑾𝑫 = [ 𝒙
𝑥̅ 𝑊𝐷 1 𝑥̅ 𝑊𝐷 2
⋮
]
𝑥̅ 𝑊𝐷 𝑝
𝑺𝑾𝑫
𝑆11 𝑆 = [ 12 ⋮ 𝑆1𝑝
𝑆12 𝑆22 ⋮ 𝑆2𝑝
dengan 𝑥̅𝑊𝐷,𝑘 =
1 ∑𝑚 𝑗=1 𝑊𝑗
⋯ ⋯ ⋱ ⋯
𝑆1𝑝 𝑆2𝑝 ] ⋮ 𝑆𝑝𝑝
𝑚
∑ 𝑊𝑗 𝑥𝑗𝑘 𝑗=1
(8)
8
1
𝑺𝑾𝑫 =
2 ∑𝑚 𝑗=2 𝑊𝑗
(9)
𝑊𝑗 [𝒙𝒋 − 𝒙𝒋−𝟏 ][𝒙𝒋 − 𝒙𝒋−𝟏 ]′
𝑺𝑾𝑫 didapatkan dari perkalian matrik successive differences Keterangan: 𝑇 2𝑊𝐷,𝑗 𝒙𝒋 ̅𝑾𝑫 𝒙 𝑺𝑾𝑫 𝑥̅𝑊𝐷,𝑘 𝑚 p 𝑊𝑗
= titik T 2 untuk pengamatan ke-j, 𝑗 = 1, 2, … , 𝑚 = vektor titik pengamatan ke-j dengan 𝑗 = 1, … , 𝑚 = vektor rata-rata contoh = matrik variance-covariance contoh = rata-rata karakteristik ke-k, 𝑘 = 1,2, … , 𝑝 = banyaknya titik pengamatan = banyaknya karakteristik yang diamati = pembobot = {
𝑝 𝑓−𝑝−1
1,
𝑇𝐽∗2 ≤ 𝑚−1 (𝑚 − 1)2 𝐵𝑒𝑡𝑎 (0.975; ,
0,
lainnya
2
2
)
Sebelum mendapatkan titik pengamatan berdasarkan metode WD perlu didefinisikan beberapa rumus sebagai berikut: 1. Membentuk pengamatan yang berbeda dengan mengambil subsampel dengan anggota tiap subsampel sebesar 𝑝 + 1 secara acak dan diberi index 𝑱 = (𝑗1 , 𝑗2 , … , 𝑗𝑝+1 ), 𝑗 = 2, … , 𝑚. 2. Dari subsampel tersebut dihitung vektor rata-rata contoh dan matrik mean square successive difference sebagai berikut:
̅𝑱 = [ 𝒙
𝑥̅𝐽 1 𝑥̅𝐽 2
⋮
]
𝑥̅𝐽 𝑝 𝑝+1
𝑥̅𝑱 𝑘
1 = ∑ 𝑥𝑗𝑘 𝑝+1
(10)
𝑗=1
𝑺𝑫,𝑱 =
1 [𝒙 − 𝒙𝒋−𝟏 ][𝒙𝒋 − 𝒙𝒋−𝟏 ]′ 2(𝑝 + 1) 𝒋
(11)
𝑺𝑫,𝑱 merupakan matrik definit positif untuk setiap 𝑱 sehingga dapat digunakan untuk mencari jarak elipsoid yang sesuai dan dapat digunakan untuk menghitung jarak sesuai dengan rumus: ′
2 −1 ̅𝑱 ] 𝑺𝑫,𝑱 ̅𝑱 ], 𝑇𝐽,𝑗 = [𝒙𝒋 − 𝒙 [𝒙𝒋 − 𝒙
dan mencari nilai 𝑉𝑗 = √(𝑑𝑒𝑡[𝑇2𝐽,(ℎ) 𝑺𝑫,𝑱 ])
𝑗 = 1,2, … , 𝑚.
(12)
9
Keterangan:
3. 4.
2 𝑇𝐽,(ℎ)
= orde statistik ke-h dari T2J,j
ℎ
= nilai integer dari
2 𝑺𝑫,𝑱 ] det[𝑇𝐽,(ℎ)
2 = determinan dari matrik [𝑇𝐽,(ℎ) 𝑺𝑫,𝑱 ]
(m+p+1) 2
𝑚−1 Mengulangi langkah 1 dan 2 sebanyak min(𝐶𝑝+1 , 1500). Ulangan sebanyak 1500 sesuai dengan ketentuan Rousseeuw dan Leroy. Amati subsampel ke-J ∗ pada saat Vj merupakan nilai minimum. Data subsampel 2 tersebut digunakan untuk menghitung nilai 𝐱̅ J dan 𝑇𝐽,(ℎ) yang merupakan ′
2
2 ̅𝑱 ] [(𝑇𝐽,(ℎ) ̅𝑱 ] dapat penduga lokasi dan dispersi, sehingga [𝒙𝑗 − 𝒙 𝑺𝑫,𝑱 )] [𝒙𝑗 − 𝒙 −1
5.
2 𝑺𝑫,𝑱 )] merupakan matrik simetris dan positif ditulis δ2 = 𝐳′𝐀𝐳. 𝐀 = [(𝑇𝐽,(ℎ) sedangkan 𝐳 = (𝐱 𝐣 − 𝐱̅ 𝐉 ). Volume dari elipsoid proposional terhadap [det(𝐀)]−1/2 sehingga volume elipsoid tersebut berhubungan dengan −1 2 [(𝑇𝐽,(ℎ) 𝑺𝑫,𝑱 )] yang proporsional terhadap 𝐕j dengan karakteristik p. Penduga µ dan 𝚺 berdasarkan data contoh adalah:
̅𝑱∗ = [ 𝒙
𝑥̅𝐽∗ 1 𝑥̅𝐽∗ 2
⋮
]
𝑥̅𝐽∗ 𝑝
𝑥̅𝑱∗ =
1 ∑ 𝑥𝑗𝑘 𝑝+1
(13)
𝑗𝜖𝐽
𝑺𝑱∗ =
2 2 𝑐̂𝑚 ,𝑝 𝑺𝑫,𝑱∗ 𝑻𝐽∗,(ℎ) 𝑚(𝑚 −
1
)−2
𝑝 𝑓−𝑝−1 (𝐵𝑒𝑡𝑎 (0.5; , )) 2 2
−1
(14)
Keterangan: 2 𝑐̂𝑚 ,𝑝
12.1246 2 = (1.149 + ) merupakan faktor koreksi 𝑚−𝑝
𝑓
=
2(𝑚 − 1)2 , diperkenalkan oleh Scoholz dan Tosch tahun 1994 3𝑚 − 4
𝐵𝑒𝑡𝑎(0.5; 𝑑1 ; 𝑑2 ) = persentil ke-50 dari distribusi beta dengan parameter 𝑑1 & 𝑑2 Titik inisial T 2 dapat dirumuskan sebagai berikut ′
2 ̅𝑱∗ ] 𝑺−1 ̅𝑱∗ ], 𝑇𝐽∗,𝑗 = [𝒙𝒋 − 𝒙 𝑱∗ [𝒙𝒋 − 𝒙
𝑗 = 1,2, … , 𝑚.
(15)
10
Titik inisial tersebut digunakan sebagai dasar penentuan pemberian bobot dengan kondisi debagai berikut: 𝑊𝑗 = pembobot = {
𝑝 𝑓−𝑝−1
1,
𝑇𝐽∗2 ≤ 𝑚−1 (𝑚 − 1)2 𝐵𝑒𝑡𝑎 (0.975; ,
0,
lainnya
2
2
)
Bobot tersebut kemudian digunakan untuk mencari titik sesuai dengan rumus (7). Menurut Pan dan Chen (2011), kelebihan metode ini adalah lebih sensitif mendeteksi pencilan baik yang bersifat acak maupun tidak dengan komputasi yang lebih mudah dengan memboboti penduga rata-rata populasi dan memodifikasi perhitungan matrik variance-covariance. Pengujian Normal Peubah Ganda Pengujian normal peubah ganda dilakukan untuk memastikan data menyebar normal peubah ganda. Salah satu metode pengujian normal peubah ganda adalah Uji Henze-Zirkler (HZ). Uji tersebut diterapkan berdasarkan pada nilai jarak nonnegatif fungsi yang mengukur jarak antar dua fungsi distribusi dengan hipotesis sebagai berikut (Korkmaz et al 2015): H0 = Data berdistribusi normal peubah ganda H1 = Data tidak berdistribusi normal peubah ganda Jika H0 benar, maka statistik uji HZ mengikuti sebaran Lognormal dengan parameter 𝜇 dan 𝜎 2 . Statistik uji HZ adalah 𝑝
𝑝
𝑚
2
𝛽 𝛽2 𝑝 1 − 𝐷 − 𝐷𝑖𝑗 2 )− 2 2(1+𝛽2 ) 𝑖𝑗 2 ∑∑𝑒 ∑𝑒 𝐻𝑍 = − 2(1 + 𝛽 𝑚
𝑖=1 𝑗=1
+ 𝑚(1 +
𝑝
2𝛽 2 )−2
𝑖=1
~𝐿𝑁(𝜇, 𝜎 2 ) 𝑖 = 1,2, . . 𝑝 𝑗 = 1,2, … , 𝑚
Keterangan: p 𝑚
= banyaknya karakteristik yang diamati = banyaknya pengamatan 1
β 𝐷𝑖𝑗 𝐷𝑖 𝜇 𝜎2
1
m(2p+1) p+4 = koefisien smoothing = ( ) 4 √2 = (𝑥𝑖 − 𝑥𝑗 )′𝑆 −1 (𝑥𝑖 − 𝑥𝑗 ) = (𝑥𝑖 − 𝑥̅ )′𝑆 −1 (𝑥𝑖 − 𝑥̅ ) 2
𝑝
=1−
𝑎 −2 (1 + 𝑝𝛽 𝑎 + (𝑝(𝑝 + 2)𝛽 4 )
2𝑎2 2𝑎−𝑝 (1 + 2𝑝𝛽 4 ) 3𝑝(𝑝 + 2)𝛽 8 = 2(1 + 4𝛽 2 ) + + 𝑎2 4𝑎4 4 8 𝑝 3𝑝𝛽 𝑝(𝑝 + 2)𝛽 − 4𝜔𝛽 −2 (1 + + ) 2𝜔𝛽 2𝜔𝛽 2 𝑝 − 2
(16)
11
𝑎 𝜔𝛽
= 1 + 2𝛽 2 = (1 + 𝛽2 ) + (1 + 4𝛽 2 )
Sehingga rata-rata dan ragam Lognormal dari statistik uji HZ dapat didefinisikan sebagai berikut: 𝜇4 √ log(𝜇) = log ( 2 ) 𝜎 + 𝜇2 𝜎 2 + 𝜇2 log(𝜎 = log ( ) 𝜎2 dengan menggunakan parameter distribusi Lognormal, dapat dicari signifikansi dari pengujian normal peubah ganda. Parameter tersebut digunakan untuk mencari titik kritis pengujian normal peubah ganda. Suatu data dikatakan menyebar normal peubah ganda apabila Statistik uji HZ lebih kecil dibanding nilai 𝐿𝑁(𝜇, 𝜎 2 ) atau nilai–p > α (0.05) (Svantesson dan Wallace 2010). 2)
Penentuan Batas Kendali Sebelum melakukan perbandingan kinerja grafik kendali, perlu dibentuk batas kendali. Batas kendali (𝑐𝛼 ) dengan peluang suatu titik pengamatan grafik kendali sebesar α dinotasikan sebagai berikut: 1 − 𝛼 = 𝑝 ( max 𝑇𝑗2 ≤ 𝑐𝛼 | 𝝁 = 0) 1≤𝑗≤𝑚
(17)
Menurut Jensen et al (2007)¸ titik – titik pengamatan sebagai hasil perhitungan metode MVE merupakan titik yang asimtotis sehingga diperlukan simulasi untuk 2 2 membentuk batas kendali pada Fase I. Sebagai akibat titik T 2 , TMVE dan TWD , merupakan penduga yang bersifat invariance atau tidak mengalami perubahan akibat transformasi maupun perubahan susunan, maka 𝝁 dan 𝚺 pada proses yang terkendali diasumsikan secara berturut-turut bernilai 0 dan 𝚺𝒂 merupakan matrik identitas untuk karakteristik saling independen atau 𝚺𝐛 merupakan matrik variancecovariance untuk karakteristik saling berkorelasi Pembentukan batas kendali dilakukan dengan simulasi sesuai prosedur sebagai berikut: 1. Membangkitkan data sebanyak m titik pengamatan yang berdistribusi normal peubah ganda (𝑁𝑝 (𝟎, 𝚺)). 2 2. Menghitung statistik 𝑇𝑗2 , 𝑗 = 1,2, … , 𝑚 dan memilih nilai maksimum (T(m) ) pada tiap metode kemudian diulang sebanyak n kali, sehingga terdapat n buah 2 T(m) . 2 3. Batas kendali merupakan persentil ke (1 − 𝛼) dari n buah T(m) pada tiap metode. Hasil simulasi Pan dan Chen pada tahun 2011 dengan nilai α = 0.05, menunjukkan bahwa semakin besar jumlah amatan (m) maka akan meningkatkan 2 batas kendali T 2 Hotelling dan menurunkan batas kendali dari TMVE . Sedangkan 2 batas kendali dari grafik T Hotelling dan WD dipengaruhi oleh banyak pengamatan dan karakteristik.
12
Perbandingan Kinerja Grafik Kendali Perbandingan kinerja grafik kendali melibatkan kombinasi antara banyaknya karakteristik (p), banyaknya pengamatan (m) dan banyaknya pencilan (k). Dari m pengamatan, terdapat k titik yang merupakan pencilan yang dibangkitkan dari proses yang tidak terkendali sedangkan sebanyak m-k pengamatan yang dibangkitkan dari proses terkendali. Proses terkendali merupakan proses dimana semua titik berada dibawah batas kendali dan diasumsikan menyebar normal peubah ganda dengan 𝝁𝟎 = (0, 0, … ,0)′ dan 𝚺𝒂 merupakan matrik identitas untuk karakteristik saling independen atau 𝚺𝐛 merupakan matrik variance-covariance untuk karakteristik saling berkorelasi. Sedangkan proses tidak terkendali diasumsikan menyebar normal peubah ganda dengan matrik variance-covariance yang sama namun vektor rata-rata bergerak beberapa nilai. Nilai tersebut bergantung pada nilai parameter non-central, dengan rumus: 𝜆2 = (𝝁𝟏 − 𝝁𝟎 )′ 𝜮−1 (𝝁𝟏 − 𝝁𝟎 ) 𝝁𝟎 = (0, 0, … ,0)′ 𝝁𝟏 = (𝜆, 0, … , 0)′ 𝝁𝟏 merupakan vektor perubahan rata-rata. Suatu grafik kendali dikatakan sensitif terhadap pencilan apabila mampu mendeteksi pencilan namun parameternya tidak berubah. Sensitifitas grafik kendali ditunjukkan oleh signal probability sehingga perbandingan kinerja grafik kendali dapat dilakukan menggunakan signal probability. Signal probability merupakan peluang mendeteksi sinyal adanya proses yang tidak terkendali. Peluang tersebut dirumuskan sebagai berikut: ∑ 𝑌𝑖 𝑖 = 1,2, … 𝑛𝑟 𝑛𝑟
(18)
Keterangan: 𝑌𝑖 = banyaknya titik keluar dari batas kendali (T2 >cα ) 𝑛𝑟 = banyaknya titik pengamatan Signal probability bergantung pada nilai parameter non-central 𝜆2. Semakin besar nilai parameter non-central maka signal probability akan meningkat. Sebaliknya apabila nilai parameter non-central meningkat namun signal probability semakin turun menunjukkan bahwa metode tersebut tidak dapat mendeteksi pencilan (Jensen et al 2007). Mendeteksi Pencilan Pencilan merupakan suatu titik pengamatan yang menyimpang jauh dibanding dengan pengamatan yang lain dan dapat muncul baik secara acak maupun dengan pola tertentu. Menurut penelitian Pan dan Chen (2011), proporsi
13
pencilan sebesar 5% dan 10% dari banyaknya pengamatan dinilai merupakan kondisi optimal untuk memperlihatkan kinerja grafik kendali. Pencilan dapat dideteksi dengan membandingkan titik pengamatan yang satu dengan yang lain dengan suatu pengujian tertentu. Mendeteksi pencilan pada kasus peubah ganda dapat menggunakan jarak Mahalanobis, dengan hipotesis sebagai berikut: H0 = Titik bukan merupakan pencilan H1 = Titik merupakan pencilan Statistik uji Mahalanobis dapat ditulis sebagai berikut (Zurich Institute, 2010): ′
𝑀𝐷𝑗 = √(𝒙𝒋 − 𝒙̅ ) 𝑺−𝟏 ( 𝒙𝒋 − 𝒙̅ )
(19)
Suatu titik dikatakan sebagai pencilan apabila 𝑀𝐷 > 𝑄 Keterangan: 𝒙𝑗 ̅ 𝒙
𝑺 𝑄
= vektor pengamatan ke-j dengan 𝑗 = 1, … , 𝑚 = vektor rata-rata contoh = matrik variance-covariance contoh = Kuantil ke 97.5 dari distribusi chi’s square dengan derajat bebas p (𝜒𝑝2 )
Sebelum melakukan proses pengendalian kualitas peubah ganda, dilakukan pendeteksian pencilan terhadap data hasil pengamatan. Suatu titik pengamatan dikatakan sebagai pencilan apabila jarak mahalanobis dari data peubah ganda tersebut lebih dari nilai kuantil distribusi chi’s square dengan derajat bebas p atau banyaknya karakteristik yang diamati.
3
METODE PENELITIAN Data
Data dalam penelitian ini adalah data simulasi. Data simulasi merupakan data bangkitan dengan banyaknya pengamatan (m) dengan tipe data numerik yang ditinjau dari beberapa aspek yaitu banyaknya karakteristik yang diamati (p) dan proporsi pencilan. Data simulasi yang digunakan merupakan hasil pembangkitan bilangan acak normal peubah ganda Np (𝛍, 𝚺𝐚 ) dengan 𝚺𝐚 adalah matrik identitas untuk karakteristik saling independen serta Np (𝛍, 𝚺𝐛 ) dengan 𝚺𝐛 adalah matrik variance-covariance untuk karakteristik saling berkorelasi dengan elemen non diagonal merupakan hasil perhitungan antara korelasi dengan simpangan baku setiap karakteristik. Besar simpangan baku yang dipilih untuk setiap karakteristik adalah 1. Korelasi antar karakteristik merupakan korelasi kuat berdasarkan kategori Colton (1974) dan arah korelasi adalah positif. Besaran koefisien korelasi Pearson yang digunakan dalam penelitian yaitu 0.95, untuk mengetahui efek korelasi antar
14
karakteristik terhadap sensitifitas grafik kendali. Banyaknya karakteristik yang diamati (p) dalam penelitian ini sebanyak 3 dan 5 dikarenakan pada penelitian metode MVE sebelumnya, metode MVE menghasilkan penduga yang optimal saat p > 2 dan akan mengalami kerumitan dalam pendugaan apabila p besar. (Vargas 2003). Proporsi pencilan yang digunakan dalam penelitian kali ini adalah sebesar 5% dan 10% artinya bahwa terdapat 5% atau 10% dari banyaknya pengamatan menyimpang dari sebagian besar titik pengamatan yang lain. Penelitian oleh Pan dan Chen (2011) menunjukkan bahwa pada saat proporsi pencilan dibawah 20%, grafik kendali berdasarkan metode WD masih mampu mendeteksi adanya pencilan, namun pada saat proporsi 20% metode WD tidak sensitif terhadap pencilan dengan menunjukkan penurunan nilai signal probability, sehingga proporsi pencilan yang digunakan sebesar 5% dan 10%. Letak pencilan pada penelitian ini tersebar secara acak. Banyaknya pengamatan sebanyak 50 dipilih berdasarkan hasil penelitian oleh Rousseeuw dan Zomeren (1990) yang merekomendasikan penerapan MVE ketika m > 5, dengan mempertimbangkan pula faktor lain yang mempengaruhi kinerja p grafik kendali seperti, banyaknya pengamatan dan karakteristik yang diamati. Pada pembentukan grafik kendali, peluang suatu titik lebih besar dibanding batas kendali (𝛼) yang digunakan sebesar 0.05 dan pada perbandingan kinerja grafik kendali ditetapkan nilai parameter non-central adalah 𝜆2 = 5, 10, 15, 20. Nilai parameter non-central dipilih secara bertahap agar dapat diketahui perubahan signal probability tiap metode dari perubahan yang kecil (𝜆2 = 5) hingga perubahan besar(𝜆2 = 20). Tabel 1 Rancangan simulasi perbandingan kinerja grafik kendali m
p
Parameter non-central (λ2 )
Proporsi pencilan
Korelasi
50
3, 5
5, 10, 15, 20
5%, 10%
0, 0.95
Simulasi yang dilakukan diulang hingga 100 kali.
Metode Analisis Penelitian ini dilakukan dengan langkah-langkah sebagai berikut: 1. Membangkitkan data yang menyebar normal peubah ganda 𝑁𝑝 (𝝁, 𝚺𝒂 ) dan 𝑁𝑝 (𝝁, 𝚺𝒃 ) dengan aspek simulasi yaitu banyaknya karakteristik (p) yang diamati sebanyak 3 dan 5 karakteristik dan banyaknya titik pengamatan (m) = 50. Proporsi pencilan yang diberikan adalah 5% dan 10% sehingga terdapat 8 set data. Langkah-langkah penyiapan data adalah sebagai berikut: 1.1. Membangkitkan data yang menyebar normal peubah ganda dengan 𝝁𝟎 = [ 0, 0, . .0] dan matrik variance-covariance untuk setiap p adalah 1 0 𝚺 𝒂 = [0 1 0 0
0 1.00 0.95 0] atau 𝚺𝒃 = [0.95 1.00 1 0.95 0.95
0.95 0.95] 1.00
15
1 0 𝚺𝒂 = 0 0 [0
2. 3. 4.
5.
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 1.00 0.95 0 0.95 1.00 0 atau 𝚺𝒃 = 0.95 0.95 0 0.95 0.95 [0.95 0.95 1]
0.95 0.95 1.00 0.95 0.95
0.95 0.95 0.95 1.00 0.95
0.95 0.95 0.95 0.95 1.00]
1.2. Mengganti 5% dan 10% data bangkitan hasil langkah 1.1 secara acak dengan nilai yang bergerak dari 𝝁𝟎 bergerak ke 𝝁𝟏 , pergerakan tersebut sesuai dengan nilai 𝜆2 yang telah ditetapkan. Membuktikan terdapat pencilan pada data hasil langkah 1 sesuai dengan proporsi menggunakan jarak Mahalanobis. Menghitung titik – titik pengamatan sesuai dengan metode Hotelling, MVE dan WD. Menghitung banyaknya titik pengamatan yang keluar dari batas kendali pada setiap metode. Tahapan ini dilakukan untuk menghitung signal probability dari tiap grafik kendali yang terbentuk dengan tujuan melihat kinerja grafik kendali. Batas kendali tiap grafik didapatkan dari simulasi dengan langkah sebagai berikut: 4.1. Membangkitkan data sebanyak m pengamatan yang menyebar 𝑁𝑝 (𝝁, 𝚺𝒂 ) dan 𝑁𝑝 (𝝁, 𝚺𝒃 ) . 4.2. Menghitung titik pengamatan dan mencari nilai titik pengamatan yang 2 paling besar (𝑇(𝑚) ). 4.3. Mengulangi langkah 4.1 dan 4.2 sebanyak 100 kali. 2 ) dan menjadikan nilai tersebut 4.4. Mencari persentil ke (1 − 𝛼)% dari (𝑇(𝑚) sebagai batas kendali. Mengulangi 100 kali tahap ke 1 hingga 4 Tahapan ini dilakukan untuk evaluasi kinerja tiap grafik kendali agar lebih reliable dengan menghitung signal probability kemudian membandingkan nilai tersebut sesuai dengan aspek simulasi.
Pengolahan data dilakukan dengan menggunakan perangkat lunak R dan Microsoft Excel. Skema algoritma penelitian ini ditampilkan pada Gambar 1.
16
Mulai
Data simulasi
Tidak Uji normal peubah ganda
Tidak Ya
Mendeteksi Pencilan
Ya
Diulang 100 kali
Menghitung statistik uji T
Grafik kendali berdasarkan metode Hotelling
Grafik kendali berdasarkan metode MVE
Grafik kendali berdasarkan metode WD
Menghitung batas kendali tiap grafik
Menghitung signal probability
Selesai
Gambar 1 Diagram alir penelitian
4
HASIL DAN PEMBAHASAN Eksplorasi Data
Data bangkitan dengan banyaknya titik pengamatan sebesar (m) 50 merupakan data yang menyebar normal (Np (μ, Σ)), dengan parameter lokasi μ0 =[ 0, 0, ..0] dan parameter skala 𝚺𝒂 merupakan matrik identitas untuk data tidak berkorelasi dan 𝚺𝒃 merupakan matrik variance-covariance untuk data berkorelasi. Beberapa pengujian atau perhitungan perlu dilakukan sebelum melakukan simulasi, agar sesuai dengan asumsi penelitian. Berikut beberapa pengujian atau perhitungan yang dilakukan Mendeteksi Pencilan Proporsi pencilan yang dicobakan dalam data simulasi adalah 5% dan 10%. Pendeteksian pencilan dilakukan dengan tujuan menguji bahwa data yang dibangkitkan mengandung pencilan sesuai dengan yang telah ditentukan.
17
Pendeteksian pencilan tersebut dilakukan dengan menggunakan jarak Mahalanobis, dengan hipotesis: H0 = Titik bukan merupakan pencilan H1 = Titik merupakan pencilan Titik pengamatan dikatakan menolak H0 apabila hasil perhitungan jarak Mahalanobis lebih besar dari Q (9.34) untuk p = 3 dan Q (12.83) untuk p = 5. Berikut disajikan proporsi hasil pendeteksian pencilan pada beberapa rancangan simulasi dengan jumlah amatan sebesar 50. Tabel 2 Hasil pendeteksian pencilan pada beberapa rancangan simulasi Banyaknya Parameter Proporsi Hasil Simulasi Jenis Data karakteristik non-central Pencilan Ulangan * (p) 5% 4.9% 5 Tidak 10% 9.9% 3 Berkorelasi 5% 5.9% 10 10% 9.0% 5% 5.2% 15 10% 9.8% Berkorelasi 5 5% 4.9% 20 10% 10% * Merupakan rata-rata proporsi pencilan yang terdeteksi Hasil pengujian menggunakan jarak Mahalanobis, terbukti bahwa data yang dibangkitkan telah mengandung pencilan sebesar 5% dan 10%. Hasil pendeteksian pencilan secara menyeluruh tersaji pada Lampiran 1 dan 2 dengan keterangan bahwa jarak Mahalanobis yang lebih besar dari kriteria akan diberi tanda “TRUE”. Pengujian Normal Peubah Ganda Data yang mengandung pencilan tersebut diasumsikan menyebar normal, sehingga perlu diuji kenormalan data. Uji normal peubah ganda menggunakan uji HZ. Hipotesis yang digunakan pada uji ini adalah: H0 = Data berdistribusi normal peubah ganda H1 = Data tidak berdistribusi normal peubah ganda Data simulasi dikatakan normal peubah ganda apabila H0 diterima dengan ketentuan nilai peluang uji HZ > 0.05. Berikut pada Tabel 3 disajikan contoh hasil uji normal peubah ganda pada beberapa rancangan simulasi dengan jumlah amatan sebesar 50.
18
Tabel 3 Hasil uji normal peubah ganda pada beberapa rancangan simulasi Banyaknya Parameter Proporsi Jenis Data karakteristik nonNilai-p * Keterangan Pencilan (p) central 0.93 5% Normal 5 Tidak 10% 0.77 Normal 3 Berkorelasi 5% 0.54 Normal 10 10% 0.35 Normal 0.07 Normal 5% 15 10% 0.12 Normal Berkorelasi 5 5% 0.40 Normal 20 10% 0.33 Normal * Hasil uji normal peubah ganda pada salah satu data hasil simulasi Hasil uji dari data bangkitan tersebut menyatakan bahwa data yang mengandung pencilan baik pada proporsi 5% dan 10% merupakan data yang menyebar normal peubah ganda. Hasil pengujian normal peubah ganda tersaji pada Lampiran 3.
Penentuan Batas Kendali Batas kendali dari tiap metode didapatkan dari hasil simulasi sebanyak 100 kali dengan asumsi bahwa μ = 0 dan 𝚺𝒂 untuk matrik variance-covariance data yang tidak berkorelasi serta 𝚺𝒃 untuk matrik variance-covariance data yang berkorelasi. Hasil simulasi batas kendali setiap metode disajikan pada Tabel 4. Tabel 4 Hasil simulasi batas kendali dengan karakteristik tidak berkorelasi dan korelasi m=50 Banyaknya Jenis Data 2 karakteristik (p) Hotelling (T ) MVE (T2MVE ) WD (T2WD ) Tidak 3 7.47 13.47 7.73 berkorelasi 5 10.45 19.95 11.28 3 7.48 13.01 7.82 Berkorelasi 5 10.23 19.27 10.94 Batas kendali yang tersaji dalam Tabel 4 merupakan hasil simulasi pada data tidak berkorelasi dan berkorelasi. Nilai korelasi antar karakteristik untuk data tidak berkorelasi sebesar 0 dan data berkorelasi sebesar 0.95. Batas kendali data berkorelasi dan tidak berkorelasi memiliki nilai yang relatif sama untuk nilai p yang sama. Perbedaan batas kendali pada masing-masing metode akan terjadi apabila banyak karakteristik berbeda. Semakin banyak karakteristik yang diamati maka batas kendali semakin meningkat.
19
Perbandingan Kinerja Grafik Kendali Kinerja grafik kendali diukur dengan menghitung signal probability selama diketahui banyaknya titik yang diamati. Signal probability merupakan suatu besaran yang menunjukkan peluang tepat satu titik pengamatan keluar dari batas kendali. Semakin besar nilai signal probability suatu metode, maka semakin sensitif mendeteksi pencilan dan menunjukkan bahwa grafik kendali robust terhadap pencilan. Signal probabilty harus diuji dalam berbagai kondisi dengan menggunakan perubahan dalam parameter non-central, untuk melihat konsistensi grafik kendali dalam mendeteksi pencilan. Pada penelitian kali ini besaran parameter non-central sebesar 5, 10, 15 dan 20. Dengan kata lain, perubahan rata-rata sebagai akibat adanya pencilan sebesar 5, 10, 15 dan 20 dengan proporsi pencilan sebesar 5% dan 10%. Perhitungan signal probability didapatkan dari hasil simulasi dengan membandingkan jumlah titik pengamatan yang keluar dari batas kendali dengan total titik pengamatan hasil simulasi. Titik pengamatan yang keluar dari batas kendali merupakan suatu pertanda bahwa proses produksi tidak berjalan dengan baik namun tidak dapat didefinisikan bahwa setiap titik yang keluar dari batas kendali merupakan suatu pencilan. Hasil perhitungan signal probability pada data yang tidak saling berkorelasi dengan berbagai kondisi disajikan pada Tabel 5. Tabel 5 Signal probability grafik kendali WD, MVE dan Hotelling data berkorelasi Proporsi pencilan Banyaknya Parameter karakteristik non5% 10% (p) central Hotelling MVE WD Hotelling MVE 5 0.032 0.032 0.039 0.032 0.029 10 0.065 0.075 0.071 0.047 0.092 3 15 0.109 0.152 0.103 0.072 0.186 20 0.145 0.235 0.147 0.092 0.251 5 0.036 0.043 0.041 0.028 0.027 10 0.058 0.059 0.058 0.041 0.067 5 15 0.097 0.133 0.087 0.072 0.139 20 0.127 0.183 0.125 0.089 0.211
tidak
WD 0.031 0.045 0.086 0.116 0.031 0.044 0.065 0.089
Dari tabel 5, terlihat bahwa semakin banyak karakteristik yang diamati maka nilai signal probability setiap grafik semakin kecil. Selain dapat dibandingkan berdasarkan banyak karakteristik yang diamati, sensitifitas grafik kendali dapat dilihat melalui proporsi pencilan. Semakin besar proporsi pencilan, maka sensitifitas grafik kendali dalam mendeteksi pencilan semakin menurun. Hal tersebut dibuktikan bahwa nilai signal probability setiap grafik kendali pada proporsi sebesar 10% lebih kecil dibanding proporsi 5%. Berikut hasil perbandingan signal probability antara grafik kendali Hotelling, MVE dan WD pada p = 3 dan proporsi pencilan sebesar 5% dan 10% untuk setiap pergerakan sejauh λ2 yang tersaji dalam bentuk grafik.
0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00
Signal Probability
Signal Probability
20
10
15
20
5
𝜆2
(a)
(b)
0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 5
10
𝜆2
Signal Probability
Signal Probability
5
0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00
10
15
𝜆2
(c)
20
15
20
15
20
0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 5
10 𝜆2
(d)
Gambar 2 Perbandingan signal probability data tidak berkorelasi (a) p = 3 proporsi pencilan = 5% (b) p = 3 proporsi pencilan = 10% (c) p = 3 proporsi pencilan = 5% dan (d) p = 5 proporsi pencilan = 10% Pada Gambar 2a, signal probability grafik Hotelling, MVE dan WD meningkat seiring dengan perubahan nilai λ2 . Hal tersebut menunjukkan bahwa ketiga metode mampu mendeteksi pencilan saat p = 3 dan proporsi pencilan sebesar 5%. Grafik MVE merupakan grafik yang paling sensitif karena memiliki signal probability yang paling tinggi dibandingkan dengan grafik lain. Begitu pula pada Gambar 2b, grafik MVE merupakan grafik kendali yang paling sensitif pada saat p = 3 dan proporsi pencilan sebesar 10% karena memiliki signal probability yang paling tinggi dibandingkan dengan grafik lain. Pada Gambar 2c maupun d, grafik MVE memiliki nilai signal probability yang tinggi dibanding dengan grafik lain sehingga grafik MVE merupakan grafik yang paling baik dalam mendeteksi pencilan pada saat p = 5. Terlihat pula, signal probability grafik Hotelling dan WD menurun seiring dengan meningkatnya proporsi pencilan pada suatu data. Hal tersebut menjelaskan bahwa grafik tersebut
21
tidak mampu mendeteksi pencilan dengan baik. Secara umum, pada data dengan karakteristik yang tidak berkorelasi grafik kendali MVE merupakan grafik yang paling sensitif dalam mendeteksi pencilan. Hasil perhitungan signal probability data yang saling berkorelasi pada berbagai kondisi ditampilkan pada Tabel 6 berikut. Tabel 6 Signal probability grafik kendali WD, MVE dan Hotelling data berkorelasi Proporsi pencilan Banyaknya Parameter karakteristik non5% 10% (p) central Hotelling MVE WD Hotelling MVE WD 5 0.102 0.162 0.144 0.107 0.262 0.143 10 0.126 0.176 0.179 0.066 0.147 0.100 3 15 0.137 0.175 0.183 0.132 0.281 0.187 20 0.141 0.172 0.194 0.139 0.283 0.204 5 0.139 0.217 0.203 0.149 0.330 0.199 10 0.157 0.234 0.245 0.159 0.363 0.207 5 15 0.164 0.237 0.266 0.162 0.383 0.211 20 0.174 0.235 0.277 0.167 0.381 0.215
0,40 0,30 0,35 0,25 0,30 0,20 0,25 0,15 0,20 0,10 0,15 0,05 0,10 0,00 0,05 0,00
5
10
15
20
𝜆2 5
10
15
𝜆2
20
Probability SignalSignal Probability
Probability SignalSignal Probability
Apabila dibandingkan dengan Tabel 5, nilai signal probability data berkorelasi lebih besar sehingga grafik kendali lebih sensitif mendeteksi pencilan pada data yang berkorelasi dibandingkan dengan data yang tidak berkorelasi. Perbandingan signal probability grafik kendali Hotelling, MVE dan WD pada data berkorelasi tersaji pada grafik berikut: (a) 0,40 0,40 (b) 0,35 0,35 0,40 0,30 0,35 0,25 0,30 0,20 0,25 0,15 0,20 0,10 0,15 0,05 0,10 0,00 0,05 0,00
5
10
15
20
15
20
𝜆2 5
10
(c)
𝜆2
(d)
Gambar 3 Perbandingan signal probability data berkorelasi (a) p = 3 proporsi pencilan = 5% (b) p = 3 proporsi pencilan = 10% (c) p = 3 proporsi pencilan = 5% dan (d) p = 5 proporsi pencilan = 10% Pada Gambar 3, semakin banyak karakteristik yang diamati maka signal probability dari grafik kendali Hotelling, MVE dan WD mengalami peningkatan. Apabila ditinjau dari proporsi pencilan, grafik kendali MVE mengalami
22
peningkatan signal probability seiring dengan peningkatan proporsi pencilan sedangkan grafik kendali Hotelling dan MVE mengalami peningkatan signal probability pada nilai parameter non-central tertentu. Parameter non-central memberikan pengaruh terhadap sensitifitas grafik kendali robust. Pada saat p = 3 dan proporsi pencilan sebesar 5% (Gambar 3a), grafik kendali WD memiliki signal probability paling tinggi dan mengalami peningkatan seiring perubahan parameter non-central dengan nilai signal probability lebih besar dibandingkan dengan grafik kendali MVE. Namun, pada saat proporsi pencilan 10%, grafik kendali MVE memiliki signal probability paling tinggi dan mengalami peningkatan seiring dengan perubahan parameter non-central meskipun pada saat λ2 = 10 mengalami penurunan nilai signal probability. Signal probability grafik WD mengalami peningkatan seiring dengan peningkatan parameter non-central pada saat p = 5 dengan proporsi pencilan sebesar 5% (Gambar 3c). Sedangkan pada proporsi pencilan sebesar 10%, grafik kendali MVE memiliki signal probability yang paling tinggi dibanding dengan grafik kendali lain. Hasil simulasi pada data berkorelasi maupun tidak, menunjukkan bahwa grafik MVE memiliki nilai signal probability yang tinggi pada beberapa rancangan simulasi sehingga dapat dikatakan bahwa grafik MVE dapat diterapkan sebagai grafik kendali yang sensitif terhadap pencilan.
5
SIMPULAN DAN SARAN Simpulan
Grafik kendali MVE merupakan grafik kendali yang robust terhadap pencilan, baik pada data yang berkorelasi maupun tidak. Hal tersebut ditunjukkan dengan signal probability grafik MVE yang konsisten meningkat pada berbagai rancangan simulasi. Sensitifitas grafik kendali robust peubah ganda dipengaruhi oleh banyaknya karakteristik. Pada data yang tidak berkorelasi, semakin banyak karakteristik yang diamati, sensitifitas grafik kendali menurun sedangkan pada data berkorelasi, semakin banyak karakteristik yang diamati maka grafik kendali semakin sensitif. Selain banyaknya karakteristik, proporsi pencilan merupakan faktor yang juga mempengaruhi sensitifitas grafik kendali peubah ganda. Pada data tidak berkorelasi, pada saat proporsi pencilan sebesar 10% maka kemampuan mendeteksi pencilan semakin turun dibandingkan dengan proporsi pencilan sebesar 5%. Berbeda dengan data tidak berkorelasi, sensitifitas grafik kendali data berkorelasi meningkat seiring dengan proporsi pencilan yang meningkat hingga 10%. Hasil simulasi tersebut terbatas pada besar proporsi pencilan sebesar 5% dan 10%. Sensitifitas grafik kendali robust pada tingkat proporsi pencilan yang lebih besar dapat berbeda dari rancangan simulasi yang telah dibangun.
23
Saran Penelitian selanjutnya perlu dilakukan peninjauan terhadap pencilan yang memiliki pola tertentu seperti tren dan terdapat autokorelasi pada data peubah ganda serta diterapkan pada pengamatan yang memiliki data subgrup.
24
DAFTAR PUSTAKA Abu-Shawiesh M, George F, Kibria B. 2014. A Comparison of Some Robust Bivariate Control Charts for Individual Observation. International Journal of Quality Research 8(2) 183 – 196. Chenouri S, Variyath A, Steiner S. 2007. A Multivariate Robust Control Chart for Individual Observation. Colton T. 1974. Statistics in Medicine. Little Brown and Company. New York. Ben-Gal I. 2005. Outlier detection, In: Maimon O and Rockach L. (Eds.) Data Mining and Knowledge Discovery Handbook: A Complete Guide for Practitioners and Researchers. Kluwer Academic Publishers. Hubert M, Engelen S. 2007. Fast Cross Validation of High Breakdown Resampling Algorithms for PCA Computational Statistics & Data Analysis. 51(10). 5013-5024. Jensen W, Birch J, Woodall W. 2007. High Breakdown Estimation Methods for Phase I Multivariate Control Charts. Journal TechReport05-6. Korkmaz S, Goksulu D, Zararsiz G. 2015. MVN: An R Package for Assessing Multivariate Normality. MVN Version 4.0. Montgomery D. 2013. Introduction to Statistical Quality Control 7th Edition. Wiley. United States of America Mohammadi M, Midi H, Arasan J. 2010. Re-weighted Robust Control Chart for Individual Observations. IMT-GT Conference on Math, Statistics and Its Application. Malaysia. Pan J, Chen S. 2011. New Robust Estimators for Detecting Non-Random Patterns in Multivariate Control Chart: A Simulation Approach. Jurnal of Statistical Computation and Simultation vol 81, No 3. March 2011. Rousseeuw J, Zomeren B. 1990. Robust Distances: Simulations and Cutoff Values. Direction in Robust Statistics and Diagnostics, Part II, edited by W. Stahel and S, Weisberg, Springer-Verlag. Sullivan J, Woodall W. 2000. Change-Point Detection of Mean Vector or Covariance Matrix Shifts Using Multivariate Individual Observations. IIE Transactions, 32 pp. 537–549. Sullivan J. 2002. Detection of Multiple Change Points from Clustering Individual Observations. J. Qual. Technol. 34 371–383. Svantesson T, Wallace J. 2010. Tests for Assessing Multivariate Normality and The Covariance Structure of Mimo Data. National Science Foundation under Wireless Innitiatives Grant CCR-9979452 and Information Technology Research Grant CCR-0081476. Vargas NJA. 2003. Robust Estimation in Peubah ganda Control Charts for Individual Observations. J. Qual. Technol. 35 (2003), pp. 367–376. William J, Woodall W, Sullivan J. 2000. On the Distribution of Hotelling Statistic Based on the Successive Differences Covariance Matrix Estimator. Journal TechReport04-5. Swiss Federal Institute of Technology Zurich. 2012. Finding Multivariate Outlier. Handbook Applied Multivariate Statistics.
25
Lampiran 1 Hasil uji pendeteksian pencilan a. Banyak karakteristik 3, parameter non-central 5 dan proporsi pencilan 5%. Q = 𝜒32 = 9.34 Ulangan ke-1 Obs
Mahalanobis
47 37 14 50 15 4 11 36 6 7 13 31 40 3 20 23 45 9 46 2 25 12 32 16 1
23.82 9.139 9.135 8.426 8.295 6.246 6.208 5.015 5.005 4.752 4.199 3.844 3.622 3.518 3.447 3.397 3.044 2.953 2.821 2.717 2.656 2.642 2.568 2.271 2.200
Distance Outlier TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
Obs
Mahalanobis
30 24 5 33 34 49 43 42 38 39 28 19 10 44 18 17 26 8 35 29 48 41 27 21 22
2.082 1.856 1.838 1.821 1.665 1.543 1.522 1.511 1.474 1.434 1.413 1.386 1.325 1.261 1.260 1.106 0.995 0.978 0.955 0.808 0.706 0.596 0.506 0.348 0.324
Distance Outlier FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
26
Lampiran 1 (Lanjutan) b.
Banyak karakteristik 3, parameter non-central 5 dan proporsi pencilan 5% Q = 𝜒32 = 9.34 Ulangan ke-2 Obs
Mahalanobis
30 22 13 24 5 40 38 31 25 32 8 41 17 37 49 42 14 33 11 7 3 46 27 9 43
12.087 9.994 8.639 8.639 7.921 7.090 5.298 5.195 5.027 4.710 4.542 4.307 4.135 4.097 3.677 3.510 3.366 3.216 3.110 3.107 3.062 3.050 2.671 2.568 2.502
Distance Outlier TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
Obs
Mahalanobis
20 16 39 28 18 48 19 50 2 4 45 26 36 6 10 21 47 34 35 12 23 44 15 1 29
2.335 2.155 2.121 1.985 1.656 1.530 1.422 1.397 1.326 1.286 1.161 1.118 0.795 0.753 0.742 0.741 0.603 0.519 0.498 0.436 0.417 0.233 0.169 0.113 0.077
Distance Outlier FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
27
Lampiran 2 Hasil pendeteksian pencilan pada beberapa rancangan simulasi a.
Banyak karakteristik 3, parameter non-central 5 dan proporsi pencilan 5%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
1 2 3 2 2 4 3 3 3 5 2 2 2 4 1 2 2 2 3 2 2 3 1 3 3
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
2 3 3 1 1 2 3 2 1 3 2 2 3 1 2 3 3 1 1 3 0 2 2 1 5
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
1 2 1 1 2 2 1 0 2 2 1 1 1 2 1 2 3 2 5 5 1 3 2 2 1
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5 4 3 3 3 3 3 3 3 4 5 4 4 4 3 4 2 5 4 5 2 2 4 2 2
Keterangan: Ulg
= Ulangan
28
Lampiran 2 (Lanjutan) b.
Banyak karakteristik 3, parameter non-central 5 dan proporsi pencilan 10%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
5 5 4 4 6 4 5 5 4 2 5 5 5 5 5 5 5 4 5 5 4 5 8 7 6
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
6 6 4 5 5 6 6 6 4 3 8 5 5 4 5 5 4 4 3 5 5 3 8 5 3
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
8 4 3 4 3 8 5 4 4 4 4 7 5 8 4 8 3 3 5 8 5 5 5 3 1
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
8 4 5 6 4 4 5 6 8 8 2 4 3 4 5 3 3 3 5 4 7 5 4 7 7
Keterangan: Ulg
= Ulangan
29
Lampiran 2 (Lanjutan) c.
Banyak karakteristik 3, parameter non-central 10 dan proporsi pencilan 10%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
6 5 3 4 6 4 5 5 4 2 5 5 5 5 5 5 5 4 5 5 4 6 5 5 6
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
6 6 3 5 5 6 6 6 4 3 8 5 5 3 5 5 3 4 3 5 5 3 6 5 3
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
4 4 3 4 3 8 5 4 4 4 4 5 5 5 4 4 3 3 5 4 5 5 5 3 5
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5 4 5 6 4 4 5 6 5 5 2 4 3 4 5 3 3 3 5 4 5 5 4 5 5
Keterangan: Ulg
= Ulangan
30
Lampiran 2 (Lanjutan) d.
Banyak karakteristik 3, parameter non-central 10 dan proporsi pencilan 5%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3 3 3 3 3 3 3 2 3 3 2 3 2 2 2 3 3 3 3 2 3 2 2 2 3
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
6 6 3 5 5 6 6 6 4 3 8 5 5 3 5 5 3 4 3 5 5 3 6 5 3
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
3 3 3 3 3 3 2 2 3 3 3 4 3 3 2 3 3 3 3 3 3 3 3 3 2
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
3 3 4 4 2 2 3 3 3 2 4 3 3 2 3 2 2 2 3 4 3 3 3 3 3
Keterangan: Ulg
= Ulangan
31
Lampiran 2 (Lanjutan) e.
Banyak karakteristik 5, parameter non-central 15 dan proporsi pencilan 5%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3 4 2 2 3 3 3 4 3 4 2 3 2 2 2 2 2 4 3 3 3 3 5 3 5
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
5 5 5 5 7 7 5 7 8 7 5 1 2 2 2 2 3 3 5 3 2 2 2 2 2
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
5 2 2 4 2 4 4 2 2 2 2 2 2 2 4 4 4 4 4 4 4 4 1 1 2
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
4 2 2 2 2 3 2 2 2 2 2 4 3 3 2 3 4 2 4 2 3 3 3 2 4
Keterangan: Ulg
= Ulangan
32
Lampiran 2 (Lanjutan) f.
Banyak karakteristik 5, parameter non-central 15 dan proporsi pencilan 5%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
3 3 2 2 2 2 2 4 4 4 3 3 3 4 3 2 5 3 3 4 4 4 3 4 4
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
4 4 5 5 3 3 5 3 3 4 5 4 3 3 2 2 4 4 4 4 4 4 1 4 4
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
3 3 3 4 4 4 4 4 4 4 3 3 3 2 4 4 3 4 2 4 4 4 4 4 2
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
3 2 2 4 4 4 4 2 2 2 2 4 4 4 4 3 3 3 4 3 4 4 4 2 4
Keterangan: Ulg
= Ulangan
33
Lampiran 2 (Lanjutan) g.
Banyak karakteristik 5, parameter non-central 15 dan proporsi pencilan 10%. Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
Ulg
Banyak Pencilan
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
4 5 5 5 6 5 6 5 6 5 5 6 5 5 5 5 6 4 5 6 5 5 4 5 5
26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
5 6 5 6 5 6 5 6 5 5 5 5 6 6 7 4 5 5 5 5 4 4 5 5 3
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
5 5 6 5 5 4 5 3 4 4 5 5 5 6 5 5 5 6 4 5 4 6 4 5 5
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
5 6 6 6 6 5 6 6 4 4 4 5 5 5 5 5 5 5 5 5 6 5 5 5 5
Keterangan: Ulg
= Ulangan
34
Lampiran 3 Hasil uji normal peubah ganda Contoh Rancangan Simulasi a b c
Nilai HZ 0.469 0.631 0.883
Nilai P 0.928 0.541 0.076
Keterangan: a. Banyak karakteristik 3, parameter non-central 5 dan proporsi pencilan 5%. b. Banyak karakteristik 3, parameter non-central 10 dan proporsi pencilan 5%. c. Banyak karakteristik 5, parameter non-central 15 dan proporsi pencilan 5%.
35
RIWAYAT HIDUP Penulis dilahirkan di Banyuwangi pada tanggal 21 September 1990, sebagai anak ketiga dari pasangan Bapak Djuwari dan Ibu Suciati. Penulis menempuh pendidikan sekolah dasar di SD Negeri IV Kalibaru Wetan Banyuwangi dan melanjutkan sekolah menengah pertama di SMP Negeri 1 Kalibaru Wetan Banyuwangi. Pendidikan sekolah menengah atas ditempuh di SMA Negeri 4 Jember Program IPA, lulus pada tahun 2008. Pada tahun yang sama penulis diterima di program studi Statistika Universitas Brawijaya, Malang dan menyelesaikan studi pada tahun 2012. Kesempatan untuk melanjutkan program master (S2) pada program studi Statistika, Sekolah Pascasarjana IPB, diperoleh pada tahun 2013 dengan program Beasiswa Pendidikan Pascasarjana Dalam Negeri (BPPDN) dari Direktorat Jendral Pendidikan Tinggi (Dikti). Dalam kurun waktu yang sama, Penulis mendapatkan keleluasaan waktu untuk mengikuti jadwal perkuliahan dari PT BANK BUKOPIN, Tbk (tempat Penulis bekerja) tanpa meninggalkan kewajiban sebagai pekerja. Hal tersebut merupakan penghargaan yang besar bagi Penulis dan dinilai setara dengan beasiswa yang diterima. Penulis juga menulis karya ilmiah yang telah dipublikasikan dalam jurnal internasional yang berjudul “Comparison of Hotelling, MVE and WD for Detecting Outlier in Robust Multivariate” diterbitkan pada IJSER Journal of Scientific and Engineering Research (IJSER), Volume 7, Issue 9 September 2016 ISSN 22295518. www.ijser.org.