Bab 3 Perbaikan Bagan Kendali Pergerakan Data (Data Driven) 3.1
Pendahuluan
Bagan kendali klasik untuk memonitoring rataan didasarkan pada asumsi kenormalan. Ketika syarat kenormalan tidak dipenuhi, bagan kendali klasik ini tidak lagi valid untuk digunakan karena galat yang fatal mungkin akan sering muncul (Albers and Kallenberg, 2006). Nilai-nilai seperti false alarm rate (FAR) dan average run length (ARL) bisa jadi berbeda dengan nilai yang ditentukan. Untuk mengatasi permasalahan tersebut, Albers dan Kallenberg pada tahun 2006 memperkenalkan penggunaan perbaikan bagan kendali pergerakan data (data driven). Pada prinsipnya, bagan kendali ini mengikuti bentuk umum batas kendali (persamaan (2.1.1)). Perbedaannya terletak pada taksiran nilai galat standarnya. Dalam bagan kendali pergerakan data (data driven), proses seleksi bagan kendali yang akan digunakan diperoleh dari nilai standarisasi maksimum dan minimum dari data terurutnya. Nilai standarisasi inilah yang menjadi titik tolak untuk menentukan apakah data berdistribusi normal atau tidak. Jika dari aturan penyeleksian data tidak berdistribusi normal, maka harus diuji apakah data termasuk parametrik atau nonparametrik. Hal yang menarik jika data bukan normal dan parametrik, maka 16
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)17 otomatis prosedur ini memutuskan bahwa data nonparametrik. Bagan kendali ini memperbaiki taksiran galat yang diakibatkan penaksiran parameter yang terlibat atau untuk data nonparametrik, bagan kendali ini digunakan untuk menaksir kuantil dari distribusinya. Pada perbaikan bagan kendali pergerakan data (data driven) ini, penaksiran untuk kuantil ekstrim digantikan oleh penaksiran kuantil biasa, sehingga dapat digunakan untuk ukuran sampel yang tidak terlalu besar (Albers and Kallenberg, 2006). Biasanya, parameter dari distribusi yang diajukan tidak diketahui. Oleh karena itu, observasi pada phase I X1 , X2 , ..., Xn digunakan untuk menaksir parameternya. Harga yang harus dibayar untuk perluasan model parametrik adalah galat stokastik yang besar yang diakibatkan penaksiran dari dua parameter tambahan, satu untuk batas kendali atas dan satu untuk batas kendali bawah. Bagan kendali satu arah yang mempunyai batas kendali atas dengan FAR=p dapat mudah diperoleh ketika fungsi distribusi kontinu F dari observasi yang terkendali diketahui. Untuk sederhananya, pilih U CL = F¯ −1 (p), dimana F¯ (x) = 1 − F (x) dan karenanya F¯ −1 (p) adalah kuantil atas p dari X yang mempunyai fungsi distribusi F . Misalnya, ketika X berdistribusi normal dengan rataan µ dan variansi σ 2 diketahui, ¯ −1 (p) (setara kita peroleh U CL = µ + up σ (lihat persamaan (2.1.1)) dengan up = Φ L pada persamaan (2.1.1)) kuantil atas p dari distribusi normal standar. Biasanya dipilih up = 3 setara dengan F AR = p = 0.00135 dan ARL =
1 p
= 741.
Ketika parameter dari F (dalam bagan kendali normal atau parametrik) tidak diketahui, atau F sendiri (dalam bagan kendali nonparametrik) tidak diketahui, kita harus menaksir kuantil atas p dengan menggunakan observasi di phase I X1 , X2 , ..., Xn , yang diasumsikan terkendali. Sebagai konsekuensinya, F AR dan ARL bukan lagi deterministik tetapi variabel acak karena mereka bergantung pada X1 , X2 , ..., Xn . Gagasan dari kasus ini adalah stokastik F AR, tulis Pn harus mendekati nilai p yang ditetapkan. Untuk mendapatkan bias yang kecil (E(Pn ) ≈ p) dibutuhkan sample berukuran besar untuk dilibatkan dalam penentuan batas kendali (wwwhome.cs.utwente.nl, [8]).
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)18 Ada dua aspek yang menjadi perhatian dalam menentukan bagan kendali standar; penaksiran parameter dan asumsi kenormalan. Untuk memonitor rataan, dasar ¯ Shewhart menunjukkan sinyal di luar kendali segera setelah dari bagan kendali X nilai observasi baru yang muncul melebihi batas kendali 3σ. Misal, asumsikan obser¯ berdistribusi normal dengan rataan µ dan simpangan baku vasi yang baru muncul X σ , batas kendali atas didefinisikan sebagai U CL = µ + 3σ dan batas kendali bawah didefinisikan sebagai LCL = µ − 3σ. Sinyal di luar kendali terjadi ketika X > U CL dan X < LCL. Peluang false alarm rate (FAR) p yang bersesuaian, yaitu peluang munculnya sinyal di luar terkendali ketika observasi dalam keadaan masih terkendali, setara dengan 0.0027 (lihat 2.2). Kondisi ini setara dengan munculnya satu sinyal di luar terkendali setiap 370 observasi pada saat proses masih terkendali.
3.2
Perbaikan bagan kendali pergerakan data
Ada tiga tujuan dari penggunaan perbaikan bagan kendali pergerakan data ini, yaitu bias EPn = p, peluang melebihi (exceedance) P (Pn > p(1 + ε)) ≤ α, dan P r( P1n > p1 (1 − ε)) ≤ α. Dalam tugas akhir ini hanya akan dibahas untuk kasus bias EPn = p. Karena keterbatasan informasi pada Albers and Kallenberg (2006), maka uraian di bawah ini hanya akan membahas pemilihan batas kendali tanpa pembuktian.
A. Bagan kendali normal Perbaikan bagan kendali pergerakan data untuk data normal ini dibuat sebagai koreksi terhadap bagan kendali normal klasik. sehingga dapat digunakan untuk jumlah sampel yang kecil. Misalkan observasi X1 , X2 , ..., Xn , Xn+1 variabel acak yang identik dan saling bebas berdistribusi N ∼ (µ, σ 2 ) selama observasi berada pada kondisi terkendali. Variabel acak X1 , X2 , ..., Xn adalah observasi pada phase I, yaitu kondisi observasi yang diasumsikan terkendali, yang mendasari penaksiran parameter µ dan σ. Sementara Xn+1 berada pada phase II, yaitu tahap monitoring.
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)19 Dalam kondisi di luar kendali, Xn+1 berdistribusi N ∼ (µ1 , σ 2 ), dengan µ1 > µ, dalam kasus melebihi batas kendali atas, dan µ1 < µ, dalam kasus data melebihi batas kendali bawah. Diasumsikan proses berada pada kondisi terkendali. Jika µ dan σ diketahui dan F AR = p, maka U CL = µ + up σ, dengan up adalah galat bakunya. Sedangkan untuk kondisi µ dan σ tidak diketahui, µ ditaksir oleh rataan sampel n
X ¯= 1 X2 X n i−1 dan σ ditaksir oleh simpangan baku sampel S =
√
S 2 dimana,
n
1 X ¯ 2 S = (Xi − X) n − 1 i−1 2
Untuk membedakan dengan batas kendali pada bagan kendali klasik, batas kendali bawah dan atas untuk perbaikan bagan kendali pergerakan data (data driven) c N dan UcLN , dengan N menyatakan norberturut-turut dilambangkan dengan LL c N dan tanda (+) mal. Untuk kasus batas bawah, tanda (−) digunakan untuk LL digunakan untuk UcLN . Sinyal di luar kendali diberikan saat observasi Xn+1 fase II c N , UcLN ). Bagan kendali satu arah dapat dengan muberada di luar interval (LL dah ditentukan dengan mengganti
p 2
pada batas kendali dengan p, dan mengambil
hubungan dari salah satu interval yang ada. Dengan menggunakan u p2 {1 +
up/2 +3 } 4n
sebagai koreksi untuk L pada persamaan (2.1.1), batas kendali atas dan bawah didefinisikan oleh: Target EPn = p
c N , UcLN LL ¯ ± u p S{1 + X 2
up/2 +3 } 4n
B. Bagan kendali parametrik Untuk memperluas suatu distribusi normal dalam suatu kelompok distribusi yang lebih besar dengan ekor yang lebih tebal atau lebih tipis dari distribusi normal, dipertimbangkan aturan dasar dari kuantil normal standar sebagai kuantil
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)20 yang baru. Jika kenormalan tidak lagi dipenuhi, model yang lebih umum harus segera dipilih.
Untuk ekor yang lebih berat dari distribusi normal, nilai galat
standar up akan meningkat, tetapi jika ekor lebih tipis, kondisi sebaliknya akan muncul (wwwhome.cs.utwente.nl, [8]). Telah disarankan untuk mengganti up dengan c(γ)u1+γ (wwwhome.cs.utwente.nl, [8]), untuk 0 < p < p
1 2
dengan γ > −1 dan
c(γ) merupakan suatu konstanta normal (untuk membuat variansi sama dengan 1) yang didefinisikan oleh c(γ) = {E|up |2(1+γ) }−1/2 . c(γ) dapat kita tuliskan sebagai berikut :
µ
c(γ) = π
1/4 −(1+γ)/2
2
3 Γ γ+ 2
¶−1/2 (3.2.1)
dengan Γ merupakan fungsi Gamma. Jika kita perhatikan untuk γ = 0 akan menuju standar normal kuantil up . Penaksiran nilai Γ dilakukan dengan metode statistik terurut. Misal X(1) ≤ . . . ≤ X(n) adalah statistik terurut dari X1 , . . . , Xn . Perhitungan untuk γ pada ekor atas dilambangkan dengan γˆ U , dapat dituliskan sebagai berikut :
µ γˆ U = 1.1218log
¯¶ X(ent(0.95n+1)) − X ¯ −1 X(ent(0.75n+1)) − X
(3.2.2)
Untuk memperbaiki taksiran galat modelnya, digunakan kuantil sampel 95% dan 75% (wwwhome.cs.utwente.nl, [8]). Penggunaan kuantil sampel 95% dan 75% didasarkan pada pendekatan data normal, dimana kuantil 75% merupakan kuantil atas (q3 ) dan kuantil 95% setara dengan batas 2σ yang merupakan batas kendali peringatan (Montgomery, 2001, hal 165). ¯ ¯ Perhatikan bahwa (X(ent(0.95n+1)) − X)/(X (ent(0.75n+1)) − X) − 1 menaksir 1+γ 1+γ (c(γ)u1+γ dan 1/ log(u0.05 /u0.25 ) = 1.1218 dengan 0.05 )/(c(γ)u0.25 ) = (u0.05 /u0.25 )
ent(x) adalah bilangan bulat dari x. Dengan cara yang sama, taksiran γ pada ekor bawah, γˆ L, dapat ditulis: µ¯ ¶ X − X(n−ent(0.95n)) γˆ L = 1.1218log ¯ −1 X − X(n−ent(0.75n))
(3.2.3)
Sebelum masuk pada pembahasan batas kendali, terlebih dahulu diperkenalkan beberapa notasi yang dibutuhkan untuk bentuk koreksinya: C1 (γ, up ) = −1.23 − 0.63γ + 0.73γ 2 + 0.74up − 0.08γup − 0.14γ 2 up
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)21 µ C2 (γ) =
ua n ua n
¶1+γ − 2.43781+γ
dengan an = 1 −
ent(0.95n + 1) ent(0.75n + 1) , bn = 1 − n+1 n+1
C3 (γ, up ) = −76.37 − 120.12γ − 81.93γ 2 + 35.53up + 53.71γup + 37.18γ 2 up c p dan Batas kendali dua sisi untuk bagan kendali parametrik dinotasikan oleh LL C (ˆ γ ,u ) γ UcLp . Dengan menggunakan {c(ˆ γ )u1+ˆ − C1 (ˆ γ , up )C2 (ˆ γ ) + 3 n p/2 } sebagai koreksi p 2
untuk L pada persamaan (2.1.1), batas kendali atas dan bawah didefinisikan oleh: c P , UcLP LL
Target
γ ¯ ± S{c(ˆ EPn = p X γ )u1+ˆ − C1 (ˆ γ , up )C2 (ˆ γ) + p 2
C3 (ˆ γ ,up/2 ) } n
Untuk batas kendali atas γˆ yang digunakan adalah γˆ U , dan untuk batas kendali bawah γˆ yang digunakan adalah γˆ L
C. Bagan kendali minimum Pada kasus nonparametrik, tidak ada solusi memuaskan yang dapat diperoleh kecuali ukuran sampel dari observasi sangat besar (wwwhome.cs.utwente.nl, [8]). Bagan kendali minimum ini merupakan perbaikan dari bagan kendali nonparametrik sehingga bagan kendali dapat digunakan untuk ukuran sampel biasa (Albers and Kallenberg, 2006). Berbeda dengan bagan kendali normal dan parametrik, bagan kendali ini tidak mengikuti bentuk umum batas kendali (persamaan (2.1.1)), tetapi menggunakan metode statistik terurut dimana kuantil yang digunakan bergantung pada ukuran sampel pada fase I (dimana observasinya diasumsikan terkendali) dan fase II (proses monitoringnya). Berikut beberapa notasi yang dipergunakan dalam membangun bagan kendali minimum: r = ent(n{m(p/2)}1/m ) k ditentukan oleh r−k+m n+m r−k−1+m , < 6 m(p/2) m m m
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)22 n+m r−k−1+m − m(p/2) m m λ= r−k+m r−k−1+m − m m dengan 0 < λ < 1 Target EP Pn = p n
3.3
c M IN , UcLM IN LL c M IN : (1 − λ)X(r−k) + λX(r+1−k) LL UcLM IN : (1 − λ)X(n+k+1−r) + λX(n+k−r)
Aturan penyeleksian
Ide dibalik aturan penyeleksian adalah bertahan selama mungkin di dalam bagan normal klasik. Penggunaan bagan kendali parametrik dilakukan jika ekor dari distribusi sampel lebih tebal atau tipis dari pada distribusi normal, dan beralih ke bagan nonparametrik MIN saat perluasan kondisi ke kelompok parametrik diperkirakan gagal juga. Dari data dapat diketahui bagan mana yang harus digunakan. Karena batas kendali ditentukan oleh perilaku pada ekor yang jauh (p kecil), ukuran alami untuk menentukan bagan mana yang akan dipilih adalah standarisasi ¯ minimum pada observasi fase I (X(n) − X)/S untuk batas kendali atas dan stan¯ − X(1) )/S untuk batas kendali bawah (Albers and Kallenberg, darisasi minimum (X 2006). Masalah selanjutnya adalah penentuan batas seleksi. Distribusi dengan ekor yang lebih tebal dari distribusi normal dapat menyebabkan masalah serius dengan perilaku observasi yang terkendali merujuk ke bagan kendali yang tidak valid. Distribusi dengan ekor yang lebih tipis lazim digunakan pada kasus observasi yang terkendali dengan konsekuensi sinyal di luar kendali yang tidak terdeteksi. Hal ini dikarenakan galat pada observasi yang terkendali lebih serius dibandingkan pada observasi yang tidak terkendali. Selain itu, karena galat model positif yang sama besar dengan p atau lebih, dapat dengan mudah muncul, sebaliknya pada galat model negatif −p, kita ambil aturan penyeleksian yang tidak seimbang. Untuk
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)23 batas kendali atas akan dipilih bagan kendali normal ketika: u(−0.7+0.5logn)/n ≤
¯ X(n) − X ≤ u5/(n√n) S
(3.3.1)
Untuk melihat apakah ini mengimplikasi, misalkan X1 , . . . , Xn peubah acak yang saling bebas dan identik dengan distribusi normal standar. Maka (Albers and Kallenberg, 2006): µ
−0.7 + 0.5log(n) P (Xn < u(−0.7+0.5logn)/n ) = 1 − n 2 ≈√ n
¶n ≈ exp(0.7 − 0.5logn)
dan
¶n µ ¶ µ 5 5 5 ≈ 1 − exp − √ ≈√ P (Xn > u5/(n√n) ) = 1 − 1 − √ n n n n ¯ karena itu, ketika standar minimun (X(n) − X)/S sangat besar, ini mengindikasikan bahwa ekor mungkin lebih tebal dari pada distribusi normal dan kita beralih ke bagan parametrik atau nonparametrik. Demikian pula peralihan untuk nilai yang ¯ relatif kecil dari (X(n) − X)/S, mengindikasikan perilaku ekor yang lebih tipis. Total dari perbaikan bagan kendali pergerakan data (data driven) dua sisi diberikan oleh persamaan berikut. Misalkan d1N = u(−0.7+0.5logn)/n , d2N = u5/(n√n)
(3.3.2)
γ γ √ d1P (ˆ γ ) = c(ˆ γ )u1+ˆ γ ) = c(ˆ γ )u1+ˆ (−0.2+0.5logn)/n , d2P (ˆ 3/(n n)
(3.3.3)
cC Batas kendali bawah dan batas kendali atas ditunjukkan berturut-turut oleh LL dan UcLC .
BAB 3. PERBAIKAN BAGAN KENDALI PERGERAKAN DATA ( DATA DRIVEN)24 Untuk batas kendali atas diperoleh sebagai berikut:
c C kita peroleh: Untuk batas kendali bawah LL