DATA COLLECTION PLAN Tipe data ada 2 macam: 1. Data kualitatif (categorical), misalnya: status perkawinan, partai politik, warna mata (defined categories). 2. Data kuantitatif (numerical), terdiri atas 2 macam: a. Diskret (atribut), misalnya: jumlah anak, jumlah produk cacat per jam (counted items) b. Kontinyu (variabel), misalnya: berat, voltase listrik (measured characteristics) Data atribut/diskret adalah Data yang diperoleh dengan cara menghitung atau konversi perhitungan menjadi persen atau proporsi. Contoh : jumlah komplain, jumlah reject/waste, proporsi cacat, proporsi rework. Hasil pengukuran data atribut adalah diskret/discontinue. Data variabel/continuous adalah Data yang diperoleh dengan cara pengukuran aktual terhadap karakteristik mutu atau proses yang bisa diukur. Contoh: panjang, volume, berat, kadar, lama pelayanan. Hasil pengukuran data variabel adalah kontinu. Data Diskret VS Kontinyu Variabel Atribut
Atribut Jumlah salah ketik
Lama penyelesaian order
%salah potong Jumlah produk reject
Suhu rata-rata per dalam per jam Biaya per unit
Jumlah komplain
Diameter produk
%on time delivery
Lama telepon di”hold”
Jumlah order yang lewat batas waktu Frekuensi suhu > 30° C Unit yang melebihi target biaya Jumlah produk yang diameternya tak memenuhi spesifikasi Frekuensi “hold” yang melebihi 30 detik
SAMPLING Latar belakang menentukan sample (n) Tidak mungkin di SENSUS Pengalaman sebelumnya Ingin menganalisa per-SEGMEN Terbatas : biaya, tenaga dan waktu Beberapa Teknik Sampling 1. Random/Probability Sampling a. Simple random sampling : dipilih acak, seperti undian b. Stratified random sampling : berdasarkan tingkatan (mgr-supv-operator) c. Cluster sampling : berdasaekan kemiripan (berdasarkan kelompok produk infant nutrition, milk powder, UHT, susu kental) 2. Non-Random/Non Probability Sampling a. Convinience/systematic sampling : setiap object ke-10 yang diambil b. Judgemental sampling : pilih sembarang object c. Quota sampling : tetapkan batasan minimal sample, misalnya : 10% Menentukan Besar Sample (cara praktis)
Minimal proportion 5% dari N Standard opinion industry n = 1500 – 2500 Central limit statistik n ≥ 30; n = 30-35 Marketing research n = 2 s/d 3 kali jumlah item pada kuisioner Teori praktis lainnya n = 50-100; 100-200; ≥ 500
Menentukan besarnya sampel Untuk menentukan besarnya sample dalam analisa data tergantung tujuan dari analisa data. Tujuannya : 1. Pengontrolan proses, dimana data dikumpulkan secara periodik selama proses berlangsung (setiap 15 menit sekali, setiap 2 jam),
2. 3.
Dalam hal ini tidak ada rumusan berapa banyaknya data yang harus diambil, banyaknya data yang diambil berdasarkan trial error. Menerima atau menolak barang (acceptance sampling) : gunakan metode ANSI/ASQ Z1.4 (data atribut) atau ANSI/ASQ Z1.9 (data variabel). Untuk penelitian ilmiah : gunakan rumus perhitungan besarnya sample terlampir.
Menentukan besar sampel (RUMUS) Menurut rumus : Jumlah sampel (n) tidak dipengaruhi jumlah populasi (N), kecuali ingin melakukan segmentasi. 𝑛=
𝑍2 𝐶𝑙 2 2
× 𝑆𝐸2
dimana : SE = standard error of estimate dari MEAN Z = nilai dibawah kurva normal, berdasarkan CL (confidence level) CI = Confidence interval Semakin besar n, semakin baik merepresentasikan kondisi sebenarnya (N), namun sampai titik tertentu, nilainya tidak akan berbeda jauh (≥ 500) 1.
Standard Error of Estimate (SE) Menunjukkan seberapa besar penyimpangan data (dalam hal ini) dari rata-rata (mean)nya. Nilai SE dapat dicari dengan tepat apabila sudah melakukan survei sebelumnya, atau pada saat melakukan pre test (trial) dengan jumlah sampel yang cukup. Nilai SE dapat didekati dengan nilai Sd (standar deviasi), yakni akar dari variance, atau dengan tabel berikut : Skala 4 5 6 7 10 11
2.
SE 0.500 0.583 0.667 0.750 1.167 1.333
Variance 0.1 – 0.5 0.15 – 0.65 0.2 – 1.1 0.3 – 1.5 0.8 – 2.5 1.5 – 3.0
Confidence Interval (CI) Menunjukkan seberapa besar selang kepercayaan kita terhadap hasil pengolahan yang ditunjukkan dengan hasil aktualnya (seriang disebut Sampling Error)
3.
Contoh : dari 5 skala (1=Sangat Tidak Puas, 5=Sangat Puas, didapat rata-rata (mean) = 3.4. CI yang ditentukan oleh kita misalnya adalah 1 (± 0.5) Dari hasil diatas (3.4), jangan terlalu cepat menyimpulkan bahwa pelanggan sudah ke arah puas (3.4 berada antara 3=Netral dan 4=Puas), karena dengan CI = ± 0.5, artinya nilai aktual masih berada dalam batas-batas toleransi 3.4 – 0.5 (3.4 minus 0.5) dan 3.4 + 0.5 (3.4 plus 0.5) atau 2.9 – 3.9 (batas bawah masih dibawah 3) Confidence Level (CL = Z) Menunjukkan seberapa besar tingkat kepercayaan kita terhadap hasil aktual yang ditunjukkan. Berkaitan erat dengan CI yang ditentukan. Semakin besar CL terhadap CI, maka kita semakin yakin/percaya bahwa hasil pengolahan memang mendekati hasil aktual. Nilai CL digambarkan dengan nilai Z (tabel normal): CL Z 60% 0.84 70% 1.04 75% 1.15 80% 1.28 85% 1.44 90% 1.64 95% 1.96 99.5% 2.81
HYPHOTHESIS TEST
Untuk mendapatkan keputusan, umumnya digunakan asumsi terhadap populasi. Asumsi untuk mendapatkan keputusan tersebut (bisa benar, bisa salah) dinamakan STATISTICAL HYPOTHESIS atau hypothesis test. Hypothesis test dapat digunakan untuk : o Menilai kinerja proses (rata-rata dan variasi) terhadap suatu standar atau spesifikasi o Menentukan apakah perbedaan-perbedaan yang terjadi selama proses o Menguji peningkatan proses dengan membandingkan data lama dan yang baru o Dan sebagainya. Dalam melakukan tes hipotesis, digunakan dua hipotesis yang berlawanan: o Hipotesis nol (null hyphothesis/H0) Yaitu hipotesis yang dirumuskan sebagai suatu pernyataan yang akan diuji. Disebut hipotesis nol karena hipotesis tersebut tidak memiliki perbedaan atau perbedaannya nol dengan hipotesis sebenarnya (tidak ada perbedaan antara nilai-nilai sampel dan parameter populasi yan diuji). H0 menunjukkan keadaan status quo atau tidak ada perbedaan. o Hipotesis alternatif (Alternative hyphothesis/H1) Yaitu suatu statement yang berkontradiksi dengan null hyphothesis Hipotesis ini menyatakan bahwa terdapat perbedaan antara nilainilai sampel dan parameter populasi yang diuji. Peneliti mengharapkan statement ini yang aktual terjadi. Menolak H0 = Menerima H1, Menolak H1 = Menerima H0.
Contoh : 1. Suatu perusahaan susu bubuk mengklaim bahwa berat susu merek MILKY beratnya adalah 400 gram. Anda melakukan pengujian apakah klaim tersebut benar. Formulasi hipotesisnya adalah : H0 : berat susu = 400 gram H1 : berat susu ≠ 400 gram
2. Jika ingin membuktikan apakah suatu prosedur lebih baik dari yang lain, maka formulasi hipotesis tersebut adalah: H0 : Tidak ada perbedaan antara prosedur H1 : Ada perbedaan prosedur 3. Toyota mengklaim bahwa mobil model terbarunya konsumsi penggunaan bahan bakarnya minimal 12 km per liter. Anda ingin membuktikan apakah klaim ini benar, dengan melakukan pengujian. Hipotesisnya adalah sebagai berikut: H0 : μ ≥ 12 km/liter H1 : μ ≤ 12 km/liter 4. Manager QA dari perusahaan makanan ingin menguji apakah kadar garam dalam produk A tidak melebihi dari yang ditetapkan dalam kemasan yaitu 0.5 gram. H0 : μ ≤ 0.5 gram (proses sesuai) H1 : μ ≥ 0.5 gram (proses tidak sesuai)
ERROR TIPE I DAN ERROR TIPE II Agar tes hipotesis baik maka harus didesain agar error dapat diminimalkan Untuk meminimalkan error, maka sampel size harus ditingkatkan Untuk sembarang tes hipotesis : o α = probabilitas menolak H0 pada kondisi H0 benar = P (Error type I) = LEVEL OF SIGNIFICANT suatu pengujian o β = probabilitas tidak menolak H0 pada kondisi H0 salah = P (Error type II) Kesimpulan Terima H0 Tolak H0
Kondisi aktual H0 benar H1 benar Keputusan tepat Error tipe I Error tipe I Keputusan tepat
Contoh : Hipotesis : H0 : Antasari tidak bersalah H1 : Antasari bersalah
Kesimpulan Terima H0 : Antasari tidak bersalah (bebas) Tolak H0
Kondisi aktual H0 benar Keputusan tepat (Antasari tidak bersalah dan dia dibebaskan) Error tipe I (Antasari tidak bersalah, tapi dipenjara) – didzolimi?
H1 benar Error tipe I (Antasari bersalah dan dia dibebaskan) (SUAP??) Keputusan tepat (Antasari bersalah dan dia dipenjara)
o
Digunakan jika dalam hipotesis alternatif (H1) terdapat simbol ≠. [GAMBAR]
One tailed test : o Tes dimana daerah kritisnya hanya di satu sisi dari mean suatu distribusi Z, dengan luas area sama dengan Level of Significance. o Digunakan jika dalam hipotesis alternatif (H1) terdapat simbol > atau <. o Contoh : menguji hipotesis bahwa suatu proses lebih baik dari yang lain. [GAMBAR]
BEBERAPA ISTILAH Level of Sigifikan (α) Menunjukkan area reject (tingkat kesalahan) dari suatu distribusi o Nilainya ditentukan sesuai tingkat ketelitian yang diinginkan, yang sering digunakan adalah 0.01 (10%) atau 0.05 (5%). Jika suatu hipotesis dengan Level of Significance sebesar 0.05 (5%), artinya o Kita 95% yakin bahwa kita mengambil keputusan yang tepat o Hipotesis tersebut ditolak pada tingkat signifikan 5% o Atau kemungkinan salah sebesar 5%
Interval Kepercayaan (Confidence Interval) Confidence Interval merupakan range dari nilai yang mungkin ditempati oleh parameter populasi (misalnya rata-rata) berdasarkan sampel. Contoh : dengan 95% confidence interval untuk μ, berarti 95% keyakinan bahwa interval ini mengandung μ.
ONE TAILED AND TWO TAILED TEST Ada dua jenis tes hipotesis : Two tailed test : o Test dimana daerah kritisnya berada di ujung kiri dan kanan dari mean suatu distribusi Z.
[GAMBAR hal 58/93] Jika kita sebelumnya memiiki cukup informasi untuk menguji hipotesis nol terhadap suatu alternatif tertentu (> atau <), maka bisa langsung menggunakan one tail test. Tetapi jika kita hanya ingin menguji ada tidaknya perbedaan dengan hipotesis nol, maka cukup menggunakan Two tail test. Dalam praktek, one tail test kadang kala hasilnya selalu memuaskan dan direkomendasikan pada kondisi yang sudah diyakini kebenarannya. Untuk penelitian yang kompleks, para Statistician menyarankan untuk menggunakan two tail test, karena sifatnya lebih konservatif, untuk menghindari kesalahan kesimpulan yang tak diinginkan.
LANGKAH-LANGKAH UJI HIPOTESIS 1. Define the hyphothesis Tetapkan hipotesis awal (H0) dan hipotesis alternatif (Ha/H1) Misal: untuk menguji apakah rata-rata populasi (μ) sama atau tidak dengan nilai tertentu. H0 : μ = x VS H1 : μ ≠ x (tanda ≠ nantinya menuntun kita untuk melakukan uji dua sisi/tail)
H0 : μ < x VS H1 : μ > x (tanda > atau < nantinya menuntun kita untuk melakukan uji satu sisi/tail) 2. Define the hyphothesis test and calculate the value of the test statistics Tetapkan tes statistik yang digunakan (Z, t, x2, F atau p-value) Misalnya untuk mengetes rata-rata populasi dengan n > 30, test statistiknya: Hitung hingga diperoleh suatu nilai : 𝑍 =
𝑥 −𝜇 𝑠/ 𝑛
3. Define the confidence level and error level (α level) Definisikan tingkat kesalahan (α) dan kuasa uji (1-α) Misalnya dengan tingkat error 5% maka tingkat kepercayaannya adalah sebesar 95%. 4. Carry out the test Hasil tes statistik pada no.3 dibandingkan dengan rejection region. Buat keputusan terima/tolak H0. 5. State a conclusion Buat kesimpulan. Gunakan bahasa sehari-hari, jangan pakai jargon statistik.
p-VALUE
p-Value adalah suatu tes statistik yang digunakan di dalam hyphothesis testing untuk menolak atau menerima null hyphothesis p-value ditunjukkan oleh tail area di dalam tabel distribusi normal yang diperoleh dari konversi hasil pengukuran aktual (rata-rata) ke dalam statistik (Z, t atau c2 statistik) p-value menunjukkan peluang untuk membuat Error Tipe I, menolak null hyphothesis yang benar. Semakin kecil p-value, semakin kecil pula peluang untuk membuat kesalahan untuk menolak null hyphothesis (H0). Nilai cut-off value yang sering dipergunakan untuk p-value adalah 0.05 (α). [GAMBAR] Acuan menerima atau menolak hipotesis pada significance level (α) Jika p-value < α, menerima H1 Jika p-value ≥ α, menerima H0
Nilai umumnya α yang digunakan adalah 0.01 atau 0.05 (α=0.05 yang paling sering) sehingga kriteria penerimaan: Jika p-value < 0.05, diterima H1 atau tolak H0 Jika p-value ≥ 0.05, diterima H0 atau tolak H1
[GAMBAR]