BAB5 PENGUMPULAN DATA DAN ANALISIS
Tujuan Instruksional Umum Tujuan Instruksional Khusus
Mahasiswa mampu mernmuskan pengumpulan data 1. Mahasiswa dapat membuat kerangka pengumpulan data 2. Mahasiswa dapat menguraikan dan membedakan berbagai distribusi statistik 3. Mahasiswa dapat menggunakan uji kebaikan sual
5.1. Pendahuluan Dalam proyek simulasi, penggunaan data input paling penting adalah untuk mendorong simulasi. Proses ini melibatkan pengumpulan data input, analisis input data, dan penggunaan analisis data input dalam model simulasi. Input data mungkin diperoleh dari catatan sejarah atau dikumpulkan secara waktu nyata sebagai tugas dalam proyek simulasi. Analisis melibatkan identifikasi distribusi teoritis yang mewakili data input. Penggunaan data input dalam model termasuk menentukan distribusi teoritis dalam kode program simulasi. Pertanyaan umum adalah mengapa kita perlu mempertimbangkan penyesuaian data dengan distribusi teoretis jika kita telah mengumpulkan nilai data. Alasan yang mendasar adalah bahwa ketika para praktisi mengumpulkan data, hanya sampel dari distribusi data sebenamya yang dikumpulkan. Walaupun praktisi tidak melihat nilai-nilai tertentu, itu tidak berarti bahwa nilai-nilai data tidak teramati tidak benar-benar ada di sistem. Jika kita berhasil mengamati sesuai dengan data untuk distribusi teoretis, maka setiap nilai data dari distribusi teoritis dapat mendorong model simulasi. Ini adalah situasi yang jauh lebih realistis daripada menjalankan simulasi dengan hanya nilai data yang diamati. Salah satu kelemahan dari pendekatan ini adalah bahwa distribusi teoritis dapat secara berkala menghasilkan nilai yang tidak biasa yang mungkin tidak benarbenar pemah hadir dalam sistem nyata. Contoh adalah waktu antar kedatangan dengan nilai yang sangat panjang. Meskipun hal ini tidak terlalu sering teljadi, praktisi hams menyadari kemungkinan ini. Jika model ini memperlihatkan perilaku yang tidak biasa yang bisa saja akibat distribusi teoretis, maka praktisi dapat mengambil tindakan. Penting untuk menekankan bahwa ini adalah peristiwa yang
83
sangat tidak mungkin dan bahwa adalah mungkin untuk membuat banyak model simulasi selama bertahun-tahun tanpa menghadapi situasi ini. Pengumpulan data input sering dianggap sebagai proses yang paling sulit dalam melakukan simulasi pemodelan dan analisis proyek. Bagian ini berkaitan dengan fakta bahwa analis simulasi dapat tergantung pada individu dan operasi di luar kendali dari analis. Hal ini berlaku terlepas dari apakah data input historis secara alami atau akan dikumpulkan dalam waktu-nyata sebagai bagian dari proyek. Dalam situasi lain, data input yang diperlukan mungkin tidak ada. Keadaan ini sering dijumpai ketika proyek melibatkan analisis peralatan model baru. Untuk membantu para praktisi dalam pengumpulan data dan proses analisis, bagian ini termasuk diskusi pada: 1. Sumber data input 2. Pengumpulan data input 3. Data input deterministik vs probabilistik 4. Data input diskrit vs kontinu 5. Distribusi data input yang umum 6. Penganalisaan data input 5.2 Sumber Input Data Ada banyak sumber yang dapat praktisi gunakan untuk memperoleh data input. Data ini dapat menjadi sejarah, anekdot, atau observasi. Bahkan jika suatu model sistem sebenamya tidak ada, adalah mungkin bagi praktisi untuk memperoleh masukan yang diperlukan dari sumber lain. Sumber-sumber yang tersedia untuk para praktisi meliputi, tetapi tidak terbatas pada, catatan sejarah, spesifikasi produsen, klaim vendor, perkiraan operator, perkiraan manajemen, pengumpul data otomatis, dan observasi langsung. Data Historis. Jika sistem dasar atau yang menyerupai telah ada selama beberapa waktu, kemungkinan bahwa ada beberapa bentuk catatan sejarah tersedia untuk para praktisi. Karena catatan sudah ada dan tidak akan memerlukan pengumpulan data waktu nyata, pendekatan ini mungkin muncul untuk menjadi pilihan yang sangat menarik bagi praktisi. Hal inijuga sering menarik bagi organisasi pengarah, yang percaya bahwa uang akan diselamatkan dengan menggunakan pendekatan ini. Namun, penggunaan catatan sejarah bukannya tanpa risiko besar. Risiko pertama adalah bahwa sistem sejarah asli telah berubah entah bagaimana atau tidak persis sarna dengan sistem yang sekarang atau yang diusulkan. Berdasarkan perbandingan setiap jenis data dengan keandalan yang dipertanyakan pada masa
84
depan pasti mengalami kesulitan. Diduga, karena sistem tidak sarna, setiap usaha untuk memvalidasi model dengan sistem data yang sekarang pasti gagal. Masalah lain adalah bahwa data historis tidak mungkin dikumpulkan dengan model simulasi secara khusus dalam pikiran. Ini berarti bahwa data yang benar-benar dibutuhkan tidak benar-benar tersedia. Terlalu sering, praktisi tidak menyadari hal ini sampai sudahjauh ke dalam model terjemahan atau bahkan tahap validasi proyek simulasi. Pada waktu itu, proyek bisa begitu ditekan sehingga tidak mungkin untuk kembali ke sistem aktual dan mengumpulkan data input model yang benar. Karena potensi masalah substansial yang terkait dengan penggunaan catatan sejarah, praktisi hams berpikir panjang dan keras sebelum menggunakannya. Hal ini yang akan membuat praktisi bekerja ekstrajika pendekatan ini berjalan masam. Spesifikasi Produsen. Spesifikasi produsen juga menawarkan praktisi kesempatan untuk menggunakan data yang telah dikompilasi orang lain. Jelas, sebagian besar produsen akan menyediakan sebuah teori berdasarkan spesifikasi untuk peralatan mereka. Apakah klaim ini benar-benar dapat dicapai dalam lingkungan yang sesungguhnya hams dibuktikan. Klaim Vendor. Klaim vendor atau distributor mungkin akan jatuh di antara spesifikasi pabrik dan realitas. Vendor atau distributor hams sudah memiliki pengalaman dengan tipe sistem yang sedang dipertimbangkan. Beberapa organisasi manufaktur membutuhkan vendor dan distributor untuk menciptakan model simulasi untuk membuktikan kemampuan peralatan mereka. Perkiraan Operator. Operator peralatan yang ada dapat menjadi sumber data yang berharga ketika praktisi tidak memiliki waktu atau sumber pengumpulan data untuk mengumpulkan data aktual. Jika operator memiliki pengetahuan tentang sistem, adalah mungkin untuk mendapatkan beberapa perkiraan kinerja yang dapat digunakan sebagai data masukan. Sebagai contoh, operator dapat ditanyakan waktu pemrosesan terpendek, paling umum, dan terpanjang untuk operasi tertentu. Praktisi kemudian dapat menggunakan data ini sebagai perkiraan pertama dengan distribusi segitiga. Perkiraan Manajemen. Praktisi juga dapat mempertimbangkan untuk meminta manajer atau teknisi yang berkaitan dengan sistem. Meskipun orang-orang ini mungkin tidak memiliki hubungan kedekatan yang sarnadengan proses, masukan mereka mungkin akan membantu bila operator yang berpengalaman tidak tersedia untuk memberi masukan.
85
--
Pengumpul Data Otomatis. Dimungkinkan untuk membuat semacam sistem pengambilan data otomatis. Hal ini analog ke monitor volume lalu lintas yang sering dijumpai di jalan. Monitor ini menghitung frekuensi mobil yang lewat titik tertentu selama jangka waktu tertentu. Akses elektronik atau informasi lain yang berbasis sistem mungkinjuga dapat menangkap jenis data yang dibutuhkan praktisi untuk model simulasi. Observasi langsung. Hal yang paling menuntut secara fisik dan mental bentuk pengumpulan data adalah pengamatan langsung. Pengamatan langsung adalah dimana praktisi atau orang lain benar-benar pergi ke lokasi sistem dan mengumpulkan data visual. Data dikumpulkan oleh pena dan buku catatan atau mungkin dengan bantuan teknologi. Jika pendekatan teknologi rendah pena dan papan yang digunakan, praktisi mungkin ingin mengembangkan semacam pengumpulan data formulir untuk menjaga proses terorganisir sebisa mungkin. 5.3 Mengumpulkan Data Input Dari pembahasan sebelumnya, kita hams yakin bahwa kebijakan yang terbaik adalah mengumpulkan data input menggunakan pengamatan. Hal ini, tentu saja, dapat dilakukan asalkan waktu dan sumber daya memungkinkan pendekatan semacam itu. 5.3.1 Peralatan Pengumpulan Data Jika input data dikumpulkan secara waktu nyata, hal itu dapat dikumpulkan secara manual atau dengan bantuan perangkat elektronik. Jika data dikumpulkan secara manual dengan alat pengatur waktu, mungkin akan membantu untuk membuat formulir untuk membantu menjaga proses pengumpulan data sebisa mungkin terorganisasi. Praktisi dapat menjaga terorganisasinya data dengan mengamankan secara mekanis atau menggunakan jam henti elektronik ke papan pengumpulan data. Berbagai pilihan perangkat elektronik studi waktu mungkin akan dimanfaatkan. Atau, analis dapat memilih untuk mengembangkan program sederhana pada komputer notebook untuk membantu pengumpulan data. Diprogram dengan menekan tombol, praktisi dapat melacak tingkat antar kedatangan tanpa hams menuliskan waktunya. Keindahan dari pendekatan ini adalah bahwa data dapat secara otomatis dicatat dalam sebuah berkas untuk analisis. Ini akan menghindarkan praktisi pada proses yang sangat membosankan untuk transkripsi data dari kertas ke komputer.
86
Penggunaan alat perekam video menawarkan kemungkinan lain lagi untuk mengumpulkan data ketika masalah privasi tidak perlu dipertimbangkan. Kebanyakan alat perekam video memiliki layar pengamatan bergerak. Jadi, adalah mungkin untuk merekam proses yang berbeda tanpa terlihat terlalu jelas. Karena pemutaran dapat dilakukan dalam jumlah tak terbatas, adalah sering untuk mengamati kegiatan yang biasanya telah terlewatkan pada waktu nyata. 5.3.2 Model dan Unit Pengumpulan Data. Isu penting untuk simulasi input data mengenai interval waktu adalah satuan waktu yang hams digunakan. Praktisi pemula sering diamati dapat merekam waktu absolut atau jam waktu ketika entitas yang berbeda tiba ke dalam sistem. Jika pendekatan ini diambil, pekeIjaan tambahan akan diperlukan untuk mengubah waktu absolut ke waktu relatif sehingga waktu antar kedatangan dapat dihitung. Biasanya dibutuhkan tenaga keIja kurang intensif untuk mengumpulkan data dengan benar di tempat pertama menggunakan relatif, pendekatan waktu antar kedatangan. Isu pengumpulan data kedua adalah jenis unit yang akan digunakan. Penghitungan tujuan, mungkin sulit untuk digunakan sebagai sebuah satuan waktu kecil seperti detik. Hal ini lebih mudah dipahami ketika menjalankan simulasi baik dilakukan untuk 8jam atau 480 menit, tidak 28.800 detik. Jika diambil unit tengah, dan sebuah unit waktu simulasi menit dipilih, semua nilai data baik itu hams dikumpulkan dalam satuan waktu yang sarna atau diubah di beberapa titik. Sebagai contoh, jika waktu layanan diambil dalam beberapa menit dan detik, yang detik akhirnya hams dikonversi ke dalam pecahan menit. Meskipun konversi data dengan cara ini dapat dilakukan dalam sebuah pengolah data elektronik,juga dimungkinkan untuk memperoleh apa yang dikenal sebagai desimal menitjam henti. Jenisjam henti khusus mencatat menit sebagai menit dan detik sebagai perseratus menit. Ketika penghenti desimal jam henti digunakan, data dikumpulkan dalam sebuah format yang segera dapat digunakan. Ingatlah selalu bahwa proses konversi satuan waktu menjadi terlalu memberatkan. 5.3.3 Pertimbangan Pengumpulan Data Lainnya. Praktisi simulasi hams juga beIjuang untuk menjadi selalu terbuka tapi juga sesederhana mungkin saat mengumpulkan data. Setidaknya ada dua alasan untuk ini, yaitu (1)Anda ingin data tidak bias; dan (2)Anda tidak ingin mengganggu proses.
87
-
-
Data tidak bias. Pertama, jika adalah jelas bahwa praktisi mengumpulkan data kinerja jenis tertentu, beberapa pekerja mungkin bernsaha untuk memberikan bias pada hasil pengumpulan data. Beberapa pekerja mungkin untuk sementara mempercepat laju pekerjaan mereka supaya terlihat menjadi produktif. Pekerja lain mungkin sengaja memperlambat laju pekerjaan mereka untuk mencegah standar kerja yang tinggi dari yang ditetapkan. Jika data bias dari salah satu perilaku ini, dapat mengarah pada sebuah model yang dapat menghasilkan hasil yang tidak akurat. Jadi tindakan terbaik adalah dengan memberikan pengarahan singkat kepada para pekerja. Dalam pengarahan singkat ini, praktisi harns menjelaskan tujuan dari pengumpulan data. Hindari Gangguan Proses. Tujuan lain bahwa praktisi harns bernsaha untuk tidak mengganggu operasi yang sedang berlangsung. Jika praktisi mempertahankan profil yang tinggi di tengah proses, kemudian pelanggan atau operator yang belum menerima pengarahan dapat menjadi penasaran. Individu ini mungkin tidak hanya berperilaku tidak normal, tetapi dapat juga mengalihkan perhatian para praktisi dengan pertanyaan. Jika praktisi terganggu, lalu masukan penting data tersebut dapat hilang atau rnsak. Dalam kasus ekstrim, masalah-masalah lain dapat terjadi. Operator atau pelanggan kurang informasi mungkin menghubungi keamanan atau penegak hukum dan melaporkan kegiatan pengumpulan data yang mencurigakan. 5.4 Data Deterministik versus probabilitik Sementara mengumpulkan data input, praktisi harns menyadari bahwa ada berbagai klasifikasi data. Satu metode untuk mengklasifikasi data adalah apakah deterministik atau probabilistik. Setiap individu proyek akan menggunakan sekumpulan unik atau jenis data input. Beberapa jenis input data tersebut dapat deterministik, danjenis lainnya probabilistik. Data Deterministik. Data deterministik berarti bahwa peristiwa yang melibatkan data yang terjadi dengan cara yang sarna atau dalam cara yang dapat diprediksi setiap kalinya. Ini berarti bahwa jenis data perlu dikumpulkan hanya sekali karena itu tidak pemah bervariasi nilainya. Contoh proses input deterministik meliputi: 1. Program komputer mesin dikontrol secara numerik waktu pemrosesan. 2. Interval perawatan preventif. 3. Kecepatan conveyor
88
Waktu pemrosesan program komputer mesin dikontrol secara numerik adalah deterministik karena kecuali ada semacam masalah, program selalu mengambil jumlah waktu yang sarna untuk menjalankannya. Program-program ini mengikuti satu himpunan sejumlah langkah masukan pemrosesan dengan nilai yang telah ditentukan sebagai alat mesin yang dikendalikan oleh komputer. Kecuali ada semacam masalah mesin, tidak ada kemungkinan penyimpangan dari program komputer. Jadwal pemeliharaan preventifjuga dapat ditentukan dengan interval tertentu. Interval dapat berdasarkan jumlah komponen telah diproses atau setelah selang waktu tertentu telah berlalu. Dalam kedua kasus, jumlah atau selang waktu yang ditentukan di awal dan bisa sarna untuk setiap siklus pemeliharaan preventif. Demikian pula, sebagian besar konveyor beroperasi pada kecepatan tertentu. Kecepatan ditentukan oleh kecepatan motor dan gearing yang menggerakkan ban beIjalan. Ini berarti bahwa kecepatan konveyor dapat diatur ke nilai-nilai yang berbeda, tetapi, sementara ban beIjalan, hal itu akan dijalankan pada kecepatan yang ditetapkan. Sementara kecepatan ban beIjalan akan berubah hanyaj ika ada semacam kerusakan atau kegagalan. Input Data Probabilistik. Berbeda dengan proses deterministik, sebuah proses probabilistik tidak teIjadi dengan jenis keteraturan yang sarna. Dalam kasus ini, proses akan mengikuti beberapa distribusi probabilistik. Dengan demikian, tidak diketahui dengan keyakinan yang sarna bahwa proses itu akan mengikuti perilaku yang diketahui dengan pasti. Contoh data probabilistik meliputi waktu antar kedatangan, proses pelayanan pelanggan, dan waktu perbaikan. Waktu antar kedatangan untuk entitas yang masuk ke sistem hampir selalu probabilistik. Interval antara entitas terakhir dengan entitas berikutnya mungkin pendek, atau mungkin akan lama. Tidak diketahui dengan pasti kapan entitas berikutnya akan tiba. Namun, dengan mengumpulkan data antar kedatangan massa, adalah mungkin untuk melihat apakah data mengikuti distribusi tertentu. Jikajumlah entitas pendatang dalam jangka waktu tertentu benar-benar acak, maka waktu antar kedatangan entitas benar-benarmengikuti distribusi eksponensial. Waktu pelayanan pelanggan juga dapat diharapkan bersifat probabilistik. Dengan kata lain, jumlah waktu yang dibutuhkan untuk memproses pelanggan individu di sebuah pusat layanan akan bervariasi, tergantung pada apa yang dibutuhkan pelanggan. Selain itu, setiap kali seorang manusia terlibat dalam proses pelayanan, ada kemungkinan akan teIjadi beberapa varian dalam waktu pelayanan.
89
Pada umumnya, dalam proses pelayanan, sejumlah kecil pelanggan akan diproses lebih cepat daripada yang lain. Demikian pula, sejumlah kedl pe1angganmungkin memerlukan waktu lebih lama untuk diproses. Sebagian besar pelanggan mungkin memerlukan waktu antara dua ekstrem. Pola yang menggambarkan jumlah pengamatan terhadap waktu pemrosesan menciptakan sebuah distribusi probabilistik. Sekali lagi, meskipun beberapa informasi tersedia tentang pola probabilitas waktu pemrosesan yang berikut, waktu pemrosesan pelanggan individu di masa depan tidak dapat diprediksi dengan tepat. Namun, temyata sering ditemukan bahwa waktu pelayanan pelanggan mengikuti distribusi normal karena proses sebenamya merupakan jumlah dari sejumlah kecil waktu sub proses. Seperti waktu pelayanan, waktu perbaikan cenderung probabilistik secara alami. Hal ini karena adalah mustahil untuk memprediksi masalah macam apa yang perlu diperbaiki. Jika masalah ini tidak serius, maka diharapkan bahwa waktu perbaikan akan lebih pendek. Sebaliknya, jika masalah berat atau memerlukan bagian lain, waktu perbaikan akan lebih panjang. 5.5 Data Diskrit vs Kontinu Klasifikasi lain input data adalah apakah data diskrit atau kontinu. Jenis data diskrit hanya dapat mengambil nilai-nilai tertentu. Biasanya ini berarti seluruh nomor. Contoh dari data diskrit dalam aplikasi simulasi adalah: 1. Jumlah orang yang datang dalam suatu sistem sebagai suatu kelompok atau batch 2. Jumlah pekerjaan diproses sebelum sebuah mesin mengalami kerusakan Batch pendatang biasanya terjadi dalam pelayanan dan sistem jenis hiburan. Jumlah pelanggan dalam batch hanya dapat diasumsikan dalam nilai bilangan bulat. Tidak mungkin untuk memiliki pelanggan fraksional. Demikian pula, jumlah pekerjaan diproses melalui mesin sebelum mengalami kerusakan adalah sebuah angka bulat. Pekerjaan baik yang selesai maupun tidak selesai. Distribusi kontinu, di sisi lain, dapat mengambil nilai dalam kisaran yang diamati. Ini berarti bahwa angkaangka pecahan kemungkinannya besar terjadi. Contoh dari data jenis kontinu meliputi waktu antara pendatang, waktu pelayanan, dan waktu rute. Jelas, waktu antara entitas pendatang dalam suatu sistem dapat mengambil setiap nilai antara 0 dan tak terhingga terlepas dari satuan waktu yang digunakan. Ini
90
jelas termasuk waktu pecahan nilai. Meskipun beberapa waktu pelayanan mungkin lebih sering diamati daripada yang lain, waktu pelayanan dapatjuga mengambil nilai apapun dalam rentang walctu yang diamati. Bagaimanapun waktu pelayanan mungkin memiliki beberapa nilai spesifIk di bawah batas bawah yang tidak mungkin untuk diamati. Demikian pula, waktu perjalanan entitas dengan berjalan kaki juga dapat mengambil setiap nilai dalam kisaran yang masuk akal. 5.6 Distribusi Data Input Umum Tujuan dari bagian ini bukanlah untuk mengubah praktisi menjadi ahli statistik, tapi untuk memberikan beberapa tingkat pengenalan dengan beberapa distribusi data input yang paling umum. Ada banyak lagi jenis distribusi probabilitas yang praktisi mungkin benar-benar hadapi. Kadang-kadang praktisi mungkin menghadapi distribusi ini hanya sebagai hasil dari program sesuai data terkomputerisasi. Dalamjenis kasus ini, hasil tertentu tidak selalu berarti bahwa ada alasan rasional mengapa data paling cocok dengan distribusi tertentu. Kadangkadang distribusi teoretis yang masuk akal akan hampir sarna baiknya dan cocok. Dalam kasus ini, praktisi hams memutuskan sendiri apakah akan menggunakan matematika sesuai yang terbaik atau sangat dekat sesuai yang masuk akal. Distribusi statistik teoritis umum yang akan dibahas adalah distribusi Bernoulli, Seragam, eksponensial, Normal, dan Segitiga. Ada juga diskusi terbatas distribusi yang kurang umum seperti Beta, Gamma, Weibull. Distribusi Bernoulli. Distribusi Bernoulli digunakan untuk model kejadian acak dengan salah satu dari dua kemungkinan hasil. Kemungkinan hasil sering disebut sebagai suatu keberhasilan atau kegagalan. Nilai rata-rata dan varians dari distribusi Bernoulli adalah: rata -rata = p Var = p (I-p) di mana p = fraksi keberhasilan dan (I - p) = fraksi kegagalan. Contoh distribusi Bernoulli dalam simulasi dapat ditemukan di (I) proses inspeksi gagal/berhasil, (2) penumpang kelas pertama vs penumpang ekonomi, (3) pesanan bum-bum vs prioritas teratur. Dalam kasus berhasil vs gagal melewati proses inspeksi, komponen hanya dapat salah satu dari kedua status. Jika 95% dari komponen berhasil melewati pemeriksaan, maka nilai p akan menjadi 0.95. Sebesar 5% tingkat kegagalan akan diwakili oleh 0.05. Penumpang kelas pertama vs ekonomi tidak benar-benar seperti
91
kategorisasi kegagalan vs keberhasilan. Dalam hal ini hanyalah persentase penumpang ke1aspertama dan ke1aspenumpang ekonomi harus total 1.0. Situasi yang serupa terjadi dengan pesanan prioritas terburu-buru vs reguler. Tidak ada keberhasilan atau kegagalan yang berhubungan dengan terburu-buru atau perintah biasa. Hanya ada dua jenis pemesanan dengan persentase yang berbeda kemungkinan. Distribusi Uniform. Sebuah distribusi uniform berarti bahwa selama rentang nilai yang mungkin, masing-masing individu memiliki kemungkinan nilai yang sarna harus diamati. Contoh yang umum dari suatu distribusi seragam adalah perilaku dadu tunggal dengan nilai 6. Nilai minimum mungkin adalah 1 dan nilai maksimal adalah 6. Karena semua bagian adalah sarna, ada kemungkinan yang sarna menerima salah satu dari nilai-nilai antara 1 dan 6. Walaupun ada sedikit kemungkinan menghadapi model simulasi yang menggunakan dadu tunggal sisi enam, distribusi seragam memang memiliki beberapa aplikasi dalam dunia simulasi. Distribusi seragam dapat digunakan sebagai model pertama sebagai contoh untuk data input dari sebuah proses jika ada sedikit pengetahuan tentang proses. Semua yang dibutuhkan untuk menggunakan distribusi seragam hanyalah waktu minimum dan waktu maksimum proses. Walaupun belum tentu asumsi valid bahwa data terdistribusi secara seragam, distribusi seragam mengizinkan praktisi untuk mulai membangun model simulasi. Begitu model menjadi lebih rumit, praktisi dapat memberikan pemikiran untuk menggunakan distribusi yang lebih akurat atau lebih tepat. Distribusi seragam dapat bersifat diskrit atau kontinu. Dalam kasus dadu tunggal dengan sisi enam, distribusi dianggap diskrit. Ini berarti bahwa nilai-nilai data hanya dapat mengambil seluruh bilangan dalam batas yang berlaku. Pada kenyataannya, kebanyakan proses simulasi yang sebenarnya secara seragam terdistribusi dapat mengambil nilai apapun termasuk angka pecahan antara minimum dan nilai maksimum. Jenis data ini adalah distribusi seragam kontinu. Formula untuk nilai rata-rata dan varians distribusi seragam adalah: Rata-rata = (a+bi ; Var = (b_a)2 2 12 Di mana a adalah nilai minimum dan b adalah nilai maksimum. Distribusi eksponensial. Distribusi eksponensial biasanya digunakan dalam hubungannya dengan proses antar kedatangan dalam model simulasi karena
92
kedatangan entitas dalam banyak sistem telah terbukti baik atau diasumsikan acak atau proses Poisson. Ini berarti bahwa jumlah acak entitas akan tiba dalam satuan waktu tertentu. Bahkan meskipun proses acak, masih akan ada beberapa rata-rata jumlah kedatangan dalam satuan waktu. Jumlah pendatang yang dapat diharapkan tiba pada unit waktu didistribusikan secara acak di sekitar nilai rata-rata. Ketika suatu sistem menampilkan keacakan atau distribusi Poisson untuk jumlah pendatang untuk jangka waktu tertentu, waktu antara kedatangan temyata terdistribusi secara eksponensial. Distribusi eksponensial hanya memiliki satu parameter. Nilai ini adalah nilai rata-rata. Jika waktu antar kedatangan menunjukkan distribusi eksponensial, akan ada lebih banyak pengamatan dengan waktu antar kedatangan lebih kecil dari nilai rata-rata. Juga akan ada lebih sedikit pengamatan dengan waktu antar kedatangan lebih besar daripada nilai rata-rata. Dengan demikian, jumlah observasi terns menurun seiring peningkatan waktu antar kedatangan. Persamaan statistik untuk nilai rata dan varians dari distribusi eksponensial adalah: Probabilitas diwakili oleh rnmus berikut: Rata
- rata = B ; Var = B2
di mana B adalah rata-rata dari data sampel dan x adalah nilai data. Hal inijuga memungkinkan untuk memanipulasi persamaan distribusi eksponensial untuk keperluan lain. Secara khusus, jika kita mengintegrasikan persamaan ini dan melakukan transformasi invers, kita dapat mengetahui persentase kumulatif pengamatan apakah berada di bawah nilai tertentu. Sebaliknya,jika kita menetapkan persentase kumulatif, maka kitajuga dapat menemukan nilai kritis. Ini berarti bahwa untuk didistribusikan secara eksponensial himpunan data dengan rata-rata B, persentase F (x) data akan ada dengan nilai kurang dari atau sarna dengan x. Sebagai contoh, jika himpunan data terdistribusi secara eksponensial dengan rata-rata 5, maka kita dapat menghitung nilai kritis untuk persentase kumulatifO.75: 6.93 = -5 x In (1-0.75) Ini berarti bahwa 75% dari pengamatan yang terdistribusi secara eksponensial dalam himpunan data dengan rata-rata 5 akan memiliki nilai 6.93 atau kurang. Kemampuan untuk mengubah persentase kumulatifke nilai kritis ini sangat berguna ketika seseorang mencoba melakukan uji kebaikan suai untuk menentukan apakah suatu kumpulan data bisa berasal dari distribusi eksponensial.
93
Contoh proses yang mungkin akan mengikuti distribusi eksponensial meliputi: antar kedatangan pelanggan, antar kedatangan perintah, dan antar kemsakan atau kegagalan mesin. Perhatikan bahwa masing-masing contoh ini melibatkan waktu antar kedatangan. Sebagaimana dibahas sebelumnya, distribusi eksponensial berlaku ketika jumlah pendatang, apa pun bentuknya, secara acak didistribusikan dengan beberapa nilai rata-rata selama jangka waktu tertentu' Ini tidakberarti bahwa distribusi eksponensial tidak dapat digunakan untuk model jenis proses lainnya. Namun,jika tidak ada alasan mendasar untuk distribusi teoritis yang digunakan, data yang teramati hams sesuai dengan distribusi teoritis khusus agar penggunaannya menjadi sah. Distribusi Segitiga. Distribusi segitiga dapat digunakan dalam situasi di mana praktisi tidak memiliki pengetahuan lengkap tentang sistem, tetapi dapat menduga bahwa data tidak secara seragam terdistribusi. Secara khusus, kalau praktisi mencurigai bahwa data terdistribusi secara normal, distribusi segitiga mungkin pendekatan pertama yang baik. Distribusi segitiga hanya memiliki tiga parameter: nilai minimum mungkin, nilai yang paling umum, dan nilai yang paling maksimum. Karena nilai yang paling umum tidak hams sarna antara minimum dan nilai maksimum, distribusi segitiga tidak selalu hams simetris. Jika praktisi menganggap bahwa data didistribusikan secara triangular (segitiga), tidak perlu untuk mengumpulkan banyak data. Bahkan, praktisi benarbenar hanya hams mengenal tiga nilai parameter. Dalam praktiknya, nilai-nilai ini dapat diperoleh dengan meminta seorang manajer atau operator mesin untuk memberikan perkiraan. Nilai rata-rata dan varians dari distribusi segitiga adalah: Rata
- rata
= a+m+b; Var = (a2+m2+b2-ma-ab-mb) 3 18
Di mana a = nilai minimum, m = nilai yang paling umum (modus), b = nilai maksimum Contoh penggunaan distribusi segitiga meliputi waktu pemrosesan manufaktur, waktu pelayanan pelanggan, dan waktu perjalanan. Waktu proses manufaktur dapat mencakup proses probabilistik. Ini berarti bahwa proses manufaktur kemungkinan besar memerlukan kehadiran manusia di suatu tempat dalam proses. Dapat juga proses yang lebih deterministik di mana masih ada
94
berbagai pekerjaan yang berbeda. Waktu layanan pelanggan dapat berhasil dimodelkan dengan distribusi segitiga.Akhir minimum distribusi mungkin mewakili jumlah waktu untuk mencatat data demografis atau mengakses catatan pelanggan dalam basis data. Waktu yang paling umum akan mencerminkan semua proses transaksi yang khas. Waktu maksimum akan mewakili layanan yang sangat kompleks. dimodelkan dengan distribusi segitiga.Akhir minimum distribusi mungkin mewakili jumlah waktu untuk mencatat data demografis atau mengakses catatan pelanggan dalam basis data. Waktu yang paling umum akan mencerminkan semua proses transaksi yang khas. Waktu maksimum akan mewakili layanan yang sangat kompleks. Waktu perjalanan juga dapat dimodelkan dengan distribusi segitiga. Dalam kasus pemodelan waktu perjalanan di bandara, waktu minimum akan sesuai dengan seseorang berlari antara lokasi tanpa bagasi. Waktu paling umum setara dengan orang berlari hanya dengan satu atau dua kantong yang mudah dikelola. Waktu maksimum setara dengan orang berjalan dengan beban koper besar. Distribusi Normal. Lama waktu untuk banyak proses pelayanan mengikuti distribusi normal. Alasan untuk ini adalah bahwa banyak proses yang sebenarnya terdiri dari sejumlah subproses. Terlepas dari distribusi probabilitas dari setiap individu subproses, ketika waktu subproses ditambahkan bersama-sama, durasi waktu yang dihasilkan sering menjadi terdistribusi secara normal. Distribusi normal memiliki dua parameter: rata-rata dan standar deviasi. Distribusi normal juga simetris. Nilai rata-rata yang sarna denganjumlah pengamatan kurang dari dan lebih besar dari rata-rata data. Pola atau distribusi dari pengamatan di masing-masing pihakjuga serupa. Rumus matematika untuk probabilitas distribusi normal adalah: f(x)
=~
e-(x-~)2/2cr2
'LV21t
Di mana JJ adalah nilai rata-rata dan a adalah standar deviasi. Distribusi normal
sering dibahas dalam kaitannya dengan distribusi normal standar atau Z. Distribusi Z adalah bentuk khusus dari distribusi normal dimana nilai rata-rata adalah 0 dan standar deviasi adalah 1. Dengan distribusi normal standar 68% dari data yang terletak di antara plus atau minus satu standar deviasi dari nilai rata-rata; 95% dari data yang dapat diamati antara plus atau minus dua standar deviasi dari nilai rata-rata dan 99.7% dari data adalah antara plus atau minus tiga standar deviasi dari nilai rata-
95
rata. Untuk data terdistribusi normal, distribusi normal standar dapat dikonversi ke nilai data aktual dengan persamaan berikut: X=JlTO'Z
di mana ~ adalah nilai rata-rata populasi yang sebenamyadan CJ adalah standar deviasi populasi sebenamya. Dalam prakteknya, nilai rata-rata populasi yang benar diperkirakan dengan nilai rata-rata sampel, dan standar deviasi populasi sebenamya diperkirakan dengan standar deviasi sampel. Ini berarti bahwa, misalnya, jika kita punya sampel nilai rata-rata 10 dan standar deviasi sampel 2, kita bisa menghitung batas 68% dari distribusi normal dengan: 8=10-2 12 = 10 + 2 Jadi kira-kira 68% dari pengamatan himpunan data yang terdistribusi normal dengan rata-rata 10 dan standar deviasi 2 akan berada antara nilai-nilai 8 dan 12. Demikian pula, kita bisa menghitung batas sekitar 95.45% dari pengamatan dengan: 10 - 2 (2) sampai 10 + 2 (2) = 6 - 14 Ini berarti bahwa jika data terdistribusi normal dengan ni1airata-rata 10 dan standar deviasi 2, maka 95% dari pengamatan akan berada di antara 6 dan 14. Menggunakan Tabel Distribusi Normal. Kita juga dapat memanipulasi persamaan ini untuk mengetahui nilai persentase kumulatif tertentu. Ini dilakukan dengan penggunaan tabel normal standar atau Z. Ingat kembali pelajaran Statistika dalam menggunakan tabel normal baku. Sebagai contoh, kita ingin mengetahui nilai 80% dari pengamatan untuk distribusi normal dengan nilai rata-rata 10 dan standar deviasi 2, kita akan ikuti langkah berikut ini: 1.
Mencari nilai terdekat di bagian tabel untuk 0.80. Nilai ini ada diurutan kesembilan, kolom kelima. Nilai Z yang sesuai dengan baris ini adalah 0 . 8 dari sembilan baris dan 0.04 dari kolom kelima. Dengan demikian nilai Z adalah 0.84. 2. Memperolehnilai aktual denganmenghitungx: x = 10+2 x 0.84 = 11.68. Jadi, 80% dari himpunan data pengamatan yang terdistribusi normal dengan rata-rata 10 dan standar deviasi 2 dapat ditemukan di bawah 11.68. Prosedur untuk
96
mencari nilai-nilai yang kurang dari 50% adalah sernpa. Sebagai contoh, kita akan menggunakan prosedur berikut untuk mencari nilai persentase kumulatif0.39: 1.
2.
Misalkan kita hanya memiliki sisi kanan tabel, kita harns mengkonversi nilai persentase kumulatif. Sebuah kumulatif adalah 0.39 persen dari 0.11 ke kiri dari nilai rata-rata. Untuk mengubahnya ke sisi kanan, kita menambahkan 0.11+0.50. Sekarang kita bisa mencari nilai kumulatif 0.61. Nilai ini ditemukan di baris ketiga, kolom sembilan.Nilai Z yang sesuai adalah 0.28. Memperoleh nilai aktual dengan menghitung x: x = 10 - 2 x 0.28 = 9.44. Ini berarti bahwa untuk himpunan data yang terdistribusi normal dengan ratarata 10 dan standar deviasi 2 bahwa 39% dari pengamatan akan memiliki nilai 9.44 atau kurang. Penggunaan tabel distribusi normal adalah penting bagi praktisi. Beberapa prosedur berikutnya memerlukan penentuan apakah suatu distribusi normal atau tidak. Dalam rangka untuk membuat keputusan ini, perlu untuk dapat mengidentifikasi nilai kritis untuk berbagai persentase kumulatif distribusi normal.
Simulasi Penggunaan Distribusi Normal. Ketika menggunakan distribusi normal untuk model penundaan pelayanan, praktisi harns menunjukkan perhatian ketika nilai rata-rata waktu layanan kecil. Dalam situasi ini, varians dari data yang dapat menyebabkan nilai kurang dari nilai rata-rata untuk menjadi negatif. Karena waktu layanan tidak boleh kurang dari nol, praktisi hams memastikan bahwa waktu layanan dihasilkan selama simulasi tidak akan negatif. Untungnya, sebagian besar paket simulasi memungkinkan praktisi untuk menentukan bahwa nilai-nilai apapun yang dihasilkan oleh distribusi normal dibuangjika mereka negatif. Contoh proses yang sering dimodelkan dengan distribusi normal meliputi pemrosesan manufaktur, waktu pelayanan pelanggan, dan waktu perjalanan. Perhatikan bahwa contoh tersebut adalah proses yang sarna yang mungkin pada awalnya praktisi perkirakan dalam ketiadaan data sebagai distribusi segitiga. Dalam kasus ini, penggunaan distribusi normal kemungkinan besar akan teIjadi sebagai akibat dari distribusi normal yang cocok dengan data empiris dan bukan sebagai perkiraan. Tanpa benar-benar melakukan uji kebaikan suai, akan dipertanyakan secara otomatis jika mengasumsikan bahwa sebuah proses berdistribusi normal dan bahwa nilai rata-rata dan standar deviasi dapat diperkirakan secara akurat. Distribusi Poisson. Distribusi Poisson digunakan untuk memodelkan peristiwa acak yang akan teIjadi dalam suatu interval waktu. Distribusi Poisson hanya memiliki satu parameter, A.Distribusi ini adalah unik dalam hal bahwa nilai
97
rata-rata dan varians keduanya sarna dengan A.Probabilitas mengamati nilai tertentu adalah: -A x
P(x)= e
A.
X! di mana Aadalah baik nilai rata-rata dan varians dan x adalah nilai dari variabel acak. Simulasi penggunaan distribusi Poisson meliputi jumlah kedatangan dalam suatu interval waktu danjumlah entitas dalam sebuah batch. Distribusi Kurang Umum. Distribusi yang kurang umum digunakan meliputi distribusi Weibull, gamma, beta, dan geometris. Para praktisi diperingatkan bahwa matematika yang terkait dengan distribusi ini dibatasi dalam aplikasi sebenarnya ke praktisi. Dalam kebanyakan kasus, distribusi ini akan ditemui hanya sebagai paling cocok dari paket perangkat lunak data terkomputerisasi. Ketika sebuah paket perangkat lunak menunjukkan bahwa distribusi tertentu adalah paling cocok, paket ini juga akan memberikan parameter distribusi yang terkait dengan cocok. Praktisi normalnya menggunakan informasi ini untuk memasukkan parameter tersebut ke dalam program simulasi. Meskipun beberapa akan berpendapat sebaliknya, matematika di balik beberapa distribusi yang kurang umum ini memiliki arti yang terbatas pada praktisi. Distribusi Weibull. Distribusi Weibull sering digunakan untuk mewakili distribusi yang tidak dapat memiliki nilai kurang dari nol. Situasi ini sering ada dengan distribusi simetris seperti distribusi normal yang mewakili waktu layanan atau proses. Jika nilai rata-rata kecil dan standar deviasi cukup besar, banyak pengamatan akan terakumulasi pada sisi kiri dari distribusi dekat O. Hal ini menghasilkan distribusi tidak simetris. Sisi kanan distribusi masih menampilkan ekor distribusi normal klasik. Distribusi Weibull memiliki dua parameter, yaitu sebuah parameter bentuk a dan parameter skala J3. Tergantung pada nilai kedua parameter, Weibull dapat mengambil bentuk mulai dari distribusi eksponensial sampai distribusi normal. Matematika yang terkait dengan distribusi Weibull seharusnya tidak ada hubungannya dengan praktisi. Persamaan yang disertakan di sini untuk kepentingan kelengkapan. Dalam prakteknya, satu-satunya informasi yang benar-benar praktisi perlu perhatikan adalah parameter a dan J3. Fungsi probabilitas panjang untuk Weibull adalah: A-a a-I -(x/j3)a tuk >0 F( X) =a,
X
e
,un
X
F(x) = 0, untuk lainnya dimana a adalah parameter bentuk dan J3adalah parameter skala.
98
Distribusi Gamma. Distribusi gamma adalah distribusi lain yang mungkin kurang umum bagi praktisi. Distribusi gamma juga dapat agak menakutkan bagi praktisi. Komentar yang sarna dari distribusi Weibull berlaku untuk distribusi gamma. Seperti dengan distribusi Weibull, distribusi gamma memanfaatkan sebuah
bentuk a dan parameterskala 13. Persamaanprobabilitasdensitasuntuk distribusi gammaadalah:
F(x) =
I
rn1a)
Xa-1e-xlP x>O
,
0, untuk lainnya Di mana a, 13,dan r didefmisikan sebagai dalam distribusi Weibull. Untungnya, nilai rata-rata dan varians dari distribusi gamma mudah diwakili bleh al3 dan al3 secara berturut-turut. Distribusi gamma tidak memiliki salah satu karakteristik yang potensial menarik minat bagi praktisi. Dalam keadaan tertentu, distribusi gamma dapat merosot ke representasi matematika yang sarna sebagai distribusi eksponensial. Keadaan ini teIjadi ketika bentuk parameter a kebetulan sarna dengan I. Jika bentuk parameter a mendekati I, maka distribusi eksponensial sepertijuga mungkin cocok. Seperti dengan distribusi Weibull, distribusi gamma tidak bisa di bawah O.Ketika bentuk parameter a melebihi nilai 2, distribusi gamma dapat mengambil bentuk mirip dengan distribusi Weibull. Ini berarti bahwa distribusi gamma juga mungkin berlaku ketika layanan atau distribusi proses simetris memiliki nilai rata-rata kecil dan varians besar. Distribusi Beta. Sebuah persamaan terakhir yang praktisi dapat jumpai adalah distribusi beta. Distribusi ini sedikit berbeda dari sebagian besar distribusi yang sebelumnya diajukan. Distribusi beta menjadi berbeda karena mampu hanya mencakup rentang antara 0 dan 1. Sementara distribusi sendiri hanya dapat antara 0 dan 1, adalah mungkin untuk mengimbangi dan atau membuat skala dengan nilai pengganda. Distribusi beta memiliki dua parameter yang berbeda, yaitu parameter bentuk a dan parameter bentuk 13. Rumus matematika untuk densitas probabilitas distribusi betaadalah: r(a+f3) 0.-],. /}-I F(x) = x ~1-x) , untuk O<x<1 r(a)r(f3) 0, untuk lainnya Dimana a dan 13 adalah parameter bentuk I dan 2, secara berturut-turut, dan r sarna dengan dalam distribusi Weibull, dan gamma. Nilai rata-rata dan varians dari distribusi beta adalah: a af3 Rata - rata = a+ Varians = (a+f3)2(a+f3+ 1)
99
--
--
Selain karena kebetulan data yang sesuai dengan distribusi beta, praktisi mungkin memang memerlukan distribusi ini karena penting untuk menyesuaikan data yang miring ke kanan daripada kiri seperti pada distribusi Weibull dan gamma. Ini mewakili beberapa waktu maksimum yang dapat diambil untuk proses tertentu. Distribusi Geometrik. Berbeda dengan distribusi sebelumnya yang kurang umum, distribusi geometrik adalah diskrit. Seperti yang anda ingat, ini berarti bahwa nilai-nilai yang diambil oleh distribusi geometrik harns bilangan bulat. Distribusi geometrik memiliki satu parameter p, yang menunjukkan probabilitas keberhasilan pada setiap usaha; (1 - p) adalah probabilitas kegagalan pada usaha tertentu. Probabilitas dari x-I kegagalan sebelum sukses di usaha ke-x diwakili oleh: P(x) = p (l-pt\ x = 1,2,... Nilai rata-rata dan varians dari distribusi geometrik diwakili oleh: Rata - rata = -1-p ; Varians = -1-p P P2 Distribusi geometrik dapat digunakan dalam program simulasi untuk: 1. Ukuran batch kedatangan 2. Jumlah item diinspeksi sebelum kegagalan ditemukan Distribusi geometrik dapat memodelkan ukuran kedatangan batch. Secara khusus, distribusi geometrik telah digunakan untuk memodelkan secara akurat jumlah orang yang dalam suatu batch di pos pemeriksaan sistem keamanan bandara. Batch merepresentasikan penumpang tunggal, suami dan istri, keluarga dengan anak-anak, dan pelancong bisnis dalam kelompok. Untuk ukuran batch kedatangan, kita tertarik pada probabilitas yang diasosiasikan dengan ukuran batch x. Penggunaan lain model distribusi geometris adalah jumlah kegagalan yang ada sebelum sukses. Untuk membuat lebih masuk akal dalam sebuah program simulasi, persentase antara keberhasilan dan kegagalan dapat diaktifkan. Jadi, kita akan benarbenar memodelkan jumlah sukses sebelum terjadinya kegagalan pertama. 5.7 Distribusi Kombinasi Beberapa jenis data input sebenamya merupakan kombinasi komponen deterministik dan probabilistik. Proses jenis ini umumnya memiliki waktu minimum, yang merupakan komponen deterministik. Komponen yang tersisa dari waktu mengikuti semacam distribusi. Contoh kasus yang menunjukkan distribusi kombinasi adalah:
100
--
I. 2. 3.
.--_...--_....
Teknisidukungan telepon Penggantian oli pada mobil Siklus sistem manufaktur tleksibel
Dalam sistem dukungan teknis telepon umumnya, jumlah waktu minimum selalu dibutuhkan untuk setiap panggilan. Selama beberapa menit awal, teknisi telepon harns menetapkan siapa pelanggan dan apakah ia berhak untuk dukungan teknis telepon. Jika pelanggan tidak memenuhi syarat dukungan, yang akan menjadi jumlah minimum mungkin waktu untuk proses pelayanan. Proses yang stokastik akan mencakup waktu memecahkan masalah yang sebenamya. Catatan bahwa dalam kasus seperti ini, praktisi mungkin ingin memodelkan proses kontak sebagai dua proses terpisah: satu untuk menetapkan kualifikasi dan satu untuk layanan ini. Dalam kasus penggantian oli mobil, jumlah waktu deterministik minimum yang diperlukan adalah untuk menaikkan dan menurunkan mobiI. Komponen probabilitas waktu akan melibatkan pembuangan oli lama, penggantian dengan oli barn, dan waktu untuk mengganti filter oli. Sistem manufaktur tleksibel (FMSs) terdiri dari dua atau lebih komputer dikontrol secara numerik (CNC) dan mesinmesin otomatis yang umum-sistem penanganan bahan. Waktu pemrosesan untuk mesin dari komponen dan pengalihan komponen kemungkinan besar akan menjadi deterministik karena mereka dikendalikan oleh komputer. Namun, selurnh siklus masih memerlukan operator manusia pada awalnya untuk memuat komponen pada awal siklus. Demikian pula pada akhir siklus, operator manusia juga akan diminta untuk membongkar komponen. 5.8 Analisis Data Input Proses penentuan distribusi teoritis yang mendasari untuk suatu himpunan data biasanya melibatkan apa yang dikenal sebagai uji kebaikan suai (Johnson et aI., 1999; Hildebrand dan Ott, 1991). Uji ini didasarkan pada semacam perbandingan antara distribusi data yang diamati dan distribusi teoritis yang sesuai. Jika perbedaan antara distribusi data yang diamati dan distribusi teoritis yang sesuai kecil, maka dapat dinyatakan dengan tingkat kepastian bahwa data input bisa berasal dari satu himpunan data dengan parameter yang sarna dengan distribusi teoritis. Ada empat metode yang berbeda untuk melakukan perbandingan ini, yaitu (1) pendekatan grafis, (2) khi-kuadrat, (3) uji Kolmogorov-Smimov, dan (4) kesalahan kuadrat. Pendekatan yang paling mendasar untuk mencoba agar sesuai input data adalah pendekatan grafis. Pendekatan ini terdiri dari perbandingan visual kualitatif
101
antara distribusi data aktual dan distribusi teoritis dari data yang teramati. Langkahlangkah untuk memanfaatkan pendekatan gratis meliputi:
. . . .
Buat histogram dari data yang diamati Buat histogram untuk distribusi teoritis Bandingkan secara visual kesamaan kedua histogram Membuat keputusan kualitatifuntuk kesamaan dua himpunan data
Dalam teknik ini, praktisi pertama-tama hams memutuskan bagaimana luas jangkauan data setiap bar histogram dan berapa banyak baruntuk gratik. Nilai bawah dan atas di masing-masing rentang data membentuk apa yang dikenal sebagai sel data. Jumlah data pengamatan di masing-masing sel digunakan untuk mewakili ketinggian bar histogram. Ada dua pendekatan umum untuk menentukan bagaimana untuk menangani masalah sel, yaitu (1) pendekatan interval sarna, dan (2) pendekatan probabilitas sarna. Dalam pendekatan interval yang sarna, praktisi menetapkan lebar sel data setiap rentang menjadi nilai yang sarna. Ini berarti bahwa praktisi kemudian hanya hams memutuskan berapa banyak sel untuk dimanfaatkan. Jangkauan lengkap dari semua nilai data kemudian dibagi dengan jumlah sel yang akan digunakan. Nilai yang dihasilkan adalah lebar data setiap rentang. Perhatikan contoh waktu layanan berikut. Data input memiliki nilai minimum 4 menit dan nilai maksimum adalah 24 menit. Jangkauan lengkap adalah 20 menit. Jika praktisi memutuskan untuk memiliki lima sel, kisaran untuk masing-masing dari lima sel data adalah 4 menit. Ini berarti bahwa sel pertama mencakup antara 4 dan 9 menit, sel kedua antara 9 dan 13 menit, dan seternsnya. Pendekatan interval yang sarna mensyaratkan bahwa praktisi memutuskan berapa banyak sel untuk dimanfaatkan. Meskipun akan ada kemungkinan untuk memutuskan secara acak pada satu nomor, akan lebih baik untuk menurunkan jumlah ini dalam beberapa macam cara rasional. Salah satu pendekatan yang telah dilakukan di masa lalu adalah untuk mengambil akar kuadrat dari jumlah titik data. Nilai yang dihasilkan adalah jumlah sel yang akan digunakan. Dengan jumlah sel, kisaran sel dapat dihitung seperti ilustrasi sebelumnya. Metode statistik lebih kuat untuk menentukan jumlah sel adalah pendekatan probabilitas sarna. Dengan metode ini, jumlah sel ditentukan dengan algoritma berikut:
102
1. 2.
Gunakanjumlah sel maksimum tidak melarnpaui 100. Jumlah yang diharapkan pengarnatan dalarn setiap sel harus sekurangkurangnya 5.
Untuk memanfaatkan pendekatan ini, praktisi pertama-tama perlu untuk membagijumlah total data poin oleh 5. Ini akan menghasilkanjumlah sel yang akan digunakan. Jika jumlah sel lebih besar dari 100, kemudian 100 digunakan untuk jumlah sel. Dengan metode ini, ada kemungkinan bahwa jumlah titik data tidak akan diterima secara merata oleh 5. Dalam kasus ini, para praktisi dapat membuang data tambahan atau mengurangi jumlah sel data ke angka yang lebih rendah berikutnya. Jika praktisi memutuskan untuk membuang data tambahan, adalah penting untuk memastikan bahwa jumlah sel tidak terlalu kecil. Di sisi lain, jika praktisi membulatkan jumlah sel ke bawah, jumlah pengamatan yang diharapkan dalarn setiap sel akan berada pada nomor yang merupakan pecahan antara 5 dan 6. Beberapa ahli statistik tidak akan setuju membuang data, tapi jika ada kumpulan data yang cukup besar, pendekatan yang paling sederhana adalah membuang beberapa titik data untuk memiliki bahkan jumlah sel. Jadi, misalnya, jika ada 52 titik data, harus ada 52 dibagi dengan 5 data sel. Ini adalah 10 sel data dengan 2 titik data yang tersisa. Pendekatan data yang membuang berarti bahwa titik data 2 terakhir tidak akan digunakan dalam proses penyesuaian distribusi. Praktisi dapat selalu membulatkan jumlah sel ke bawah, akan tetapi, hal ini mungkin menyebabkan tidak semua pengamatan yang diharapkan masuk. Penggunaan nomor bukan keseluruhan jumlah pengamatan yang diharapkan secara statistik akan lebih kuat. Namun, bisa cukup membingungkan bagi banyak praktisi. Jika pendekatan ini digunakan, maka 52 titik data akan menghasilkan total dari 52 dibagi dengan lima sel. Jumlah sel yang dihasilkan adalah lOA. Jumlah sel dibulatkan ke bawah sampai 10. Jumlah pengamatan yang diharapkan dihitung dengan membagi 52 dengan 10, berarti bahwa setiap sel akan diharapkan memiliki 5.2 pengamatan. Tentu tidak mungkin untuk mengamati potongan 5.2 data dalarn rentang data apapun karena anda tidak bisa memiliki pecahanjumlah pengamatan. Pendekatan probabilitas sarnamemiliki salah satu karakteristik lain yang dapat mengganggu bagi praktisi pemula. Karakteristik ini adalah hasil dari fakta bahwa setiap sel mungkin sarna secara alami. Ini berarti bahwa setiap sel diharapkan memiliki jumlah sarna pengarnatan terlepas dari distribusi yang sedang diperiksa. Akibatnya, lebar interval sel data yang berbeda mungkin berbeda.
103
--
---
Grafik Perbandingan dari Sel. Setelahjumlah sel ditentukan, praktisi dapat memutuskan batas sel untuk setiap sel jika data berasal dari distribusi teoritis tertentu. Kemudian praktisi mengamati macam data dan menghitung frekuensi pengamatan yang bersesuaian dengan setiap sel. Frekuensi ini digunakan untuk membuat histogram. Langkah terakhir melibatkan perbandingan visual subjektif antara histogram yang diamati dan apa yang mungkin diharapkan dari distribusi teoretis untuk setiap sel. Sifat subjektif dari perbandingan antara data yang diamati dan teoritis tidak menghasilkan perbandingan yang kuat. Untuk alasan ini saja, tidak dianjurkan penggunaan metode grafis untuk membuat kesimpulan tentang kumpulan data tertentu. Uji Kebaikan Suai Khi-Kuadrat. Khi-kuadrat secara umum diterima sebagai uji kebaikan suai yang lebih disukai. Seperti uji perbandingan grafik, khikuadrat didasarkan pada perbandingan jumlah aktual pengamatan versus jumlah pengamatan yang diharapkan. Ini berarti bahwa uji khi-kuadrat probabilitas sarna juga menggunakan pendekatan untuk menentukan jumlah sel dan batas sel. Langkah-Iangkah dalam melaksanakan uji khi-kuadrat adalah sebagai berikut: 1. Menetapkan hipotesis nol dan altematif 2. Menentukan tingkat signifikansi pengujian 3. Menghitung nilai kritis dari distribusi khi-kuadrat 4. Menghitung uji khi-kuadrat dari data statistik 5. Membandingkan uji statistik dengan nilai kritis 6. Menerima atau menolak hipotesis nol Hipotesis nol pada umumnya adalah pemyataan yang menyatakan bahwa data input bisa berasal dari distribusi teoritis tertentu. Demikian pula, hipotesis altematif adalah pemyataan bahwa. data input tidak mungkin berasal dari distribusi teoritis tertentu. Dalam prakteknya, pemyataan hipotesis nol dan altematif yang diringkas mengikuti format berikut: Ho: Distribusi (parameter 1,parameter 2, ...) Ha: Tidak distribusi (parameter 1,parameter 2, ...) Distribusi akan dinamai sesuai dengan nama distribusi teoretis sebenamya, dan parameter akan sesuai dengan parameter tertentu yang terkait dengan distribusi teoritis tertentu. Jika kita sedang menguji data layanan yang terdistribusi normal, kita akan membutuhkan data parameter nilai rata-rata dan standar deviasi. Sebagai
104
contoh, jika kita berpikir bahwa distribusi teoritis itu nonnal dengan rata-rata 5 dan standar deviasi 2,pemyataan hipotesis akan muncul sebagai berikut: Ho: Data berdistribusi nonnal (5, 2) Ha:Data tidak berdistribusi nonnal (5, 2) Menentukan Tingkat Signifikansi Uji. Hal ini diperlukan untuk membangun tingkat keyakinan uji. Sebagai contoh, jika kita ingin yakin 95% dari hasil tes, tingkat signiflkansi adalah 0.05. Tingkat signiflkansi sering disebut sebagai tingkat a. Tingkat a umum lainnya 0.01 dan 0.10. Penelitian sosial biasanya tidak membutuhkan tingkat a yang sangat kecil. Nilai 0.05 atau 0.10 sudah cukup. Tapi penelitian teknik atau eksakta, khususnya kedokteran, membutuhkan tingkat a yang sangat keci!. Tingkat a 0.10 untuk eksaktalteknik bisa terlalu besar. Menentukan Nilai Kritis untuk Distribusi Khi-Kuadrat. Proses ini terdiri dari penentuan nilai kritis khi-kuadrat. Nilai kritis adalah batas antara bagian tidak bennakna dan signiflkan dari distribusi khi-kuadrat. Dengan kata lain, dengan tingkat signiflkansi 0.05 merupakan nilai di mana 95% dari distribusi ada di sebelah kiri nilai kritis, sedangkan 5% dari distribusi ada di kanan nilai kritis. Perhitungan Statistik Uji Khi-Kuadrat dari Data. Uji statistik dihitung dengan cara menjumlahkan hasil kuadrat perbedaan antara data jumlah poin yang diamati dan jumlah titik data yang diharapkan dibagi dengan jumlah titik data yang diharapkan untuk setiap individu sel data. Proses ini lebih mudah dijelaskan dengan rumus berikut:
X2~ (Oi-Eii Di mana X2= ujistatistikyangakandihitungdandibandingkandengannilaikritis;Oi = jumlah titik data pengamatan dalam sel ke-i; Ei =jumlah titik data yang diharapkan dalam sel ke-i; dan n =jumlah sel data. Untuk setiap sel dalam rumus di atas, praktisi akan mengambil jumlah nilai yang diamati dalam rentang sel dan mengurangi jumlah nilai yang diharapkan. Angka ini kemudian dikuadratkan. Nilai positif yang dihasilkan dibagi dengan jumlah diharapkan sarna dengan nilai yang digunakan sebelumnya. Perhitungan ini dibuat untuk setiap sel dalam uji dan dijumlahkan. Nilai yang dihasilkan mengikuti distribusi chi-kuadrat.
105
Pembandingan Uji Statistik dengan Nilai Kritis. Dalam langkah ini, kita membandingkan uji statistik yang hanya dihitung dengan nilai kritis yang ditentukan sebelumnya. Perbandingan dilakukan untuk melihat apakah uji statistik lebih kecil dari nilai kritis atau lebih besar dari nilai kritis. Jika temyata statistik uji lebih kecil dari nilai kritis, maka hipotesis nol yang menyatakan bahwa data bisa berasal dari distribusi teoritis tertentu tidak dapat ditolak pada tingkat signifikansi yang ditentukan sebelumnya. Sebaliknya, jika nilai statistik uji lebih besar dari nilai kritis, maka hipotesis nol ditolak. ltu berarti bahwa ada bukti yang menunjukkan data tidak datang dari distribusi teoritis yang sarna. Jumlah Data Minimum untuk Uji Khi-Kuadrat. Salah satu kelemahan uji khi-kuadrat adalah bahwa hal itu dapat dilaksanakan hanya jika cukup jumlah data yang ada untuk menerapkan uji. Secara umum, kita perlu untuk memiliki paling sedikit 20 titik data agar uji berfungsi secara matematis. Jika hanya 20 titik data yang tersedia, total 4 sel data yang ak~mdigunakan. Ini berarti bahwa minimum titik data yang lebih realistis setidaknya 30. Dengan setidaknya 30 titik data, praktisi dapat memiliki keyakinan yang wajar akan hasil uji khi-kuadrat. Dalam peristiwa dimana data yang ada tidak cukup untuk melakukan uji khi-kuadrat, praktisi dapat mempertimbangkan memanfaatkan Kolmogorov-Smimov. Perhatikan contoh berikut untuk menunjukkan penggunaan uji kebaikan suai khi-kuadrat. Data di bawah ini diperoleh dari waktu antar kedatangan pelanggan di pusat pelayanan dalam menit. Kami ingin memastikan bahwa distribusi antar kedatangan mengikuti distribusi eksponensial. 0.87 2.57 3.23 3.94 0.06 0.95 2.48 1.43 1.63 15.80 1.50
1.36
3.43 0.25
1.04
5.53
0.54 1.41
0.80
3.86 0.77
2.23 2.00
1.88
2.73
0.17 0.01
2.68 0.55
3.48
Untuk memulai, kita perlu menghitung ringkasan statistik untuk data. Meskipun kita dapat menghitung nilai rata-rata dan standar deviasi data, distribusi eksponensial hanya memiliki satu parameter, nilai rata-rata. Nilai rata-rata = 2.31 dan standar deviasi = 2.88. Kita memiliki 30 titik data, dan kita akan menggunakan pendekatan yang disarankan kemungkinan sarna. Ini berarti bahwa kita perlu menggunakan total atau 6 sel dalam pengujian kita.
106
Dengan ringkasan statistik, adalah mungkin untuk membuat hipotesis nol dan altematif, yaitu: Langkah 1.Ho: data berdistribusi eksponensial (2.31). Ha: data tidak mengikuti distribusi eksponensial (2.31). Langkah2. Tingkat signifikansi dipilih sebesar 0.05. Langkah 3. Nilaikritiskhi-kuadratuntukderajatbebas(6-1-1)=4.Adaenam sel, satu parameter untuk nilai rata-rata dan tambahan satu derajat kebebasan untuk uji. Menggunakan tabel khi-kuadrat, diperoleh nilai kritis 9.49. Langkah4. Kita menghitung persen batas bawah dan atas untuk setiap sel, nilai batas atas dan bawah x untuk setiap sel, dan jumlah yang diamati dan diharapkan untuk setiap sel. Nilai-nilai di bawah dan atas x kolom dihitung dengan menggunakan rumus: x = -0.97 x In [l-f(x)] Di mana F (x) adalah persentase kumulatif persentase bawah dan atas kolom. Uji statistik adalahjumlah dari kolom terakhir, yaitu 0.2 + 0.0 + 0.2 + 0.0 + 1.8+ 1.8 = 4.0 Langkah5. Uji statistik lebih kedl dari nilai kritis pada alfa 0.05, yaitu 4.0 <9.4. Langkah 6. Kesimpulan: Tidak dapat menolak hipotesis no1,dengan kata lain data berdistribusi secara eksponensial dengan rata-rata 2.31. Contoh Khi-Kuadrat Distribusi Normal. Uji kebaikan suai khi-kuadrat juga mudah diterapkan untuk distribusi normal. Misalkan kita ingin menguji data waktu layanan berikut untuk melihat apakah berasal dari distribusi normal. 6.44 5.92 6.88 6.49 9.14 6.68 9.01 4.80 1.77 0.52 3.59 5.10 1.28 7.75 4.90 7.91 6.33 6.44 3.10 7.09 3.59 6.26 4.88 3.68 5.35 3.82 9.37 4.98 7.50 7.39 Ringkasan statistik untuk kumpulan data ini adalah: nilai rata-rata = 5.61, standar deviasi = 2.25, danjumlah data = 30. Pengujiannya menggunakan perangkat lunak statistic SPSS dan langkahlangkahnya adalah sebagai berikut: Langkah 1. Ho : data mengikuti distribusi normal (5.61, 2.25). HI : data tidak mengikuti distribusi normal (5.61,2.25). Langkah 2. Tingkat signifikansi (a) :0.05 (sesuai dengan default SPSS)
107
Langkah 3. Nilai kritis :tingkat signifikansi 0.05. Tolak Hojikanilai P lebih kecil dari 0.05. Langkah 4. Perhitungan. 1. 2. 3. 4. 5. 6. 7.
Input data ke lembar keIja SPSS. Bukamenu "Analyzeq Pilih ''Nonparametric Testq Pilih "Chi-S.nare& .q Masukkan variabel yang akan diuji distribusinya ke kotak "Test Variable Listq Tekan "Okq Hasil: Test Statistics Waktu layanan Chi-S. .uare
a
df Asymp. Sig.
1.733 27 1.000
a. 28 cells (100.0 %) have expected fre..uencies less than 5. The minimum expected cell fre..uency is 1.1.
Langkah 5. Baca "Asymp. Sig dari tabel di atas dan bandingkan dengan 0.05. Karena 1.000 lebih besar dari 0,05, maka terima Ho, artinya data pengamatan mengikuti distribusi normal Kolmogorov-Smirnov (KS). Uji KS digunakan hanya ketika jumlah titik data sangat terbatas dan uji khi-kuadrat tidak dapat diterapkan dengan tepat. Alasan untuk ini adalah bahwa secara umum diterima bahwa uji KS memiliki sedikit kemampuan sesuai data dibandingkan teknik lainnya seperti khi-kuadrat. Sebuah pembatasan akhir uji KS adalah bahwa beberapa referensi merekomendasikan menggunakan KS dengan distribusi diskrit. Sebenamya ada banyak versi dari uji ini dengan berbagai tingkat kompleksitas. Untuk diskusi lengkap tentang uji KS, praktisi dapat merujuk ke buku statistik atau ke buku simulasi Law-Kelton. Versiuji KS yang disajikan dalam buku ini adalah yang paling sederhana untuk diterapkan. Ahli statistik kadang-kadang mengkritik versi uji statistik lemah. Namun, bagi praktisi, perbedaannya mungkin tidak signifikan.
108
Konsep di belakang uji KS adalah perbandingan antara distribusi kumulatif teoretis dan kumulatif distribusi diamati. Jika perbedaan maksimum antara kumulatif distribusi teoretis dan teramati melebihi nilai kritis, maka distribusi yang diamati tidakmungkin berasal dari distribusi teoritis KS. Langkah-Iangkah untuk KS adalah: 1. 2. 3. 4. 5. 6.
Menetapkan hipotesis nol dan altematif Menentukan tingkat signiflkansi pengujian Menentukan nilai kritis KS menggunakan tabel Menentukan perbedaan mutlak terbesar antara dua distribusi kumulatif Membandingkan dengan nilai KS kritis Menerima atau menolak hipotesis nol
Seperti dengan uji khi-kuadrat, uji KS dimulai dengan pembentukan hipotesis nol dan altematif. Untuk uji KS, kita juga bisa memadatkan hipotesis nol dan altematif sebagai berikut: Ho: Data berdistribusi (parameter 1,parameter 2, ...) Ha: Data tidak mengikuti distribusi (parameter 1,parameter 2, ...) Dalam cara yang sarna seperti uji khi-kuadrat, juga diperlukan untuk membangun tingkat keyakinan untuk uji KS. Sebagai contoh, jika kita ingin yakin 95% dari hasil uji, tingkat signiflkansi adalah 0.05. Nilai kritis untuk uji KS diperoleh dari tabel. Tabelmemiliki dua parameter, ukuran sampel dan tingkat signiflkansi. Dalam menentukan perbedaan kumulatif dua distribusi, plot sederhana dapat digunakan untuk membantu. Probabilitas kumulatif diplot pada sumbu vertikal, dan rentang nilai data diplot pada sumbu horizontal. Untuk distribusi data yang teramati, probabilitas kumulatif adalah jumlah pengamatan yang kurang dari atau sarna dengan nilai data dibagi dengan jumlah pengamatan. Untuk distribusi teoretis, probabilitas kumulatif dapat dihitung secara matematis. Setelah plot selesai, tujuannya adalah untuk menentukan perbedaan mutlak maksimal kumulatif probabilitas antara distribusi teoritis dan mengamati. Hal ini hanya dilakukan dengan mengurangi nilai distribusi kumulatif. Perbedaan absolut maksimum dalam probabilitas kumulatif antara teori dan distribusi diamati kemudian dibandingkan. Jika perbedaan absolut maksimum kurang dari nilai kritis KS, maka hipotesis nol tidak dapat ditolak. Sebaliknya, jika perbedaan mutlak maksimum lebih besar
109
dari nilai kritis KS, maImhipotesis nol ditolak. Jika hipotesis nol tidak dapat ditolak, maka sampel bisa berasal dari distribusi teoritis dengan parameter tertentu. Kalau
tidak, jika hipotesis nol ditolak, maka sampel tidak berasal dari distribusi teoritis dengan parameter tertentu. Untuk menggunakan uji KS, perhatikan kembali contoh pengujian terhadap distribusi normal pada uji khi-kuadrat. Pengujiannya menggunakan perangkat lunak statistic SPSS dan langkah-Iangkahnya adalah sebagai berikut: Langkah 1. Ho : data mengikuti distribusi normal (5.61, 2.25). HI : data tidak mengikuti distribusi normal (5.61,2.25). Langkah 2. Tingkat signifikansi (a) : 0.05 (sesuai dengan default SPSS) Langkah 3. Nilai kritis :tingkat signifikansi 0.05. Tolak Hojika nilai p lebih kecil dari 0.05. Langkah 4. Perhitungan. 1.Input data ke lembar kerja SPSS. 2. Bukamenu "Analyzeq 3. Pilih "Nonparametric Testq 4. Pilih "I-Sample KS& .q 5. Masukkan variabel yang akan diuji distribusinya ke kotak "Test VariableListq 6. Tekan "Okq 7. Hasil: One - Sample Kolmogorov-Smirnov Test Waktu layanan N a,b Nonnal Parameters
Mean Std. Devistion Absolute Positive Negative
Kolmogorov-Smimov Z Asymp. Sig. (2-tailed)
a. Test distribution is Nonnal b. Calculated from data
110
30 5.5987 2.24463 .116 .056 -.116 .635 .815
Langkah 5. Baca "Asymp. Sig. (2-tailed) dari tabel di atas dan bandingkan dengan 0.05. Karena 0.815 lebih besar dari 0,05, maka terima Ho,artinya data pengamatan mengikuti distribusi nonnal. Kuadrat Kesalahan. Pendekatan kesalahan kuadrat menggunakan pendekatan interval sarna atau pendekatan probabilitas sarna sebelumnya untuk menentukan jumlah sel dan batas-batas sel. Sesuai namanya, pendekatan kesalahan kuadrat merupakan total kuadrat dari kesalahan antara yang diamati dan distribusi teoretis. Kesalahan didetinisikan sebagai perbedaan antara dua distribusi untuk setiap individu sel data. Pendekatan kesalahan kuadrat biasanya digunakan sebagai alat untuk menilai kesesuaian relatifberbagai distribusi teoritis yang berbeda untuk mewakili distribusi yang diamati. Jadi, distribusi teoretis terbaik akan dianggap sebagai yang memiliki paling kecil penjumlahan kesalahan kuadrat. 5.9 Jumlah Data yang Harus Dikumpulkan Sebuah pertanyaan yang sangat umum di kalangan praktisi pemula menyangkut jumlah data yang perlu dikumpulkan. Kemungkinan pertanyaan ini tampaknya terkait dengan tingkat kesulitan terlibat dengan pengumpulan data. Semakin sulit atau susah mengumpulkan data, semakin besar kemungkinan bahwa pertanyaan akan muncul. Ini adalah pertanyaan yang sulit untuk dijawab secara terpisah, namun pengamatan berikut bisa membantu: 1. 2. 3.
Data yang tepat Nilai-nilai yang berbeda yang mungkin terjadi Kebutuhan untuk memiliki cukup data untuk melakukan uji kebaikan suai
Sebuah prinsip penting pengumpulan data adalah bahwa data tidak boleh bias dengan cara apapun. Sebagai contoh, jika praktisi berupaya mengumpulkan data antar kedatangan pada suatu restoran selama seminggu, data tidak dapat digunakan untuk mendorong suatu model yang digunakan untuk memeriksa prosedur staf pada akhir pekan. Jika maksudnya adalah untuk memeriksa kinerja sistem di akhir pekan, maka input datajuga harns dikumpulkan selama waktu yang sarna. Selanjutnya,jika model tersebut untuk diperiksa baik untuk hari kerja dan pengaruh akhir minggu, maka keduajenis data harus dikumpulkan. Isu penting lainnya bahwa praktisi mengumpulkan data yang mungkin cukup berisi lengkap data input yang mungkin ada untuk proses tertentu. Jika nilai ekstrim
111
- - -
--
- - -
--
tidak diamati tapi benar-benar ada dan merupakan hal penting, maka distribusi teoritis yang dihasilkan mungkin tidak valid. Masalah ini tidak mudah diselesaikan seperti halnya penyelesaian hari kerja atau akhir pekan. Dalam rangka untuk menyesuaikan distribusi data yang diamati dan teoretis, jumlah minimum data biasanya diperlukan. Meskipun tidak ada angka ajaib, memiliki kurang dari 25-30 titik data dapat mencegah praktisi dari pelaksanakan uji kebaikan suai dengan benar. Ketikajumlah marjinal titik data dikumpulkan, praktisi mungkin terpaksa menggunakan analisis yang kurang diminati atau kurang kokoh. Selalu penting bagi praktisi untuk mengambil pendekatan konservatif dan mengumpulkan lebih banyak data yang dapat diandalkan. Biasanya jauh lebih sulit untuk kembali dan mengumpulkan data tambahan daripada untuk mengumpulkan jumlah data yang konservatif sejak awal. 5.10Apa Yang Terjadi Jika Data Tidak Dapat Sesuai? Secara periodik praktisi akan menghadapi situasi di mana data yang diamati tidak sesuai dengan distribusi teoretis. Dengan asumsi bahwa data yang dikumpulkan secara akurat, kemungkinan penyebab kesulitan ini meliputi: 1. Tidak cukup data dikumpulkan. 2. Data adalah kombinasi dari sejumlah distribusi yang berbeda. Meskipun praktisi mungkin telah mampu mengumpulkan setidaknya 30 titik data, tidak ada jaminan bahwa data ini sudah cukup untuk secara akurat sesuai dengan distribusi tertentu. Jadi kecuali terlalu membebani untuk mengumpulkan data tambahan, praktisi harus siap untuk kembali ke sistem dan mengumpulkan lebih banyak data. Jika tidak mungkin untuk mengumpulkan data tambahan, praktisi mungkin mencoba untuk menjalankan simulasi dengan data yang diamati, bukan data distribusi teoritis. Kebanyakan paket simulasi memiliki ketentuan untuk kemungkinan ini. Meskipun implementasi distribusi yang diamati ataUdata empiris dapat berbeda-beda, sebuah pendekatan umum dengan menggunakan pendekatan distribusi kumulatif untuk menghasilkan data dapat digunakan. Kemungkinan lain pada kegagalan menyesuaikan distribusi teoretis adalah bahwa waktu data yang teramati mungkin sebenarnya merupakan kombinasi dari beberapa proses yang berbeda. Proses-proses ini dapat berupa saling eksklusif atau berurutan. Sebuah contoh khas di mana hal ini mungkin terjadi adalah ketika tipe entitas pelanggan membayar barang di meja kasir. Di sini, praktisi mungkin
112
_
__n
___U.._
__
.._
-
n
-
menggabungkan beberapa waktu pemrosesan berurutan ke satu himpunan data. Proses sebenamya dari sistem kasir terdiri dari: 1. Memuat barang pada ban berjalan. 2. Memindai barang 3. Memasukkan barang ke kantong plastik 3. Pembayaran untuk barang Jika semua proses ini disatukan, kita akan mengabaikan efek bahwa item yang lebih cenderung memakan waktu lebih lama untuk dimuat ke ban berjalan dan untuk dipindai. Di sisi lain, pembayaran barang tidak akan diharapkan menjadi fungsi dari jumlah barang yang dibeli. Dengan demikian, praktisi mungkin harns memecah proses ini menjadi lebih dari satu himpunan data untuk memiliki harapan yang masuk akal sesuai dengan himpunan data ke dalam distribusi teoretis. Jenis situasi lain di mana bisa sangat sulit untuk menyesuaikan data yang teramati adalah jika proses eksklusif yang saling berbeda digabungkan. Situasi ini mungkin juga akan ditemukan pada contoh kasir yang sarna. Metode pembayaran untuk barang mernpakan proses saling eksklusif. Artinya, hanya satu jenis pembayaran biasanya akan dilakukan, tunai, cek, kredit, atau debit. Praktisi dapat mengharapkan bahwa transaksi tunai akan mengambil rata-rata waktu kurang dari transaksi kredit atau debet yang lebih rnmit. Sebuah transaksi cek bahkan mungkin memakan waktu lebih lama daripada transaksi kredit atau debet. Jika masing-masing jenis pembayaran ini memiliki distribusi teoritis yang berbeda, kemudian praktisi mengabaikannya, maka kemungkinan akan dihasilkan distribusi gabungan yang tidak dapat sesuai dengan salah satu distribusi teoretis. Dalam situasi ini, praktisi harns mengumpulkan data waktu individu untuk masingmasing jenis pembayaran. Perhatikan, bahwa ini secara otomatis dapat menghasilkan jumlah yang lebih besar secara signiftkan dari pengumpulan data dari awalnya dilakukan. Situasi pengumpulan data sebenamya sedikit lebih buruk. Praktisi juga harns memiliki distribusi tambahan yang menentukan persentase. masing-masing jenis pembayaran yang berbeda. Jika praktisi rajin dalam pengumpulan data, adalah mungkin bahwa persentase distribusi jenis juga dapat dikumpulkan pada saat yang sarnasebagai waktu pembayaran.
113
Daftar Pustaka 1. 2. 3. 4. 5 6. 7. 8. 9.
Hoover, Stewart V. Dan Perry, Ronald F. Simulation: A Problem Solving Approach. Addison-WesleyPublishing-Company, Massachusetts. 1989. Banks, Jerry, Carson II, J. Dan Nelson, B.L. Discrete-Event System Simulation. Prentice-Hall International, Inc., London. 1984. Law, Averill M. Dan Kelton, David W. Simulation Modeling and Analysis. McGraw-Hill Inc., Singapore. 1991. Pegden, C. Dennis, Shannon, Robert E. Dan Sadowski, Randall P. Introduction to Simulation Using SIMAN. McGraw-Hill, Inc., Singapore. 1995. Ronald E. Walpole. Probability Y Statistics for Engineers Y Scientists. Prentice Hall. Hildebrand, D.K. and Ott, L. Statistical Thinkingfor Managers, PWS-Kent, Boston. 1991. Johnson, R.A., Freund, J.E., and Miller, I. Miller and Freund's Probability and Statistics for Engineers, Pearson Education, New' ork. 1999. Bowerman, Bruce and 0 Connell, Richard T. Applied Statistics: Improving Business Processes. Irwin Professional Publishing, USA. 1997. Walpole, Ronald E. Probability & Statistics for Engineers and Scientist. Prentice Hall. 2002.
114