PEMODELAN TRAFIK SELF-SIMILAR DENGAN DISTRIBUSI PARETO
ZAKI MUBARROK
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2007
PEMODELAN TRAFIK SELF-SIMILAR DENGAN DISTRIBUSI PARETO
ZAKI MUBARROK
Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2007
ABSTRAK ZAKI MUBARROK. Pemodelan Trafik Self-Similar dengan Distribusi Pareto. Dibimbing oleh FAHREN BUKHARI dan SONY HARTONO WIJAYA. Pemodelan trafik memegang peranan yang cukup penting dalam mendesain suatu jaringan komunikasi supaya diperoleh suatu desain yang ideal. Dengan berkembangnya jaringan komunikasi dan jenis layanannya pada saat ini, perilaku trafik mengalami perubahan. Model trafik Poisson, sudah tidak sesuai lagi untuk digunakan sebagai model pembangkit trafik sekarang ini. Pada perkembangannya trafik dilihat dari sifat statistiknya yang mempunyai rataan dan ragam yang unik. Ternyata trafik sekarang mempunyai sifat Self-Similar, yaitu dalam beberapa periode waktu yang berbeda trafik mempunyai struktur korelasi yang hampir sama. Derajat kemiripan atau Self-Similar dari suatu trafik dinyatakan dalam suatu parameter yang disebut dengan parameter Hurst. Trafik Self-Similar mempunyai nilai parameter Hurst antara 0.5 sampai dengan 1. Dari hasil penelitian untuk data trafik nyata yang diambil dari proxy server FMIPA IPB, trafik menunjukkan sifat Self-Similar, hal ini dapat diketahui dari parameter Hurst yang diperoleh selalu lebih besar dari 0.5. Hasil penelitian juga menunjukkan bahwa untuk jumlah sumber trafik yang berbeda (source), berpengaruh kecil terhadap derajat Self-Similar dari trafiknya. Dari uji Chi-Square, distribusi dari data trafiknya lebih mendekati distribusi Pareto daripada distribusi Poisson. Untuk simulasi trafik dengan model Pareto mampu menghasilkan trafik yang bersifat Self-Similar, hal ini dapat diketahui dari parameter Hurst yang diperoleh selalu lebih besar dari 0.5. Kata kunci: jaringan komputer, trafik Self-Similar, Pareto, Hurst.
Judul Skripsi
:
Pemodelan Trafik Self-Similar dengan Distribusi Pareto
Nama
:
Zaki Mubarrok
NRP
:
G64102021
Menyetujui, Pembimbing I
Pembimbing II
Ir. Fahren Bukhari, M.Sc.
Sony Hartono Wijaya, S.Kom.
NIP. 131 403 803
Mengetahui, Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Drh. Hasim, DEA NIP. 131 578 806
Tanggal Lulus:…………………
PRAKATA Puji dan Syukur penulis panjatkan kepada Allah SWT, karena berkat rahmat dan karuniaNyalah, tugas akhir ini dapat diselesaikan. Penelitian ini mengambil tema Jaringan dengan judul Pemodelan Trafik Self-Similar dengan Distribusi Pareto. Penulis menyadari, bahwa penyusunan tugas akhir ini tidak terlepas dari bimbingan dan bantuan dari berbagai pihak. Untuk itu, pada kesempatan kali ini penulis mengucapkan terima kasih kepada: 1
Bapak Ir. Fahren Bukhari, M.Sc. dan Bapak Sony Hartono Wijaya, S.Kom. selaku pembimbing I dan pembimbing II.
2
Kedua orang tua yang telah memberikan dorongan moril dan materiil.
3
Keluarga Besar Masruchin.
4
I-6 Community: Alfath, Andra, Adi, Adit, Dany, Feri, dan Iwan.
5
Rekan-rekan ILKOMERZ 39.
6
Seluruh staf Departemen Ilmu Komputer.
Semoga tulisan ini dapat bermanfaat, Amin.
Bogor, November 2007
Zaki Mubarrok
RIWAYAT HIDUP Penulis lahir di Demak pada tanggal 20 Juli 1983 sebagai anak ke-3 dari 5 bersaudara, putra dari pasangan Abdul Chadziq dan Masruchatun. Tahun 2002, penulis lulus dari SMU Negeri 1 Demak dan melanjutkan pendidikan di Institut Pertanian Bogor (IPB) melalui jalur Undangan Seleksi Masuk IPB (USMI) pada Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.
vi
DAFTAR ISI Halaman DAFTAR GAMBAR ........................................................................................................................ vii DAFTAR LAMPIRAN ..................................................................................................................... vii PENDAHULUAN ................................................................................................................................ 1 Latar Belakang................................................................................................................................. 1 Tujuan .............................................................................................................................................. 1 Ruang Lingkup ................................................................................................................................ 1 Manfaat Penelitian ........................................................................................................................... 1 TINJAUAN PUSTAKA....................................................................................................................... 1 Jaringan Komputer .......................................................................................................................... 1 Self-Similarity ................................................................................................................................. 1 Aggregated Variance ....................................................................................................................... 2 Distribusi Poisson ............................................................................................................................ 2 Pemodelan Trafik dengan Distribusi Pareto ................................................................................... 3 Chi-Square Fit Test ......................................................................................................................... 4 METODE PENELITIAN ..................................................................................................................... 5 Metode Pengumpulan Data ............................................................................................................. 5 Metode Perhitungan Parameter Hurst ............................................................................................. 5 Chi-Square Fit Test ......................................................................................................................... 5 HASIL DAN PEMBAHASAN............................................................................................................ 5 Data Hasil Pengukuran .................................................................................................................... 5 Chi-Square Fit Test..................................................................................................................... 6 Hubungan Parameter model Pareto dengan karakteristik trafik ..................................................... 7 Hubungan parameter α terhadap karakteristik trafik ................................................................. 7 Hubungan parameter b terhadap karakteristik trafik ................................................................. 8 KESIMPULAN DAN SARAN............................................................................................................ 8 Kesimpulan ...................................................................................................................................... 8 Saran ................................................................................................................................................ 9 DAFTAR PUSTAKA .......................................................................................................................... 9
vii
DAFTAR GAMBAR Halaman 1 PDF dari distribusi Pareto dengan beberapa parameter α yang berbeda dan b=1. ....................... 3 2 Grafik data trafik hasil pengukuran 1.000.000 sampling. ............................................................. 5 3 Grafik data trafik hasil pengukuran 100.000 sampling. ................................................................ 5 4 Grafik data trafik hasil pengukuran 10.000 sampling. .................................................................. 6 5 Grafik Aggregated Variance data pengukuran. ............................................................................. 6 6 Grafik Aggragated Variance untuk beberapa jumlah source yang berbeda. ................................ 6 7 Hubungan parameter α terhadap parameter Hurst. ........................................................................ 7 8 Hubungan parameter α terhadap traffic load................................................................................. 7 9 Hubungan parameter α terhadap variance trafik. .......................................................................... 8 10 Hubungan parameter b terhadap nilai parameter Hurst................................................................. 8 11 Hubungan parameter b terhadap variance trafik. .......................................................................... 8
DAFTAR LAMPIRAN Halaman 1 2 3 4
Penjabaran rumus Aggregated Variance ..................................................................................... 11 Penurunan rumus nilai rata-rata sebaran Pareto .......................................................................... 12 Penurunan rumus Variance sebaran Pareto ................................................................................. 13 Pengaruh parameter αON dan αOFF terhadap karakteristik trafik dengan bON = 1024 byte dan bOFF = 1 milidetik. ......................................................................................................................... 14 5 Pengaruh parameter bON dan bOFF terhadap karakteristik trafik dengan αON = 1.0 dan αOFF = 1.0 ....................................................................................................................................................... 17
1
PENDAHULUAN Latar Belakang Pemodelan trafik memegang peranan yang penting dalam jaringan komunikasi, manajemen jaringan, QoS (Quality of Service), dan antrian. Dengan banyaknya jenis layanan saat ini (data, suara, video, citra, dan lain lain) yang harus dilakukan pada suatu jaringan komunikasi secara bersamaan, mengakibatkan pemodelan trafik mengalami perubahan (Fernandes et al. 2004). Manurut Haryatno (2001) pemodelan trafik dengan menggunakan Poisson tidak dapat memodelkan trafik yang mempunyai fluktuasi yang bersifat bursty dengan tepat, untuk itu diperlukan suatu model trafik yang dapat mewakili fluktuasi trafik yang bersifat bursty. Pada perkembangannya, pemodelan trafik lebih dilihat pada sifat-sifat statistiknya. Trafik ternyata mempunyai sifat Self-Similar, yaitu dalam periode waktu yang berbeda, trafik mempunyai sifat statistik yang hampir sama. Sifat Self-Similar pada suatu proses acak dapat dilihat dengan membandingkan data periode tertentu dengan data agregatnya. Data dari kedua proses tersebut akan memiliki struktur korelasi dan distribusi yang sama. Derajat Self-Similar dari suatu trafik dinyatakan dalam suatu parameter yang disebut parameter Hurst. Dengan metode tertentu, variance dari data trafik akan dihitung pada masing-masing skala waktu untuk menghasilkan nilai parameter Hurst tersebut.
Tujuan Pada penelitian ini akan dilakukan analisis terhadap data trafik nyata melalui perhitungan parameter Hurst untuk melihat derajat Self-Similar dari trafik nyata dan uji Chi-Square untuk melihat bentuk distribusi dari data trafiknya. Dalam hal ini distribusi yang diujikan adalah distribusi Poisson dan Pareto. Selain itu juga dilakukan analisis terhadap data trafik simulasi dari model Pareto dengan berbagai variasi parameter simulasi untuk mengetahui karakteristik trafik melalui perhitungan parameter Hurst, rata-rata trafik, traffic load, dan variance.
Ruang Lingkup Untuk membatasi ruang lingkup penelitian, penulis melakukan pembatasan sebagai berikut : 1 Analisis trafik hanya berdasarkan parameter Hurst. 2 Perhitungan nilai parameter Hurst hanya menggunakan metode Aggregated Variance. 3 Panjang data trafik yang digunakan dalam analisis hanya 1.000.000 sample tiap data.
Manfaat Penelitian Hasil Penelitian ini dapat dijadikan referensi untuk penentuan parameter simulasi trafik Pareto sesuai dengan nilai parameter Hurst, rata-rata trafik, traffic load, dan variance yang diinginkan pada suatu desain jaringan komputer.
TINJAUAN PUSTAKA Jaringan Komputer Jaringan Komputer didefinisikan sebagai kumpulan komputer dalam jumlah banyak yang terpisah-pisah secara fisik akan tetapi saling berhubungan secara logik dalam melaksanakan tugasnya. Jaringan komputer lokal atau Local Area Network (LAN) merupakan jaringan milik pribadi di dalam sebuah gedung atau kampus yang berukuran sampai beberapa kilometer. LAN sering digunakan untuk menghubungkan komputerkomputer pribadi dan workstation dalam kantor perusahaan untuk memakai resource bersama dan saling bertukar informasi (Tanenbaum 1996). Self-Similarity Trafik dalam jaringan komunikasi data adalah beban yang diangkut oleh jaringan. Dalam rekayasa jaringan, trafik inilah yang menjadi perhatian utama. Karakteristik trafik suatu jaringan komunikasi ditentukan oleh aktivitas pelanggan yang dapat diwakili oleh dua hal, yaitu besarnya paket dalam byte yang dikirim dari suatu sumber trafik dan waktu kedatangan antar paket.
2
Crovella (2004) mengatakan bahwa trafik pada jaringan komunikasi lebih baik dimodelkan dengan menggunakan proses Self-Similar. Sifat utama dari Self-Similar adalah adanya struktur korelasi dari prosesproses agregatnya (misalkan agregasi berukuran m) yang tidak cepat berubah dari nilai variance data aslinya jika m membesar menuju takhingga. Misalkan
X = ( X 1 , X 2 , X 3 , K) adalah
proses stokastik stasioner, dan X i adalah jumlah kejadian setiap unit waktu, untuk setiap panjang blok m = 1,2,3, K , maka
X ( m) = ( X i( m) ; i = 1,2,3, K) adalah deret waktu yang baru (aggregated) yang diperoleh dengan merata-ratakan setiap blok deret waktu X asal yang berukuran m yang berurutan dan tidak saling beririsan.
ke dalam blok-blok dengan panjang m, dan mencari rata-rata masing-masing blok. X k ( m) =
km 1 X i , k = 1,2, K , [ N / m] ∑ m i =( k −1) m+1
Variance dari deret waktu yang baru dapat dihitung dengan persamaan berikut:
VarX ( m) =
1 N /m ( X k ( m) − X ) 2 N / m k =1
∑
km 1 X i , k = 1,2, K , [ N / m] (1.1) m i =( k −1) m +1
∑
X (m) adalah proses stasioner yang baru untuk setiap m (Willinger et al 1998). ( X 1 , X 2 , X 3 , K) terdistribusi Jika secara independen dan identik dengan ratarata dan variance yang berhingga, maka setelah perataan, variance akan mengalami penurunan. Penurunan variance ini disebut decaying variance. Dari persamaan di atas dapat ditentukan: Var ( X ( m ) ) ≈ Var ( X )m −1
(1.2)
Sebuah proses stokastik mempunyai penurunan variance secara perlahan (Slowly Decaying Variance) jika: Var( X (m) ) ≈ Var( X )m −β ,0 < β < 1
(1.3)
Aggregated Variance Sebuah parameter yang digunakan untuk menyatakan derajat Self-Similar adalah parameter Hurst (H ) . Paremeter Hurst merupakan sebuah ukuran besarnya kemiripan dari suatu trafik dengan trafik itu sendiri pada periode yang berbeda. Deret waktu baru yang sudah berskala didapatkan dengan cara membagi deret (data trafik) yang panjang data trafiknya sebesar N
(2.2)
Deret X (m) terskala m H −1 , jadi jika deret tersebut mempunyai variance terbatas, variance dari hasil perhitungan di atas akan asymtot terhadap m 2 H − 2 , dapat dilihat pada Lampiran 1. log
log Var x 2H 2 log m (2.3)
Untuk m = 1,2,3, K , maka X (m) adalah X k (m) =
(2.1)
Dengan membuat grafik log terhadap log , dan dengan menggunakan regresi linier maka dapat ditarik garis lurus pada grafik tersebut. Dengan gradien garis yang terbentuk (β) tersebut, maka nilai parameter Hurst didapat dengan persamaan:
β = 2H − 2
(2.4)
H = β / 2 +1
(2.5)
Apabila sebuah proses stokastik mempunyai nilai H ϵ [0,½] maka proses stokastik disebut short-range dependence, dan bila nilai H ϵ [½,1] maka proses stokastik disebut long-range dependence (Kalim et al 1998).
Distribusi Poisson Tanner (1995) mengatakan distribusi Poisson adalah salah satu distribusi diskret yang memiliki Fungsi Sebaran Peluang atau Probability Distribution Function (PDF): μ ! dan Fungsi Sebaran Kumulatif atau Cumulative Distribution Function (CDF):
dengan µ adalah rata-rata dari distribusi Poisson.
3
Pemodelan Pareto
Trafik
dengan
Distribusi
Sutjipto (2001) mengatakan model adalah sebuah pendekatan atau representasi dari suatu struktur, kelakuan, atau karakteristik sebuah sistem, konsep, atau proses dalam dunia nyata. Kelengkapan dan kecocokan dengan sistem nyatanya merupakan parameter atau tolok ukur terpenting dalam menilai sebuah model. Suatu upaya untuk mendapat model disebut langkah pemodelan. Asumsi yang umum digunakan dalam pemodelan jaringan komunikasi adalah besarnya paket dalam satuan byte yang ditransmisikan dan waktu kedatangan antar paket, yang selanjutnya masing-masing disebut dengan periode ON untuk besarnya paket dalam satuan byte dan periode OFF untuk waktu kedatangan antar paket. Untuk dapat memperoleh hasil studi yang baik, maka dalam pemodelan trafik yang bersifat Self-Similar harus digunakan model matematika yang merupakan proses SelfSimilar juga. Ada beberapa model yang dapat merepresentasikan proses Self-Similar, antara lain model Pareto, Haar Wavelet, FGN (Fractional Gaussian Noise), FGM (Fractional Brownian Motion), dan Fractional ARIMA. Pada penelitian ini digunakan model Pareto sebagai pembangkit data trafik simulasinya. Model Pareto merupakan model yang paling sederhana dibandingkan dengan model yang lainnya jika dilihat dari formula pembangkit data trafiknya. Distribusi Pareto mempunyai Fungsi Sebaran Peluang atau Probability Distribution Function (PDF):
P( x) =
αb α x α +1
,x≥b
(3.1)
α disebut dengan parameter shape (tail index), dan b merupakan nilai minimum dari sebuah populasi. Ketika α ≤ 2 , variance dari distribusi tersebut adalah takhingga. Ketika α ≤ 1 , rata-rata dari distribusi tersebut adalah takhingga yang dapat dilihat pada Lampiran 2 dan 3. Untuk Trafik Self-Similar, 1 2 karena proses Self-Similar mengasumsikan ruang sebaran dengan ratarata yang berhingga dan variance takhingga. Grafik dari Fungsi Sebaran Peluang dapat dilihat pada Gambar 1.
Gambar 1 PDF dari distribusi Pareto dengan beberapa parameter α yang berbeda dan b=1. Nilai rata-rata dari distribusi Pareto dapat dihitung dengan persamaan:
E ( x) =
αb α −1
(3.2)
Untuk memperoleh suatu populasi dengan distribusi Pareto dapat dibangkitkan dengan persamaan: X PARETO =
b U
1/ α
(3.3)
dengan U adalah suatu bilangan dari sebaran uniform untuk selang (0,1]. Beban (load) L dihasilkan dari total penjumlahan setiap beban dari setiap sumber trafik yang selanjutnya disebut source yang secara matematis dapat dituliskan:
L=
N
∑ Li
(3.4)
i =1
dengan N merupakan jumlah source. Beban dari masing-masing source merupakan perbandingan antara rata-rata dari total besarnya ukuran paket yang ditransmisikan dengan jumlah antara rata-rata dari total ukuran paket yang ditransmisikan dan rata-rata kedatangan antar paket, secara matematis dapat dituliskan sebagai:
Li =
ON i ON i + OFFi
(3.5)
Sebaran Pareto yang benar mengasumsikan ruang sample yang takhingga, namun keterbatasan komputer menyebabkan hasil dari pembangkitan data menjadi terhingga. Misalkan S adalah nilai
4
terkecil yang lebih besar dari nol hasil pembangkitan bilangan acak dengan sebaran Uniform. Sehingga didapat nilai dari sebaran Pareto yang tidak akan lebih besar dari q , secara matematis dapat ditulis: q=
b S
(3.6)
1/ α
Maka diperoleh rata-rata dari sebaran Pareto hasil bangkitan: q
q
∫
E ( x) = x f ( x) dx = b
= αb α
∫
x
b
q
dx
∫ xα
= αb α
b
αb α x α +1
⎣
x1−α 1−α
(3.7) b
α −1 ⎤ α ⎥
⎥ ⎦
(3.8)
1 − Li Li
(3.9)
Misalkan MON dan MOFF masing-masing merupakan nilai minimum dari periode ON dan periode OFF, maka: α OFF −1 ⎤ ⎡ M OFF α OFF ⎢ 1 − S α OFF ⎥ ⎥ α OFF − 1 ⎢ ⎣ ⎦ α ON −1 ⎤ ⎡ M α 1 − Li = ON ON ⎢1 − S α ON ⎥ ⎥ Li α ON − 1 ⎢ ⎣ ⎦
(3.10)
Dengan α ON merupakan parameter shape dari periode ON dan α OFF adalah parameter shape dari periode OFF. Misalkan: TON =
Jika α ON = α OFF , akan diperoleh persamaan:
⎡1 ⎤ M OFF = k ⎢ − 1⎥ L ⎣ i ⎦
(3.12)
−1 α ON − 1 α dan TOFF = OFF , α ON α OFF
Law (1991) mengatakan Uji Chi-Square digunakan untuk mengetahui apakah suatu sample data menyebar sesuai dengan distribusi tertentu yang diujikan atau tidak. Hipotesis dari Chi-Square Fit adalah:
Misalkan ada beban Li dan ukuran paket k dari suatu sumber trafik, dapat dihitung nilai minimum dari periode OFF. Rata-rata dari periode OFF dapat dihitung dengan persamaan (3.2), sehingga diperoleh: OFFi = ON i
⎤ TOFF 1 − S TON ⎡ 1 − 1⎥ (3.11) ⎢ T TON 1 − S OFF ⎣ Li ⎦
Chi-Square Fit Test q
Subtitusikan persamaan (3.6) dan (3.7) sehingga didapatkan:
αb ⎡ ⎢1 − S α −1 ⎢
M OFF = M ON
dx
α −1 αb ⎡ ⎛ b ⎞ ⎤ ⎢1 − ⎜⎜ ⎟⎟ ⎥ = α −1 ⎢ ⎝ q ⎠ ⎥ ⎦ ⎣
E ( x) =
diperoleh:
Test
H0
: Sample data menyebar sesuai dengan Distribusi yang diujikan.
H1
: Sample data tidak menyebar sesuai dengan Distribusi yang diujikan.
Untuk perhitungan Chi-Square Fit Test, data dibagi ke dalam k kelas dan uji statistiknya didefinisikan sebagai:
adalah frakuensi observasi untuk dengan adalah frekuensi harapan bagian ke-i, dan pada kelas ke-i. Frekuensi harapan dapat dihitung dengan: dengan adalah Fungsi Distribusi Kumulatif untuk distribusi yang diujikan, merupakan adalah batas batas atas dari kelas ke-i, bawah dari kelas ke-i, dan adalah besarnya sample data. Uji statistik mengikuti distribusi Chiderajad bebas, dimana Square dengan k adalah jumlah kelas dikurangi 1, dan c adalah jumlah parameter dari distribusi yang akan diujikan. Untuk Pareto yang memiliki 2 parameter yaitu α dan b, sehingga c untuk Pareto adalah 2. Untuk Poisson mempunyai 1 parameter yaitu µ, sehingga c untuk Poisson adalah 1.
5
Hipotesis pertama akan ditolak ketika: ,
dengan adalah nilai kritis dari , distribusi Chi-Square dengan derajad bebas dan selang kepercayaan 1 .
METODE PENELITIAN Metode Pengumpulan Data
Pada penelitian ini, pengambilan data dilakukan dengan metode penelusuran paket (packet traces) menggunakan bantuan utiliti gratis, Ethereal versi 0.10.12 yang dibuat oleh Gerald Combs. Aplikasi Ethereal dijalankan pada server proxy Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Pengambilan data dilakukan pada tanggal 28 Maret – 3 April 2006. Selain itu juga dilakukan pengambilan data trafik hasil bangkitan perangkat lunak DITG Versi 2.4 dengan berbagai variasi parameter α dan b yang berbeda untuk diketahui karakteristik trafik dari masingmasing trafik yang dihasilkan selama 1000 detik. Untuk mengetahui pengaruh parameter α terhadap karakteristik trafik Pareto digunakan variasi dari parameter α adalah 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, dan 1.9; bON = 1024 byte; dan bOFF = 1 milidetik. Sedangkan pengaruh parameter b terhadap karakteristik trafik Pareto digunakan variasi bON adalah 512, 1024, dan 2048 byte. Sedangkan variasi dari nilai bOFF adalah 0.01, 0.05, 0.1, 0.5, 1, 5, 10 milidetik. Metode Perhitungan Parameter Hurst
Chi-Square Fit Test
Langkah pertama untuk melakukan uji Chi-Square terhadap data trafiknya, adalah dengan membagi data trafiknya ke dalam 10 kelas, kemudian dicari peluangnya untuk masing-masing kelompok. Langkah yang kedua adalah membangkitkan data peluang dari distribusi yang diujikan (dalam hal ini Pareto dan Poisson). Langkah yang ketiga adalah menghitung nilai Chi-Square untuk masing-masing distribusi yang diujikan. Kemudian yang terakhir adalah membandingkan nilai dari Chi-Square tersebut dengan nilai kritis untuk selang kepercayaan 95%.
HASIL DAN PEMBAHASAN Data Hasil Pengukuran
Data hasil pengukuran yang diambil dengan jumlah sampling 1.000.000, 100.000, 10.000. Bentuk grafik data hasil pengukuran disajikan pada Gambar 2, 3, dan 4.
Gambar 2 Grafik data trafik hasil pengukuran 1.000.000 sampling.
Ada beberapa metode yang biasa digunakan untuk menghitung nilai parameter Hurst antara lain Aggregated Variance, R/S Variance dan Periodogram. Pada dasarnya semua metode tersebut menghitung variance untuk semua skala waktu. Pada penelitian ini hanya digunakan metode Aggregated Variance.
Gambar 3 Grafik data trafik hasil pengukuran 100.000 sampling.
6
Tabel 1 Pengaruh jumlah source terhadap parameter Hurst
Gambar 4 Grafik data trafik hasil pengukuran 10.000 sampling. Pada Gambar 2, Gambar 3, dan Gambar 4 menunjukkan bahwa data trafik yang diambil dari server proxy FMIPA dengan skala waktu yang berbeda menunjukkan trafik yang bursty, maka trafik bersifat SelfSimilar.
N
β
H
1
-0.082353
0.958824
10
-0.086581
0.956709
20
-0.093790
0.953105
30
-0.089608
0.955196
Dari tabel di atas dapat diketahui bahwa parameter Hurst mempunyai nilai yang hampir sama dan semuanya diatas ½ pada masing-masing jumlah source yang berbeda. Dari tabel di atas dapat disimpulkan jumlah source yang berbeda memiliki pengaruh yang kecil terhadap trafik Self-Similar.
Nilai parameter Hurst hasil perhitungan menggunakan metode Aggregated Variance adalah 0.958824, dengan H = β / 2 + 1 , β adalah gradien dari garis yang terbentuk, yaitu -0.082353 (Gambar 5). Dengan nilai parameter Hurst yang lebih besar dari ½, maka trafik nyata bersifat Self-Similar.
Gambar 6 Grafik Aggragated Variance untuk beberapa jumlah source yang berbeda.
Gambar 5 Grafik Aggregated Variance data pengukuran. Hasil perhitungan nilai parameter Hurst dan plot variance dengan jumlah source yang berbeda, masing-masing dapat dilihat pada Tabel 1 dan Gambar 6.
Dari hasil perhitungan parameter Hurst dengan jumlah source yang berbeda, dapat dikatakan bahwa trafik dengan 1-source mempunyai karakteristik yang sama dengan N-source. Dengan demikian pemodelan trafik dengan satu buah source sudah dapat mewakili pemodelan trafik untuk jumlah source yang lebih besar.
Chi-Square Fit Test
Untuk pengujian Chi-Square, dibangkitkan data peluang dari masingmasing distribusi yang diujikan yaitu distribusi Pareto dan Poisson. Parameter pembangkitan data Pareto adalah nilai shape dan nilai minimum Untuk nilai shape digunakan nilai sebesar 1.5, pemilihan nilai ini karena trafik Self-Similar dihasilkan oleh
7
model pareto dengan nilai shape antara 1 sampai dengan 2. Untuk nilai minimumnya digunakan nilai 54 yang diperoleh dari nilai minimum data trafik nyata. Untuk pembangkitan trafik Poisson digunakan parameter rata-rata sebesar 3117.773688 yang diperoleh dari hasil perhitungan rata-rata pada data trafik real. Dari hasil perhitungan untuk uji ChiSquare pada data trafik nyata diperoleh nilai Chi-Square untuk sebaran Pareto ( ) sebesar 3,008 dan untuk nilai kritis dari distribusi Chi-Square dengan derajad bebas sebesar 10-2-1=7 dan selang kepercayaan sebesar 95% ( . ; ) adalah 14.067. Dengan nilai yang lebih kecil dari . ; , maka hipotesa pertama diterima yang mengatakan bahwa distribusi data trafik nyata tersebut mengikuti distribusi Pareto. Sedangkan untuk nilai Chi-Square untuk sebaran Poisson ( ) mencapai nilai takhingga, dan nilai kritis dari distribusi ChiSquare untuk derajad bebas sebesar 10-1-1=8 dan selang kepercayaan sebesar 95% ( . ; ) adalah 15.507. Dengan nilai yang lebih besar dari . ; , maka hipotesa pertama ditolak yang mengatakan bahwa distribusi dari data trafik nyata tidak mengikuti distribusi Poisson.
Hubungan Parameter model dengan karakteristik trafik
Pareto
Parameter yang digunakan untuk pembangkitan trafik dengan Pareto adalah α dan b. Untuk mengetahui hubungan antara parameter pembangkit trafik Pareto dan dengan karakteristik trafik yang dihasilkan, dilakukan beberapa simulasi trafik. Dalam hal ini karakteristik trafik yang diukur adalah parameter Hurst, rata-rata trafik, traffic load, dan variance.
Hubungan parameter karakteristik trafik
α
nilai parameter Hurst yang menunjukkan bahwa peningkatan nilai αON akan meningkatkan nilai parameter Hurst dari trafik yang dihasilkan untuk nilai αOFF yang tetap. Dari grafik tersebut juga dapat diketahui bahwa peningkatan nilai αOFF akan menurunkan nilai parameter Hurst untuk nilai αON yang tetap (Gambar 7).
Gambar 7 Hubungan parameter α terhadap parameter Hurst. Nilai rata-rata trafik yang dihasilkan meningkat dengan meningkatnya nilai parameter αOFF untuk nilai αON yang tetap, akan tetapi cenderung menurun dengan meningkatnya nilai parameter αON untuk nilai αOFF yang tetap. Hal ini menunjukkan bahwa traffic load yang dihasilkan akan meningkat dengan meningkatnya nilai dari parameter αOFF dan akan turun dengan meningkatnya nilai dari parameter αON (Gambar 8).
terhadap
Untuk mengetahui hubungan parameter αON dan αOFF terhadap karakteristik trafik yang dihasilkan, digunakan variasi dari parameter α adalah 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, dan 1.9; bON = 1024 byte; dan bOFF = 1 milidetik. Hasil dari simulasi ini bisa dilihat pada Lampiran 4. Dengan berbagai variasi nilai αON dan αOFF yang sudah ditentukan menghasilkan
Gambar 8 Hubungan parameter α terhadap traffic load. Pada Gambar 9 dapat dilihat kenaikan nilai perameter αON akan cenderung menurunkan variance untuk nilai αOFF yang sama, sedangkan pengaruh αOFF berlaku sebaliknya yaitu peningkatan nilai αOFF cenderung meningkatkan variance untuk nilai αON yang sama dari trafik hasil bangkitannya.
8
Pada Gambar 11 dapat diketahui bahwa peningkatan nilai bON akan meningkatkan variance trafik yang dihasilkan, sedangkan kenaikan nilai bOFF berlaku sebaliknya kecuali pada saat bON = 2048 byte dan bOFF antara selang 0.01 sampai 0.1 menunjukkan peningkatan variance.
Gambar 9 Hubungan parameter α terhadap variance trafik. Hubungan parameter karakteristik trafik
b
terhadap
Secara teori peningkatan parameter bON akan meningkatkan rata-rata trafik yang dihasilkan dan peningkatan bOFF akan menurunkan rata-rata trafik, namun hubungan parameter bON dan bOFF terhadap nilai Hurst belum dapat dipastikan. Untuk mengetahui hubungan parameter bON dan bOFF terhadap nilai Hurst, dibangkitkan data trafik dengan berbagai variasi bON dan bOFF. Variasi bON yang digunakan adalah 512, 1024, dan 2048 byte. Sedangkan variasi dari nilai bOFF adalah 0.01, 0.05, 0.1, 0.5, 1, 5, 10 milidetik. Hasil simulasi ini bisa dilihat pada Lampiran 5. Dari hasil pembangkitan trafik, secara umum dapat diketahui bahwa nilai parameter Hurst akan meningkat dengan meningkatnya nilai dari bOFF untuk selang 0.01 sampai 0.1 milidetik, sedangkan untuk selang 0.5 sampai 10 milidetik peningkatan nilai bOFF akan menurunkan nilai parameter Hurst dari trafik yang dihasilkan. Peningkatan nilai parameter bON cenderung meningkatkan nilai dari parameter Hurst pada selang 0.5 sampai 10 milidetik (Gambar 10).
Gambar 10
Hubungan parameter b terhadap nilai parameter Hurst.
Gambar 11
Hubungan parameter terhadap variance trafik.
b
KESIMPULAN DAN SARAN Kesimpulan
Berdasarkan penelitian yang telah dilakukan, diperoleh beberapa kesimpulan sebagai berikut: 1
Dari perhitungan parameter Hurst yang telah dilakukan untuk trafik nyata diperoleh nilai yang lebih besar dari 0.5, yaitu sebesar 0.958824, maka dapat dikatakan trafik ethernet bersifat SelfSimilar.
2
Dari perhitungan parameter Hurst untuk jumlah source yang berbeda, diperoleh nilai yang hampir sama. Hal ini menunjukkan bahwa karakteristik trafik sama untuk jumlah source yang berbeda.
3
Simulasi data trafik dengan menggunakan model Pareto menghasilkan data trafik yang juga SelfSimilar. Ini didapat dari hasil perhitungan parameter Hurst yang nilainya lebih besar dari 0.5.
9
4
5
Nilai parameter Hurst dari data trafik hasil simulasi cenderung menurun pada peningkatan nilai αOFF dan cenderung meningkat dengan meningkatnya nilai αON. Nilai parameter Hurst juga dipengaruhi oleh parameter bOFF dan bON yang diinputkan. Traffic load yang dihasilkan oleh Pareto cenderung meningkat untuk peningkatan nilai αOFF , akan tetapi cenderung menurun untuk peningkatan nilai αON.
Popescu A. Traffic Self-Similarity. International Conference on Telecommunications IEEE ICT. 2001. Sutjipto, MR. Pemodelan Trafik Self Similar dengan menggunakan Fractional Gaussian Noise. Tesis. Institut Teknologi Bandung. 2001. Tanenbaum AS. Computer Network. 3rd Edition. Prentice Hall. 1996. Tanner, Mike. Practical Queueing Analisys. McGRAW-HILL .1995. Willinger W, Paxson V, Toqqu MS. SelfSimilarity and Heavy Tails: Struktural Modelling of Network Traffic. 1998.
Saran
Untuk penelitian selanjutnya dapat dilakukan pemodelan trafik pada masingmasing protokol yang berbeda. Dari hasil data trafik simulasi diperoleh nilai parameter Hurst yang berkisar antara 0.576427 sampai 0.741946, sehingga dapat digunakan model trafik yang lain agar kisaran nilai parameter Hurst yang dihasilkan menjadi lebih besar.
DAFTAR PUSTAKA Crovella ME, Bestavros A. Explaining World Wide Web Traffic Self-Similarity. Computer Science Departement – Boston University.Downey AB. 2004. Fernandes S, Kamienski C, and Sadok D. Accurate and Fast Replication on the Generation of Fractal Network Traffic Using Alternative Probability Models. Computer Science Center, Federal University of Pernambuco. 2004. Figueiredo DR, Liu B, Feldmann A, Misra V,Towsley D, Willinger W. On TCP and Self-Similar Traffic. Oktober 2004. Haryatno J. Pemodelan trafik Self-Similar menggunakan Haar Wavelet. Tesis. Institut Teknologi Bandung. 2000. Kalim SA, Sacks Lionel. An Investigation Using Wavelet Analysis to Detect A Change In The Characteristics Of SelfSimilar Traffic. Departement of Electronic Engineering, University College London. 1998. Law A, Kelton WD. Simulation Modeling & Analysis-2nd Ed. McGRAW-HILL. 1991.
LAMPIRAN
11
Lampiran 1 Penjabaran rumus Aggregated Variance
Deret
terskala
12
Lampiran 2
P( x) =
Penurunan rumus nilai rata-rata sebaran Pareto
αbα xα +1 ∞
E ( x) = ∫ xP( x) dx b
∞
⎛ αb α ⎞ = ∫ ⎜⎜ x α +1 ⎟⎟ dx x ⎠ b⎝ = αb
α
∞
∫x
−α
dx
b
∞
⎡ x1−α ⎤ = αb ⎢ ⎥ ⎣1 − α ⎦ b α
αbα 1−α ∞ [x ]b = 1−α
⎧ αbα ⎫ 1−α , α >1 ⎪ ⎪⎪ 1 − α 0 − b ⎪ =⎨ ⎬ ⎪ ⎪ ⎪⎩∞ , α ≤ 1⎪⎭
(
)
⎧ αb ⎫ ⎪ α − 1 ,α > 1 ⎪ ⎪ ⎪ =⎨ ⎬ ⎪∞ , α ≤ 1⎪ ⎪ ⎪ ⎩ ⎭
13
Lampiran 3 Penurunan rumus Variance sebaran Pareto
P( x) =
αbα xα +1
⎧ αb ⎫ ⎪ α −1 ,α > 1 ⎪ ⎪ ⎪ E ( x) = ⎨ ⎬ ⎪∞ , α ≤1⎪ ⎪ ⎪ ⎩ ⎭ Var ( x) = E ( x − E ( x)) 2 = E ( x 2 ) − E 2 ( x) ∞
⎛ αbα ⎞ = ∫ ⎜⎜ x 2 α +1 ⎟⎟ dx − E 2 ( x) x ⎠ b ⎝ = αb
α
∞
∫x
1−α
dx − E 2 ( x)
b
∞
⎡ x 2−α ⎤ 2 = αb ⎢ ⎥ − E ( x) 2 α − ⎣ ⎦b α
=
2 ⎧ α bα ⎫ ⎛ αb ⎞ 2 −α (0 − b ) − ⎜ ⎟ , α > 2⎪ ⎪ ⎝ α −1 ⎠ ⎪⎪ 2 − α ⎪⎪ ∞ 2 ( ) E x − = ⎨ ⎬ b ⎪ ∞ ,α ≤ 2 ⎪ ⎪ ⎪ ⎪⎩ ⎪⎭
αbα 2−α [x ] 2 −α
⎫ ⎧ αb 2 α 2b 2 ,α > 2 ⎪ − ⎪ 2 ⎪ ⎪ α − 2 (α − 1) =⎨ ⎬ ⎪∞ , α ≤ 2⎪ ⎪ ⎪ ⎭ ⎩ 2 ⎫ ⎧ αb ,α > 2⎪ ⎪ 2 ⎪ ⎪ (α − 2)(α − 1) =⎨ ⎬ ⎪∞ , α ≤ 2⎪ ⎪ ⎪ ⎭ ⎩
14
Lampiran 4 Pengaruh parameter αON dan αOFF terhadap karakteristik trafik dengan bON =1024 byte dan bOFF = 1 milidetik
αON 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.1 1.1 1.1 1.1 1.1 1.1 1.1 1.1 1.1 1.1 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.2 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.4 1.4 1.4 1.4 1.4 1.4 1.4 1.4
αOFF 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7
Parameter Hurst 0.741946 0.723700 0.690934 0.651452 0.623571 0.613512 0.603033 0.595160 0.582261 0.582614 0.740316 0.726859 0.692289 0.648521 0.625766 0.613279 0.600234 0.595149 0.580888 0.578240 0.739654 0.727435 0.692373 0.654475 0.628771 0.613927 0.603155 0.594109 0.577199 0.584421 0.746716 0.730371 0.698630 0.658914 0.634370 0.622200 0.609855 0.596512 0.592974 0.583539 0.746864 0.734678 0.700190 0.658630 0.636533 0.621515 0.605744 0.600810
Rata-rata 482.547000 736.603478 1034.185119 1325.577896 1583.699469 1817.720249 2024.023108 2215.098114 2395.902914 2557.337600 412.110235 628.739277 881.608301 1132.525472 1352.990202 1553.159724 1730.513067 1893.744871 2048.440576 2185.576250 358.598605 546.751289 767.204956 985.353453 1175.587990 1351.421369 1514.839243 1648.194737 1783.068908 1889.286054 317.262071 483.666543 678.478684 879.911757 1043.816190 1202.241399 1368.820996 1457.048961 1592.875784 1689.446939 285.311202 434.329615 608.941197 782.057321 933.696951 1071.930551 1194.711946 1306.641035
Variance 7502752.505 11660829.235 16705054.743 21972278.459 27038268.978 31517201.080 35941340.842 40453887.384 45182181.211 48682497.066 5553051.980 8574440.107 12408785.371 16543380.179 19881474.318 23097995.688 26351511.786 28960360.681 32354361.759 35622085.172 4271214.904 6540381.113 9352210.485 12088068.167 15167829.546 17431312.562 20153181.911 22311432.417 24382905.141 26072523.567 3157920.388 4917244.256 7031451.680 9176521.407 11332993.015 13338594.245 15359163.487 16758856.458 17901819.142 19396095.208 2503030.228 3854185.805 5531200.388 7203036.733 8618674.648 10047879.708 11485065.677 12390118.858
Traffic load 0.038604 0.058928 0.082735 0.106046 0.126696 0.145418 0.161922 0.177208 0.191672 0.204587 0.032969 0.050299 0.070529 0.090602 0.108239 0.124253 0.138441 0.151500 0.163875 0.174846 0.028688 0.043740 0.061376 0.078828 0.094047 0.108114 0.121187 0.131856 0.142646 0.151143 0.025381 0.038693 0.054278 0.070393 0.083505 0.096179 0.109506 0.116564 0.127430 0.135156 0.022825 0.034746 0.048715 0.062565 0.074696 0.085754 0.095577 0.104531
15
Lanjutan
αON 1.4 1.4 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.5 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.6 1.7 1.7 1.7 1.7 1.7 1.7 1.7 1.7 1.7 1.7 1.8 1.8 1.8 1.8 1.8 1.8 1.8 1.8 1.8 1.8 1.9 1.9 1.9 1.9 1.9 1.9 1.9
αOFF 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6
Parameter Hurst 0.588242 0.576427 0.748812 0.739282 0.705739 0.666973 0.641781 0.626914 0.609592 0.606591 0.591010 0.584875 0.757794 0.739429 0.711989 0.672141 0.645363 0.632684 0.622073 0.612475 0.594691 0.587268 0.757600 0.748220 0.716937 0.677730 0.653029 0.639604 0.627520 0.618536 0.599839 0.631370 0.759323 0.754377 0.720611 0.682060 0.657406 0.646324 0.635932 0.626276 0.605329 0.598967 0.766082 0.760765 0.724942 0.689027 0.665286 0.649394 0.637961
Rata-rata 1413.117335 1507.986439 259.409886 395.269731 553.383520 711.091322 848.046286 974.581114 1086.053122 1195.240864 1291.492442 1378.305046 244.999781 365.050127 512.013363 654.191203 780.314455 895.822104 998.624005 1092.302234 1181.794112 1260.683840 222.123880 337.681387 473.742441 607.234282 725.163784 832.232251 927.471868 1014.724341 1097.408411 1156.365289 208.468986 317.302905 443.445018 569.246467 679.484807 780.815563 869.161870 950.946793 1029.301470 1097.880228 194.827648 300.063677 419.022914 538.666818 642.356639 738.018505 821.298511
Variance 13488418.733 14611593.834 2146760.897 3028285.949 4505003.156 5602026.055 6870108.556 7779725.753 8958122.734 9694980.317 10491422.687 11348141.741 1569352.754 2640813.879 3599050.537 4593379.702 5646169.242 6442515.188 6943111.385 7604727.305 8385108.398 9037493.404 1465762.556 2164449.546 3031362.583 3890865.486 4548310.586 5260459.282 5733064.240 6195293.674 6926623.890 7279754.834 1234368.191 1732517.513 2574969.254 3294044.415 3877814.864 4290376.956 4791856.612 5196272.416 5589426.960 5925240.183 1041639.155 1457669.548 2202627.698 2695954.021 3235141.049 3638562.880 4136115.728
Traffic load 0.113049 0.120639 0.020753 0.031622 0.044271 0.056887 0.067844 0.077966 0.086884 0.095619 0.103319 0.110264 0.019600 0.029204 0.040961 0.052335 0.062425 0.071666 0.079890 0.087384 0.094544 0.100855 0.017770 0.027015 0.037899 0.048579 0.058013 0.066579 0.074198 0.081178 0.087793 0.092509 0.016678 0.025384 0.035476 0.045540 0.054359 0.062465 0.069533 0.076076 0.082344 0.087830 0.015586 0.024005 0.033522 0.043093 0.051389 0.059041 0.065704
16
Lanjutan
αON 1.9 1.9 1.9
αOFF 1.7 1.8 1.9
Parameter Hurst 0.634426 0.615968 0.603967
Rata-rata 898.528418 971.955606 1037.479491
Variance 4375269.093 4719042.594 5036096.626
Traffic load 0.071882 0.077756 0.082998
17
Lampiran 5 Pengaruh parameter bON dan bOFF terhadap karakteristik trafik dengan αON = 1.0 dan αOFF = 1.0 bON (byte) 512 512 512 512 512 512 512 1024 1024 1024 1024 1024 1024 1024 2048 2048 2048 2048 2048 2048 2048
bOFF (milidetik) 0.01 0.05 0.10 0.50 1.00 5.00 10.00 0.01 0.05 0.10 0.50 1.00 5.00 10.00 0.01 0.05 0.10 0.50 1.00 5.00 10.00
Parameter Hurst 0.661107 0.647138 0.799718 0.745044 0.724246 0.688812 0.652058 0.631263 0.637640 0.804268 0.757365 0.741946 0.700978 0.671196 0.634056 0.642745 0.711061 0.780494 0.760408 0.720364 0.697848
Rata-rata 3969.384 3261.015 2063.765 504.839 273.226 197.977 32.957 4560.978 4554.121 3532.691 889.940 482.547 103.555 55.838 4916.924 4972.592 5364.777 1542.110 838.479 180.344 98.289
Variance 81888794.597 64301176.107 43482238.828 6986670.668 3393097.386 2695945.855 400280.423 101615189.689 101271841.953 82083013.905 15842037.321 7502752.505 1442269.882 787396.577 114690856.639 115750411.252 126028930.833 33829868.414 15660603.040 3002663.482 1604268.411
Traffic load 0.317457 0.260771 0.165101 0.040387 0.021858 0.015838 0.002637 0.364826 0.364083 0.282558 0.071195 0.038604 0.008284 0.004467 0.393341 0.397633 0.418311 0.123369 0.067078 0.014428 0.007863