PEMODELAN TRAFIK GSM DI AREA SURABAYA MENGGUNAKAN METODE ARIMA Fadil Rahman Hakim, Dr. Ir. Achmad Mauludiyanto, MT. Program Studi Telekomunikasi Multimedia – Jurusan Teknik Elektro Fakultas Teknologi Industri Institut Teknologi Sepuluh Nopember - ITS Surabaya Email:
[email protected] Abstrak–Dalam tugas akhir ini akan dilakukan pemodelan dan prediksi trafik menggunakan metode ARIMA. Penelitian ini akan dipelajari dengan menggunakan data trafik voice GSM (Global System for Mobile communication) di area Surabaya yang meliputi daerah perumahan, industri dan pusat belanja. Data tersebut merupakan trafik busy hour selama bulan Januari 2011. Identifikasi model dilakukan dengan menganalisa kestasioneran data trafik, baik dalam mean maupun varian. Kestasioneran data dalam varian dicek dengan cek lambda Box-Cox. Sedangkan kestsioneran data dalam mean dicek dengan cek ACF maupun PACF. Setelah estimasi model didapatkan, dilakukan uji normalisasi residual kormogorov smirnov. Hasil Penelitian menunjukkan bahwa 96,77% pemodelan ARIMA di area perumahan dapat didekati dengan ARIMA 1 0 0 dan sisanya 3,23% adalah model ARIMA 2 0 0. Sedangkan pada area industri diperoleh pendekatan model ARIMA 1 0 0 sebesar 96,77% dan ARIMA 0 1 1 sebesar 3,23%. Hasil yang berbeda tampak pada area pusat belanja dengan prosentase model yang bervariasi, tetapi untuk prosentase tebesarnya adalah model ARIMA 1 1 0 sebesar 32,26%. Proses validasi pemodelan ARIMA dilakukan dengan membandingkan data pengukuran dengan data hasil pembangkitan model. Untuk melihat pergeseran real dan perubahan pola antara nilai data hasil pembangkitan dengan data asli pengukuran bisa dilihat berdasarkan grafik series model. Dan untuk melihat pola distribusi data dapat menggunakan grafik ECDF (Empirical Comulative Distribution Function). Dimana ECDF menampilkan data hasil evaluasi sesuai distribusi prosentase kemunculan data. Kata Kunci ARIMA, Trafik GSM 1. PENDAHULUAN LOBAL system for mobile communication atau lebih dikenal dengan GSM merupakan salah satu sistem komunikasi jarak jauh dengan sistem wireless dan merupakan ssebuah standart global untuk komunikasi bergerak digital. Spektrum frekuensinya terdiri dari dua sub-band yang masing-masing sebesar 25 MHz. Trafik dapat diartikan sebagai pemakaian. Dimana pemakaian tersebut diukur dalam rentang waktu tertentu (berapa lama, kapan). Pada sistem
G
trafik telekomunikasi pemakaian dapat berupa pertukaran informasi data speech maupun paket data. Data trafik GSM adalah data runtun waktu yang berbentuk musiman, yakni cenderung mengulangi pola gerak dalam periode musiman, adanya korelasi beruntun yang kuat pada jarak semusim yaitu waktu yang berkaitan dengan banyak observasi per periode musim. Asumsi yang penting yang harus dipenuhi dalam memodelkan runtun waktu adalah asumsi kestasioneran. Apabila asumsi stasioner belum dipenuhi maka deret belum dapat dimodelkan. Namun, deret yang nonstasioner dapat ditransformasikan menjadi deret yang stasioner. 2. PEMILIHAN MODEL ARIMA ARIMA (Autoregresive Integrated Moving Average) adalah model statistik yang digunakan untuk melakukan analisa sifat-sifat dari data runtun waktu terhadap data-data yang telah lalu, sehingga didapatkan suatu persamaan model yang menggambarkan hubungan dari data runtun waktu tersebut. Dalam melakukan pendekatan model menggunakan ARIMA, proses pemilihan model dilakukan dengan mengamati distribusi dari koefisien autokorelasi (ACF) dan koefisien parsial autokorelasi (PACF). Stasioneritas merupakan istilah yang sangat penting dalam analisis time series, khususnya pada pemodelan ARIMA. Suatu deret pengamatan atau data yang diperoleh dikatakan stasioner jika proses tidak berubah seiring perubahan waktu. Dimana rata-rata deret pengamatan disepanjang waktu selalu konstan. Jika data belum stasioner terhadap varians maka perlu dilakukan transformasi, dimana salah satu transformasi yang dapat digunakan adalah transformasi Box-Cox. Namun bila data belum stasioner terhadap mean, maka dilakukan proses difference. Untuk mendapatkan validasi model maka terlebih dahulu kita melakukan proses transformasi boxcox untuk menentukan nilai dari tiap data pembangkitan apakah telah stationer ataukah belum. Apabila data tersebut belum stationer maka diperlukan transformasi λ. Transformasi tergantung dari nilai λ yang di tentukan: 0,maka Zt = ln Zt λ (lambda) 0,5 maka Zt = Zt0,5 - 0,5 maka Zt = 1/ Zt0,5 1 maka tidak perlu transformasi 1
Tabel 1. Differencing
Data trafik voice GSM
Trafik
Pembeda 1
Diff 1
10,27
*
*
6,21
10,27
-4,06
4,37
6,21
-1,84
2,57
4,37
-1,8
1,56
2,57
-1,01
4,01
1,56
2,45
7,49
4,01
3,48
10,85
7,49
3,36
16,17
10,85
5,32
16,02
16,17
-0,15
16,11
16,02
0,09
Apakah Stasioner dalam varians Cek dengan Box-Cox λ=1
Tidak
Transformasi : λ = 0 --> Ln [Zt] λ = 0.5 --> Zt0.5 λ = -0.5 --> 1/Zt0.5
Ya
Tidak
Apakah Stasioner dalam mean Cek ACF & PACF
Differencing
Ya
Identifikasi ACF & PACF
Dugaan ARIMA
Proses difference merupakan suatu proses untuk membuat data agar stasioner terhadap mean. Dimana prinsip dari metode ini yaitu dengan mecari selisih dari satu periode data terhadap data berikutnya. Sampai diperoleh data baru hasil differencing yang stasioner terhadap mean. ACF atau fungsi korelasi adalah suatu regresi dimana menunjukkan hubungan antara dua variasi data, sehingga pada akhirnya dapat digunakan untuk menggambarkan apa yang terjadi pada satu variabel bila terjadi perubahan pada variabel yang lain. Koefisien autokorelasi parsial mengukur tingkat keeratan hubungan antara Xt dengan Xt-k. Sedangkan Pengaruh dari timelag 1,2,3.... dan seterusnya sampai k-1 dianggap konstan. Dengan kata lain fungsi autokorelasi parsial mengukur derajat hubungan antara nilai sekarang dengan nilai sebelumnya (untuk timelag tertentu). 3. METODOLOGI Setelah data trafik terkumpul dari proses pengambilan di servo analytica, maka selanjutnya adalah melakukan pemodelan ARIMA. Gambar 1a merupakan diagram alir dari pemodelan ARIMA, sedangkan gambar 1b adalah untuk menentukan model yang terbaik dengan nilai MSE terkecil. Dimana kedua proses tersebut didekati dengan menggunakan software Minitab. Minitab ini merupakan sistem software yang didisain khusus untuk pengolahan statistik data. Minitab dapat memberikan kemudahan bagi siapapun yang akan mengolah data sesuai dengan yang dibutuhkan. Data yang diolah tersebebut dapat ditampilkan berdasarkan predefine selected dari sebuah menu untuk menghasilkan model berupa teks maupun grafik.
Gambar 1a. Diagram Alir Pemodelan ARIMA [7] Dugaan ARIMA
Estimasi Parameter : delta & phi Cek p-value < 0.05
Tidak
Ya
Tidak
Diagnosa *Uji Ljung-Box : White noise residual p-value > 0.05
Ya Diagnosa **Uji normalisasi residual kolmogorov Smirnov p-value > 0.05
Gambar 1b. Diagram Alir Penentuan Model ARIMA Identifikasi model dilakukan dengan menganalisa kestasioneran data trafik, baik dalam mean maupun varians. Kestasioneran data dalam varians dicek dengan cek lambda Box-Cox. Sedangkan kestsioneran data dalam mean dicek dengan cek ACF maupun PACF. Dan setelah estimasi model didapatkan, dilakukan uji normalisasi residual kormogorov smirnov.
2
Tabel 2. Identifikasi ACF dan PACF
Gambar 2. Grafik time series data trafik pertanggal 1 Jan 2011 area pusat belanja
Gambar 3. Box-cox sebelum transformasi dengan lamda 0.00
Gambar 4. Box-cox setelah transformasi dengan lamda 1.00 Pada gambar 2 ditunjukkan satu event data trafik pertanggal 1 januari 2011 pada area pusat belanja. Berdasarkan gambar 2 terlihat ada peningkatan trafik mulai jam 10 pagi dan trafik kembali turun setelah jam 11 malam. Selanjutnya untuk mengetahui apakah data trafik tersebut stasioner dalam varian maka pengecekan nilai lamda sangat berpengaruh dalam melakukan pendekatan ARIMA model. Hasil tes box-cox dari data trafik pada gambar 3 menunjukkan bahwa nilai lamda 0 (nol). Hal ini berarti bahwa data belum stasioner terhadap varian. Maka sesuai dengan langkah transformasi maka data Zt harus di ln Zt terlebih dahulu sampai hasil dari lamda sama dengan 1 sehingga tidak perlu ditransformasi lagi. Untuk memastikan bahwa nilai lamda setelah ditransformasi sudah bernilai 1, maka perlu dicek lagi box-cox seperti gambar 4.
Model
ACF
MA (q) : moving average of order q AR (p) : autoregressive of order p ARMA (p,q) : Mixed autoregressive-moving average of order (p,q) AR (p) or MA (q) No order AR or MA (white noise or random process)
Cuts off after lag q
Dies down
PACF
Dies down
Cuts of after lag p
Dies down
Dies down
Cuts of after lag q No spike
Cuts of after lag p No spike
Gambar 5. PACF cut off setelah lag 1
Gambar 6. ACF dies down Tahap selanjutnya adalah menguji apakah Zt telah stasioner terhadap mean dengan melihat polt Autocorrelation Function (ACF) dan Partial Autocorrelation Function (PACF). Dimana arti stasioner adalah apabila suatu data runtut waktu memiliki rata-rata dan memiliki kecenderungan bergerak menuju rata-rata. Berdasarkan diagram alir model ARIMA, check ACF dan PACF diperlukan dalam menentukan pendekatan model dugaan ARIMA. Dari tabel 2 pembacaan ACF dan PACF ini terdiri dari dua macam, yaitu: • Cuts off ACF dan PACF dikatakan cuts off apabila digambar terhadap sumbu waktu akan stasioner pada lags yang cukup kecil. Gambar 5 merupakan contoh dari ACF atau PACF dengan nilai cuts off pada lag pertama (lag 1).
3
•
Dies Down Apabila plot ACF atau PACF mencapai nilai stasioner pada lags yang cukup besar (>5) atau bisa dikatakan turun lambat, maka kondisi ini dikatakan mengalami dies down. Gambar 6 merupakan contoh dies down.
Dari data yang sudah stasioner terhadap varian yaitu diperoleh setelah transformasi sampai lamda bernilai 1. Kemudian grafik plot PACF pada gambar 5 menunjukkan Zt telah stasioner dengan cut off pada lag 1. Dimana nilai lag pada gambar PACF mewakili untuk dugaan ARIMA dengan nilai AR sama dengan 1 sehingga diperoleh dugaan ARIMA 1 0 0. Sedangkan untuk mengetahui nilai MA pada ARIMA maka menggunakan lag pada grafik ACF. Seperti gambar 6 menunjukkan Zt telah stasioner dengan dies down pada lag 1. Ini berarti nilai MA sama dengan 1, sehingga didapat dugaan ARIMA 0 0 1. Dari hasil grafik plot ACF dan PACF tersebut menunjukkan data tidak perlu proses differencing karena data sudah stasioner terhadap mean. Dalam menentukan dugaan ARIMA dimungkinkan terdapat dua atau lebih pemodelan dalam satu event dimana p-value harus memenuhi sesuai dengan syarat, maka dipilih MSE terkecil sebagai model yang mendekati. Dari contoh ACF dan PACF pada gambar diatas maka ada dua dugaan model ARIMA yaitu untuk AR 1 maka dugaan ARIMA 1 0 0, dan untuk MA 1 maka dugaan ARIMA 0 1 1. Dari hasil estimasi ARIMA 1 0 0 pada gambar 7 dapat dilihat untuk p-value delta phi memenuhi syarat yaitu kurang dari 0,05 dan p-value Ljung box juga memenuhi syarat yaitu lebih dari 0,05. Jadi pemodelan data event ini hasilnya adalah ARIMA 1 0 0 dengan koefisien 0,9744 dan MS 0,26106. Sedangkan untuk hasil estimasi ARIMA 0 0 1 sesuai gambar 8 tidak dapat dijadikan sebagai model ARIMA karena nilai p-value Ljung box tidak memenuhi syarat yaitu lebih dari 0,05. Dari hasil dugaan ARIMA, juga terdapat data residual dimana merupakan nilai kesalahan yang muncul akibat pemodelan. Data residual ini yang digunakan untuk uji normalitas dengan metode Kolmogorov-Smirnov. Dimana residual dikatakan memenuhi uji normalitas apabila p-value > 0,05. Namun bila ternyata nilai p-value kurang dari 0,05 dugaan ARIMA masih tetap bisa dipakai tetapi terdapat distribusi probabilitas data yang agak jauh terhadap garis normal probabilitas. Dari hasil grafik pada gambar 9 terlihat nilai pvalue lebih dari 0,05. Hal ini berarti bahwa residual white noise sudah mengikuti distribusi garis normal.
Gambar 7. Hasil dugaan ARIMA 1 0 0
Gambar 8. Hasil dugaan ARIMA 0 0 1
Gambar 9. Probabilitas kolmogorov-smirnov 4. HASIL PEMODELAN ARIMA Untuk dapat mencapai tujuan penelitian ini, yaitu mendapatkan model terbaik untuk memodelkan data trafik di Surabaya, maka sesuai dengan metode dan langkah-langkah pemodelan ARIMA diperoleh hasil pemodelan ARIMA dari masing masing area. Dimana sesuai tabel 2 hasil rekapitulasi pemodelan ARIMA area perumahan terdapat 2 model yaitu ARIMA 1 0 0 dan ARIMA 2 0 0. Yaitu untuk ARIMA 1 0 0 meliputi 30 event kecuali tanggal 29 Januari 2011 merupakan ARIMA 2 0 0. Sedangkan pada tabel 3 hasil rekapitulasi pemodelan ARIMA area industri juga terdapat 2 model yaitu ARIMA 1 0 0 dan ARIMA 0 1 1. Yaitu untuk ARIMA 1 0 0 meliputi 30 event yaitu kecuali tanggal 10 Januari 2011 merupakan ARIMA 0 1 1. Berbeda dengan area perumahan dan industri dimana area pusat belanja sesuai hasil rekapitutasi ARIMA menunjukkan lebih banyak variasi model ARIMA. Model terbanyak yaitu ARIMA 1 1 0 meliputi 10 event, kemudian untuk ARIMA 1 0 0 dan ARIMA 0 1 1 masing masing sebanyak 8 event. 4
Sisanya 2 event yaitu ARIMA 2 0 0 dan 3 event tidak memenuhi syarat pemodelan ARIMA. Tabel 2. Hasil rekapitulasi model ARIMA area perumahan No 1 2
ARIMA 100 200
Event 01-28; 30-31
29-Jan-11
Total 30 1
Percent 96,77% 3,23%
Tabel 3. Hasil rekapitulasi model ARIMA area industri
Gambar 10. Grafik series data pengukuran Vs Data Pembangkitan
Tabel 4. Hasil rekapitulasi model ARIMA area pusat belanja
5. PEMBANGKITAN DATA PEMODELAN Dari hasil pemodelan ARIMA setiap event perlu dilakukan proses validasi dengan membandingkan data hasil pembangkitan dengan data asli pengukuran. Dalam proses pembangkitan data ini dilakukan dengan 3 metode pendekatan sekaligus untuk melihat variasi hasilnya. Ketiga metode tersebut adalah: 1. Metode estimasi Merupakan nilai prediksi yang diperoleh dasri hasil fitting pada storage ARIMA. Setiap nilai fit akan mendekati nilai data asal pada saat proses ARIMA. Sebagai catatan apabila pada saat proses ARIMA data asal sudah mengalami perubahan baik distasionerkan ataupun proses differencing, maka nilai fit harus diinvers terhadap data asli sehingga pendekatan nilainya tetep sesuai dengan data asli pengukuran. Untuk melakukan invers diperoleh dengan persaaman yaitu:
Yt X t ' X t 1 Dimana: Y(t) adalah data hasil bangkitan model X(t)’ adalah nilai fits pembangkitan model X(t-1) adalah data awal yang digunakan sebelum proses differencing 2.
Metode formulasi residu Perhitungan nilai perkiraan data menggunakan pendekatan nilai residu. Nilai residu itu sendiri didapatkan dari selisih nilai data asli terhadap nilai fit ARIMA. Sedangkan untuk memperoleh data hasil pembangkitan model maka diperoleh dengan persamaan yaitu:
Gambar 11. Grafik ECDF Data pengukuran Vs pembangkitan ARIMA
Z t 1Z t 1 ... p Z t p at atau
Z t at 1at 1 ... q at q
Dimana: Zt = nilai variabel dependent pada waktu t a t = Residual pada waktu t p = Nilai koefisien dari AR (p)
q
= Nilai koefisien dari MA(q)
δ = konstanta Metode distribusi normal Nilai dari distribusi normal ini dibangkitkan secara acak berdasarkan nilai mean dan standar deviation hasil tes probabilitas kolmogorovsmirnov. Dimana mean adalah nilai rata rata dari data yang diproses, sedangkan standart deviation adalah suatu sample yang memberikan ukuran penyebaran data. Sebagai ciri dari pembangkitan normal ini setiap nilai yang dibangkitkan antara satu dengan yang lain tidak memiliki hubungan pola keterkaitan data. Sehingga pola dari nilai distribusi normal akan berbeda dengan nilai data asli pengukuran. Untuk nilai yang hasilnya negatif maka untuk penyesuaian data trafik maka di buat nol dengan asumsi tidak ada trafik. Dari hasil pembakitan data berdasarkan 3 metode diatas, untuk melihat pergeseran real dan perubahan pola antara nilai data hasil pembangkitan dengan data asli pengukuran bisa dilihat berdasarkan gambar 10 grafik series model. Dan untuk melihat pola distribusi data dapat menggunakan grafik ECDF (Empirical Comulative Distribution Function) pada gambar 11. 5 3.
[5] 6. KESIMPULAN Dari masing-masing data trafik GSM setiap area tersebut kemudian dimodelkan dengan metode ARIMA yang kemudian direkapitulasi untuk mengetahui kecenderungan model. Dari hasil rekapitulasi menunjukkan bahwa area perumahan dan industri mempunyai kecenderungan model yang sama yaitu ARIMA 1 0 0, sedangkan untuk area pusat belanja hasil model yang diperoleh lebih bervariasi dan yang paling dominan adalah ARIMA 1 1 0 (32,26%), ARIMA 1 0 0 (25,81%) dan ARIMA 0 1 1 (25,81%). Hasil pemodelan membuktikan bahwa trafik GSM dapat didekati dengan metode ARIMA, dimana dari 93 data trafik perhari yang dimodelkan hanya terdapat 3 data trafik perhari (3,23%) yang tidak memenuhi syarat pemodelan ARIMA. Dari ketiga metode pembangkitan data menunjukkan bahwa metode residu hasinya paling mendekati data aslinya baik secara pola maupun distribusi data dengan nilai mean dan StDev yang tidak berbeda jauh. 7. DAFTAR PUSTAKA [1] Shu, Yantai. Wireless Traffic Modeling and Prediction Using Seasonal ARIMA Models. Institute of Electronics, Information and Communication Engineers, vol.E-88B, No-10, 2005 [2] Ir. Suwadi, MT., “Rekayasa Trafik Telekomuikasi”, Handout Kuliah Sentral Jaringan Telepon dan Rekayasa Trafik, ITSSurabaya, 2009 [3] GSM System, “Manual Description”, Ericsson,1998 [4] Kartika Senja, Fritha., Udiyarsa, Dedhi., “Service Quality Assurance Telkomsel”, Laporan Kerja Praktek, ITS-Surabaya, 2004
[6] [7]
[8]
[9]
Wei, William W.S.,”Time Series AnalysisUnivariate and Multivariate Methods”, Second Edition, Addison-Wesley Publishing Company, USA, 2006 Minitab Statistical Software, “Tutorial and Guide Minitab”, Minitab,2004 A. Mauludiyanto., G. Hendrantoro., M. H. Purnomo., Suhartono., “Pemodelan ARIMA dan Deteksi Outlier Data Curah Hujan Sebagai Evaluasi Sistem Radio”. Juti (Jurnal ilmiah Teknologi Informasi), vol.7-Nomor 3, Januari 2009 A.Mauludiyanto, G.Hendrantoro, M.H.Purnomo, T.Ramadhany. “Pemodelan ARIMA untuk Redaman Hujan pada Lintasan Radio Terestrial 28 GHz di Surabaya”. Jurnal Penelitian Telekomunikasi, vol. 14-Nomor 2, Desember 2009 Halim, Siana., “Diktat-Time Series Analysis”, Handout Kuliah Teknik Peramalan, UK. PetraSurabaya, 2006
RIWAYAT PENULIS Fadil Rahman Hakim, lahir di kota Kediri, 29 Nopember 1985. Menyelesaikan pendidikan di SDN Putih Kab. Kediri, kemudian meneruskan pendidikan di SLTPN 02 Gampengrejo Kab. Kediri dan SMUN 1 Ponorogo. Selanjutnya pada tahun 2004 meneruskan pendidikan Diploma-III di Politeknik Negeri Malang (POLINEMA), lulus pada tahun 2007. Diterima di Jurusan Teknik Elektro FTI-ITS pada bulan Juli 2009 melalui Program Lintas Jalur, mengambil Bidang Studi Telekomunikasi Multimedia.
6