PENGEMBANGAN MODEL COOPERATIVE WEB CACHE STUDI KASUS: JARINGAN INTERNET ITB
TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar Magister dari Institut Teknologi Bandung
Oleh
KATINI NIM : 23507017 (Program Studi Magister Informatika)
INSTITUT TEKNOLOGI BANDUNG 2009
Pengembangan Model Cooperative Web Cache Studi Kasus: Jaringan Internet ITB
Oleh
KATINI NIM : 23507017 (Program Studi Magister Informatika)
Menyetujui Tim Pembimbing Tanggal 26 Juni 2009
Pembimbing
Dr. Ir. Husni S. Sastramihardja NIP. 130 675 823
ii
ABSTRAK Pengembangan Model Cooperative Web Cache Studi Kasus: Jaringan Internet ITB
OLEH:
KATINI NIM: 23507017 (Program Studi Magister Informatika) Institut Teknologi Bandung (ITB) memiliki visi untuk menuju universitas riset. Oleh karena itu, ITB harus menyediakan fasilitas riset yang memadai, yang salah satunya adalah fasilitas akses internet. Salah satu strategi bisnis ITB dalam menyediakan fasilitas riset adalah dengan memaksimalkan penggunaan sarana teknologi informasi yang sudah ada. Penurunan menjadi strategi teknologi informasi diterapkan dengan menghemat penggunaan bandwith melalui penggunaan teknologi web cache. Cache yang bekerja sama dengan cache yang lain dapat membentuk sebuah cooperative web cache. Permasalahannya adalah belum diketahuinya secara pasti berapakah jumlah total trafik HTTP yang dihasilkan oleh penerapan cooperative web cache di ITB. Apakah terjadi pengurangan trafik internet jika dibandingkan dengan tidak menggunakan cooperative web cache. Berapakah penghematan yang berhasil dilakukan. Bagaimana meningkatkan kinerja dari cooperative web cache. Untuk memahami penerapan cooperative web cache di ITB, maka dilakukan proses identifikasi kebutuhan ITB menuju universitas riset, identifikasi penerapan cooperative web cache saat ini di ITB, dan analisa kuantitatif terhadap kinerja cooperative web cache di ITB. Karena kompleksitas komunikasi yang terjadi pada cooperative web cache, maka untuk mengevaluasi kinerja cooperative web cache tidak cukup dihitung dengan menggunakan hit rate saja. Oleh karena itu, pada penelitian ini, kinerja cooperative web cache dievaluasi dengan menggunakan metode biaya komunikasi Packet Hop (PH) yang menghitung biaya komunikasi berdasarkan probabilitas terjadinya komunikasi, jumlah paket yang dikirimkan dalam sekali pengambilan data dan jarak dari web cache ke server. Penghitungan PH ini dapat memberikan gambaran menyeluruh mengenai biaya komunikasi dengan memperhitungkan hit rate sebagai salah satu komponennya. Berdasarkan evaluasi yang dilakukan dalam penelitian ini, web cache memiliki kekurangan pada mekanisme pencarian objek yang ada pada sibling web cache. Web cache harus mengirimkan pesan Internet Cache Protocol (ICP) ke seluruh sibling web cache setiap kali ingin mencari keberadaan sebuah objek di sibling web cache. Untuk itu, pada penelitian ini diusulkan untuk lebih meningkatkan lagi iii
peran koordinator pada sistem cooperative web cache. Koordinator difungsikan sebagai penyimpan informasi keberadaan objek, sehingga web cache cukup bertanya pada koordinator untuk mengetahui lokasi objek pada sibling web cache. Untuk menjaga validitas informasi lokasi objek di koordinator, diperkenalkan mekanisme komitmen yang menyatakan lama periode penyimpanan yang disanggupi web cache. Dengan komitmen ini diharapkan false hit tidak terjadi. Hasil evaluasi penerapan cooperative web cache di ITB menjadi kebutuhan dari pengembangan model modified cooperative web cache. Untuk mengembangkan model modified cooperative web cache dilakukan dengan melakukan identifikasi aktor dan peran pada modified cooperative web cache, identifikasi artifak yang terlibat dalam proses cooperative, dan identifikasi siklus hidup. Dari hasil identifikasi tersebut dikembangkan model modified cooperative web cache. Model modified cooperative web cache kemudian dianalisa secara kuantitatif untuk mengetahui nilai kinerjanya dibandingkan dengan model cooperative web cache. Penelitian ini menghasilkan model modified cooperative web cache yang memiliki keunggulan jangkauan penyimpanan objek yang lebih luas. Jangkauan penyimpanan objek ini dihitung berdasarkan batas biaya komunikasi optimal. Jangkauan penyimpanan objek memberikan manfaat potensial terjadinya sibling hit yang disebabkan oleh peningkatan kemampuan web cache dalam menyimpan objek web. Jangkauan penyimpanan objek juga menyatakan kemampuan sistem cooperative web cache dalam mengakomodasi objek web dengan biaya komunikasi yang lebih murah sehingga dapat menghemat bandwith. Oleh karena itu, model modified cooperative web cache dapat dijadikan sebagai alternatif strategi teknologi informasi ITB dalam mencapai visinya menuju universitas riset. Kata kunci: cooperative web cache, web cache, universitas riset, strategi teknologi informasi, modified cooperative web cache, koodinator.
iv
ABSTRACT Development of Cooperative Web Cache Model Case Study: ITB Internet Network
Oleh:
KATINI NIM : 23507017 (Program Studi Magister Informatika) Institut Teknologi Bandung (ITB) has a vision towards research university. Therefore, ITB should provide adequate research facilities, which one of them is internet access. One of ITB business strategy to provide research facility is maximizing the use of information technology facilities that already exist. The derivation to information technology strategy is using web cache technology to save the bandwidth. Web cache that works with the other web cache can form a cooperative web cache. The problem is we don’t know exactly how many HTTP trafic generated by cooperative web cache in ITB. Did the internet trafic really reduce. How many bandwidth can be saved. How to improve the performance of cooperative web cache. To understand the application of cooperative web cache in ITB, we identify the needs towards research university, identify the implementation of cooperative web cache at this time in ITB, and do quantitative analysis to know the performance of cooperative web cache in ITB. Because of the complexity of communication happened in cooperative web cache, the performance of cooperative web cache can not be evaluated using the hit rate only. Thus, in this research, cooperative web cache performance is evaluated using Packet Hop (PH) cost communication method that calculate the communication cost of cooperative web cache based on the probability of data communication, the number of packets being sent in a communication and distance from the web cache to the server. PH can describe the communication cost used by cooperative process by taking hit rate into account as one of its components. Based on the evaluation conducted in this research, web cache has a weakness in the search object mechanism on the sibling web cache. Web cache must send an ICP message to all the sibling web cache every time it wants to search the existence of an objects in the sibling web cache. Therefore, in this research we proposed to increase the role of coordinator in the cooperative system. Coordinator stores the information of the object location, so the web cache can ask the coordinator to search the object location of the sibling web cache. To maintain the validity of the object location information, we introduced the v
commitment mechanism that state the period of storage agreed by the web cache. By this commitment, false hit is never expeected to be happened. The evaluation result of the implementation of cooperative web cache in ITB becomes the needs of modified cooperative web cache model development. To develop a modified cooperative web cache model, we identify the actors and roles involved in the modified cooperative web cache, identify artifact used in the cooperative process, and identify life cycle happened in modified cooperative web cache. By the identification results, modified cooperative web cache model was developed. Then the modified cooperative web cache model was analyzed to determine the quantitative value of the model performance compared to cooperative web cache performance. This research develop modified cooperative web cache mode that has a wide range of object storage. The range of the object storage is calculated based on the optimal communication cost limit. The range of the object storage provide potential benefit of sibling hit caused by enhancement of web cache ability to save the web object. The range of the object storage also state the ability of cooperative web cache system to accomodate web object with a cheaper of cost communication, so can save the bandwidth. Therefore, the modified cooperative web cache model can be used as an alternative of the information technology strategy in ITB towards research university vision. Keywords: cooperative web cache, web cache, research university, information technology strategy, modified cooperative web cache, coordinator.
vi
PEDOMAN PENGGUNAAN TESIS
Tesis S2 yang tidak dipublikasikan terdaftar dan tersedia di Perpustakaan Institut Teknologi Bandung, dan terbuka untuk umum dengan ketentuan bahwa hak cipta ada pada pengarang dengan mengikuti aturan HaKI yang berlaku di Institut Teknologi Bandung. Referensi kepustakaan diperkenankan dicatat, tetapi pengutipan atau peringkasan hanya dapat dilakukan seizin pengarang dan harus disertai dengan kebiasaan ilmiah untuk menyebutkan sumbernya. Memperbanyak atau menerbitkan sebagian atau seluruh tesis haruslah seizin Dekan Sekolah Pascasarjana, Institut Teknologi Bandung.
vii
UCAPAN TERIMA KASIH
Puji syukur kehadirat Allah SWT atas rahmat dan karunia-Nya sehingga proses tesis ini dapat terselesaikan dengan baik. Penulis ingin mengucapkan terima kasih kepada: 1. Dr. Ir. Husni S. Sastramihardja selaku pembimbing yang dengan ikhlas bersedia meluangkan waktu, tenaga, pikiran, dan perhatian dalam memberikan bimbingan dan arahan sehingga proses thesis dapat dilalui dengan baik. 2. Dra. Harlili, M.Sc., Dra. Christine Suryadi, M.T., dan Ir. Adi Mulyanto, M.T. selaku penguji pada saat proposal, pra sidang, dan sidang tesis ini. Terima kasih atas saran dan perbaikan yang diberikan. 3. Bapak Basuki Suhardiman atas bantuan, fasilitas, dan dorongan selama pengerjaan tesis. 4. Rekan-rekan di CNRG yang banyak memberikan bantuan teknis selama pengerjaan tesis. 5. Orang tua, Mertua, dan Suami tercinta atas dukungan yang diberikan selama pengerjaan tesis. Semoga tesis ini dapat bermanfaat bagi penulis dan pembaca buku tesis. Bandung, 26 Juni 2009
Penulis
viii
DAFTAR ISI
Abstrak .................................................................................................................. iii Abstract .................................................................................................................. v Pedoman Penggunaan Tesis ............................................................................... vii Ucapan Terima Kasih ........................................................................................ viii Daftar Isi ............................................................................................................... ix Daftar Lampiran ................................................................................................ xiii Daftar Gambar ................................................................................................... xiv Daftar Tabel........................................................................................................ xvi BAB I Pendahuluan .............................................................................................. 1 I.1
Latar Belakang ........................................................................................... 1
I.2
Rumusan Masalah ...................................................................................... 3
I.3
Tujuan ........................................................................................................ 4
I.4
Batasan Masalah ........................................................................................ 4
I.5
Kegunaan Hasil .......................................................................................... 4
I.6
Metodologi ................................................................................................. 4
I.7
Sistematika Pembahasan ............................................................................ 6
BAB II Dasar teori ................................................................................................ 7 II.1 WWW (World Wide Web) ......................................................................... 7 II.1.1 TCP, Router, dan Packet Loss ............................................................ 7 ix
II.1.2 Protokol HTTP .................................................................................... 7 II.1.3 Jalur Internet ....................................................................................... 8 II.2 Web Cache ................................................................................................. 9 II.2.1 Motivasi dan Tujuan ......................................................................... 10 II.2.2 Operasi Dasar Web Cache................................................................. 10 II.2.3 Fungsi Dasar Web Cache .................................................................. 12 II.2.4 Penghitungan Kinerja ........................................................................ 12 II.3 Cooperative.............................................................................................. 13 II.4 Cooperative Web Cache .......................................................................... 13 II.4.1 Hirarki Web Cache............................................................................ 13 II.4.2 Lingkup Cooperative Web Cache ..................................................... 14 II.4.3 Tujuan Cooperative Web Cache ....................................................... 15 II.4.4 Protokol Komunikasi ICP ................................................................. 16 II.5 Squid ........................................................................................................ 17 II.6 Universitas Riset ...................................................................................... 19 II.6.1 Karakteristik Universitas Riset ......................................................... 19 II.6.2 Tujuan Terwujudnya ITB sebagai Universitas Riset ........................ 20 II.7 Strategi ..................................................................................................... 20 II.8 Metode Eksperimen ................................................................................. 22 BAB III Analisa ................................................................................................... 24 III.1
Lingkup dan Tujuan Analisa ................................................................ 24 x
III.2
Identifikasi Kebutuhan Universitas Riset ............................................. 25
III.2.1
Strategi Bisnis ................................................................................ 25
III.2.2
Strategi Sistem Informasi .............................................................. 25
III.2.3
Strategi Teknologi Informasi ......................................................... 28
III.3
Identifikasi Penerapan Cooperative Web Cache ITB Saat Ini ............. 30
III.3.1
Web Cache ITB ............................................................................. 31
III.3.2
Hirarki Web Cache ITB ................................................................. 31
III.3.3
Model Web Cache.......................................................................... 34
III.3.4
Model Cooperative Web Cache ..................................................... 37
III.4
Analisa dan Evaluasi ............................................................................ 40
III.4.1
Fungsi Dasar Cooperative Web Cache .......................................... 40
III.4.2
Artifak Proses Cooperative............................................................ 45
III.4.3
Penghitungan Kinerja Cooperative Web Cache ............................ 46
III.4.4
Analisa Kuantitatif Penerapan Cooperative Web Cache di ITB.... 47
BAB IV Pemodelan Modified Cooperative Web Cache .................................... 61 IV.1
Metode Pemodelan Modified Cooperative Web Cache........................ 61
IV.2
Identifikasi Kebutuhan ......................................................................... 61
IV.3
Identifikasi Aktor dan Peran................................................................. 62
IV.4
Identifikasi Artifak ............................................................................... 64
IV.5
Identifikasi Siklus Hidup ...................................................................... 65
IV.6
Model Modified Cooperative Web Cache ............................................ 69 xi
IV.7
Analisa Kuantitatif................................................................................ 70
IV.7.1
Kasus Modified Cooperative Web Cache ...................................... 72
IV.8
Kontribusi Penelitian terhadap Indikator Capaian Strategi Bisnis ....... 75
IV.9
Kesimpulan Analisa Kuantitatif Model Modified Cooperative Web
Cache .............................................................................................................. 77 BAB V Kesimpulan dan Saran .......................................................................... 80 V.1 Kesimpulan .............................................................................................. 80 V.2 Saran ........................................................................................................ 81 Daftar Pustaka..................................................................................................... 83
xii
DAFTAR LAMPIRAN
Lampiran A Contoh Scripts pada Cooperative Web Cache ............................. 85 Lampiran B Hasil Pengamatan ......................................................................... 86 B.1 Data pengamatan request yang menghasilkan local hit dan local miss ...... 86 B.2 Data pengamatan total ukuran objek per status local hit dan local miss .... 87 B.3 Data pengamatan request yang menghasilkan sibling hit dan sibling miss 88 B.4 Data pengamatan ukuran objek per status sibling hit dan sibling miss ....... 89 B.5 Data ukuran pesan ICP ................................................................................ 90 B.6 Data jumlah paket ....................................................................................... 91 B.7 Data jumlah Hop ......................................................................................... 92 B.8 Data hasil perhitungan rumus (9) ................................................................ 94 B.9 Data hasil perhitungan rumus (14) .............................................................. 95
xiii
DAFTAR GAMBAR
Gambar II-1 Layer komunikasi jaringan antara web server dengan web client (browser). ................................................................................................................ 8 Gambar II-2 Jalur koneksi dari salah satu client di ITB menuju web server www.mit.edu ........................................................................................................... 9 Gambar II-3 Operasi dasar web cache .................................................................. 11 Gambar II-4. Hirarki web cache............................................................................ 14 Gambar II-5. Hierarchical Web Cache dan Cooperative Web Cache .................. 15 Gambar II-6. Penggunaan protokol ICP ............................................................... 16 Gambar II-7. Fungsi Squid.................................................................................... 19 Gambar II-8. Hubungan antara strategi bisnis, strategi sistem informasi, dan strategi teknologi informasi................................................................................... 21 Gambar III-1. Skema analisa................................................................................. 24 Gambar III-2. Hirarki web cache ITB ................................................................... 33 Gambar III-3. Pembentukan model ....................................................................... 34 Gambar III-4. Siklus hidup web cache.................................................................. 36 Gambar III-5. Model web cache ITB saat ini. ...................................................... 37 Gambar III-6. Siklus hidup cooperative web cache ITB ...................................... 39 Gambar III-7. Model cooperative web cache ITB saat ini.................................... 40 Gambar III-8. Ilustrasi proses validasi response dengan menggunakan refresh_pattern ...................................................................................................... 44
xiv
Gambar III-9. Skenario komunikasi dari client ke server. .................................... 49 Gambar III-10. Skenario cooperative web cache.................................................. 50 Gambar III-11. Batas impas biaya komunikasi ( PH ).......................................... 58 Gambar IV-1. Metode pembentukan model modified cooperative web cache ..... 61 Gambar IV-2 Siklus hidup modified cooperative web cache................................ 68 Gambar IV-3 Model modified cooperative web cache ......................................... 69 Gambar IV-4 Skema komunikasi model modified cooperative web cache .......... 70 Gambar IV-5. Titik optimal PH dari model modified cooperative web cache ..... 75
xv
DAFTAR TABEL
Tabel III-1. Hirarki web cache ITB....................................................................... 32 Tabel III-2. Aktor dan peran dalam web cache ..................................................... 35 Tabel III-3. Aktor dan peran pada cooperative web cache ................................... 38 Tabel III-4. String penanda uncachable pada URL .............................................. 42 Tabel III-5. Response code yang cachable ........................................................... 42 Tabel III-6. Cache control yang cachable ............................................................ 43 Tabel III-7. Data ukuran objek web per status ...................................................... 54 Tabel III-8. Rata-rata request, ukuran objek, dan jumlah paket ........................... 54 Tabel IV-1. Aktor dan peran pada modified cooperative web cache .................... 63 Tabel IV-2. Jumlah mahasiswa ITB per Desember 2008 ..................................... 77 Tabel IV-3. Perbandingan kinerja cooperative web cache dan modified cooperative web cache .......................................................................................... 78 Tabel A-1. Scripts pada cooperative web cache ................................................... 85 Tabel B-1. Data local hit dan local miss ............................................................... 86 Tabel B-2 Data total ukuran objek per status local hit dan local miss.................. 87 Tabel B-3. Data sibling hit dan sibling miss ......................................................... 88 Tabel B-4. Data total ukuran objek per status local hit dan local miss................. 89 Tabel B-5. Data ukuran rata-rata pesan ICP ......................................................... 90 Tabel B-6. Data jumlah paket per ukuran objek web............................................ 91
xvi
Tabel B-7. Data jumlah paket per pesan ICP ........................................................ 91 Tabel B-8. Jumlah hop dari web cache ke sibling web cache............................... 92 Tabel B-9. Jumlah hop dari web cache ke parent web cache ............................... 92 Tabel B-10. Jumlah hop dari web cache ke web server ........................................ 93 Tabel B-11. Data hasil perhitungan rumus (9). ..................................................... 94 Tabel B-12. Data hasil perhitungan rumus (14) .................................................... 95
xvii