BAB II DASAR TEORI II.1 WWW (World Wide Web) II.1.1 TCP, Router, dan Packet Loss Internet merupakan jaringan komputer global yang saling berkomunikasi dengan menggunakan protokol jaringan Internet Protocol (IP). Jaringan fisik akan mentransmisi sinyal pesan antar dua titik jaringan. Router akan menentukan jalur yang digunakan untuk menghubungkan antar sender dengan receiver. Di atas protokol IP adalah TCP (Transmission Control Protocol). IP berfungsi sebagai kontrol komunikasi pada jalur antar dua titik, sedangkan TCP mengontrol komunikasi secara end to end. TCP bertanggung jawab dalam mendekomposisi pesan ke dalam paket data jaringan, menggabungkannya kembali di sisi receiver, dan memastikan pesan terkirim tanpa ada error. Congestion terjadi ketika trafik paket data yang masuk ke sebuah router lebih cepat daripada kemampuan router dalam memprosesnya, dan antrian router telah penuh. Ketika antrian router mengalami overflow, paket data akan dibuang. Router tidak akan menginformasikan ke sender ketika sebuah paket dibuang. Satu-satunya mekanisme untuk mendeteksi packet loss adalah sedikitnya jumlah acknowledgement dari receiver. Jika acknowledgment tidak diterima, TCP akan mengirim ulang paket tersebut dan memperlambat laju pengiriman paket untuk mengurangi congestion. Akibatnya, throughput koneksi akan berkurang beberapa sebagai akibat dari pembuangan paket. II.1.2 Protokol HTTP WWW merupakan gabungan antara aplikasi client dan server di internet yang saling berkomunikasi via Hyper Text Transport Protocol (HTTP). HTTP diimplementasikan
menggunakan
TCP/IP.
HTTP
menspesifikan
aturan
menginterpretasi dan menangani dokumen dan multimedia. Namun, HTTP bergantung pada TCP untuk memastikan dokumen telah ditransimisikan secara
7
lengkap dan benar. Web client menginisiasi komunikasi dengan mengirimkan HTTP request ke web server. Setelah menerima HTTP request, web server akan menjawab dengan HTTP response header. Jika request berhasil, maka web server akan mengirimkan objek yang diminta. Gambar II-1 menunjukkan hubungan antara web server, web browser, dan layer dibawahnya yaitu protokol HTTP dan TCP/IP.
Gambar II-1 Layer komunikasi jaringan antara web server dengan web client (browser). Meskipun HTTP merupakan protokol aplikasi yang dominan di internet, trafik jaringan juga berisi protokol penting lainnya seperti SMTP (Simple Mail Transfer Protocol) dan FTP (File Transfer Protocol). Trafik dari semua aplikasi tersebut, berkompetisi di router dan berinterferensi satu sama lain pada saat beban trafik besar. II.1.3 Jalur Internet Di internet, jalur antara web server dan browser biasanya terdiri atas 15-20 link [CRO]. Masing-masing link tersebut memungkinkan terjadinya packet loss. Contohnya pada gambar II-2 berikut menunjukkan link traversal antara jalur dari client di ITB ke web server resmi MIT.
8
Gambar II-2 Jalur koneksi dari salah satu client di ITB menuju web server www.mit.edu Paket data berjalan melalui gateway LAN (Local Area Network) menuju ke jaringan regional. Dari jaringan regional, paket data memasuki backbone internet. Meskipun backbone internet memiliki bandwith terbesar, pada gateway router antara jaringan regional dan backbone, dan router pada backbone, paling sering terjadi congestion dan delay terbesar. Oleh karena itu, komunikasi antar jaringan regional menjadi lebih kencang daripada komunikasi yang traversal melalui backbone internet.
II.2 Web Cache Cache diartikan sebagai tempat penyimpanan yang bersifat temporal, terletak di dekat pengguna sehingga pengguna dapat dengan cepat mengaksesnya. Teknologi caching berhasil karena pattern data menunjukkan locality of reference. Ada dua jenis locality yaitu temporal dan spasial (Wessels, 2001). Temporal berarti suatu data lebih populer dari data yang lain. Artinya dalam periode waktu tertentu, data yang populer akan lebih sering diakses. Spasial artinya request terhadap beberapa data tertentu, biasanya terjadi bersamaan dengan suatu request. Request yang menunjukkan locality of reference akan sering mengakses data yang sama atau mirip dalam interval waktu yang dekat. Locality memungkinkan caching alogrithm untuk memprediksi referensi data di masa datang, dan 9
memindahkan data tersebut ke tempat penyimpan cache yang lebih cepat, pada saat CPU sibuk. Dengan mengurangi komputasi dan transfer data, caching dapat menyembunyikan latensi akses data dan meningkatkan kinerja sistem secara keseluruhan. II.2.1 Motivasi dan Tujuan Tujuan dari web cache adalah untuk mempercepat akses pengguna ke sebuah konten web, mengurangi network load, dan mengurangi server load tujuan (Hoffman dan Beaumont, 2005). Jika obyek yang diinginkan tersimpan dalam cache, maka akses terhadap sebuah konten dapat diakselerasi sehingga mengurangi network load. Kecepatan akses dan dampak trafik jaringan yang dihasilkan web cache dipengaruhi oleh beberapa hal berikut: a. Ukuran/kapasitas cache b. Aturan cacheability c. Kecepatan koneksi jaringan pada cache d. Rata-rata transaksi maksimal cache e. Lokasi cache f. Karakteristik konten yang diakses pengguna II.2.2 Operasi Dasar Web Cache Ketika client mengirim request terhadap sebuah obyek, browser pertama kali akan mengecek ketersediaannya pada cache yang ada di mesin client. Jika cache pada browser tidak memiliki salinan dari objek yang diinginkan, browser akan mengirimkan request ke cache server dalam jaringan lokal. Jika memiliki salinan dari objek yang diinginkan, cache server mengirimkan objek tersebut ke client. Sehingga, akan mengurangi delay panjang yang disebabkan oleh pengiriman objek dari jaringan internet. Jika cache tidak memiliki salinan objek yang diinginkan, maka cache akan mengambil objek langsung dari web server aslinya, untuk kemudian disimpan ke dalam cache jika perlu. Operasi dasar tersebut dapat dilihat pada gambar II-3. 10
Setiap request yang dapat dilayani oleh web cache akan menghasilkan cache hit dan setiap request yang tidak dilayani oleh web cache akan menghasilkan cache miss.
Gambar II-3 Operasi dasar web cache
11
II.2.3 Fungsi Dasar Web Cache Web cache memiliki empat fungsi dasar yaitu (Wessels, 2001): a. Discovery, berkaitan dengan bagaimana cache menemukan lokasi objek yang diminta. b. Dissemination, berkaitan dengan bagaimana objek yang diinginkan akan dikirimkan ke web cache, dikirimkan ke client yang menginginkan objek tersebut, dan diputuskan apakah akan disimpan dalam cache atau tidak. c. Validation, merupakan metode untuk menjaga agar objek web yang ada di cache tetap up to date. d. Replacement, merupakan metode untuk memilih antara obyek yang lebih populer dan kurang populer yang dilatarbelakangi oleh keterbatasan kapasitas penyimpanan. II.2.4 Penghitungan Kinerja Berikut ini ada beberapa cara menghitung kinerja web cache (Hoffman dan Beaumont, 2005): a. Throughput (requests per second atau bytes per second), menghitung jumlah total trafik yang dapat ditangani web cache. Jika beban trafik melebihi kapasitas throughput dari cache, maka akan terjadi bottleneck di jaringan. Nilai throughput dapat dipengaruhi oleh bandwith jaringan koneksi. Semakin tinggi nilai throughput, semakin tinggi pula kinerja cache. b. Response time merupakan interval waktu dari request dikirimkan oleh client sampai client menerima response dari web cache. Jika terjadi hit, response time menggambarkan kecepatan web cache dalam mengambil dan merespon objek. Jika terjadi miss, nilai response time ditambahkan dengan waktu yang dibutuhkan web server untuk merespon request. Semakin kecil nilai response time, semakin tinggi kinerja cache.
12
c. Hit ratio, menghitung trafik yang dapat dilayani oleh web cache. Hit ratio dihitung
dengan
membandingkan
antara
jumlah
request
yang
menghasilkan hit dengan total request.
II.3 Cooperative Cooperative didefinisikan sebagai paradigma yang memanfaatkan komunikasi untuk membuat node bekerja sama. Proses komunikasi dilakukan secara terdistribusi untuk memperoleh keuntungan bersama (Liu dkk., 2009). Menurut
(Auramaki
dan
Kovalainen,
2003),
proses
cooperative
akan
menghasilkan knowledge baru, dan sharing interpretasi dan makna. Pada proses cooperative, knowledge yang lama juga digunakan, dievaluasi, dan diperbaharui. Menurut (Cabitza dkk., 2009), pada proses cooperative, dibutuhkan artifak yang dapat digunakan oleh aktor yang kompeten/koordinator untuk mengetahui apa yang telah dan apa yang sedang terjadi dalam proses cooperative. Selain itu artifak tersebut juga dapat digunakan untuk melihat konteks cooperative terkait dengan tujuan dan ekspektasi bersama. Artifak tersebut adalah: a. Templates: properti hasil dari kerja cooperative. b. Maps: spesifikasi interdependensi antar task maupun sumber daya dalam skenario cooperative. c. Scripts: spesifikasi protokol mengenai artikulasi sebuah task dan interaksi sumber daya.
II.4 Cooperative Web Cache II.4.1 Hirarki Web Cache Beberapa web cache dapat bergabung membentuk sebuah hirarki. Web cache yang terletak di level paling bawah akan meneruskan setiap cache miss ke level atasnya sampai status cache hit diperoleh atau request terkirim ke web server aslinya. Untuk menggambarkan hubungan antara dua buah web cache digunakan istilah parent, child, and sibling. Child caches merupakan cache yang terletak satu
13
level di bawah parent cache. Sibling cache merupakan sesama cache yang terletak satu level. Untuk lebih jelasnya, dapat dilihat pada gambar II-4. Pada hubungan sibling, sebuah web cache hanya boleh meminta objek yang telah disimpan oleh sibling. Sedang pada hubungan parent, web cache dapat meminta objek apapun kepada parent, baik sudah tersimpan dalam cache’s parent maupun tidak (Wessels, 2001).
Sibling Cache
Gambar II-4. Hirarki web cache II.4.2 Lingkup Cooperative Web Cache Cooperative web cache merupakan mekanisme untuk berbagi dokumen antar cache (Dykes dan Robins, 2001). Jika terjadi cache miss, proxy dapat memilih untuk mengalihkan request menuju web cache lain yang berada pada satu level yang sama, daripada menuju ke web cache lain yang berada pada level di atasnya maupun web server original. Web cache dapat mempercepat penerimaan data karena : 1. Kecepatan transfer pada jaringan lokal lebih cepat daripada kecepatan transfer pada jaringan internet. 2. Dokumen web biasanya di-request ulang oleh user yang sama maupun user yang berbeda, yang berada pada jaringan lokal yang sama.
14
Gambar II-5 menunjukkan lingkup bahasan antara hierarchical web cache dengan cooperative web cache. Hierarchical web cache terjadi jika suatu request diteruskan ke web cache lain yang berada pada satu level di atasnya. Cooperative web cache terjadi jika suatu request diteruskan ke web cache lain yang berada pada level yang sama.
Gambar II-5. Hierarchical Web Cache dan Cooperative Web Cache II.4.3 Tujuan Cooperative Web Cache Tujuan dari cooperative web cache adalah untuk meningkatkan hit rate dan mengurangi duplikasi objek antar web cache. Hit rate dapat ditingkatkan dengan asumsi bahwa setiap request yang menghasilkan cache miss di cache lokal, mungkin menghasilkan cache hit dari web cache lain yang menjadi anggota cooperative web cache. Pada web cache yang tidak tergabung dalam cooperative web cache, masingmasing web cache pasti akan berusaha untuk menyimpan seluruh objek, meskipun objek tersebut juga ada di web cache yang lain. Dengan cooperative web cache, objek cukup disimpan di salah satu web cache, dan dapat diakses oleh seluruh anggota cooperative web cache.
15
II.4.4 Protokol Komunikasi ICP Internet Cache Protocol (ICP) merupakan protokol tercepat untuk menentukan sibling web cache yang memiliki objek web tertentu (Hoffman dan Beaumont, 2005). Web cache saling mempertukarkan pesan query dan reply ICP untuk mengetahui web cache yang mana yang biasanya memiliki objek tertentu. Selanjutnya, web cache akan mengirimkan request HTTP ke sibling web cache terpilih
untuk
mengambil
objek
web
yang
diinginkan.
Protokol
ini
diimplementasikan dengan UDP untuk mempercepat proses query dan meminimalkan trafik.
Gambar II-6. Penggunaan protokol ICP Gambar II-6 mengilustrasikan bagaimana protokol ICP digunakan. Prosesnya adalah sebagai berikut: 1. Client mengirimkan request HTTP ke sebuah web cache untuk memperoleh objek tertentu. Pada kasus ini, web cache tidak memiliki objek yang diinginkan.
16
2. Web cache mengirimkan pesan ICP_OP_QUERY ke seluruh sibling web cache. 3. Setiap sibling web cache akan mengirimkan respond seperti pesan ICP_OP_HIT, pesan ICP_OP_MISS, atau pesan error. Jika ada sibling web cache yang mengirimkan pesan HIT, web cache akan mengirimkan pesan request HTTP ke sibling web cache tersebut untuk mengambil objek yang diinginkan. Sibling web cache yang dipilih adalah yang pertama kali mengirimkan pesan HIT. Response yang tercepat menunjukkan bahwa sibling web cache letaknya paling dekat, jalurnya tidak mengalami congestion, dan cache tidak overloaded. Pada contoh ini, diasumsikan bahwa tidak ada response yang mengembalikan HIT. 4. Karena objek web tidak ditemukan di sibling web cache, web cache akan mengirimkan pesan request HTTP menuju parent web cache atau web server aslinya. 5. Web server kemudian mengirimkan objek ke web cache dan kemudian menyimpannya. 6. Web cache mengirimkan objek ke client.
II.5 Squid Squid merupakan aplikasi web cache yang bersifat open source. Manfaat Squid antara lain (Wessels, 2004): a. Penghematan bandwith untuk akses internet. b. Mengurangi waktu yang dibutuhkan untuk mengakses sebuah halaman web. c. Mengamankan host pada jaringan internal dengan melewatkan setiap trafik web ke proxy. d. Mengumpulkan statistik trafik web pada jaringan. e. Mencegah pengguna mengunjungi web site yang tidak sesuai aturan tertentu. 17
f. Memastikan bahwa hanya pengguna terdaftar yang dapat melakukan koneksi ke internet. g. Meningkatkan privacy pengguna dengan menyaring informasi dari web request. h. Mengurangi beban web server. i. Konversi request terenkripsi Hyper Text Transfer Protocol Secure (HTTPS) di satu sisi, menjadi request tak terenkripsi (HTTP) di sisi yang lain. Squid berfungsi sebagai proxy dan cache. Sebagai sebuah proxy, squid menjadi media antara pada transaksi web. Squid menerima request dari client, memprosesnya, dan meneruskan request ke web server aslinya. Request dapat disimpan dalam log, ditolak, maupun dimodifikasi sebelum diteruskan. Sebagai sebuah cache, Squid menyimpan konten web yang baru saja diakses, untuk kemungkinan penggunaan ulang selanjutnya. Request selanjutnya untuk konten yang sama mungkin diambil dari cache, daripada mengambil kembali konten tersebut ke web server aslinya. Gambar II-6 menunjukkan posisi Squid yang berada di antara client dan server. Squid menerima request baik HTTP maupun HTTPS dari client, dan berkomunikasi dengan beberapa protokol server yaitu server HTTP, FTP, dan Gopher. Secara konsep, Squid memiliki dua sisi, yaitu sisi client yang berkomunikasi dengan web client seperti browser, dan sisi server yang berkomunikasi dengan web server. Server tersebut disebut sebagai web server aslinya karena merupakan lokasi asli atas data yang diminta.
18
Gambar II-7. Fungsi Squid
II.6 Universitas Riset II.6.1 Karakteristik Universitas Riset Menurut (The Boyer Commission on Educating Undergraduates in the Research University, 1998), universitas riset memiliki karakteristik sebagai berikut: a. Mempunya komitmen untuk menciptakan pengetahuan baru. b. Kemampuan penelitian digunakan sebagai dasar pengangkatan dan promosi anggota fakultas. c. Jumlah mahasiswa pasca
sarjana jauh lebih banyak daripada jumlah
mahasiswa tingkat sarjana. d. Memiliki lingkungan penelitian yang mendukung, yaitu perpustakaan yang lengkap, laboratorium yang memadai, komputer yang canggih, dan memiliki penerbit kampus. e. Berorientasi internasional dengan menarik mahasiswa pasca sarjana dari berbagai belahan dunia, sehingga terbentuk komunitas yang memiliki keragaman dimensi, heterogen, multikultural, dan multietnik. f. Mendukung kesenian, dengan menyediakan fasilitas seni yang memadai.
19
II.6.2 Tujuan Terwujudnya ITB sebagai Universitas Riset Berdasarkan (Institut Teknologi Bandung, 2009), tujuan dari terwujudnya ITB sebagai Universitas Riset Research University) adalah a. Meningkatkan peran ITB dalam memecahkan masalah strategis nasional, regional dan global melalui riset dalam bidang IPTEKS. b. Mewujudkan ITB sebagai Universitas Riset berkelas dunia. c. Menciptakan kesempatan yang lebih luas kepada setiap individu di ITB untuk melakukan penelitian yang berdampak terhadap masyarakat dan bangsa dalam bidang ekonomi, sosial, dan politik. d. Menciptakan suasana penelitian dan pengembangan yang makin kondusif dan kreatif sehingga memperoleh hasil yang optimum. e. Mendorong penelitian dan pengembangan dalam bentuk penelitian dasar (long term), terapan, dan bersifat multi disiplin. f. Mendorong pemaduan penelitian dan pengembangan dengan pendidikan dan pengabdian masyarakat diantaranya mendiseminasikan hasil penelitian berupa publikasi dan penyuluhan.
II.7 Strategi Strategi merupakan sekumpulan aksi yang
menawarkan
keuntungan
jangka
panjang bagi stakeholder organisasi (Ward dkk., 2004). Strategi harus mengidentifikasi posisi organisasi saat ini dan posisi organisasi yang diinginkan di masa datang, sehingga dapat menentukan cara terbaik untuk mencapai posisi yang diinginkan. Ada 3 macam strategi pada organisasi (Ward dan Peppard, 2002), yaitu a. Strategi bisnis Strategi bisnis merupakan keputusan bisnis yang ditetapkan oleh organisasi mengenai sasaran, arahan, dan perubahan yang akan dilakukan demi mencapai sasaran organisasi. Strategi bisnis menyatakan kemana organisasi akan menuju dan mengapa keputusan tersebut diambil.
20
b. Strategi sistem informasi Strategi sistem informasi menyatakan informasi dan sistem yang dibutuhkan
organisasi
untuk
mendukung
strategi
bisnis
secara
keseluruhan. c. Strategi teknologi informasi Strategi teknologi informasi menyatakan bagaimana kebutuhan organisasi akan informasi dan sistem dapat didukung oleh teknologi.
Gambar II-8. Hubungan antara strategi bisnis, strategi sistem informasi, dan strategi teknologi informasi. Gambar II-8 menyatakan hubungan antara strategi bisnis, strategi sistem informasi, dan strategi teknologi informasi. Strategi sistem informasi diturunkan dari strategi bisnis, sehingga strategi sistem informasi yang ditetapkan dapat mendukung strategi bisnis. Strategi sistem informasi menyatakan kebutuhan dan 21
prioritas informasi dan sistem yang dibutuhkan untuk mendukung strategi bisnis. Strategi teknologi informasi harus memenuhi kebutuhan strategi sistem informasi melalui dukungan infrastruktur dan layanan.
II.8 Metode Eksperimen Eksperimen dilakukan untuk menemukan sesuatu terkait dengan proses atau sistem tertentu. Eksperimen dapat definisikan sebagai pengujian terhadap sebuah sistem dengan merubah variabel input dari sebuah proses atau sistem sehingga alasan terhadap perubahan output dapat diobservasi dan dan diidentifikasi. Untuk melakukan eksperimen, (Montgomery, 1997) memberikan petunjuk sebagai berikut: a. Identifikasi dan pernyataan masalah. Tujuannya adalah untuk mendapatkan pernyataan atas masalah yang beralasan. Pernyataan atas masalah tersebut berguna untuk membangun ide terkait dengan sasaran eksperimen. Selain itu, pernyataan atas masalah yang gamblang dapat memberikan pemahaman atas fenomena dan solusi akhir atas permasalahan. b. Pembatasan lingkup. Faktor-faktor yang akan dipertimbangkan dalam eksperimen, nilai batas atas dan batas bawah atas faktor dan level spesifik atas eksperimen yang akan dilakukan. Selain itu, harus dijelaskan bagaimana faktor-faktor tersebut dapat dikontrol pada nilai yang diinginkan dan bagaimana cara mengukurnya. c. Pemilihan variabel yang akan diamati. Variabel yang akan diamati harus dipastikan memberikan informasi yang berguna atas proses yang akan dipelajari. Pada umumnya, rata-rata maupun standard deviasi atas karateristik yang diukur, akan menjadi variabel yang harus diamati. d. Pemilihan design experiment. Tahap ini meliputi jumlah eksperimen yang akan dilakukan, pemilihan urutan eksperimen, dan menentukan apakah ada batasan yang akan diterapkan. 22
e. Menjalankan eksperimen. f. Analisa statistik terhadap data. Metode statistik harus digunakan untuk menganalisa data sehingga hasil dan kesimpulannya bersifat objektif dan bukan merupakan anggapan. g. Kesimpulan dan rekomendasi. Setelah data dianalaisis, kesimpulan atas hasil dan rekomendasi harus dibuat.
23