KOMPRESI DATA 1
KOMPRESI INTUITIF • Telah ada sebelum penemuan komputer • Lebih mengandalkan intuisi manusia • Contoh: – Telegram – Kode Braille – Kode Morse
• Kurang efisien • Tidak dapat bersaing dengan metode yang lebih baru
KOMPRESI INTUITIF: BRAILLE
FUNGSI KOMPRESI • Mengurangi jumlah keseluruhan jumlah bit yang digunakan dalam sebuah file, • Dapat ditransmisikan lebih cepat via internet
• Menggunakan ruang kosong yang lebih sedikit di disk • Proses berikutnya adalah ekspansi, yaitu mengembalikan file ke ukuran normal • Aplikasi: 7zip, WinRar, WinZip
CARA KERJA SEDERHANA • Sebagian besar file komputer cukup redundan (berulang) – memiliki informasi yang sama yang terdaftar secara berulang. • Program kompresi file menghilangkan redundansi. Sebuah program kompresi file mendaftarkan informasi hanya sekali, dan • kemudian mengacu kepada informasi tersebut kapan pun informasi muncul di dalam program
KOMPRESI STRING "Ask not what your country can do for you - ask what you can do for your country."
• Kutipan di atas memiliki 17 kata, yang tersusun atas: – 61 huruf
– 16 spasi – 1 tanda sambung – Satu titik
KOMPRESI STRING • "ask" muncul sebanyak dua kali • "what" muncul sebanyak dua kali • "your" muncul sebanyak dua kali
• "country" muncul sebanyak dua kali • "can" muncul sebanyak dua kali
• "do" muncul sebanyak dua kali • "for" muncul sebanyak dua kali • "you" muncul sebanyak dua kali
PEMBENTUKAN KAMUS
Kalimatnya sekarang menjadi:
HASIL KOMPRESI • Kalimat lengkap di atas (sebelum terkompresi) menggunakan 79 unit memori (1 karakter per unit memori) • Kalimat terkompresi: 37 unit • Kamus: 37 unit • Total = 74
• Tingkat kompresi = (79-74)/79 = 6.32% • Semakin banyak kata yang diproses, maka tingkat kompresinya semakin tinggi
MENCARI POLA "Ask not what your country can do for you - ask what you can do for your country."
• Program kompresi tidak memiliki konsep kata yang terpisah • Untuk mereduksi ukuran file, maka berhati-hati dalam memilih pola yang akan dimasukkan ke kamus • Kamus jauh berbeda dari contoh sebelumnya
MENCARI POLA • "ask not what your", ada pengulangan dari huruf “t” yang diikuti dengan sebuah “spasi” pada “not “ dan “what “. • Jika program kompresi menulis ke dalam dictionary, maka akan langsung menulis sebuah angka 1 setiap kali sebuah “t” diikuti dengan sebuah “spasi”. • Tetapi, melihat ukuran kalimatnya, maka kemungkinan program tidak akan melakukannya. • “ou”, yang terdapat pada “your” dan “country”. Jika kalimatnya lebih panjang, maka menuliskan pola ini ke dalam dictionary akan dapat menghemat banyak tempat. “ou” adalah sebuah kombinasi yang umum di dalam Bahasa Inggris. • Keseluruhan kata “your” dan “country” diulang, biasanya diulang secara bersamaan seperti frasa “your country”. Maka kemungkinan program akan menggantikan “ou” dengan “your country” ke dalam dictionary.
MENCARI POLA
• "can do for" juga terulang. Sebanyak satu kali, • diikuti dengan “your” dan diikuti dengan satu kali oleh “you” yang menghasilkan pola terulang " can do for you”. • Hal ini memungkinkan kita menulis 15 karakter dengan 1 angka nilai, sedangkan “your country” hanya memungkinkan menulis 13 karakter dengan 1 angka nilai. • Maka program akan melakukan overwrite terhadap entry "your country" sebagai "r country", dan kemudian
• menulis sebuah entry terpisah untuk “can do for you”. • Program terus bekerja seperti ini, mengambil semua bit informasi yang terulang, dan melakukan kalkulasi pola mana yang harus ditulis ke dalam dictionary. Jadi , anda bisa lihat bahwa cara program melakukan ini cukup rumit.
KAMUS BARU
Kalimat lebih singkat: • Kalimat = 18 unit. • Kamus = 41 unit • Total = 59
• Tingkat Kompresi = (79-59)/79 = 25.32%
KOMPRESI UTUH • Jenis kompresi yang telah kita bahas tadi disebut sebagai Kompresi Lossless • karena memungkinkan anda menciptakan ulang (re-kreasi) sesuai file aslinya. • Dasar gagasan memecah file ke dalam “bentuk” lebih kecil untuk transmisi (pengiriman) atau juga penyimpanan, • lalu kemudian menyatukannya kembali di ujung lain sehingga dapat dipergunakan lagi
KOMPRESI HILANG • Kompresi Lossy bekerja dengan cara yang sangat berbeda. Program ini menghilangkan bit yang tidak diperlukan ("unnecessary bits”) dari informasi,
• membuat ukuran file menjadi lebih kecil. • Banyak digunakan untuk mengurangi ukuran file berjenis bitmap, yang cenderung berukuran besar. • Tidak dapat membangkitkan file asli setelah dikompresi.
SUMBER David Salomon, “Data Compression The Complete Reference 4th Edition”, Chapter 3, Springer, 2004