BAB 2 LANDAS AN TEORI
Pada bab ini, penulis akan membahas mengenai teori yang digunakan dalam penyusunan skripsi seperti Content Based Image Retrieval (CBIR), Latent Semantic Indexing (LSI). Sebelum penulis membahas CBIR dan LSI, terlebih dahulu penulis menjelaskan beberapa definisi dasar mengenai citra dan pengolahan citra.
2.1
Citra 2.1.1 Definisi Adapun beberapa definisi citra sebagai berikut: •
M enurut Pearson (1991), citra adalah representasi dua dimensi dari dunia visual, menyangkut berbagai macam disiplin ilmu yang mencakup seni, human vision, astronomi, teknik, dan sebagainya. M erupakan suatu kumpulan piksel-piksel atau titik-titik yang berwarna yang berbentuk dua dimensi.
•
M enurut M ichael C. Fairhust (1994), suatu fungsi 2 dimensi, dimana harga-harga fungsi tersebut f(x,y) pada koordinat spasial (x,y) di bidang x dan
y
mendefinisikan suatu ukuran intensitas cahaya atau
kecermerlangan titik tersebut.
7
8
•
M enurut Foley, James D (1996), citra adalah array dari nilai-nilai dimana sebuah
nilai tersebut adalah
sekumpulan
angka yang
mendeskripsikan atribut dari piksel di dalamnya. •
M enurut Wolfram Research, Inc (2002), citra adalah sinyal diskrit 2 dimensi. Secara matematis, sinyal ini dapat direpresentasikan sebagai fungsi dari variable-variable 2 dimensi. Setiap elemen dari array tersebut disebut piksel.
Citra sebagai keluaran dari suatu sistem perekaman data dapat bersifat sebagai berikut : 1. Optik berupa foto, 2. Analog berupa sinyal video contohnya gambar pada monitor televisi, 3. Digital yang dapat langsung disimpan pada suatu pita magnetik.
Terdapat dua macam citra, yaitu: •
Citra diam M erupakan citra tunggal yang tidak bergerak tetap, biasa disebut citra.
•
Citra bergerak (moving images) M erupakan rangkaian citra diam yang ditampilkan secara beruntun (sekuensial) sehingga memberikan kesan pada mata kita sebagai gambar yang bergerak. Setiap citra di dalam rangkaian tersebut disebut frame.
9
2.1.2 Citra Digital Citra digital secara umum didefinisikan sebagai pemrosesan citra dua dimensi dengan komputer. Dalam definisi yang lebih luas, pengolahan citra digital juga mencakup semua data dua dimensi. Citra digital adalah barisan bilangan nyata maupun kompleks yang diwakili oleh bit – bit tertentu. Unit terkecil dari data digital adalah bit, yaitu angka biner, 0 atau 1. Kumpulan dari data sejumlah 8 bit data adalah sebuah unit data yang disebut byte, dengan nilai dari 0 – 255. Dalam hal citra digital, nilai level energi dituliskan dalam satuan byte. Kumpulan byte ini dengan struktur tertentu bisa dibaca oleh software dan disebut citra digital 8 bit. Citra digital dapat didefinisikan sebagai fungsi dua variabel f(x,y), dimana x dan y adalah koordinat spasial dan nilai f(x,y) adalah intensitas citra pada koordinat tersebut, hal tersebut diilustrasikan pada gambar 2.1. Teknologi dasar untuk menciptakan dan menampilkan warna pada citra digital berdasarkan penelitian bahwa sebuah warna merupakan kombinasi dari tiga warna dasar, yaitu merah, hijau, dan biru (Red, Green, Blue - RGB).
10
Gambar 2.1 Letak koordinat x1,y1, pada sebuah citra Tiga tipe citra: 1. Citra grayscale (tingkat keabuan) 2. Citra berwarna (color) 3. Citra rumit/komplek (complex)
2.1.3 Citra Grayscale Suatu citra dikatakan sebagai citra grayscale apabila sebuah citra tidak memiliki warna RGB atau dapat dikatakan sebuah citra yang memiliki nilai dari putih yang memiliki intensitas paling besar sampai hitam yang memiliki intensitas paling rendah seperti yang dapat dilihat pada gambar 2.2. Citra grayscale terdiri dari x dan y dalam spasial koordinat dan memiliki nilai intensitasnya masingmasing. Pada citra grayscale setiap gambar memiliki intensitas antara 0 (hitam) hingga 255 (putih) dalam citra 8 bitnya.
11
Gambar 2.2 Intensitas grayscale
254 252 255 205 198 97 87 23
255 252 205 181 200 213 100 35
255 114 101 122 215 115 184 65
254 7 199 234 245 217 142 43
211 211
67
43
.. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. .. ..
33 180 65 123 245 221 233 33
41 100 61 143 253 224 211 121
44 128 57 98 252 243 215 211
254 121 213
Gambar 2.3 Citra grayscale yang diubah menjadi nilai matriks
12
Dengan algoritma perhitungan tingkat keabuan, piksel dari suatu citra yang mengandung warna-warna RGB (Red, Green, Blue) diubah menjadi warna dalam berbagai tingkat keabuan (I) dengan menjumlahkan nilau warna merah, hijau, dan biru kemudian dibagi tiga sehingga didapatkan nilai rata-rata dari ketiga warna.
3 Gambar 2.4 Rumus grayscale berdasarkan RGB
2.1.4 Citra Berwarna Citra berwarna merupakan citra yang ditampilkan dengan menggunakan Red Green Blue (RGB) atau Hue Saturation Intensity (HSI) model. Intensitas (intensity) merupakan tingkat kecerahan (lightness) dan ketajaman (brightness) dari warna yang dipilih. Hitam asli (pure black) diangka 0 dan putih walaupun hue ataupun saturation telah diatur. Saturation merupakan tingkat dari kemurnian dari sebuah hue atau berkurangnya warna putih. Intensitas atau value merupakan sebuah pengukuran dari sejumlah cahaya yang direfleksikan dari hue. Hue merupakan dominan dari wavelength.
13
Gambar 2.5 RGB dan perpaduan warnanya
Gambar 2.6 Roda HS I
14
Gambar 2.7 RGB
Gambar 2.8 Perbedaan HS V
Gambar 2.9 Perbedaan saturation dan value
15
2.1.5 Citra Kompleks (complex) Citra kompleks disimpan dalam 64 bit floating point yang terdiri dari 32 bit real (asli) dan 32 bit imaginary parts (bagian khayalan). Citra kompleks mengandung informasi frekuensi yang menampilkan sebuah citra grayscale dan sangat bermanfaat untuk diterapkan pada proses domain frekuensi ke citra data. 2.1.6 Histogram Salah satu cara untuk memperbaiki suatu citra digital adalah dengan mengatur level dari brightness dan contrast-nya. Variasi sebuah brightness akan digambarkan pada suatu citra dengan menggunakan histogram tersebut dan dimanipulasi dengan merubah histogram citra tersebut. Histogram akan menempatkan beberapa piksel dengan brightness level mereka yang sesuai. Untuk piksel dengan ukuran level brightness sebesar 8 bit, maka brightness akan memiliki grey level yang berkisar antara 0 (hitam) sampai 255 (putih). Sehingga histogram yang memiliki nilai brightness yang lebih kecil akan terlihat lebih gelap dibandingkan dengan yang memiliki nilai lebih besar. Histogram yang memiliki grey level dibawah 120 memiliki tingkat kegelapan yang lebih gelap, dimana warna gelap tersebut seperti ditunjukan gambar 2.10 yang dimiliki oleh ban mobil dan bagian bawah mobil, serta bayangan mobil yang memiliki warna cenderung hitam. Disini juga terlihat bahw a apabila suatu gambar memiliki warna yang cenderung gelap maka secara keseluruhan histogram akan berkonsentrasi ke arah kiri (hitam).
16
Gambar 2.10 Ban mobil dan histogramnya dengan grey level < 120
Gambar 2.11 Ban mobil dan histogramnya setelah dinaikkan nilai brightness nya Dengan penaikkan nilai brightness seperti yang ditunjukan gambar 2.11, histogram cenderung merata dan agak sedikit terkonsentrasi ke arah kanan (putih).
2.2
Karakteristik Citra 2.2.1 Piksel (Pixel) Piksel (pixel) atau picture element, dan kadang-kadang disebut juga dengan “pel” merupakan satuan terkecil dari sebuah citra digital. Pada citra digital, jika
17
dilihat dengan teliti, maka terdapat banyak titik kecil berbentuk segi empat yang membentuk citra, titik kecil tersebut disebut piksel. Beberapa definisi piksel menurut para ahli: •
Oliver (1996) Piksel merupakan titik yang merupakan penyusun dari citra yang ditampilkan komputer.
•
M ichael C. Fairhust (1995) Piksel merupakan titik terkecil yang telah didigitkan secara spasial dan terdiri dari N x N sample yang terdistribusi secara sama.
•
J.R Parker (1994) Piksel merupakan bagian array 2 dimensi dari suatu raster image. Setiap piksel mempresentasikan warna atau tingkat keabuan dan terletak pada posisi vertikal dan horizontal, atau yang lebih dikenal dengan baris dan kolom.
•
M urni (1992) Piksel merupakan bagian terkecil dari gambar yang mengandung informasi.
•
Adrian Low (1991) Piksel dianggap sebagai bagian terkecil dari citra. Dapat berupa logika maupun fisik. Dengan kata lain, dapat berupa lokasi elemen dari suatu citra atau menampilkan salah satu dari tingkat keabuan.
18
Jumlah piksel per-satuan panjang menentukan resolusi citra tersebut. M akin banyak piksel yang mewakili sebuah citra, maka makin tinggi resolusinya dan makin halus citra digital tersebut. piksel
Gambar 2.12 Piksel
Gambar 2.13 Citra 180x240
Gambar 2.14 Citra 100x133
Perbandingan citra 180 x 240 piksel dengan citra 100 x 133 piksel, tampak kelihatan lebih jelas jika dengan citra 180 x 240 piksel dibandingkan dengan citra 100 x 133.
19
2.2.2 Kontras (Contrast) Kontras adalah perbedaan brightness relative antara sebuah benda dengan sekelilingnya pada citra. Sebuah bentuk tertentu mudah terdeteksi apabila pada sebuah citra kontras antara bentuk tersebut dengan background tinggi. Teknik pengolahan citra bisa dipakai untuk mempertajam kontras. Citra dapat dimanipulasi menggunakan algoritma (persamaan matematik). 2.2.3 Resolusi Resolusi dari sebuah citra adalah karakteristik yang menunjukkan level kedetailan yang dimiliki oleh sebuah citra. Resolusi diwakili oleh sebuah piksel sebagai elemen terkecil dari sebuah citra. Resolusi merupakan hal penting yang perlu dipertimbangkan dalam rangka pemilihan citra yang akan digunakan terutama dalam hal aplikasi, waktu, biaya, ketersediaan citra, dan fasilitas komputasi. Semakin tinggi tingkat resolusi suatu citra, berarti semakin banyak jumlah piksel yang digunakan dalam citra tersebut, sehingga citra yang dihasilkan menjadi lebih bersih dan halus.
2.3
Matriks (Matrix) M atriks adalah suatu kumpulan angka-angka atau elemen-elemen yang disusun
menurut baris dan kolom, dimana jumlah baris dan kolom bisa sama maupun berbeda, dimana panjang dan lebarnya ditunjukkan oleh banyaknya kolom-kolom dan baris-baris.
20
M atriks dalam suatu citra, menunjuk kepada ukuran pikselnya. Contohnya, jika suatu citra grayscale memiliki ukuran 1024 x 768 piksel, maka jika diubah ke dalam data matriks, maka akan berukuran matriks 1024 x 768.
Gambar 2.15 Matriks
2.4
Pengolahan Citra Digital (Digital Image Processing) Image Processing merupakan bentuk dari signal processing, yang dimana
inputnya berupa citra (image), seperti foto atau video, dan output dari image processing tersebut berupa karakteristik atau parameter yang berhubungan dengan citra tersebut. Pengertian pengolahan citra yang lain adalah pemrosesan citra, khususnya dengan menggunakan komputer menjadi citra yang kualitasnya lebih baik. Hasil output dari pengolahan citra tidaklah harus berupa citra, tetapi dapat berupa bagian dari citra tersebut. Umumnya, operasi-operasi pada pengolahan citra diterapkan pada citra bila : 1.
Perbaikan atau memodifikasi citra perlu dilakukan untuk meningkatkan kualitas penampakan atau untuk menonjolkan beberapa aspek informasi yang terkandung di dalam citra,
2.
Elemen di dalam citra perlu dikelompokkan, dicocokkan, atau diukur,
21
3.
Sebagian citra perlu digabung dengan bagian citra yang lain
Secara umum, operasi pengolahan citra dapat diklasifikasikan dalam beberapa jenis sebagai berikut: 1.
Perbaikan kualitas citra (image enhancement). Jenis operasi ini bertujuan untuk memperbaiki kualitas citra dengan cara memanipulasi parameter-parameter citra. Dengan operasi ini, ciri-ciri khusus yang terdapat di dalam citra lebih ditonjolkan. Contoh-contoh operasi perbaikan citra:
2.
•
Perbaikan kontras gelap/terang
•
Perbaikan tepian objek (edge enhancement)
•
Penajaman (sharpening)
•
Pemberian warna semu (pseudocoloring)
•
Penapisan derau (noise filtering)
Pemugaran citra (image restoration). Operasi ini bertujuan menghilangkan atau meminimalkan cacat pada citra. Tujuan pemugaran citra hampir sama dengan operasi perbaikan citra. Bedanya, pada pemugaran citra penyebab degradasi gambar diketahui. Contoh-contoh operasi pemugaran citra:
3.
•
Penghilangan kesamaran (deblurring).
•
Penghilangan derau (noise)
Pemampatan citra (image compression). Jenis operasi ini dilakukan agar citra dapat direpresentasikan dalam bentuk yang lebih kompak sehingga memerlukan memori yang lebih sedikit. Hal
22
penting yang harus diperhatikan dalam pemampatan adalah citra yang telah dimampatkan harus tetap mempunyai kualitas gambar yang bagus. Contoh metode pemampatan citra adalah metode JPEG. 4.
Segmentasi citra (image segmentation). Jenis operasi ini bertujuan untuk memecah suatu citra ke dalam beberapa segmen dengan suatu kriteria tertentu. Jenis operasi ini berkaitan erat dengan pengenalan pola.
5.
Penganalisa citra (image analysis) Jenis operasi ini bertujuan menghitung besaran kuantitif dari citra untuk menghasilkan deskripsinya. Teknik ini mengekstraksi ciri-ciri tertentu yang membantu dalam identifikasi objek. Proses segmentasi kadangkala diperlukan untuk melokalisasi objek yang diinginkan dari sekelilingnya. Contoh-contoh operasi analisa citra:
6.
•
Pendeteksian tepi objek (edge detection)
•
Ekstraksi batas (boundary)
•
Representasi daerah (region)
Rekonstruksi citra (image reconstruction) Jenis operasi ini bertujuan untuk membentuk ulang objek dari beberapa citra hasil proyeksi. Operasi rekonstruksi citra banyak digunakan dalam bidang medis. M isalnya beberapa foto rontgen dengan sinar X digunakan untuk membentuk ulang gambar organ tubuh.
23
Beberapa macam proses dalam image processsing: •
Eucladean Geometry Transformation, meliputi pembesaran citra, pengurangan citra, dan rotasi citra.
•
Color Corrections, meliputi pengaturan kontras, dan kecerahan citra (contras dan brightness), Quantization (Color translation ke pallet warna yang lain).
•
Digital Compositing, meliputi penggabungan antara 2 gambar atau lebih. Proses ini biasa digunakan dalam proses pembuatan film untuk membuat “M attes”.
•
Interpolation dengan menggunakan Bayer Filter Pattern, Bayer Filter Pattern digunakan untuk menyusun ulang presentasi komposisi pewarnaan RGB (Red Green Blue). M etode Bayer Filter Pattern ditemukan oleh Dr.Bryce E.Bayer, sekarang ini metode Bayer Filter banyak digunakan di teknologi single chip digital image censors pada kamera digital, camcorder, dan scanner.
•
Image Registrasition,
meliputi kesesuaian antara dua gambar atau
lebih. •
Image Differencing, meliputi morphing yaitu efek khusus dalam film dan animasi yang berubah (morphs) satu gambar ke lainnya melalui transisi yang halus.
•
Image Recognition, misalnya mengambil teks dari gambar dengan menggunakan optical character recognition.
24
•
Image Segmentation, mengacu pada proses partisi gambar digital menjadi beberapa segmen (bagian dari pixels) (Juga dikenal sebagai superpixels).
•
High Dynamic Range Imaging, dengan menggunakan teknik penggabungan dua atau beberapa gambar.
•
Geometric Hashing, digunakan untuk pengenalan objek atau gambar dua dimensi (dimensi x dan y) yang mewakili affine invariance.
Image processing biasanya mengarah kepada digital image processing. Digital image processing adalah penggunaan dari algoritma komputer (computer algorithm) untuk melakukan image processing yang lebih rumit (complex) pada citra digital (digital image), dengan demikian dapat menyajikan kinerja yang lebih canggih dengan tugas yang sederhana (simple task). Digital image processing, khususnya, merupakan satusatunya praktek teknologi untuk classification, feature extraction, pattern recognition, projection, multi scale signal analysis. 2.4.1 Classification (S tatistical Classification) M erupakan suatu prosedur pembelajaran mesin yang di mana setiap item akan ditempatkan dalam kelompok – kelompok berdasarkan informasi kuantitatif pada satu atau lebih karakteristik yang melekat pada item seperti ciri-ciri, variabel, karakter, dan didasarkan pada serangkaian pelatihan sebelumnya. 2.4.2
Feature Extraction M elibatkan sejumlah sumber daya yang diperlukan untuk menjelaskan
sebuah set data besar secara akurat. Ketika melakukan analisis terhadap data yang kompleks, salah satu masalah utama yang berasal dari jumlah variabel yang terlibat
25
analisis dengan sejumlah besar variabel biasanya membutuhkan sejumlah memori yang besar dan daya komputasi atau algoritma klasifikasi yang overfits. Feature extraction merupakan istilah umum untuk membangun metode kombinasi dari variabel-variabel sekelilingnya. M asalah saat ini masih menggambarkan data dengan akurasi yang memadai 2.4.3 Pattern Recognition M erupakan “tindakan mengambil data mentah dan mengambil tindakan berdasarkan kategori pola”. Tujuannya adalah untuk mengelompokan data pola yang didasarkan pada apriori baik pengetahuan atau informasi statistik diambil dari pola-pola.
Pola harus
diklasifikasikan
kelompok
pengukuran
atau
pengamatan, menentukan titik dalam ruang multidimensi yang tepat. 2.4.4 Multiscale Signal Analysis (Signal Processing) M erupakan suatu spesialisasi dalam teknik elektro yang mempelajari dan mengembangkan metode algoritma, manipulasi, analisa dan interpretasi sinyal. Sinyal dapat berarti suara, citra, waktu berbagai nilai dan sensor data, misalnya data biologis seperti elektrokardiogram, sistem kontrol sinyal.
2.5
Kecerdasan Buatan (Artificial Intelligence) 2.5.1 Definisi Kecerdasan Buatan Kecerdasan buatan (Artificial Intelligence), atau disebut juga dengan intelegensia semu, merupakan kecerdasan atau pengetahuan dari suatu mesin dan merupakan cabang dari ilmu komputer (computer science), yang bertujuan untuk menciptakan kecerdasan mesin. Kecerdasan buatan merupakan ilmu yang
26
membahas mengenai perancangan mesin supaya mesin dapat menemukan solusi untuk menyelesaikan masalah yang kompleks (rumit) dalam kehidupan manusia sehari – hari. Beberapa definisi kecerdasan buatan, diantaranya: •
Charniak dan mcdermot (1984) Kecerdasan buatan adalah kemampuan berpikir melalui modelmodel dan perhitungan atau komputasi.
•
H.A. Simon (1987) Kecerdasan buatan merupakan kawasan penelitian, aplikasi dan instruksi yang terkait dengan pemrograman komputer untuk melakukan sesuatu hal yang dalam pandangan manusia adalah cerdas.
•
Levine et al (1990) Kecerdasan buatan adalah suatu cara membuat komputer dapat berpikir secara pintar.
•
Rich and Knight [1991]: Kecerdasan
buatan
merupakan
studi tentang bagaimana
membuat komputer melakukan hal-hal yang pada saat ini dapat dilakukan lebih baik oleh manusia. •
Turban (1992)
27
Kecerdasan buatan adalah bagian dari ilmu komputer yang ditujukan untuk membuat software dan hardware menghasilkan sesuatu seperti yang dihasilkan seperti yang dihasilkan manusia. •
Encyclopedia Britannica Kecerdasaan buatan merupakan cabang dari ilmu komputer yang dalam merepresentasi pengetahuan lebih banyak menggunakan bentuk simbol-simbol daripada bilangan, dan memproses informasi berdasarkan metode heuristic atau dengan berdasarkan sejumlah aturan.
Tujuan dari kecerdasan buatan menurut Winston dan Prendergast, yaitu: 1.
M embuat mesin menjadi lebih pintar, (tujuan utama)
2.
M emahami apa itu kecerdasaan, (tujuan ilmiah)
3.
M embuat mesin lebih bermanfaat.(tujuan entrepreneurial)
M enurut Stuart Russell dan Peter Norvig, definisi artificial intelligence dapat dibagi menjadi : •
Sistem berpikir seperti manusia
•
Sistem bertingkah seperti manusia
•
Sistem bertingkah secara rasional
28
Gambar 2.16 Domain penelitian dalam kecerdasan buatan 2.5.2 Sejarah Artificial Intelligence Kecerdasan buatan (artificial intelligence), termasuk dalam bidang ilmu yang relative muda. Tahun 1950, para ilmuwan mulai meneliti bagaimana agar mesin dapat melakukan perkerjaan dan berpikir seperti manusia. Alan Turing, seoran g matematika dari Inggris, yang pertama kali mengusulkan adanya test untuk mengetahui apakah suatu mesin dapat dikatakan cerdas. Artificial intelligence (AI) atau disebut juga dengan kecerdasan buatan, dimunculkan oleh seorang profesor dari Massachusettes institute of technology, yang bernama John M cCarthy pada tahun 1956 pada Darthmouth Conferrence yang dihadiri oleh para peneliti AI. Adapun beberapa program AI. yang mulai dibuat pada tahun 1956 – 1966 antara lain:
29
1.
Logic Theorist, diperkenalkan pada Darthmouth Conferrence Program ini dapat membuktikan teorema-teorema matematika.
2.
S ad S am, diprogram oleh Robert K. Lindsay 1960 Program ini dapat mengetahui kalimat – kalimat sederhana yang ditulis dalam bahasa inggris, dan mampu memberikan jawaban atas fakta – fakta yang didengar dalam sebuah percakapan.
3.
ELIZA, diprogramkan oleh Joseph Weizenbaun 1967 Program ini mampu melakukan terapi terhadap pasien dengan memberikan beberapa pertanyaan.
2.5.3 Ruang Lingkup Artificial Intelligence Adapun ruang lingkup utama dalam Artificial Intelligence (kecerdasan buatan) adalah sebagai berikut : 1.
Sistem Pakar, atau disebut juga dengan Expert System Komputer
digunakan
sebagai
sarana
untuk
menyimpan
pengetahuan para pakar, dengan demikian mesin akan memiliki keahlian untuk menyelesaikan permasalahan dengan keahlian yang dimiliki oleh pakar. 2.
Pengolahan Bahasa Alami (Natural Language Processing) Dengan pengolahan bahasa alami ini, diharapkan user dapat berkomunikasi dengan mesin dengan menggunakan bahas a sehari-hari.
3.
Pengenalan Ucapan (S peech Recognition)
30
M elalui
pengenalan
ucapan,
diharapkan
manusia
dapat
berkomunikasi dengan mesin dengan menggunakan suara. 4.
Robotika system sensor (Robotic and sensory system) Sistem sensor, seperti system vision, system tactile, dan system pemrosesan sinyal jika dikombinasikan dengan AI, dapat dikategorikan kedalam suatu system yang luas yang disebut system robotic.
5.
Computer Vision M encoba untuk dapat menginterprestasikan gambar atau objek – objek tampak melalui computer.
6.
Intelligent Computer-Aided Instruction, Komputer dapat digunakan sebagai tutor yang dapat melatih dan mengajar.
7.
Permainan (Game) M enurut Sri Kusuma Dewi, games adalah fasilitas yang sangat menarik dalam komputer. Ide games pertama kali dikenalkan oleh Claude Shannon (1950) yang menuliskan paper tentang permainan catur.
Keuntungan kecerdasan buatan dibanding kecerdasan alamiah: •
Lebih permanen,
•
M emberikan kemudahan dalam duplikasi dan penyebaran,
•
Relatif lebih murah dari kecerdasan alamiah,
•
Konsisten dan teliti,
31
•
Dapat didokumentasi,
•
Dapat mengerjakan beberapa task dengan lebih cepat dan lebih baik dibandingkan dengan manusia.
Keuntungan kecerdasan alamiah dibanding kecerdasan buatan : •
Bersifat kreatif,
•
Dapat
melakukan
proses
pembelajaran
secara langsung,
sementara kecerdasan buatan harus mendapatkan masukan berupa symbol dan reperesentasi-representasi. •
Fokus yang luas sebagai referensi untuk pengambilan keputusan sebaliknya kecerdasan buatan menggunakan fokus yang sempit.
Sistem yang menggunakan kecerdasan buatan akan memberikan output berupa solusi dari suatu masalah berdasarkan kumpulan pengetahuan yang ada. Secara umum, untuk membangun suatu system yang mampu menyelesaikan masalah, perlu dipertimbangkan 4 hal yaitu : 1.
Mendefinisikan masalah dengan tepat. Pendefinisian ini mencakup spesifikasi yang tepat mengenai keadaan awal dan solusi yang diharapkan.
2.
Menganalisis masalah tersebut serta mencari beberapa teknik penyelesaian masalah yang sesuai.
3.
Merepresentasikan
pengetahuan
yang
perlu
menyelesaikan masalah tersebut. 4.
Memilih teknik penyelesaian masalah yang terbaik.
untuk
32
Sehingga untuk mendeskripsikan masalah dengan baik harus:
2.6
1.
M endefinisikan suatu keadaan ruang keadaan (state space).
2.
M enetapkan satu atau lebih keadaan awal (initial state).
3.
M enetapkan satu atau lebih tujuan (goal state).
4.
M enetapkan kumpulan aturan.
Computer Vision Pada hakikatnya, computer vision mencoba meniru cara kerja system visual
manusia (human vision). Computer Vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, klasifikasi, pengenalan (recognition), dan membuat keputusan. Computer Vision berkaitan dengan teori dibalik sistem buatan (artificial systems), yang mengekstrak informasi dari suatu citra. Proses-proses di dalam computer vision dapat dibagi menjadi tiga aktivitas: 1.
M emperoleh atau mengakuisisi citra digital.
2.
M elakukan teknik komputasi untuk memperoses atau memodifikasi data citra (operasi-operasi pengolahan citra).
3.
M enganalisis dan menginterpretasi citra dan menggunakan hasil pemrosesan
untuk tujuan tertentu, misalnya memandu
robot,
mengontrol peralatan, memantau proses manufaktur, dan lain -lain. Beberapa ahli mendefinisikan Computer Vision sebagai berikut: •
M enurut M ichael C. Fairhurst (1995)
33
Computer vision sesuai dengan sifatnya, merupakan suatu objek yang merangkul berbagai disiplin tradisional secara luas guna mendasari prinsipprinsip formalnya, dan dalam mengembangkan suatu metodologi yang berlainan dari apa yang dimilikinya, pertama-tama harus menggabungkan dan secara berurutan membangun materi yang mendasarkan ini. •
Adrian Low (1991) Computer vision berhubungan dengan perolehan gambar, pemrosesan, klasifikasi, pengenalan, dan menjadi penggabungan, pengurutan pembuatan keputusan menuju pengenalan.
•
J.R. Parker (1994) Computer vision menyangkut pengekstrakan informasi dari citra, dan dalam identifikasi dan klasifikasi objek-objek dalam citra.
Daerah atau bagian yang paling erat dengan Computer Vision itu sendiri yaitu, image processing, machine vision, dan image analysis. Image processing dan image analysis, berfokus pada pemrosesan citra 2 dimensi, bagaimana merubah suatu citra menjadi citra yang lain, seperti contrast enhancement (penambahan terang), edge extraction (penambahan garis tepi), noise removal, atau geometrical transformation seperti rotasi citra. Machine vision cenderung berfokus terhadap aplikasi terutama dalam bidan g manufaktur seperti robot otonom berbasis vision dan sistem untuk vision berdasarkan pengukuran. Ini mengimplementasi teknologi sensor citra dan teori control seringkali terintegrasi dengan pengolahan data citra untuk mengendalikan robot dan yang real time processing ditekankan dengan cara yang efisien implementasi di hardware dan software.
34
Hal ini juga menyiratkan bahwa kondisi-kondisi eksternal seperti pencahayaan dapat dan sering lebih terkontrol dalam machine vision daripada di computer vision pada umumnya.
2.7
Content Based Image Retrieval (CBIR) 2.7.1 Sejarah Istilah CBIR berasal dari tahun 1992, ketika digunakan oleh T. Kato untuk mendeskripsikan eksperimen automatic retrieval image dari sebuah databas e berdasarkan warna dan bentuk. Istilah tersebut untuk menggambarkan proses pengambilan citra yang diinginkan dari sebuah koleksi database besar berdasarkan fitur sintaksis gambar. Teknik-teknik, alat dan algoritma yang digunakan berasal dari bidang-bidang seperti statistik, pengenalan pola, pemrosesan sinyal. 2.7.2 Konsep Dasar CBIR (Content Based Image Retrieval), atau disebut juga Query by Image Content (QBIC) merupakan suatu aplikasi dari Computer Vision untuk masalah image retrieval (pengambilan citra), yaitu sebuah teknik yang menggunakan content visual dari citra tetap dalam mencari kesamaan citra dalam citra databas e yang sangat besar menurut input atau sesuai dengan keinginan pengguna (user). Content based berarti pencarian akan menganalisa isi sebenarnya dari citra. M enganalisa dalam konteks dapat berarti berupa warna, bentuk, tekstur, atau informasi lain yang terdapat dalam citra tersebut. Tanpa kemampuan dalam
35
memeriksa konten citra, pencarian harus tergantung pada metadata seperti judul dan kata kunci yang susah payah atau mahal untuk diproduksi. 2.7.3 Sistem S oftware dan Teknik Banyaknya sistem CBIR dibangun, namun masalah mengambil citra berdasarkan konten piksel sebagian besar sampai saaat ini belum terpecahkan. Teknik Query, Implementasi berbeda dari CBIR memanfaatkan berbagai jenis query user sebagai berikut : 1. Query by example Teknik query yang melibatkan sistem CBIR dengan contoh gambar yang kemudian mendasarkan pada pencarian. 2. Semantic Retrieval Sistem ideal CBIR dari perspektif pengguna akan melibatkan apa yang disebut sebagai semantic retrieval dimana pengguna melakukan permintaan seperti contoh “find pictures of dogs”. 3. M etode query lain seperti : •
browsing for example images,
•
navigating customized / hierarchical categories,
•
querying by image region,
•
querying by multiple example images,
•
querying by visual sketch,
•
querying by direct specification of image features,
•
multimodal queries.
36
Konten teknik perbandingan, metode yang digunakan untuk mengekstrak konten dari citra sehingga memudahkan untuk dibandingkan. 1. Colour,
pengambilan citra berdasarkan kesamaan warna yang ada
dengan menghitung sebuah color histogram untuk setiap citra yang ada untuk mengidentifikasikan piksel dalam nilai-nilai sebuah citra. 2. Teksture, ukuran tekstur dilihat untuk pola visual dalam citra dan bagaimana mereka terdefinisikan secara spasial. 3. Shape, bentuk tidak harus kepada bentuk citra tetapi bentuk berdasarkan citra daerah tertentu yang sedang dicari. CBIR merupakan kombinasi dari beberapa pengetahuan yang berbeda, seperti: •
pattern recognition,
•
wavelet filtering,
•
machine learning,
•
object matching,
CBIR ditujukan untuk pengertian karakteristik visual dari suatu citra tanpa penjelasan tulisan. Penelitian dan isu pembangunan di CBIR mencakup berbagai topik, banyak berbagi dengan arus utama pengolahan gambar dan pengambilan informasi. Beberapa yang paling penting adalah : •
Pemahaman citra kebutuhan pengguna dan informasi perilaku mencari.
•
Identifikasi cara-cara yang sesuai untuk menggambarkan isi citra.
37
•
M engekstraksikan fitur tersebut dari citra mentah.
•
M enyediakan penyimpanan untuk citra database yang besar.
•
M encocokkan query dan citra yang disimpan dengan sebuah cara yang mencerminkan kesamaan.
•
M engakses citra yang disimpan secara efisien berdasarkan isi.
•
M enyediakan antarmuka yang dapat digunakan manusia untuk sistem CBIR.
Contoh penerapan aplikasi CBIR: •
Pencegah kejahatan (crime prevention) Contohnya: Automatic Face Recognition.
•
Pengecekan keamanan (security check) Contohnya: Fingerprint, retina scanning
•
Diagnosis medis (medical diagnosis) Contohnya: CT-scan, M RI, Ultrasound Intellectual Property: untuk Trademark (menjaga property kepemilikan)
•
2.8
Image Search Engine (WWW-World Wide Web)
Image Retrieval Image Retrieval (Pengambilan citra) adalah suatu sistem komputer untuk
menelusuri (browsing), mencari (searching), dan pengambilan citra (image retrieval) dari suatu database yang besar pada citra-citra digital (digital images). Sebagian besar cara lama dan umum metode pada image retrieval memanfaatkan metode penambahan
38
metadata seperti captioning, keywords, atau deskripsi dari pada citra tersebut sendiri sehingga dapat disajikan dengan penjelasan kata – kata.
2.9
Latent Semantic Indexing (LS I) 2.9.1 Definisi Latent Semantic Indexing merupakan metode pengambilan (retrieval) dan indexing menggunakan teknik matematika yang disebut dengan Singular Value Decomposition (SVD). Pengambilan citra menggunakan Latent Semantic Indexing telah digunakan, yaitu dengan pengindeksan berdasarkan teks (context based) atau dengan pengindeksan berdasarkan citra (content based). 2.9.2 Penerapan LS I LSI dapat diterapkan dalam Context Based Information Retrieval dan Content Based Image Retrieval. LSI dalam Context Based Information Retrieval dapat berdasarkan penjelasan–penjelasan yang dimana ditambahkan untuk menyingkapkan citra (kata kunci (keyword), keterangan ), atau pada teks tambahan yang “sengaja” tersedia dengan sebuah citra (judul halaman, judul tambahan, dekat teks). Dari teks tersebut, pengindeksan dapat diciptakan menggunakan teknik standard pengambilan teks. Kesamaan antara citra dimana yang pada gilirannya sering didasarkan pada kesamaan penggunaan kata. M asalah yang penting dengan pendekatan Context Based Information Retrieval ini adalah perbedaan pada penggunaan kata diantara dokumen-dokumen, diantaranya:
39
•
Dokumen dapat membahas topik yang sama dengan menggunakan kata-kata berbeda (sinonim)
•
M enggunakan kata-kata yang sama yang menggambarkan konsepkonsep yang berbeda (ambiguitas)
LSI dalam Content Based Image Retrieval (CBIR) menggunakan query by example (QBE) telah menjadi terkenal beberapa tahun belakangan ini. Sistem CBIR mencoba untuk mengenal citra yang secara visual paling mirip untuk contoh citra. kesamaan didasarkan pada seperangkat citra dengan fitur-fitur tingkat rendah. Fitur yang dapat digunakan untuk pengindeksan citra yaitu warna, tekstur, bentuk dan tata ruang. Beberapa penelitian tentang fitur yang paling cocok dengan persepsi manusia telah dilakukan, misalnya penelitian yang dilakukan oleh Gargi dan Kasturi (1996) serta Liu dan Picard (1996), tetapi fitur apa yang paling cocok dengan persepsi manusia sebagian karena adanya keterlibatan subjektivitas karena mustahil bahwa fitur ada secara keseluruhan. M asalah penting dalam pengindeksan berbasis konten adalah kenyataan kesamaan visual yang tidak sesuai dengan kesamaan semantik. Oleh karena itu, bahkan jika fitur ada yang sesuai dengan visi manusia, tetap pengambilan citra tidak selalu berkaitan dengan contoh citra pada tingkat semantik. M asalah ini dikenal sebagai kesenjangan semantik (semantic gap) dan menyebabkan sistem pengambilan citra untuk mengambil citra yang agak mirip dengan fitur.
40
2.9.3 Keuntungan dan Kerugian LS I Keuntungan LS I adalah sebagai berikut : 1. True(latent)dimensions Asumsi di LSI (dan juga untuk bentuk-bentuk lain dari dimensi pengurangan seperti analisis komponen utama) adalah bahwa dimensi baru adalah lebih baik representasi dokumen dan query. M etafora yang mendasari istilah "laten" adalah bahwa dimensi-dimensi baru adalah representasi benar. Ini benar representasi kemudian tertutup oleh proses generasi yang menyatakan dimensi tertentu dengan satu set kata-kata dalam beberapa dokumen dan berbagai set kata-kata dalam dokumen lain. analisis LSI pulih asli semantik struktur ruang dan dimensi aslinya. 2. S ynonymy Sinonim mengacu pada fakta bahwa konsep dasar yang sama dapat dijelaskan menggunakan istilah yang berbeda. strategi pengambilan tradisional mengalami kesulitan menemukan dokumen pada topik yang sama yang menggunakan kosa kata yang berbeda. Dalam LSI, konsep dalam pertanyaan serta semua dokumen yang terkait dengan itu semua mungkin diwakili oleh kombinasi variable indeks. 3. Polysemy Polisemi menggambarkan kata-kata yang memiliki lebih dari satu arti, yang umum. Besar jumlah kata polysemous dalam query dapat mengurangi
ketepatan
pencarian
secara
signifikan. Dengan
menggunakan sistem di LSI, satu kesempatan untuk menghapus beberapa noisy dari data, yang dapat digambarkan sebagai penggunaan
41
langka dan kurang penting istilah tertentu. . Karena istilah vektor LSI hanya menimbang rata-rata yang berbeda makna dari istilah, ketika makna sesungguhnya berbeda dari arti rata-rata, LSI benar-benar dapat mengurangi kualitas pencarian. 4. Term Dependence M odel ruang vektor tradisional menganggap merdeka dan istilah istilah melayani sebagai dasar vektor ortogonal dari ruang vektor. Karena ada yang kuat asosiasi antara istilah dalam bahasa, asumsi ini tidak pernah puas. Sementara istilah kemerdekaan merupakan pendekatan orde pertama yang paling masuk akal, mungkin untuk mendapatkan peningkatan kinerja dengan menggunakan istilah dalam asosiasi proses pengambilan. M enambahkan frasa umum sebagai item pencarian yang sederhana penerapan pendekatan ini. Kerugian LS I adalah sebagai berikut : 1. S torage Satu juga dapat berargumentasi bahwa representasi SVD lebih kompak. Banyak dokumen yang memiliki lebih dari 150 istilah yang unik. Jadi representasi vektor jarang akan memakan ruang penyimpanan lebih dari representasi SVD kompak jika kita mengurangi sampai 150 dimensi. 2. Efficiency Salah satu kecepatan yang paling penting dalam pencarian vektor ruang berasal dari menggunakan indeks terbalik. Akibatnya, hanya dokumen yang memiliki beberapa istilah umum dengan query harus diperiksa selama pencarian. Dengan LSI, bagaimanapun pertanyaan harus
42
dibandingkan dengan setiap dokumen dalam koleksi. Namun, beberapa faktor yang dapat mengurangi atau menghilangkan kekurangan ini. Jika query memiliki jangka lebih dari perwakilannya dalam ruang vektor LSI, maka hasil kali dalam nilai kemiripan akan mengambil lebih banyak waktu untuk menghitung dalam ruang panjang. 3. LS I and normally-distributed data Keberatan lain untuk SVD adalah bahwa dengan semua metode lain, benar-benar dirancang untuk data terdistribusi normal, namun distribusi tersebut tidak cocok untuk menghitung data, dan data perhitungan yang panjang terdiri dari oleh-dokumen matriks. 2.9.4 Aplikasi LS I Beberapa aplikasi LSI yaitu •
Information retrieval
•
Relevance Feedback
•
Information Filtering
•
TREC
•
Noisy Input
2.10 Precision dan Recall Precision dapat dilihat sebagai ukuran ketepatan, sedangkan Recall merupakan ukuran dari kelengkapan. Dalam information retrieval, Precision didefinisikan sebagai jumlah dokumen yang relean diambil oleh pencarian dibagi dengan total jumlah dokumen yang diambil
43
oleh pencarian. Recall didefinisikan sebagai jumlah dokumen yang relevan diambil oleh pencarian dibagi dengan jumlah dokumen yang relevan yang ada. Precision dengan nilai sempurna 1.0 berarti bahwa setiap hasil diambil oleh pencarian relevan, sedangkan Recall dengan nilai sempurna 1.0 berarti semua dokumen yang relevan diambil oleh pencarian
2.11 Mikroorganisme 2.11.1
Definisi
M ikroorganisme atau mikroba adalah suatu organisme yang mikroskopik (berukuran terlalu kecil untuk dilihat dengan mata telanjang manusia). Studi mikroorganisme disebut mikrobiologi. M ikroorganisme hidup di semua bagian biosfer dimana terdapat cairan air, termasuk tanah, air panas, di laut lantai, tinggi di atmosfer dan jauh di dalam batubatuan di dalam bumi kerak. M ikroorganisme sangat penting untuk daur ulan g nutrisi dalam ekosistem ketika mereka bertindak sebagai dekomposer. 2.11.2
Klasifikasi dan S truktur
M ikroorganisme hampir dapat ditemukan di mana saja di taksonomi organisasi hehidupan di planet ini. Bakteri dan archaea hampir selalu mikroskopik, jumlah eukariota juga mikroskopik, termasuk protista, beberapa jamur, beberapa hewan dan tumbuhan. Virus umumnya dianggap tidak hidup dan demikian tidak mikroba, meskipun bidang mikrobiologi juga mencakup studi tentang virus.
44
2.11.3
Bakteri
Bakteri berasal dari kata Latin bacterium (jamak, bacteria), adalah kelompok raksasa dari organisme hidup. Bakteri sangatlah kecil dan kebanyakan uniselular (bersel tunggal), dengan struktur sel yang relatif sederhana tanpa nukleus/inti sel, cytoskeleton, dan organel lain seperti mitokondria dan kloroplas. Kebanyakan dari mereka kecil, biasanya hanya berukuran 0,5-5 μm, meski ada jenis dapat menjangkau 0,3 mm dalam diameter. Oleh karenanya, bakteri disebut mikroskopik karena hanya dapat dilihat melalui mikroskop. Bakteri di dunia diperkirakan sekitar 5 × 1030. Bakteri pertama ditemukan oleh Anthony van Leeuwenhoek pada 1674. Istilah bacterium diperkenalkan di kemudian hari oleh Ehrenberg pada tahun 1828, diambil dari kata Yunani βακτηριον yang memiliki arti "small stick". Berdasarkan bentuknya, bakteri dibagi menjadi tiga golongan besar, yaitu: •
Kokus (Coccus) dalah bakteri yang berbentuk bulat seperti bola, dan mempunyai beberapa variasi sebagai berikut: o
Mikrococcus, jika kecil dan tunggal
o
Diplococcus, jka bergandanya dua-dua
o
Tetracoccus,
jika
bergandengan
empat
dan
bujursangkar o
Sarcina, jika bergerombol membentuk kubus
o
Staphylococcus, jika bergerombol
o
Streptococcus, jika bergandengan membentuk rantai
membentuk
45 •
Basil (Bacillus) adalah kelompok bakteri yang berbentuk batang atau silinder, dan mempunyai variasi sebagai berikut:
•
o
Diplobacillus, jika bergandengan dua-dua
o
Streptobacillus, jika bergandengan membentuk rantai
Spiril (Spirilum) adalah bakteri yang berbentuk lengkung dan mempunyai variasi sebagai berikut: o
Vibrio, (bentuk koma), jika lengkung kurang dari setengah lingkaran
o
Spiral, jika lengkung lebih dari setengah lingkaran
Gambar 2.17 Morfologi bakteri