BAB II KAJIAN TEORITIS
2. 1 Pengertian Sistem Temu Balik Informasi Sejak diperkenalkan pertama sekali pada tahun 1952 dan mulai diteliti tahun 1961, banyak para ahli memaparkan pengertian sistem temu balik informasi. Seperti yang dikutip oleh Hardi (2006: 22) bahwa “Lancaster mendefenisikan temu kembali informasi sebagai suatu proses pencarian dokumen dengan menggunakan istilah luas untuk mengidentifikasi dokumen yang berhubungan dengan subjek tertentu”. Hal ini berarti bahwa sistem temu balik informasi merupakan jalan menuju perolehan informasi yang sesuai dengan kebutuhan pengguna. Pengertian senada dinyatakan oleh Hasugian (2006: 73) bahwa “pada dasarnya sistem temu balik informasi adalah suatu proses untuk mengidentifikasi, kemudian memanggil (retrieve) suatu dokumen dari suatu simpanan (file), sebagai jawaban atas permintaan informasi”. Pendapat tersebut mengindikasikan bahwa sistem temu balik informasi benar-benar dirancang demi memenuhi kebutuhan informasi pengguna, sehingga tujuan memberi kepuasan kepada pengguna dapat terpenuhi. “Tujuan utama sistem temu kembali informasi adalah untuk menemukan dokumen yang sesuai dengan kebutuhan informasi pengguna secara efektif dan efisien, sehingga dapat memberikan kepuasan baginya”, ( Tague-Sutcliffe dalam Hasugian, 2006: 3). Ada beberapa fungsi utama sistem temu balik informasi seperti yang dinyatakan Chowdhury (1999: 3) bahwa ada tujuh fungsi utama sistem temu balik informasi yang dapat didaftarkan sebagai berikut: 1. To identify the information (sources) relevant to the areas of interest of the target users community 2. To analyse the contents of the sources (documents) 3. To represent the contens of the analysed sources in a way that will be suitable for matching users queries 4. To analyse users queries and to represent them in aform that will be suitable for matching with the database 5. To match the search statement with the stored database 6. To retrieve the information that is relevant, and 7. To make necessary adjustments in the system based on feedback from the users”.
Universitas Sumatera Utara
Pernyataan di atas dapat diartikan tujuh fungsi utama sistem temu balik informasi adalah sebagai berikut: 1. Untuk mengidentifikasi informasi (sumber informasi) yang relevan dengan bidang-bidang yang sesuai dengan minat dan tujuan komunitas pemakai 2. Untuk menganalisis isi dari sumber informasi (dokumen) 3. Untuk merepresentasikan isi dan sumber informasi yang telah dianalisis dengan cara yang sesuai untuk kemudian menyesuaikannya dengan permintaan pemakai 4. Untuk menganalisis permintaan-permintaan pemakai dan merepresentasikannya ke dalam bentuk yang disesuaikan, untuk disesuaikan dengan database 5. Untuk menyesuaikan pernyataan penelusuran dengan database 6. Untuk menemukan informasi yang relevan 7. Untuk membuat penyesuaian kebutuhan pada dasar sistem arus balik dari pemakai.
2. 2 Komponen Sistem Temu Balik Informasi “Pada intinya dalam sistem temu balik informasi terdapat tiga komponen utama yang saling mempengaruhi, yaitu (1) kumpulan dokumen; (2) kebutuhan informasi pengguna, dan (3) proses pencocokan (matching) antara keduanya”, (Di Nubila, et.al dalam Zaenab, 2002: 41). Hasibuan dalam Hasugian (2006: 3) juga membagi komponen sistem temu balik informasi atas 3, namun berbeda dari pendapat di atas, Hasibuan mencantumkan user (pemakai) menggantikan kebutuhan informasi pemakai pada pendapat Di Nubila, “Secara garis besar komponen sistem temu balik informasi terdiri dari pemakai (user), dokumen, dan matcher-machine”.
2.2. 1 Dokumen Dalam sistem temu balik informasi, dokumen sebagai komponen pertama disimpan dengan struktur tertentu. Hal ini dinilai penting mengingat kesalahan merepresentasikan dokumen dapat menyebabkan dokumen sulit atau bahkan tidak dapat ditemukan kembali.
Universitas Sumatera Utara
“Struktur dokumen dalam suatu basis data elektronis memegang peranan penting dalam meningkatkan kinerja sistem temu kembali informasi. Stuktur tersebut dibentuk oleh berbagai ciri yang menjadi bagian dari suatu dokumen. Ciri-ciri tersebut meliputi : kata-kata indeks (Indeks terms), kata-kata bebas (Free text terms), pengarang, referensi (Cited documents), sitasi (Citing document), dan afiliasi pengarang”, (Hasibuan, 2006: 1). Representasi dokumen dalam setiap database berbeda-beda. Namun sebagian besar pangkalan database merepresentasikannya dalam bentuk indeks atau abstrak tergantung kapasitas sumber informasi (database) dimana dokumen tersebut disimpan. “Secara teknis setiap dokumen yang telah dianalisis subjeknya dan diindeks, disimpan dalam suatu pangkalan data. Di sisi lain, kebutuhan informasi pengguna dianalisis dan direpresentasikan dalam suatu istilah pencarian (search terms). Selanjutnya, representasi dokumen dan pertanyaan pengguna (query) dipadukan dalam suatu proses pencocokan (matching) hingga menemukan dokumen yang relevan” (Zaenab, 2002: 42). Dari pendapat tersebut dapat dipahami bahwa, bentuk representasi dokumen pada setiap database berbeda-beda sesuai kapasitas database yang menyimpannya. Dan sebagian besar database yang ada merepresentasikan dokumen kedalam bentuk indeks atau abstrak.
2.2. 2 Pemakai (User) Komponen Sistem Temu Balik Informasi yang kedua adalah user (pemakai). Menurut Chowdhury (1999: 179), “ the user is the focal point of all information retrieval system because the sole objective of any information storage and retrieval system is to transfer information from the source (the database) to the user”. Pendapat tersebut dapat diartikan bahwa pemakai (user) adalah poin utama dari semua sistem temu balik informasi, karena tujuan utama dari setiap penyimpanan informasi adalah menemukan kembali informasi dari sumbernya (database) kepada pemakai. Hal ini membuktikan bahwa pemakai (user) benar-benar merupakan komponen tak terpisahkan dalam sistem temu balik informasi. Dalam konsep sistem temu balik informasi , user (pemakai) adalah komponen yang paling penting yang mengoperasikan sistem temu balik informasi dalam rangka memenuhi kebutuhan informasinya. Namun, kadang kala pemakai sendiri sulit
Universitas Sumatera Utara
mengidentifikasi kebutuhan informasinya. “Memastikan kebutuhan informasi pemakai merupakan suatu fenomena yang rumit, bahkan pemakai sendiri sering merasa kesulitan dalam mengungkapkan dan mengidentifikasi kebutuhan mereka” (Chaudry dalam Ishak, 2006: 92).
2.2. 3 Permintaan (Query) Query (permintaan) adalah komponen sistem temu balik informasi sangat menentukan keberhasilan suatu sistem temu balik informasi untuk menemukan dokumen dalam suatu database. Keberhasilan suatu sistem temu balik informasi menemukan dokumen adalah dikarenakan permintaan (query) yang dimasukkan dengan dokumen yang terdapat dalam database saling berhubungan. “Antara dokumen dengan permintaan (query) dikatakan terhubung (related) jika keduanya mengenai (about) sesuatu yang sama, karena keduanya merupakan entitas yang serupa dan memiliki nilai (value) atribut yang sama. Keterhubungan antara dokumen dengan query (permintaan), dan nilai suatu dokumen bagi pembaca bersifat sangat subyektif yang dipengaruhi oleh latar belakang penilai atau pembaca dalam domain subjek yang bersangkutan”, (Bookstein dalan Hasugian, 2006: 6). Memahami karakteristik dari suatu sistem temu balik informasi merupakan hal yang penting. Kemampuan
pengguna memformulasikan query dengan tepat akan
mempengaruhi tingkat perolehan dan ketepatan dokumen yang semakin tinggi. Sebagian besar pengguna lebih tertarik menggunakan operator Boolean logic sebagai fasilitas penelusuran dan formulasi bahasa alamiah (natural language). Padahal cara ini tidak selalu sesuai dengan karakteristik suatu sistem temu balik informasi. “Kesederhanaan pengolahan dan kemampuannya dalam membangun konsep dari beberapa istilah merupakan salah satu alasan untuk menggunakan logika Boolean”, (Hasugian, 2006: 4).
2.2. 4 Indeks Indeks merupakan komponen sistem temu balik informasi yang dimaksudkan untuk memberikan jalan masuk ke dalam dokumen. Indeks juga merupakan representasi atau wakil dokumen yang dideskripsikan dengan istilah indeks yang ditentukan melalui proses pengindeksan.
Universitas Sumatera Utara
“Representasi dokumen memiliki beberapa karakteristik, yaitu dapat membedakan satu dokumen dengan dokumen yang lain (discriminating power), dapat mengidentifikasi dokumen yang sama (identification of similarity), dapat menggambarkan isi dokumen (descriptiveness), dapat menghindari ketaksaan dan ambiguitas (ambiguity), dan dapat dinyatakan dengan ringkas (conciseness), (Meadow dalam Hasugian: 2006: 74). Pendapat di atas mengandung pengertian bahwa
penentuan representasi
dokumen, khususnya indeks harus sesuai dengan ketentuan-ketentuan yang dapat mewakili dokumen dalam suatu database, sehingga dapat dengan mudah untuk ditelusur dan ditemubalik.
2.2. 5 Pencocokan (Matching) Komponen sistem temu balik informasi yang selanjutnya adalah pencocokan (matching). Dalam sistem temu balik informasi pencocokan (matching) merupakan perbandingan antara query dan sumber informasi (database). “Pencocokan (matching) adalah proses membandingkan antara istilah yang tercantum dalam pertanyaan pemakai dengan istilah yang tercantum dalam dokumen, (Meadow dalam Hasugian, 2006: 3). Ada dua fungsi pencocokan (matching) seperti yang diungkapkan Hasibuan dalam Hasugian (2006:3) bahwa “sekurang-kurangnya ada dua fungsi pencocokan (matching function), yaitu fungsi exact match dan fungsi partial match”. “Fungsi exact match adalah pencocokan dimana representasi suatu pertanyaan persis sama atau harus sesuai dengan representase dokumen, agar dokumen tersebut dapat terambil (retrieved). Sedangkan fungsi partial match atau pencocokan sebagian yaitu representasi pertanyaan hanya sebagian saja yang sama dengan representasi dokumen. Pencocokan sebagian ini dikenal dengan pemenggalan (truncation)” (Hasugian, 2006: 3). 2. 3 Kebutuhan Informasi Pengguna Banyak pakar yang mengungkapkan defenisi kebutuhan informasi. Salah satunya Krikelas dalam kutipan Ishak (2006: 91), ia mendefenisikan kebutuhan informasi sebagai berikut: “...when the current state of possessed knowledge is less than needed”. Dari pengungkapan Krikelas dapat diartikan bahwa kebutuhan informasi timbul ketika pengetahuan yang dimiliki seseorang kurang dari yang dibutuhkan, sehingga mendorong seseorang untuk mencari informasi.
Universitas Sumatera Utara
Memahami kebutuhan pemakai sebenarnya tidak terlalu sulit. Melakukan pendekatan dengan pemakai (user approach) adalah langkah awal untuk dapat memahami kebutuhan informasi pemakai (information need). “Pendekatan ini dilakukan terutama untuk memahami karakteristik umum pemakai, mengetahui ruang lingkup atau konteks informasi yang dibutuhkan, mengidentifikasi subjek, dan menyeleksi sumbersumber database yang akan digunakan dalam penelusuran” (Hasugian, 2006: 6). Namun Moores dalam Ishak (2006: 92) menyatakan agak sulit menentukan hal ini karena kebutuhan informasi pemakai selalu berubah dan berkembang, “They have customer’s need that are changing all the time. Understanding how these needs are changing is obviously an essential element when designing future service”. Pendapat tersebut dapat diartikan bahwa kebutuhan informasi pemakai selalu berubah dan berkembang setiap waktu. Memahami bagaimana kebutuhan itu berubah merupakan unsur penting dalam perencanaan layanan informasi dimasa mendatang. Oleh sebab itu selalu mengikuti perkembangan informasi adalah penting sebagai jalan mempermudah mengidentifikasi kebutuhan pemakai.
2. 4 Fasilitas Penelusuran Rowlands dalam Hasugian (2006: 74) menyatakan bahwa: “suatu sistem temu balik informasi memiliki sejumlah fasilitas yang dapat digunakan untuk query atau bahasa perintah (query or command language); formulasi query dengan Boolean (Boolean query formulation); pemurnian penelusuran (search refinement); pemendekan/pemotongan dan penelusuran rentetan teks (truncation and text string searching); pembatasan penelusuran (stop list or common word list); tesaurus/pendukung perbendaharaan kosa kata (thesaurus/vocabulary support); kedekatan penelusuran (proximity searching); pembatasan penelusuran dengan ruas (limiting searching by field); dan penelusuran kawasan numerik (numeric range searching)”. Keberadaan fasilitas penelusuran ini sangat mempengaruhi tingkat efektifitas sistem temu balik informasi yang akan menghasilkan tingkat perolehan (recall) dan ketepatan (precision) yang tinggi. 1. Boolean query formulation Boolean query formulation atau yang lebih dikenal dengan operator Boolean Logic merupakan hubungan dari istilah-istilah yang ditelusur. Boolean Logic terdiri dari 3
Universitas Sumatera Utara
operator logis, yaitu AND, OR dan NOT. Operator Boolean berfungsi sebagai instruksi atas informasi yang diinginkan pengguna. “Operator Boolean berperan sebagai pembentuk konsep dari apa yang hendak ditanyakan oleh pemakai terhadap sistem temu kembali informasi” (Hasibuan dalam Hasugian, 2006: 4). Penggunaan operator Boolean dengan tepat, dalam melakukan penelusuran pada sistem temu balik informasi, akan menghasilkan perolehan (recall) yang tinggi dengan tingkat ketepatan (precision) yang tinggi pula. “Operator Boolean OR akan menghadirkan dokumen yang berisi sekurangkurangnya salah satu dari istilah yang ditelusur. Biasanya digunakan untuk mencari istilah-istilah atau konsep-konsep yang sinonim. Contoh: information OR technology, akan menghadirkan semua dokumen yang berisi salah satu istilah tersebut, dan juga dokumen yang berisi kedua istilah itu. Jadi semakin banyak istilah atau konsep yang digabungkan dalam penelusuran dengan menggunakan OR, semakin banyak dokumen yang dihadirkan. Operator Boolean AND digunakan untuk menghadirkan dokumen-dokumen dimana kedua istilah yang ditelusur sama-sama disebutkan dalam dokumen itu. Penelusuran dengan menggunakan AND akan memperkecil hasil informasi yang ditemukan. Contoh: copyright AND royalty akan menghadirkan dokumen yang berisi copyright dan royalty saja, dokumen yang hanya berisi salah satu dari istilah tersebut tidak akan muncul. Maka, semakin banyak istilah yang dibangun, semakin sedikit persentase perolehan dokumen. Operator Boolean NOT akan menghasilkan dokumen-dokumen yang berisi hanya satu istilah saja. Contoh: Roses NOT Jasmines, akan menghasilkan dokumen yang berisi istilah atau konsep tentang Roses saja; dokumen yang berisi Jasmines atau Roses dan Jasmines tidak akan muncul. Logika NOT akan menyisihkan dokumen-dokumen yang tidak dikehendaki dari penelusuran. Pada beberapa Search Engine, Boolean logic bisa digantikan dengan simbol. Tidak adanya simbol atau operator Boolean yang digunakan akan diterjemahkan sebagai OR atau AND atau NOT secara otomatis. Contoh penggunaan simbol dalam penelusuran: 1. Boolean Logic: OR Simbol: information technology
Universitas Sumatera Utara
2. Boolean Logic: AND Simbol : +aids+adults 3. Boolean Logic: NOT Simbol: kidney-bronchitis 4. Boolean Logic: OR, AND Simbol: information technology+development”, (Sayekti, 2001: 24-25). 2. Proximity Searching (Kedekatan kata dalam penelusuran) Fasilitas penelusuran yang lain yaitu dapat menggunakan proximity searching atau kedekatan kata dalam penelusuran. Hal ini dimaksudkan untuk melakukan pendekatan istilah-istilah yang akan ditelusur dan ditemu balik. Chowdhury (1999: 171) menyatakan “proximity searching is a common feature of all text retrieval systems, including online databases and CD-ROM databases”, pernyataan tersebut dapat diartikan bahwa proximity searching (pendekatan penelusuran) adalah sebuah fitur yang biasa ada disemua teks sistem temu balik, yang dimasukkan pada database online dan CD-ROM online. Chowdhury juga menambahkan bahwa didalam konsep temu balik informasi ada beberapa ketentuan untuk pendekatan penelusuran, hal ini dimaksudkan untuk menyaring pernyataan penelusuran melalui pendekatan yang dilakukan penelusur untuk istilah-istilah yang harus ada dalam konteks database. Di bawah ini beberapa contoh proximity searches: •
COLD SAME FLU Akan menemubalik seluruh rekod dimana istilah penelusuran COLD dan FLU harus ada dalam paragraf yang sama;
•
COLD WITH FLU Akan menemubalik semua rekod dimana istilah penelusuran COLD dan FLU harus ada dalam satu kalimat;
•
COLD ADJ FLU Akan menemubalik semua rekod dimana istilah penelusuran COLD harus diikuti istilah FLU dalam satu kalimat, tetapi istilah FLU yang diikuti COLD tidak akan ditemubalik.
•
COLD NEAR FLU
Universitas Sumatera Utara
Akan menemubalik semua rekod dimana istilah penelusuran COLD diikuti istilah FLU, atau istilah FLU diikuti istilah COLD. (Berdasarkan contoh yang dipaparkan Chowdhury, 1999: 172). 3. Limiting Searching (Pembatasan Penelusuran) Fasilitas penelusuran ini berfungsi untuk membatasi istilah penelusuran pada ruas data tertentu. Oleh sebab itu fasilitas ini juga sering disebut “field searching”. Chowdhury (1999: 174) mendefenisikan “limiting search or field-specific search is a common feature of text retrieval systems, and online and CD-ROM databases also provide this search facility”. Defenisi tersebut berarti limiting search atau penelusuran ruas-ruas yang spesifik adalah sebuah fitur yang ada dalam teks sistem temu balik, dalam database online dan CD-ROM juga tersedia fasilitas penelusuran ini.
Contoh: MANAGEMENT*BUSINESS/ (4) Akan menemubalik rekod dimana kedua istilah penelusuran ini harus ada dalam satu ruas dan mengidentifikasi keberadaannya dalan ruas 4. 4. Truncation (Pemenggalan) Penelusuran cara ini dimaksudkan untuk melakukan pemenggalan istilah penelusuran yang diarahkan pada semua bentuk kata yang berbeda, tetapi akar katanya tetap sama. “Truncation allows a search to be conducted for all the different forms of a word having the same common root”, (Chowdhury, 1999: 174). Pernyataan ini berarti truncation
(pemenggalan)
memperkenankan
sebuah
penelusuran
melakukan
pemenggalan dari semua bagian yang berbeda pada sebuah kata yang memiliki akar yang sama. Fasilitas penelusuran ini menggunakan
simbol-simbol untuk melakukan
pemenggalan, seperti (#, ?, atau $, dsb). Contoh: •
BOUND$, Akan menemubalik semua cantuman yang berisi kata yang dimulai dengan istilah BOUND, seperti: BOUNDARY, BOUNDLESS, dsb.
Universitas Sumatera Utara
•
$PORT Akan menemubalik semua
cantuman yang berisi istilah yang berakhiran
PORT, seperti: IMPORT, REPORT, dsb. •
$FORM$ Akan menemubalik cantuman istilah yang mengandung kata FORM, seperti: INFORMATION. REFORMATION, CONFORMATION, dsb. (Berdasarkan contoh yang dipaparkan Chowdhury, 1999: 174).
5. String Searching String searching merupakan fasilitas penelusuran yang berfungsi mencocokan karakter istilah penelusuran dengan karakter istilah yang terdapat dalam database yang seringkali belum terindeks. Rumitnya lagi penelusuran ini bekerja sangat lamban pada database dengan kapasitas besar. “String searching is the ability to search on character strings within the body of the text in a record, wich is usually available for those fields whose text has not been included in an inverted file, and is, therefore, not pre-indexed”, (Chowdhury, 1999: 176). Pernyataan ini dapat diartikan bahwa string searching adalah kemampuan untuk menelusur dengan menggunakan karakter string yang melekat pada bagian teks suatu data, yang biasanya tersedia untuk ruas-ruas data yang belum terindeks. Contoh: KOLOID$, maka database akan menemubalik istilah seperti: KOLOID+, KOLOID:, KOLOID~, KOLOID”, KOLOID%, dan sebagainya.
2. 5 Penilaian Relevansi Komponen terakhir dalam sistem temu balik informasi adalah penilaian relevansi. Hal ini merupakan tahap yang menentukan dalam proses temu balik informasi. Penyebabnya adalah selain untuk menentukan dokumen yang relevan dengan kebutuhan informasi pengguna, hasil penilaian tersebut merupakan parameter yang dapat digunakan untuk menggambarkan efektivitas dari suatu sistem temu balik informasi. Penilaian relevansi menurut Burgin dalam Zaenab (2002: 43) “dapat diukur sesuai dengan batasan tingkat relevansi yang dibagi atas tiga, yaitu sangat relevan, kurang relevan, dan tidak relevan”.
Universitas Sumatera Utara
Tabel-1: Tingkat relevansi, defenisi dan interpretasi yang digunakan dalam penilaian
relevansi.
Kategori Relevansi Sangat relevan
Defenisi
Dokumen merupakan tanggapan langsung dari pertanyaan Kurang relevan Topik dari dokumen relevan, tetapi bukan tanggapan langsung dari pertanyaan Tidak relevan Dokumen tidak relevan dengan pertanyaan Sumber: Burgin dalam Zaenab (2002: 43).
Interpretasi Saya kecewa bila sistem gagal menemukan dokumen Dokumen ditemukan atau tidak, saya tetap merasa senang Saya kecewa bila sistem menemukan dokumen ini
Dari pendapat diatas dapat disimpulkan bahwa penelusur akan selalu melakukan penilaian atas dokumen terpanggil, apakah sesuai atau tidak dengan informasi yang dibutuhkannya, dan hal ini adalah bagian paling menentukan akan efektivitas suatu sistem temu balik informasi. “Dalam penilaian relevansi ada dua hal penting yang biasa digunakan untuk mengukur kemampuan suatu sistem untuk memanggil dokumen sesuai dengan istilah yang di formulasikan, yaitu perolehan (recall) dan ketepatan (precision)”, (Pao dalam Hasugian, 2006: 5).
2.5. 1 Recall (Perolehan) Recall merupakan istilah yang digunakan untuk dokumen terpanggil yang relevan dengan pernyataan (query) yang dimasukkan pengguna dalam suatu sistem temu balik informasi. Chowdhury (1999: 205) menyatakan bahwa : “Recall thus relates to the ability of the system to retrieve relevant documents”. Pendapat tersebut dapat diartikan bahwa recall (perolehan) berhubungan dengan kemampuan suatu sistem temu balik dalam menemukan dokumen yang relevan. Hal ini berarti perolehan (recall) adalah bagian dari proses temu balik informasi yang dapat digunakan sebagai alat ukur tingkat efektivitas suatu sistem temu balik informasi.
Universitas Sumatera Utara
“Perolehan (recall) berhubungan dengan kemampuan sistem untuk memanggil dokumen yang relevan, sedangkan ketepatan (precision) berkaitan dengan kemampuan sistem untuk tidak memanggil dokumen yang tidak relevan”, (Hasugian, 2006: 5). Berikut rasio tingkat perolehan (recall) yang dapat dicapai dalam kegiatan penelusuran menurut Hasugian (2006: 5): Jumlah dokumen relevan yang terambil Recall = ---------------------------------------------------------------------Jumlah dokumen relevan yang ada dalam database (file)
2.5. 2 Precision (Ketepatan) “Recall sebenarnya sulit diukur karena jumlah seluruh dokumen yang relevan dalam database sangat besar. Oleh karena itu presisi-lah (precision) yang biasanya menjadi salah satu ukuran yang digunakan untuk menilai keefektivan suatu sistem temu balik informasi”, (Hasugian, 2006: 5). “Precision adalah jumlah kelompok dokumen relevan dari total jumlah dokumen yang ditemukan oleh sistem”, (Hardi, 2006: 22). Presisi juga merupakan cara mengukur tingkat efektivitas sistem temu balik informasi. Pengukuran tingkat ketepatan (precision) dalam kegiatan penelusuran menurut Hasugian (2006: 5): Jumlah dokumen relevan yang terambil Precision = ---------------------------------------------------------------Jumlah dokumen yang terambil dalam pencarian
“Untuk memudahkan pemahaman akan kedua pengukuran tersebut, berikut dikemukakan tabel perhitungan penentuan recall dan precision. Tabel-2: Perhitungan Recall dan Precision Relevant
Not Relevant
Total
Retrieved
A
B
a+b
Not Retrieved
C
D
c+d
Total
a+c
b+d
Universitas Sumatera Utara
Berdasarkan tabel di atas, perhitungan precision dan recall dapat diukur dengan mengacu pada rasio yang telah dikemukakan sebelumnya. Untuk menghitung rasio recall, tentukan jumlah dokumen relevan yang terambil, berdasarkan data pada tabel yaitu a, sedangkan jumlah dokumen relevan dalam database adalah a + c. Dengan demikian recall (R) dapat dinyatakan sebagai berikut: a R = ---------a+c Untuk menghitung precision, yaitu jumlah dokumen relevan yang terambil adalah a, sedangkan jumlah dokumen yang terambil dalam penelusuran adalah a + b. Maka precision (P) dapat dinyatakan sebagai berikut: a P = ----------a+b (Hasugian, 2006: 5). “Kondisi ideal dari kefektifan suatu sistem temu balik informasi adalah apabila rasio recall dan precision sama besarnya (1 : 1)”, (Pao dalam Hasugian, 2006: 6). “Akan tetapi dalam kenyataannya, hasil yang diperoleh memuaskan bila precision tinggi walaupun recall rendah”, (Rowley dalam Hasugian, 2006: 6). Dengan demikian, dapat disimpulkan bahwa bagian terpenting dalam proses temu balik informasi adalah ketika kebutuhan informasi pengguna tercapai dikarenakan presisi yang dihasilkan dalam penelusuran tinggi.
Universitas Sumatera Utara
2.6 Pengantar Tentang Database PubMed PubMed adalah suatu jasa layanan dari U.S. National Library of Medicine yang meliputi lebih dari 17 juta sitiran dari MEDLINE dan jurnal-jurnal sains yang lain untuk artikel-artikel biomedical yang ditemubalikkan mulai
tahun 1950-an. PubMed juga
mencakup banyak link ke artikel teks penuh dan sumber daya lain yang berhubungan. “PubMed is a service of the U.S. National Library of Medicine that includes over 17 million citations from MEDLINE and other life science journals for biomedical articles back to the 1950s. PubMed includes links to full text articles and other related resources”. (NCBI, PubMed: 2007) Database PubMed menyediakan banyak menu-menu pilihan yang memungkinkan pengguna memperoleh informasi yang tepat, efektif dan efisien. Diantaranya adalah menu Entrez PubMed, PubMed Service dan Related Resources. Menu Entrez PubMed memberi petunjuk bagi pengguna bagaimana menelusur menggunakan database PubMed, agar hasil penelusuran sesuai kebutuhan. Ada beberapa alternatif pilihan menu yang berkaitan dengan hal ini , yaitu: Overview, Help, Tutorials, New/Noteworthy dan E-Utilities. Menu Overview, berisi tentang penjelasan segala fasilitas yang ada pada database PubMed. (Lihat tampilannya pada lampiran 8). Menu Help akan menelusur jutaan bibliografi dan abstrak di bidang kedokteran, ilmu perawatan, dokter gigi, dokter hewan, sistem layanan kesehatan , dan ilmu preclinical. PubMed help juga menyediakan akses ke MEDLINE dan artikel sains jurnal terpilih di luar MEDLINE. “PubMed lets you search millions of bibliographic citations and abstracts in the fields of medicine, nursing, dentistry, veterinary medicine, the health care system, and preclinical sciences. It provides access to MEDLINE® and to articles in selected life sciences journals not included in MEDLINE”. (NCBI, PubMed: 2007) Menu Tutorials merupakan penjelasan segala fasilitas database PubMed dengan audio dan animated tutorials yang dinamakan Quick Tours. Disajikan secara online menggunakan Macromedia Flash Player. Menu ini akan sangat memudahkan pengguna bagaimana cara memanfaatkan semua fasilitas database PubMed.
Universitas Sumatera Utara
Menu E-Utilities atau Entrez utilities adalah alat penyedia akses ke Entrez data di luar web query yang sangat membantu untuk menemukan kembali hasil pencarian untuk kemudian akan digunakan kedepannya . “Entrez Programming Utilities are tools that provide access to Entrez data outside of the regular web query interface and may be helpful for retrieving search results for future use in another environment”. (NCBI, PubMed: 2007) Selain itu, pada menu PubMed Service, database PubMed juga menyediakan beberapa menu layanan pilihan seperti: Journal Database yaitu layanan yang memungkinkan pengguna menelusur artikel dengan hanya mengetahui subjek, judul, pengarang, ISO, ISSN atau berada di database mana. Ada juga menu Single Citation Matcher yaitu menu yang memungkinkan pengguna memperoleh kutipan dari suatu artikel seperti judul, volume jurnal yang memuatnya, atau isu dari isi artikel tersebut. Menu Batch Citation Matcher yaitu layanan untuk pengguna yang ingin mengakses informasi dari link atau website lain diluar database PubMed. Dan banyak lagi seperti Clinical Queries, Link Out dan My NCBI. Satu lagi adalah menu Related Resources yang menyediakan menu pilihan seperti National Library of Medicine (NLM) Catalog dan TOXNET. Menu NLM Catalog menyediakan akses ke NLM data bibliografi untuk jurnal, buku, audiovisual, perangkat lunak komputer, sumber daya elektronik dan material lain. Hubungan ke perpustakaan Locatorplus,
NLM online publik akses katalog, juga
disajikan. “The NLM Catalog provides access to NLM bibliographic data for journals, books, audiovisuals, computer software, electronic resources and other materials. Links to the library's holdings in LocatorPlus, NLM's online public access catalog, are also provided”. (NCBI, PubMed: 2007) Menu TOXNET (Toxicology Data Network) adalah database tentang ilmu racun (toxicology), bahan-kimia berbahaya (hazardous chemicals), kesehatan lingkungan (environmental health), dan pelepasan racun (toxic releases). Disamping itu ada pula menu Order Documents, NLM Mobile, NLM Gateway, Consumer Health, Clinical Alerts, ClinicalTrials.gov dan PubMed Central. Tampilan menu-menu tersebut dapat dilihat pada lampiran 8.
Universitas Sumatera Utara
2.7 Sistem Temu Balik Informasi pada Database PubMed PubMed sebagai database online menyediakan begitu banyak artikel-artikel berikut fasilitas-fasilitas penelusuran untuk menemukan artikel-artikel tersebut. Diantaranya adalah Boolean Logic Operator dan Trancation. Boolean Operator “Combining search terms with Boolean operators (AND, OR, NOT) PubMed assumes the AND operator between concepts, e.g., “vitamin c common cold” is translated as vitamin c AND common cold. Enter Boolean operators in uppercase characters to combine or exclude search terms: AND retrieves results that include all the search terms. OR retrieves results that include at least one of the search terms. NOT excludes the retrieval of terms from your search. PubMed processes searches in a left-to-right sequence. Use parentheses to “nest” concepts that should be processed as a unit and then incorporated into the overall search. Example: Common cold AND (vitamin c OR zinc)”, (PubMed Central (PMC) : 2007) Hal ini menjelaskan kombinasi istilah penelusuran dengan operator Boolean (AND, OR, NOT). PubMed mengasumsikan bahwa operator AND ada diantara konsep, contoh: “vitamin c common cold” yang diterjemahkan sebagai vitamin c AND common cold. Operator Boolean dimasukkan menggunakan karakter huruf besar untuk mengkombinasi atau mengeluarkan istilah penelusuran. AND menemukan kembali hasil yang meliputi semua istilah penelusuran OR menemukan kembali hasil yang meliputi sedikitnya salah satu dari istilah pencarian. NOT meniadakan penemuan kembali atas istilah penelusuranmu Proses penulusuran PubMed berurutan dari kiri ke kanan. Gunakan tanda kurung untuk "menspesifikkan" konsep yang harus diproses sebagai unit dan kemudian menyatukan dengan keseluruhan pencarian. Contoh: Common cold AND ( vitamin c OR zinc ). Truncation Fasilitas sistem temu balik informasi lain yang dapat dipergunakan atau berlaku pada database PubMed adalah pemenggalan kata (Truncation). Sistem akan menemukan seluruh kata/istilah yang didalamnya terkandung kata/istilah yang dimasukkan ke dalam sistem.
Universitas Sumatera Utara
“Truncating search terms. To search for all terms that begin with a word, enter the word followed by an asterisk (*). More information about truncation: ♦ PubMed searches for the first 600 variations of a truncated term. If a truncated term (e.g., tox*) produces more than 600 variations, PubMed displays a warning message to lengthen the root word to search for all endings. ♦ Truncation turns off automatic term mapping and the automatic explosion of a MeSH term. For example, heart attack* will not map to the MeSH term Myocardial Infarction or include any of the more specific terms, e.g., Myocardial Stunning; Shock, Cardiogenic. ♦ Truncating a word in a multi-word query may result in an unexpected phrase search. For example the search, fetus infection* maternal will treat fetus infection* as a phrase.” (NCBI, PubMed Central (PMC): 2007). Pernyataan tersebut berarti pemenggalan istilah penelusuran. Untuk menelusur semua istilah yang dimulai dengan satu kata, masukan kata diikuti tanda bintang(*). Informasi lebih lanjut tentang truncation: ♦ Penelusuran PubMed untuk yang pertama 600 variasi pemenggalan istilah. Jika suatu istilah dipenggal diujung (contoh, tox*) menghasilkan lebih dari 600 variasi, PubMed akan menampilkan suatu peringatan pesan untuk memperpanjang akar kata untuk menelusur semua akhiran. ♦ Memenggal dan memetakan istilah secara otomatis dan dengan otomatis pula akan memunculkan istilah-istilah MeSH (Medical Subject Heading). Sebagai contoh, heart attack* akan memetakan istilah MeSH, Myocardial Infarction atau memasukkan istilah apapun yang lebih spesifik, contoh, Myocardial Stunning; Shock, Cardiogenic. ♦ Memenggal suatu kata dari banyak kata query dapat menghasilkan frasa penelusuran yang tidak diduga. Sebagai contoh penelusuran,
fetus
infection*maternal will treat fetus infection* sebagai frasa.
Universitas Sumatera Utara