BAB II TINJAUAN LITERATUR 2.1 Pengindeksan Subjek 2.1.1. Pengertian Pengindeksan Subjek Di dalam sebuah perpustakaan pengindeksan subjek sangatlah penting, karena pengindeksan merupakan salah satu kegiatan utama yang dapat mendukung proses penelusuran informasi ini. Di sini tentunya adalah pengindeksan tentang subjek, yang dikenal dengan sebutan subject indexing. Menurut Cleveland and Cleveland (2001,97) bahwa, “Indexing is the process identyfying information in a knowledge record (text or nontext) an organizing the pointers to that information in to searchable file”. Artinya Pengindeksan adalah proses mengidentifikasi informasi kedalam sebuah catatan pengetahuan baik dalam bentuk teks maupun bukan teks yang berfungsi untuk memberi petunjuk keinformasi file yang akan dicari ataupun dituju. Selain itu menurut pendapat Sugeng (2013), “ Pengindeksan adalah sebuah proses untuk melakukan pengindeksan terhadap kumpulan dokumen yang akan disediakan sebagai informasi kepada pemakai. According to the British indexing standard (BS3700 :1988), an index is a systematic arrangement of entries designed to enable users to locate information in a document. The process of creating an index is called indexing, and a person who does it is called a indexer.There are many types of indexes, from cumulative indexes for journals tocomputer database indexes. Merced (2011) Berdasarkan pendapat di atas,“ Indeks adalah susunan sistematis dari perancangan entri yang memungkinkan pengguna untuk menemukan informasi pada dokumen. Proses dalam membuat indeks disebut pengindeksan, dan orang yang melakukan proses index disebut indekser. Ada beberapa jenis indeks, yaitu indeks kumulatif untuk jurnal, dan indeks database untuk komputer. Indexing (pengindeksan) adalah kegiatan pencatatan ciri-ciri dokumen yang penting, seperti analisis isi dokumen, pencatatan judul, pengarang, penerbit,
7 Universitas Sumatera Utara
halaman dokumen dan lain-lain. (LIPI-Pusat Dokumentasi dan Informasi Ilmiah 2012). Selain pendapat di atas Konfhage yang dikutip oleh Andriaty (2002,1) menyatakan “Indeks merupakan hasil utama dari proses analisis dokumen, dibuat untuk keperluan temu kembali informasi dalam suatu pangkalan data atau dalam majalah sekunder tercetak. Suatu indeks harus memberikan kemungkinan bagi pengguna untuk dapat mengakses suatu dokumen, maupun sekumpulan secara efisien”. Dari keempat pendapat di atas maka dapat disimpulkan bahwa pengindeksan adalah proses mengidentifikasi catatan dari wakil dokumen yang penting serta pengorganisasian informasi kedalam pangkalan data untuk mempermudah dalam penelusuran informasi. 2.1.2 Tujuan dan Manfaat Pengindeksan Subjek Tujuan pengindeksan adalah untuk menemukan kembali dokumen yang relevan dengan permintaan pemustaka (LIPI-Pusat Dokumentasi dan Informasi Ilmiah 2012). The main purpose of indexing and abstracting is to construct representations of published items in a form suitable for inclusion in some type of database. (Lancaster 1998). Maksudnya tujuan utama dari pengindeksan adalah untuk membentuk atau membangun representasi dari item yang dicantumkan dalam bentuk yang sesuai untuk dimasukan kedalam database. Berdasarkan pendapat di atas dapat diketahui bahwa tujuan dari pengindeksan subjek adalah untuk membentuk representasi dari isi wakil dokumen yang dicantumkan ke dalam database guna mempermudah dalam sistem temu balik informasi. 2.2.
Pengindeksan Subjek Secara Manual (Human Indexer) Pengindeksan subjek secara manual harus dilakukan oleh seorang
pustakawan
yang
memiliki
keahlian
dan
keterampilan
dalam
bidang
8 Universitas Sumatera Utara
pengindeksan. Berikut defenisi dari pustakawan menurut Ikatan Pustakawan Indonesia dalam (Hermawan and Arzen 2006,45) yaitu: Pustakawan adalah seorang yang melaksanakan kegiatan perpustakaan dengan jalan memberikan pelayanan kepada masyarakat sesuai dengan tugas lembaga induknya berdasarkan ilmu pengetahuan, dokumentasi dan informasi yang dimilikinya melalui pendidikan. Dalam Undang-Undang RI No. 43 tahun 2007 tentang Perpustakaan Pasal 1 ayat 8 dinyatakan bahwa,” Pustakawan adalah seseorang yang memiliki kompetensi
yang
diperoleh
melalui
pendidikan
dan/
atau
pelatihan
kepustakawanan serta mempunyai tugas dan tanggung jawab untuk melaksanakan pengelolaan dan pelayanan perpustakaan. Berdasarkan pendapat di atas dapat disimpulkan bahwa pustakawan adalah seseorang yang mempunyai kompetensi dibidang perpustakaan yang mampu melayani pengguna sesuai dengan lembaga induknya. Salah satu tugas pokok pustakawan tingkat ahli yaitu: Pengolahan bahan pustaka/ koleksi yang melakukan kegiatan mendeskripsikan bahan pustaka dan menyiapkan sarana temu kembali informasi, meliputi kegiatan katalogisasi deskripsi, klasifikasi, penetapan tajuk subyek serta pengelolaan data bibliografinya, menentukan kata kunci, meyusun bibliografi, indeks dan sejenisnya. (Hermawan and Arzen 2006) Pustakawan yang melakukan kegiatan indeks/ penentuan indeks disebut indekser (human indexer). Seorang indekser harus mampu menganalisa dan mengevaluasi suatu dokumen artikel/ teks serta harus mampu membuat notasi klasifikasi dari suatu dokumen. Hasil indeks subjek yang dihasilkan para indekser akan dicocokkan dengan thesaurus yaitu Library Of Congress Subject Heading (LCSH), sehingga indeks subjek yang dihasilkan oleh indekser merupakan indeks subjek yang terkontrol dan menjadi kosakata yang baku. Human indexer use their knowledge to find the “aboutness” of the writing they are analyzing and find concept within the writing. Human indexing tends to “focus on larger documentary units, such as complete periodical articles, complete chapter in collection, or even complete monographs”. Human indexers are inconsistent. (Anderson dan Perez dalam Shield 2005,1)
9 Universitas Sumatera Utara
Dari pendapat di atas dapat diartikan bahwa indekser menggunakan pengetahuan yang mereka miliki untuk menemukan konsep dalam sebuah tulisan dan kemudian menggunakan istilah dalam pencarian sebuah karya. Pengindeksan secara manual cenderung fokus pada unit dokumentasi yang besar, seperti artikel terbitan berkala yang lengkap. Pengindeksan secara manual cenderung tidak konsisten. Menurut Sulistyo-Basuki (1992,95) langkah-langkah kegiatan penentuan pengindeksan sama dengan kegiatan penentuan deskripsi isi adalah sebagai berikut : 1. Pengamatan awal terhadap dokumen 2. Identifikasi subjek utama 3. Identifikasi elemen yang dideskripsikan dan pemisahan istilah berkaitan. 4. Verifikasi relevansi istilah-istilah tersebut. 5. Konversi istilah dari bahasa sehari-hari ke bahasa dokumenter (bilamana diperlukan). 6. Verifikasi relevansi deskripsi 7. Pengaturan deksripsi sesuai dengan ketentuan formal yang dianut oleh sistem informasi bersangkutan. Berdasarkan pendapat di atas dapat disimpulkan bahwa seorang indekser harus melakukan pengamatan awal terlebih dahulu terhadap isi dokumen tersebut dengan melihat sekilas rangkuman dari dokumen, langkah kedua menganalisis subjek utama dengan menyesuaikan tingkat analisis dengan tingkat pengindeksan yang diinginkan, langkah ketiga pemisahan istilah penting yang harus memperhatikan struktur dokumen serta merekam pentingnya dokumen tersebut terhadap berbagai subjek. Tujuannya untuk menghasilkan pengindeksan yang hamper sesuai dengan dokumen aslinya. Langkah keempat setelah pemilihan istilah penting, tingkat berikutnya adalah pemilihan istilah yang sesuai. Langkah berikutnya, istilah yang dipilih harus diterjemahkan kedalam bahasa dokumenter, paling sedikit untuk pengindeksan dalam unit informasi. Langkah keenam tahap verifikasi menjamin bahwa pengindeksan telah dilakukan sesuai dengan ketentuan yang berlaku. Pengindeks memeriksa ulang hasil pengindeksan.
10 Universitas Sumatera Utara
Dapat disimpulkan bahwa pengindeksan secara manual merupakan proses penentuan rangkuman atau konsep sebuah dokumen yang dilakukan oleh indekser. Pengindeksan subjek dilakukan mulai dari tahap awal, yaitu pengamatan sebuah dokumen sampai kepada pengaturan deskripsi isi, dan hasil pengindeksan subjek secara manual adalah deskripsi indeks yakni wakil isi dari dokumen tersebut.
2.3.
Pengindeksan Subjek Secara Otomatis (Machine Indexer) Pengindeksan subjek secara otomatis sangat identik dengan penggunaan
komputer. Pengindeksan subjek secara otomatis dapat mempemudah pekerjaan atau dengan kata lain dapat memperkecil beban kerja seorang indekser. Dalam hal ini seorang indekser dituntut harus memiliki kemampuan dalam bidang komputer. Menurut Tulic yang dikutip oleh (Obaseki 2010) adalah: Automated indexing is the process of assigning and arranging index terms for natural language without human intervention. The index is produced using algorithms. These algorithms workson database containing document representations, inncluding full text or bibliographic records, but alsoon non-text data bases such as images or music. Maka dapat diartikan bahwa, pengindeksan otomatis adalah proses menetapkan dan menerapkan persyaratan indeks untuk bahasa alamiah tanpa campur tangan manusia. Indeks ini dibuat dengan menggunakan algoritma. Algoritma bekerja pada database yang berisi representasi atau wakil dokumen, termasuk teks yang lengkap, atau catatan bibliografi, termasuk juga pada basis data non-teks seperti gambar atau musik. Menurut Seth yang dikutip oleh (Obaseki 2010) yaitu : Argues for the use of automated indexing because it is faster and cheaper. Seth asserts that this is one way of achieving the goals of information centers. This view is welcomed by numerous scholars, because automated indexing can deal with the increasing amount of new material being produced that has made manual indexing slow and expensive. Dapat dijelaskan bahwa, penggunaan pengindeksan secara otomatis lebih cepat dan lebih murah. Seth juga menegaskan bahwa ini adalah salah satu cara 11 Universitas Sumatera Utara
untuk mencapai tujuan pusat informasi. Pandangan ini disambut baik oleh banyak orang, karena pengindeksan otomatis dapat menangani peningkatan jumlah materi baru yang sebelumnya dibuat secara pengindeksan manual yang lambat dan mahal. Menurut Anderson dan Perez yang dikutip oleh Shield (2005,1) bahwa : Automatic indexing often refers to indexing done by computer algorithms. Obviously, humans are involved with creating the programs for the computers, and in setting the parameters, but the work is done by computers. Indexing is based solely on the text stored and is completely immune to the particular group of users and their queries. Maka dapat diartikan pengindeksan subjek secara otomatis sering merujuk kepada algoritma atau statistika komputer. Secara jelas, manusia juga dilibatkan dalam penciptaan program komputer, dan pengaturan tolak ukur, tetapi pada akhirnya
pekerjaan diselesaikan oleh komputer. Pengindeksan subjek secara
otomatis didasarkan pada teks yang tersimpan dan dilengkapi kekebalan untuk kelompok pengguna khusus dan query mereka. Automated indexing a tool that now accompanies most processing software, build a concordanceor a word list, from processed files. Although the manufacturers often claimthese packages build indexes, the beginning stages of building an index.Usability tests of these packages have shown that the word lists omit manykey ideas and phrases, and cannot fine-tune terminology for easy retrieval,or build the needed hierarchies of ideas that professional indexing can. (Maron) Berdasarkan defenisi di atas dapat diartikan bahwa, pengindeksan otomatis adalah sebuah alat yang menyertai sebagian besar perangkat lunak pengolahan, membangun indeks atau daftar kata, dari file yang diproses. Meskipun produsen sering mengklaim paket ini berfungsi untuk membangun indeks. Kegunaan dari pengindeksan otomatis ini untuk menunjukkan daftar kata, dan mengabaikan banyak kata buangan dan tidak bisa menyempurnakan istilah-istilah untuk memudahkan pencarian, atau saat membangun istilah- istilah tersebut secar a hirarki diperlukan ide- ide yang telah dilakukan oleh pengindeks professional. Dari beberapa pendapat di atas dapat disimpulkan bahwa, pengindeksan subjek secara otomatis adalah pengindeksan yang dilakukan melalui sistem komputerisasi yang dilakukan oleh seorang indekser yang mempunyai keahlian 12 Universitas Sumatera Utara
dalam bidang komputer, dimana pengindeksan subjek secara otomatis mengacu kepada algoritma atau statistika komputer, yang dapat mempercepat pekerjaan dalam membangun indeks. Pengindeksan otomatis dapat dibagi ke dalam 4 pendekatan yakni: statistik, sintaksis, sistem semantik, dan dasar ilmu pengetahuan. (Clevleand and Clevleand yang dikutip oleh Shield 2005,1). Menurut (Diakoff 2004,84-96) pengindeksan secara otomatis memiliki ciri-ciri sebagai berikut: 1. Lebih canggih 2. Sangat baik untuk materi yang sama 3. Sangat murah 4. Mampu untuk menyaring istilah seperti halnya pengelompokan kata. Berikut masalah dengan pengindeksan otomatis meliputi : 1. Presisi rendah, bahwa masalah yang muncul adalah pengindeksan otomatis tidak akan memeriksa istilah yang langka. 2. Rendahnya temu kembali atau recall karena adanya sinonim kata 3. Secara umum yang timbul dari penggunaan penulis adalah " istilah terlalu luas atau terlalu sempit
2.4. Dalil Zipf 2.4.1. Pengertian Zipf Dalil Zipf memiliki peranan yang penting dalam pengindeksan subjek terutama untuk pengindeksan subjek secara otomatis. Dalil zipf digunakan untuk mengetahui suatu dokumen dengan memberi peringkat kata dalam literatur, atau distribusi frekwensi kata dengan peringkat kata (word frequency), (Hasugian 1999,1). Dari penjelasan tersebut dapat disimpulkan bahwa Dalil Zipf berfungsi untuk mengetahui indeks subjek suatu dokumen dengan melihat dari frekwensi kata dokumen. Zipf's law A well-known bibliometric law concerning the frequency of words in a text. The law is named for philologist George Kingsley Zipf (19021950) (Diodata 1994, 167). Maksudnya Hukum Zipf adalah salah satu kajian dari
13 Universitas Sumatera Utara
bidang bibliometrik terkenal mengenai frekwensi kata dalam teks. Maka hukum ini disebut George Kingsley Zipf (1902-1950). Zipf mulai terkenal dalam bidang bibliometrika setelah karyanya yang berjudul “The Psycho-biology of language”, terbit pada tahun 1935. Zipf melalui karya tersebut membawa studi bahasa ke dalam suatu kondisi ilmu eksakta dengan memakai prinsip-prinsip statistik. Empat belas tahun kemudian, Zipf semakin terkenal dengan bukunya yang berjudul, “Human Behavior and Principle of Least Effort” yang terbit pada tahun 1949. Karya tersebut menyatakan bahwa seseorang lebih mudah untuk memilih dan menggunakan kata-kata umum, yang lebih familiar dari pada kata-kata yang tidak dikenalnya, dengan demikian kemungkinan pemunculan kata-kata umum yang lebih familiar dalam suatu karya biasanya lebih tinggi dari pada kata-kata yang tidak dikenalnya. Sekalipun Zipf adalah seorang ahli bahasa dan filsafat, namun ia tertarik untuk melakukan teknik pengukuran (matrics) terhadap dokumen atau literatur dengan memakai pendekatan statistik. Zipf berhasil melakukan observasi atau pemeriksaan terhadap sebuah novel yang berjudul “Ulysses”, karangan James Joice yang pada saat itu merupakan salah satu pemegang hadiah nobel. Hasil observasinya menyatakan bahwa terdapat 29.899 kata yang berlainan dalam karya tersebut, sedangkan jumlah kata seluruhnya adalah 260.430. Dalam hasil pemeriksaan atau observasinya, Zipf juga menemukan beberapa kata yang berkali-kali digunakan (di ulang), dan kata-kata yang penggunaanya rendah, bahkan ada kata yang hanya digunakan sekali. Kata yang dimaksud adalah kumpulan huruf yang diapit oleh dua spasi. Kata bergaris hubung dianggap satu kata, dan tanda kutip dianggap bagian dari satu kata. Semua kata fonetik yang dianggap kata berbeda, kata sandang (stopword) tidak dipergunakan dan diabaikan oleh Zipf. Kemudian Zipf membuat perhitungan peringkat kata. Perhitungan peringkat kata ini yang akhirnya dikenal dengan sebutan Dalil Zipf’s.
14 Universitas Sumatera Utara
2.4.2 Perkembangan dan Aplikasi Dalil Zipf Peringkat kata yang diperkenalkan oleh Zipf bersifat lebih konsisten dan lebih dikenal dengan sebutan Dalil Zipf yang pertama. Berikut isi dari Dalil Zipf yang pertama yaitu : Zipf's Law is often used to predict the frequency of words within a text. The Law states that in a relatively lengthy text, if you "list the words occurring within that text in order of decreasing frequency, the rank of a word on that list multiplied by its frequency will equal a constant. The equation for this relationship is: r x f = k where r is the rank of the word, f is the frequency, and k is the constant. (Guo Gen-Ming 2008, 5). Berdasarkan pendapat di atas bahwa, Hukum Zipf sering digunakan untuk memprediksi frekwensi kata- kata dalam teks, bahwa bila jumlah pengulangan setiap kata yang berlainan terdapat pada sebuah teks dihitung dan hasilnya dituangkan dalam bentuk tabel, dengan peringkat 1 adalah kata yang memiliki frekwensi pengulangan paling tinggi dan seterusnya, maka peringkat susunan jajaran itu disebut ranking (r) dan jumlah pengulangan kata disebut frekwensi (f) maka r x f = K ( konstanta). Dimana Dalil Zipf tersebut digunakan hanya untuk kata-kata yang sering muncul dengan frekwensi tertinggi. Perhitungan setiap kata yang berbeda cara menulisnya dianggap kata yang berbeda dan kata yang memiliki frekwensi pengulangan yang sama memperoleh peringkat yang berbeda pula. Selain itu, ada satu lagi rumus Zipf tentang kata yang memiliki frekwensi pengulangan yang rendah, rumus ini disebut sebagai Dalil Zipf’s II. Dimana dalil ini tidak ada hubungannya sama sekali dengan dalil yang pertama. Karena dalil kedua ini ini hanya berlaku untuk kata-kata yang muncul dengan frekwensi yang rendah. Kemudian dalil kedua ini telah diperbaiki oleh Booth dengan rumus sebagai berikut : Ii/ In= n ( n-1)/2 Dimana : Ii = kata yang diulang 1 (satu) kali In= kata yang diulang n kali.
15 Universitas Sumatera Utara
Rumus Booth juga menjelaskan adanya titik frekwensi antara kata yang berfrekwensi tinggi dengan kata yang berfrekwensi rendah. Titik frekwensi ini terjadi pada saat peralihan dari kata yang memiliki frekwensi khusus ke kata yang memiliki frekwensi pengulangan yang sama. Selanjutnya Goffman memperkenalkan model transisi, yang merupakan Zipf’s I (berlaku hanya untuk kata yang memiliki frekuensi pengulangan yang tinggi) dan dalil Zipf’s II (berlaku untuk kata yang memiliki frekwensi pengulangan yang rendah). Kata yang memiliki frekwensi pengulangan yang tinggi biasanya adalah kata sandang dan kata sambung serta awalan yang tidak sesuai sebagai istilah indeks. Dalam pengindeksan, istilah ini disebut stopword dan selalu dibuang dikarenakan kata sandang (stopword) tidak diperhitungkan sebagai kosa kata indeks. Sedangkan kata yang memiliki frekwensi pengulangan yang rendah adalah kata yang menunjukkan ciri khas dari seorang pengarang. Kata ini tidak dipergunakan dalam pengindeksan. Model transisi yang ditawarkan Goffman memberikan suatu penjelasan yang lebih rasional dan pasti, dengan memperkenalkan cara untuk mengulangi kelemahan tersebut, dengan maksud untuk mencari titik transisi, yaitu nilai batas antara kata yang berfrekwensi rendah. Hal ini dapat diduga bahwa titik transisi tersebut merupakan daerah yang memuat kata-kata yang menunjukkan isi dokumen. Untuk menentukan titik ini dipakai rumus ABC, yang merupakan pengembangan dari dalil Zipf’s II yaitu:
Dimana: a = 1, b = 1 dan c = - 2 Ii Pao yang dikutip oleh Hasugian (1999,9) menyatakan bahwa “Setelah diperoleh titik transisi (dari nilai n di atas), dengan mengambil jumlah kata yang sama di atas dan di bawah titik tersebut, maka diperoleh daerah transisi. Kata-kata
16 Universitas Sumatera Utara
yang berada pada daerah transisi setelah dikurangi dengan kata-kata buangan (stopword), merupakan istilah indeks dokumen”. 2.4.3. Penentuan Indeks Subjek dengan Menggunakan Dalil Zipf Ada beberapa langkah untuk menentukan indeks suatu artikel dengan menggunakan dalil ini yaitu : 1. Memilih dokumen. Dalam memilih dokumen peneliti biasanya memilih dokumen elektronik, karena informasi lebih bersifat akurat. 2. Menghitung jumlah frekwensi kata yang terdapat dalam dokumen, digunakan bantuan bantuan komputer, dengan memakai program aplikasi Microsoft Word. Caranya adalah semua kata yang terdapat pada artikel tersebut diblok (short), dengan menggunakan perintah convert table to text dari menu table, kemudian number colums diisi dengan angka satu (1), lalu di-click kemudian di ascending, hasilnya ialah bahwa semua kata akan tampil berurut dengan frekwensi pemunculannya, selanjutnya frekwensi kata tersebut dihitung secara manual dan hasil angka frekwensi yang diperoleh diketik disamping setipa kata (mulai dari frekwensi kata tertinggi sampai ke frekwensi rendah). 3. Menentukan titik transisi dari suatu dokumen. Untuk menentukan titik transisi, dipergunakan rumus dari Dalil Zipf II yang sudah dikembangkan yaitu rumus ABC yaitu:
4. Penentuan daerah transisi Dilakukan dengan cara mengambil 10 kata diatas dan 10 kata di bawah titik transisi. 5. Penentuan indeks dokumen. Kata-kata yang terdapat pada daerah transisi, setelah kata buangan (stopword) dihilangkan selanjutnya dijadikan menjadi indeks dokumen.
17 Universitas Sumatera Utara
6. Interprestasi terhadap indeks dokumen. Setelah indeks dokumen diperoleh, maka selanjutnya diinterpretasikan atau dinilai apakah indeks tersebut benar-benar dapat menggambarkan isi atau subjek dari artikel 2. Menghitung jumlah dan frekuensi kata 3. Menentukan titik transisi dari suatu dokumen 4. Penentuan daerah transisi 5. Penentuan indeks dokumen 6. Interpretasi terhadap indeks dokumen 2.4.4. Penelitian Terdahulu Sudah banyak penulis terdahulu yang melakukan penelitian menggunakan Dalil Zipf diantaranya yaitu ; Penelitian tentang Dalil Zipf yang sudah pernah dilakukan oleh (Simarmata 2006), pada artikel ilmiah dari Jurnal Agricultural Research, dimana jurnal ini lebih membahas tentang jurnal yang berbasis sains yang mengkhususkan kepada jurnal Ilmu Pertanian. Pada penelitian ini, hasil indeks yang menggunakan Dalil Zipf dibandingkan dengan hasil indeks secara konvensional (indeks yang dibuat oleh indekser) yang sudah ditetapkan secara langsung 2 human indexer di Unit Kerja Perpustakaan Sumatera Utara yang nantinya hasil indeks tersebut akan mewakili dari isi dokumen tersebut. Kesimpulan yang diambil bahwa, ada 13 artikel yang diuji coba dengan menggunakan Dalil Zipf, diperoleh data antara lain; 8 artikel memiliki indeks relevan yang sama dengan indeks yang dibuat oleh indekser dan 1 artikel memiliki relevan marginal dan 5 artikel lainnya tidak memiliki persamaan indeks. Hasil penelitian menunjukkan bahwa hasil pengindeksan dengan Dalil Zipf tidak sama dengan hasil pengindeksan yang dihasilkan oleh indekser. Selain itu penelitian dibidang Zipf’s juga dilakukan (Powers 1998), pada Information Theory and Psychological. Teori Zipf’s diterapkan pada teori tersebut dengan melihat frekuensi konstanta bebas. Dengan penggunaan Dalil Zipf dapat dilakukan penggabungan efek bahasa dan gaya penerjemahan. Beberapa terjemahan ditargetkan pada level kosa kata yang lebih dikenal serta penggunaan kosa kata secara teknis. Pada penelitian yang dilakukan oleh (Ginting,Sri Ulina 2003), pada artikel ilmiah dari Jurnal Lancet (Jurnal Ilmu Kedokteran dan Kesehatan) diperoleh
18 Universitas Sumatera Utara
kesimpulan bahwa dari kelima artikel yang telah diuji coba dengan menggunakan Dalil Zipf, diperoleh data antara lain tiga artikel memiliki kesamaan dan ketepatan istilah secara relevan marginal dengan indeks yang dihasilkan oleh indekser, yaitu artikel pertama, kedua dan artikel ketiga, dua artikel lainnya menunjukkan bahwa hasil pengindeksan menggunakan Dalil Zipf tidak memiliki kesamaan (tidak relevan) dengan indeks yang dihasilkan oleh indekser, yaitu artikel keempat dan kelima. Hasil penelitian menunjukkan bahwa Dalil Zipf tidak dapat sepenuhnya menggantikan posisi seorang indekser dalam melakukan kegiatan pengindeksan subjek, walaupun sebenarnya indeks yang dihasilkan Dalil Zipf dapat menggambarkan secara nyata isi dari artikel, karena indeks yang dihasilkan merupakan indeks tunggal (pra-koordinasi) yang dimunculkan dari bahasa alamiah (natural languanges) dari penulis artikel. Dalam penelitian yang dilakukan oleh (Sitohang 2009), pada artikel-artikel The Journal of Knee Surgery Volume 21, Issu 2, 3, dan 4 Tahun 2008, diperoleh kesimpulan bahwa penggunaan Dalil Zipf dalam pengindeksan subjek dapat menghasilkan indeks subjek tunggal (pra-koordinasi) yang diperoleh langsung dari bahasa dokumen itu sendiri, sedangkan indeks yang dihasilkan Medical Subject Headings pada artikel tersebut merupakan indeks subjek terkontrol atau menggunakan bahas baku. Dan penggunaan Dalil Zipf ternyata memiliki tingkat relevan yang tinggi jika dibandingkan dengan hasil relevan marginal dan hasil indeks subjek yang tidak relevan. Hal ini terbukti dari hasil rekapitulasi, dimana tingkat relevan berjumlah 66 % sedangkan tingkat relevan marginal dan tingkat non-relevan masing-masing 17 % serta Dalil Zipf dapat digunakan untuk pengindeksan subjek pada artikel tersebut karena pengindeksan Dalil Zipf dengan MeSH memiliki tingkat kerelevanan yang tinggi. Selanjutnya penelitian yang pernah
dilakukan oleh (Andriaty 2002)
dengan judul Aplikasi Dalil Zipf dalam pengindeksan, dapat disimpulkan bahwa menerapkan Dalil Zipf perlu memperhatikan penyusunan distribusi frekwensi kata, contohnya: kata merupakan rangkaian huruf yang diapit oleh spasi, kata yang dituliskan dengan garis penghubung dianggap sebagai kata tunggal, kutipan dianggap bagian dari teks, dll. Serta harus memperhatikan langkah penyusunan distribusi frekwensi kata, dan harus mampu menganalisis data dengan
19 Universitas Sumatera Utara
menentukan peringkat, frekwensi, dan kata yang sudah dimasukkan kedalam table distribusi frekwensi kata. Selain itu penelitian terdahulu yang dilakukan oleh (Hartinah 2002) dengan judul Penggunaan Dalil Zipf pada pengindeksan otomatis, dapat disimpulkan bahwa Dalil Zipf di desain untuk sistem informasi, yaitu dengan prinsip bahwa pengindeksan outomasi, dimana komputer menghitung kata yang sesungguhnya atau frase yang sering muncul, dan kata yang sering muncul atau paling banyaklah yang akan mewakili subjek indeks dari dokumen tersebut. Berikutnya penelitian terdahulu yang pernah dilakukan oleh (Mustafa 2009) dengan judul HUKUM ZIPF Mengenai Frekuensi Kata dalam Dokumen Sebagai Dasar Pengembangan Sistem Pengindeksan Otomatis (automatic indexing), dapat disimpulkan bahwa frekwensi pemunculan kata dalam suatu dokumen, baik ilmiah maupun non-ilmiah sebagai media komunikasi, mempunyai pola tertentu dan dapat dijadikan parameter dalam proses pengindeksan. Telah dikembangkan beberapa aplikasi komputer yang dapat membantu menentukan secara otomatis kata atau istilah indeks dari suatu teks lengkap dokumen digital. Proses ini dikenal sebagai pengindeksan secara otomatis (automatic indexing). Dengan teknik dan bantuan aplikasi komputer ini, kata atau istilah indeks dari suatu dokumen dapatditentukan tanpa melakukan proses pengindeksan manual oleh petugas profesional, melainkan cukup dengan menjalankan programnya, maka kata dan istilah indeks dapat segera diketahui. Jumlah kata atau istilah yang diinginkan dikeluarkan sebagai kata/ istilah indeks dapat diatur.
20 Universitas Sumatera Utara