ANALISIS HUBUNGAN ANTARA DESKRIPTOR, REFERENSI, DAN SITASI UNTUK MEMBANGUN STRUKTUR KOLEKSI DOKUMEN YANG INHEREN Zainal A. Hasibuan* dan Mustangimah** ABSTRACT There are many characteristics can be used to identify a document which cover characteristics of the documents, cited documents, and citing documents This research explored the inherent structure of a document collection as one of main components of information retrieval system. The characteristics examined are: descriptors, references (cited documents), and citations (citing documents). Three independent variables were studied: co-descriptor, bibliographic coupling, and co-citation. A test collection was constructed by searching on a single descriptor "information retrieval" in the CD-ROM version of Education Resource Information Clearinghouse (ERIC), covering the period 1981 through 1985. Descriptors were extracted from ERIC; cited and citing documents associated with the test collection were derived from Social Sciences Citation Index (SSCI), covering the period 1981 through 1990. Three hypothesis were tested in this study, that are: (1) the higher the frequency of co-descriptors between documents, the higher the frequencies of their bibliographic coupling and co-citation; (2) the higher the frequency of bibliographic coupling between documents, the higher the frequencies of their co-citation and co-descriptors; and (3) the higher the frequency of co-citation between documents, the higher the frequencies of their co-descriptors and bibliographic coupling. The results showed that all of three hypothesis are supported statistically and there is a significant linear relationship among the observed variables. It is mean that there is a significant relationship among descriptors, references, and citation, so that it can be used to construct the inherent structure of document collection in order to improve information retrieval system performance.
ABSTRAK Terdapat beberapa karakteristik yang dapat digunakan untuk mengidentifikasi suatu koleksi dokumen yang meliputi karakteristik yang dimiliki oleh dokumen yang bersangkutan, dokumen yang disitir (cited documents), dan dokumen yang menyitir (citing documents). Penelitian ini bertujuan untuk menggali struktur koleksi dokumen yang inheren yang merupakan salah satu komponen dalam sistem temu kembali informasi. Diamati 3 (tiga) karakteristik dokumen, yaitu deskriptor, referensi (cited documents), dan sitasi (citing documents). Variabel yang diamati adalah ko-deskriptor (co-descriptor), pasangan bibliografi (bibliographic coupling), dan ko-sitasi (co-citation). Selain itu penelitian ini juga bertujuan untuk mengukur keeratan hubungan dua variabel di antara ketiga variabel tersebut. Sebagai koleksi uji digunakan dokumen yang ditemukan dari penelusuran dengan menggunakan deskriptor "information retrieval" pada basis data Education Resource Information Clearinghouse (ERIC) versi CD-ROM periode tahun 1981 sampai dengan tahun 1985. Deskriptor diambil dari basis data ERIC; adapun referensi dan sitasi ditelusur dengan menggunakan basis data Social Sciences Citation Index (SSCI) periode tahun 1981 sampai dengan tahun 1990. Ada 3 (tiga) hipotesis yang diuji dalam penelitian ini yaitu: (1) semakin tinggi frekuensi ko-deskriptor maka akan semakin tinggi frekuensi pasangan bibliografi dan frekuensi ko-sitasi, (2) semakin tinggi frekuensi pasangan bibliografi maka akan semakin tinggi frekuensi ko-sitasi dan frekuensi ko-deskriptor, dan (3) semakin tinggi frekuensi ko-sitasi maka akan semakin tinggi frekuensi ko-deskriptor dan frekuensi pasangan bibliografi. Hasil penelitian menunjukkan bahwa ketiga hipotesis tersebut didukung secara statistik dan ada hubungan linear yang signifikan di antara variabel-variabel yang diamati. Ini berarti ada hubungan yang signifikan antara deskriptor, referensi, dan sitasi sehingga hal tersebut dapat digunakan untuk membangun struktur koleksi dokumen yang inheren dalam rangka meningkatkan unjuk kerja sistem temu kembali informasi.
PENDAHULUAN Siatem temu kembali informasi (Information Retrieval System) merupakan sistem yang kompleks. Sistem tersebut terdiri dari 3 (tiga) komponen utama yaitu dokumen, kueri pemakai, dan fungsi penyesuaian (matching function), di mana masing-masing komponen tersebut berpengaruh terhadap unjuk kerja sistem. Usaha untuk memperbaiki unjuk kerja sistem berkaitan dengan peningkatan efisiensi dan efektivitas masing-masing komponen. *
Fakultas Ilmu Komputer, Universitas Indonesia Pusat Pengembangan Teknologi Informasi dan Komputasi, Badan Tenaga Nuklir Nasional
**
1
Dokumen merupakan salah satu komponen utama dalam sistem temu kembali informasi. Kandungan informasi dokumen biasanya direpresentasikan dalam bentuk istilah indeks atau kata kunci yang merupakan pintu gerbang menunju subjek dokumen. Indeks atau kata kunci dapat dapat berupa kata atau istilah dalam bahasa alamiah (natural language), yaitu bahasa yang digunakan dalam dokumen, atau istilah dalam kosa kata terkendali (controlled vocabulary) seperti tesaurus. Deskriptor merupakan representasi subjek dokumen yang ditentukan oleh indekser atau pakar subjek menggunakan kosa kata terkendali. Pencarian dokumen berdasarkan deskriptor dilakukan dengan mempertimbangkan kandungan subjek koleksi dokumen. Hal ini dilakukan dengan menggunakan deskriptor sebagai input atau kueri. Beberapa dokumen yang mempunyai subjek yang sama mempunyai deskriptor yang sama, sehingga akan ditemukan secara bersama-sama dengan deskriptor tersebut. Deskriptor yang digunakan bersama oleh dua atau lebih dokumen disebut sebagai ko-deskriptor (co-descriptor). Pendekatan lain untuk menemukan dokumen yang relevan dalam suatu sistem temu kembali informasi adalah menggunakan referensi yang disitir oleh suatu dokumen, yang dikenal dengan pencarian berdasarkan sitasi. Hal ini dapat dilakukan dengan menggunakan nama pengarang, tahun terbit, judul, dan komponen lain yang mewakili dokumen yang disitir. Pencarian berdasarkan sitasi ini didasarkan pada pertimbangan adanya jaringan yang menghubungkan antara dokumen yang disitir dan dokumen yang menyitir. Beberapa dokumen yang menyitir dokumen yang sama memberikan indikasi adanya hubungan tertentu di antara dokumen-dokumen tersebut yang mengarah pada hubungan subjek. Jika 2 (dua) dokumen menyitir paling sedikit satu dokumen yang sama maka dikatakan bahwa kedua dokumen tersebut merupakan pasangan bibliografi (bibliographic coupling). Pasangan bibliografi ini merupakan indikasi adanya hubungan antara kedua dokumen tersebut. Di samping itu, beberapa dokumen yang secara bersama-sama disitir oleh suatu dokumen juga memberikan indikasi adanya hubungan tertentu di antara dokumendokumen tersebut. Jika 2 (dua) dokumen disitir oleh paling sedikit satu dokumen yang terbit kemudian, dikatakan bahwa kedua dokumen tersebut merupakan ko-sitasi (co-citation). Kositasi ini merupakan indikasi adanya hubungan antara kedua dokumen tersebut. Penelitian ini bertujuan untuk menggali struktur koleksi dokumen yang inheren sebagai suatu usaha untuk meningkatkan unjuk kerja sistem temu kembali informasi, dengan mengkaji karakteristik yang dimiliki oleh sekumpulan dokumen. Secara lebih spesifik penelitian ini bertujuan untuk mengetahui bagaimana hubungan antara ko-deskriptor, pasangan bibliografi, dan ko-sitasi. Ada 3 (tiga) hipotesis yang diuji dalam penelitian ini yaitu: semakin tinggi frekuensi ko-deskriptor maka akan semakin tinggi frekuensi pasangan bibliografi dan frekuensi ko-sitasi, semakin tinggi frekuensi pasangan bibliografi maka akan semakin tinggi frekuensi ko-sitasi dan frekuensi ko-deskriptor, dan semakin tinggi ko-sitasi maka akan semakin tinggi frekuensi ko-deskriptor frekuensi dan frekuensi pasangan bibliografi. Selain itu penelitian ini juga bertujuan untuk mengukur keeratan hubungan dua variabel di antara ketiga variabel tersebut.
TINJAUAN LITERATUR Dalam beberapa sistem temu kembali informasi, dokumen disimpan dalam bentuk surogat informasi seperti abstrak dan indeks (Pao, 1989: 98). Salah satu jenis indeks adalah indeks subjek yang menggambarkan topik atau subjek yang dibahas dalam dokumen. Deskriptor merupakan salah satu bentuk indeks, yaitu indeks yang ditentukan berdasarkan kosa kata terkendali. Jenis indeks yang lain adalah indeks sitasi yang menggambarkan dokumen melalui dokumen lain yaitu melalui referensi dan sitasi. Indeks tersebut merupakan titik akses vital yang menghubungkan dokumen dengan pencarian informasi.
2
Metode pencarian yang populer adalah pencarian dengan menggunakan deskriptor atau kata kunci. Akan tetapi berdasarkan asumsi bahwa seorang pengarang atau penulis menyitir hasil karya pengarang atau penulis lain menunjukkan adanya hubungan antara dokumen yang menyitir dengan dokumen yang disitir, maka pencarian berdasarkan sitasi merupakan upaya yang logis untuk menemukan dokumen yang relevan (Bonzi, 1982; Harter, 1986; Harter et al., 1993; Pao, 1986). Dengan demikian maka pencarian berdasarkan deskriptor dan pencarian berdasarkan sitasi merupakan metode pencarian yang bersifat komplementer dalam sistem temu kembali informasi (Chapman dan Subramanyam, 1981; Pao, 1986, 1989, 1993; McCain, 1989). Jika 2 (dua) dokumen menyitir paling sedikit satu dokumen yang sama maka dikatakan bahwa kedua dokumen tersebut terkapling secara bibliografi. Frekuensi pasangan bibliografi (bibliographic coupling) yaitu jumlah referensi yang dimiliki bersama oleh pasangan dokumen menunjukkan kekuatan pasangan (Kessler, 1963). Selanjutnya Kessler (1965) menunjukkan adanya hubungan yang erat (r=0,9) antara pasangan bibliografi dengan indeks subjek. Kemudian Vladut and Cook (1984) menunjukkan bahwa teknik pasangan bibliografi merupakan cara yang efektif untuk mendapatkan hubungan semantik antar publikasi ilmiah. Tidak seperti pasangan bibliografi yang menghubungkan dokumen sumber, ko-sitasi menghubungkan dokumen yang disitir. Ko-sitasi didefinisikan sebagai 2 (dua) dokumen yang disitir secara bersama-sama oleh paling sedikit satu dokumen yang terbit kemudian. Frekuensi atau kekuatan ko-sitasi adalah jumlah dokumen yang menyitir 2 (dua) dokumen sebelumnya secara bersama. Dua dokumen mempunyai kekuatan ko-sitasi yang tinggi apabila semakin banyak dokumen yang terbit kemudian yang menyitir kedua dokumen tersebut. Ko-sitasi dapat digunakan untuk menggambarkan spesialisasi (Small, 1973, 1980, 1987) dan dapat digunakan untuk menggambarkan keterhubungan subjek dalam koleksi dokumen (McCain, 1991). Pola ko-sitasi berubah dari waktu ke waktu sebagaimana berubahnya minat dalam suatu komunitas ilmiah. Sebagaimana pasangan bibliografi, kositasi dapat digunakan untuk mengukur kedekatan subjek antar dokumen (Small, 1973, 1980, 1987).
METODE PENELITIAN Penelitian ini dilakukan dengan menggunakan basis data Education Resource Information Clearinghouse (ERIC) versi CD-ROM tahun 1981 sampai dengan 1985. Hal ini didasarkan pada pertimbangan bahwa dalam jangka waktu 5 tahun dapat diperoleh dokumen yang disitir dan dokumen yang disitir dalam jumlah yang cukup. Sebagai langkah awal, dilakukan penelusuran dengan kata kunci “information retrieval” dalam ruas (field) deskriptor. Penelusuran dibatasi untuk jenis dokumen yang termasuk dalam kategori artikel jurnal. Dokumen yang diperoleh dari penelusuran ini digunakan sebagai koleksi uji. Deskriptor untuk masing-masing dokumen dalam koleksi uji adalah semua deskriptor yang terdapat dalam ruas deskriptor. Selanjutnya dilakukan penelusuran untuk mendapatkan data bibliografi dokumen yang disitir dan dokumen yang menyitir masing-masing dokumen dalam koleksi uji. Penelusuran dokumen yang disitir (referensi) dilakukan menggunakan basis data Social Science Citation Index (SSCI) versi CD-ROM pada kurun waktu yang sama. Adapun penelusuran dokumen yang menyitir (sitasi) dilakukan menggunakan basis data Social Science Citation Index (SSCI) versi CD-ROM pada kurun waktu tahun 1981 sampai dengan tahun 1990. Hal ini didasarkan pada pertimbangan bahwa dokumen dalam koleksi uji telah mendapatkan waktu yang cukup untuk disitir oleh dokumen lain yang terbit pada waktu selanjutnya. Setiap dokumen dalam koleksi uji dipasangkan satu sama lain. Selanjutnya diamati
3
variabel-variabel ko-deskriptor, pasangan bibliografi, dan ko-sitasi dari setiap pasangan dokumen tersebut. Ko-deskriptor adalah descriptor yang digunakan bersama oleh dua dokumen atau lebih, setelah deskriptor “information retrieval” dieliminasi. Hasil perhitungan masing-masing variabel disajikan dalam bentuk tabel distribusi frekuensi. Pengujian hipotesis dilakukan dengan uji t dan korelasi antar variabel diukur menggunakan koefisien korelasi Pearson. Kedua hal tersebut dilakukan dengan menggunakan paket program SPSS.
HASIL DAN PEMBAHASAN Karakteristik Koleksi Uji Tabel 1 menunjukkan karakteristik koleksi uji secara global. Jumlah dokumen dalam koleksi uji adalah 504 dengan jumlah deskriptor sebanyak 5.580. Dilihat dari referensinya (dokumen yang disitir), terdapat 208 (41,27%) dokumen yang tidak memiliki daftar referensi atau tidak dapat ditemukan dalam basis data SSCI, 296 (58,73%) dokumen memiliki paling sedikit satu referensi, dan jumlah total referensi sebanyak 5.248 dokumen. Dalam hal ini jumlah referensi bervariasi antara satu dokumen dengan dokumen lain dan terdapat ketidaklengkapan dan ketidakseragaman dalam penulisan referensi. Selanjutnya bila dilihat dari sitasinya (dokumen yang menyitir), terdapat 120 (23,8%) dokumen yang tidak memiliki sitasi (dokumen yang menyitir), 384 (74,2%) memiliki paling sedikit satu sitasi, dan jumlah total sitasi sebanyak 2.384 dokumen. Hal ini berarti 23,8% koleksi uji tidak pernah disitir oleh dokumen lain dalam kurun waktu yang ditetapkan dalam penelitian ini. Ko-deskriptor Jumlah pasangan dokumen yang diperoleh dari koleksi uji sebanyak 126.756 pasangan. Berdasarkan ko-deskriptornya, terdapat 40,256 (31,76%) pasangan dokumen yang tidak memiliki ko-deskriptor dan 86.500 (68,74%) pasangan dokumen memiliki paling sedikit satu ko-deskriptor. Frekuensi ko-deskriptor bervariasi antara 1 sampai dengan 13 dan sebagian besar pasangan dokumen yaitu sebanyak 43,343 (34,20%) hanya memiliki satu ko-deskriptor. Adapun distribusi pasangan dokumen berdasarkan frekuensi ko-deskriptor selengkapnya tercantum pada Tabel 2 Pasangan Bibliografi Pasangan bibliografi terjadi apabila suatu pasangan dokumen paling sedikit memiliki satu referensi yang sama. Dengan demikian maka dalam pasangan dokumen dimana salah satu atau kedua dokumen tidak mempunyai referensi, otomatis pasangan dokumen tersebut tidak memiliki pasangan bibliografi. Seperti telah dikemukakan pada bagian terdahulu bahwa banyaknya dokumen dalam koleksi uji yang memiliki paling sedikit referensi adalah 296 dokumen. Dari jumlah tersebut, terdapat 43.660 pasangan dokumen yang diharapkan memiliki pasangan bibliografi. Hasil analisis menunjukkan bahwa sebanyak 42.554 (97,47%) tidak memiliki pasangan bibliografi dan hanya sebanyak 1.106 (2,53%) yang memiliki pasangan bibliografi, dengan frekuensi atau kekuatan pasangan bibliografi bervariasi antara 1 sampai dengan 18. Karakteristik ini menunjukkan bahwa referensi memberikan kontribusi yang lemah terhadap pemasangan dokumen. Adapun distribusi pasangan dokumen berdasarkan kekuatan pasangan bibliografi selengkapnya tercantum pada Tabel 3. Ko-sitasi Ko-sitasi terjadi apabila suatu pasangan dokumen disitir secara bersama-sama oleh paling sedikit satu dokumen yang terbit kemudian. Dengan demikian maka dalam pasangan dokumen dimana salah satu atau kedua dokumen tidak mempunyai sitasi atau tidak pernah
4
disitir oleh dokumen lain, otomatis pasangan dokumen tersebut tidak memiliki ko-sitasi. Seperti telah dikemukakan pada bagian terdahulu bahwa banyaknya dokumen dalam koleksi uji yang memiliki sitasi adalah 384 dokumen. Dari jumlah dokumen tersebut, terdapat 73,536 pasangan dokumen yang diharapkan memiliki ko-sitasi. Hasil analisis menunjukkan bahwa sebanyak 71.142 (96,74%) tidak memiliki ko-sitasi dan hanya sebanyak 2.394 (3,26%) yang memiliki ko-sitasi dengan frekuensi bervariasi antara 1 sampai dengan 28. Karakteristik ini menunjukkan bahwa sitasi memberikan kontribusi yang lemah terhadap pemasangan dokumen. Adapun distribusi pasangan dokumen berdasarkan frekuensi ko-sitasi selengkapnya tercantum pada Tabel 4. Hubungan Antar Variabel Nilai-nilai ko-deskriptor, pasangan bibliografi, dan ko-sitasi bervariasi untuk setiap pasangan dokumen. Pasangan dokumen yang memiliki nilai tinggi untuk salah satu variabel, belum tentu memiliki nilai tinggi untuk kedua variabel yang lain. Misalnya pasangan dokumen yang memiliki frekuensi ko-deskriptor yang tinggi belum tentu memiliki frekuensi pasangan bibliografi dan ko-sitasi yang tinggi juga. Untuk menguji hipotesis pertama, diambil nilai 7 sebagai nilai batas frekuensi kodeskriptor yang tinggi, dan diperoleh 87 pasangan dokumen. Tabel 5 menunjukkan daftar pasangan dokumen yang mempunyai frekuensi ko-deskriptor tinggi dan nilai kedua variabel lain yang bersesuaian. Dari tabel tersebut terlihat bahwa pasangan dokumen yang memiliki frekuensi ko-deskriptor yang tinggi tidak otomatis memiliki frekuensi yang tinggi untuk pasangan bibliografi dan ko-sitasi. Misalnya pasangan dokumen [366;400] memiliki frekuensi tertinggi tetapi tidak memiliki pasangan biblkiografi dan ko-sitasi. Rata-rata frekuensi pasangan bibliografi dan ko-sitasi pada kelompok pasangan dokumen tersebut adalah masing-masing 0,47 dan 1.17. Nilai tersebut lebih besar daripada nilai rata-rata untuk keseluruhan pasangan dokumen yang memiliki pasangan bibliografi dan ko-sitasi. Dengan uji t pada taraf nyata 0,01 dan derajat bebas 86 memberikan nilai t sebesar 2,92 dan 3,11 masing-masing untuk pasangan bibliografi dan ko-sitasi. Hal ini berarti bahwa pasangan dokumen yang mempunyai frekuensi ko-deskriptor tinggi cenderung mempunyai frekuensi pasangan bibliografi dan ko-sitasi yang tinggi. Hasil ini mendukung hipotesis pertama yang menyatakan bahwa semakin tinggi frekuensi ko-deskriptor maka semakin tinggi juga frekuensi pasangan bibliografi dan ko-sitasinya. Selanjutnya untuk menguji hipotesis kedua, diambil nilai 4 sebagai nilai batas frekuensi pasangan bibliografi yang tinggi dan diperoleh 64 pasangan dokumen. Tabel 6 menunjukkan daftar pasangan dokumen yang mempunyai frekuensi pasangan bibliografi tinggi dan nilai kedua variabel lain yang bersesuaian. Nilai rata-rata ko-sitasi dan ko-deskriptor pada kelompok pasangan dokumen tersebut masing-masing 2,34 dan 2,88. Nilai tersebut lebih besar daripada nilai rata-rata untuk keseluruhan pasangan dokumen yang memiliki ko-sitasi dan ko-deskriptor. Dengan uji t pada taraf nyata 0,01 dan derajat bebas 63 memberikan nilai t sebesar 5,29 dan 7,70 masing-masing untuk ko-sitasi dan ko-deskriptor. Hal ini berarti bahwa pasangan dokumen yang mempunyai frekuensi pasangan bibliografi tinggi cenderung mempunyai frekuensi ko-sitasi dan ko-deskriptor yang tinggi. Hasil ini mendukung hipotesis kedua yang menyatakan bahwa semakin tinggi frekuensi pasangan bibliografi maka semakin tinggi juga frekuensi ko-sitasi dan ko-deskriptornya. Selanjutnya untuk menguji hipotesis ketiga, diambil nilai 5 sebagai nilai batas frekuensi ko-sitasi yang tinggi dan diperoleh 64 pasangan dokumen. Tabel 7 menunjukkan daftar pasangan dokumen yang mempunyai frekuensi ko-sitasi tinggi dan nilai kedua variabel lain yang bersesuaian. Dalam hal ini nilai rata-rata ko-deskriptor dan pasangan bibliografi pada kelompok pasangan dokumen tersebut masing-masing 3,69 dan 1,98. Nilai tersebut lebih besar daripada nilai rata-rata untuk keseluruhan pasangan dokumen yang memiliki ko-
5
deskriptor dan pasangan bibliografi. Dengan uji t pada taraf nyata 0,01 dan derajat bebas 63 memberikan nilai t sebesar 9,84 dan 4,75 masing-masing untuk ko-deskriptor dan pasangan bibliografi. Hal ini berarti bahwa pasangan dokumen yang mempunyai frekuensi ko-sitasi tinggi cenderung mempunyai frekuensi ko-deskriptor dan pasangan bibliografi yang tinggi. Hasil ini mendukung hipotesis ketiga yang menyatakan bahwa semakin tinggi frekuensi kositasi maka semakin tinggi juga frekuensi ko-deskriptor dan pasangan bibliografinya. Untuk mengetahui kekuatan hubungan antara dua variabel digunakan analisis korelasi yaitu koefisien korelasi Pearson. Analisis korelasi ini didasarkan pada pasangan dokumen yang mempunyai nilai lebih besar dari nol untuk kedua variabel yang dimaksud. Selanjutnya untuk mengetahui signifikansi koefisien korelasi tersebut dilakukan pengujian hipotesis H0: ρ = 0 versus H1: ρ > 0 dengan uji t. Adapun hasil analisis korelasi dan pengujian hipotesis tercantum pada Tabel 8. Dari Tabel 8 terlihat bahwa nilai p untuk setiap pasangan dua variabel lebih kecil dari 0,001. Hal ini menunjukkan bahwa pada taraf nyata 0,001 terdapat korelasi yang signifikan antara dua variabel. Dengan demikian maka terdapat korelasi yang positif antara kodeskriptor dan pasangan bibliografi, ko-deskriptor dan ko-sitasi, serta pasangan bibliografi dan ko-sitasi. Seperti telah dikemukakan pada bagian terdahulu bahwa ko-deskriptor, pasangan bibliografi, dan ko-sitasi berkaitan dengan subjek dokumen, maka deskriptor, referensi, dan sitasi dapat digunakan untuk membangun struktur yang inheren untuk merepresentasikan subjek dokumen dalam usaha untuk meningkatkan unjuk kerja sistem temu kembali informasi.
KESIMPULAN Dari uraian di atas dapat disimpulkan bahwa ada hubungan yang erat antara deskriptor, referensi, dan sitasi. Semakin tinggi frekuensi ko-deskriptor maka akan semakin tinggi frekuensi pasangan bibliografi dan frekuensi ko-sitasi, semakin tinggi frekuensi pasangan bibliografi maka akan semakin tinggi frekuensi ko-sitasi dan frekuensi ko-deskriptor, dan semakin tinggi ko-sitasi maka akan semakin tinggi frekuensi ko-deskriptor frekuensi dan frekuensi pasangan bibliografi. Selain itu ada hubungan linear yang signifikan di antara codeskriptor, pasangan bibliografi, dan ko-sitasi. Hasil tersebut menunjukkan adanya hubungan yang signifikan antara deskriptor, referensi, dan sitasi sehingga hal tersebut dapat digunakan untuk membangun struktur koleksi dokumen yang inheren dalam rangka meningkatkan unjuk kerja sistem temu kembali informasi.
DAFTAR PUSTAKA 1. Bonzi, Susan. (1982). Characteristic of a literature as predictors of relatedness between cited and citing works, Journal of the American Society for Information Science, 33, 4, 208-216. 2. Borko, Harold. (1977). Toward a theory of indexing, Information Processing and Management, 13, 6, 355-365. 3. Braam, R. R., Moed, H. & van Raan , A. F. J. (1991). Mapping of science by combined cocitation and word analysis. I. Structural aspects. Journal of the American Society for Information Science, 42, 4, 233-251. 4. Braam, R. R., Moed, H. & van Raan , A. F. J. (1991). Mapping of science by combined cocitation and word analysis. II. Dynamical aspects. Journal of the American Society for Information Science, 42, 4, 252-266. 5. Chapman, J and K. Subramanyam. (1981). Citation search strategy. National Online Meeting, 97-102. 6. Griffiths, A., Luckhurst, H. C., & Willett, P. (1986). Using inter-document similarity
6
7. 8.
9. 10. 11.
12. 13. 14.
15. 16. 17. 18. 19. 20. 21. 22. 23.
24. 25. 26. 27.
information in document retrieval system. Journal of the American Society for Information Science , 37, 1, 3-11. Harter, S. P. (1986). Online Information Retrieval: Concepts, Principles, and Techniques. Academic Press, Orlando, FL. Harter, S. P., Nisonger, T. E. & Aiwei Weng. (1993). Semantic relationships between cited and citing articles in library and lnformation science journals. Journal of the American Society for Information Science, 44, 9, 543-552. Kessler, M. M. (1963). Bibliographic coupling between scientific papers. American Documentation, 14, 10-25. Kessler, M. M. (1965). Comparison of the results of bibliographic coupling and analytic subject indexing. American Documentation, 16, 223-233. Kwok, K. L. (1985). A probabilistic theory of indexing and similarity measure based on cited and citing documents. Journal of the American Society for Information Science, 36, 5, 342-351. Leydesdorff, L., & Zaal, R. (1987/1988). Co-words and citations relations between document sets and environments. Informetrics, 105-119. McCain, K. W. (1986). Co-cited author mapping as a valid representation of intellectual structure. Journal of the American Society for Information Science, 37, 3, 111-122. McCain, K. W. (1989). Descriptor and citation retrieval in the medical behavioral sciences literature: Retrieval overlaps and novelty. Journal of the American Society for Information Science, 40, 2, 110-114. McCain, K. W. (1991). Core journal networks and co-citation maps: new bibliometric tools for serials research and managements. Library Quarterly, 61, 3, 311-336. Pao, M. L. (1986). Comparing retrievals by keywords and citation. Proceeding of the 7th National Online Meeting, 341-346. Pao, M. L. & Worthen, D. B. (1989). Retrieval effectiveness by semantic and citation searching. Journal of the American Society for Information Science, 40, 4, 226-235. Pao, M. L. (1993). Term and citation retrieval: A field study. Information Processing and Management, 29, 1, 95-112. Salton, G. (1971). Automatic indexing using bibliographic citations. Journal of Documentation, 27, 2, 98-110. Shaw, W. M. Jr. (1985). Critical thresholds in co-citation graphs. Journal of the American Society for Information Science, 36, 1, 38-43. Shaw, W. M. Jr. (1986). An investigation of document partition. Information Processing and Management, 22, 1, 19-28. Shaw, W. M. Jr. (1990). An investigation of document structures. Information Processing and Management, 26, 3, 339-348. Small, H. (1973). Co-citation in the scientific literature: A new measure of the relationship between two documents. Journal of the American Society for Information Science, 24, 4, 265-269 Small, H. (1980). Co-citation Context Analysis and the Structure of Paradigms. Journal of Documentation, 36, 3, 183-196 Small, H. (1987). The Significance of Bibliographic References. Scientometric, 12, 339-341 Trivison, D. (1987). Term co-occurrence in cited/citing journal articles as a measure of document similarity. Information Processing and Management, 23, 3, 183-194. Vladutz, G & J. Cook. (1984). Bibliographic coupling and subject relatedness. Proceeding ASIS 47th Annual Meeting: 204-207.
7
Tabel 1. Karakteristik Koleksi Uji ________________________________________________________________________ Dokumen: Jumlah dokumen 504 Jumlah dokumen yang memiliki paling sedikit satu referensi 296 Jumlah pasangan dokumen yang mungkin 126,756 Deskriptor: Jumlah total deskriptor 5,580 Jumlah pasangan dokumen yang mempunyai paling sedikit satu co deskriptor 85,500 Referensi (dokumen yang disitir): Jumlah total referensi 5,248 Jumlah pasangan dokumen yang mempunyai paling sedikit satu pasangan bibliografi 1,106 Sitasi (dokumen yang menyitir): Jumlah dokumen yang mempunyai paling sedikit satu dokumen yang menyitir 384 Jumlah total dokumen yang menyitir 2,384 Jumlah pasangan dokumen yang mempunyai paling sedikit satu ko-sitasi 2,394 __________________________________________________________________________ Tabel 2. Distribusi Frekuensi Ko-deskriptor. Frekuensi Pasangan dokumen ko-deskriptor Jumlah Persentase 0 40.256 31,76 1 43.343 34,20 2 27.892 22,00 3 10.886 8.59 4 3.157 2,49 5 946 0,75 6 189 0,15 7 66 0,05 8 13 0,01 9 4 ≅ 0.00 10 3 ≅ 0,00 11 0 0,00 12 0 0,00 13 1 ≅ 0,00 Total 126.756 100 Rata-rata 1,19
8
Tabel 3. Distribusi Frekuensi Pasangan Bibliografi. Frekuensi Pasangan dokumen pasangan bibliografi Jumlah Persentase 0 42.554 97,47 1 796 1,82 2 191 0,44 3 55 0,13 4 26 0,06 5 16 0,04 6 4 0,01 7 4 0,01 8 5 0,01 9 1 ≅ 0,00 10 3 0,01 11 1 ≅ 0,00 12 0 0,00 13 1 ≅ 0,00 14 1 ≅ 0,00 15 1 ≅ 0,00 16 0 0,00 17 0 0,00 18 1 ≅ 0,00 Total 43.660 100,00 Rata-rata 0,04 Tabel 4. Distribusi Frekuensi Ko-sitasi. Frekuensi Pasangan dokumen ko-sitasi Jumlah Persentase 0 71.142 1 1.875 2 311 3 104 4 40 5 20 6 14 7 9 8 5 9 2 10 2 11 3 12 3 13 1 14 2 16 1 25 1 28 1 Total 73.536 Rata-rata 0,05
9
Tabel 5. Kelompok pasangan dokumen dengan frekuensi ko-deskriptor tinggi No.
Pasangan dokumen
Kodesk
Pasangan bibliografi
Kositasi
No.
Pasangan dokumen
Kodesk
Pasangan bibliografi
Kositasi
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44.
(366:400) (140:153) (366:438) (400:438) (230:231) (363:392) (424:445) (438:453) (163:164) (239:240) (253:422) (268:269) (269:332) (313:422) (321:500) (412:420) (424:438) (424:448) (424:460) (443:444) (94:165) (120:371) (139:143) (139:301) (139:332) (143:301) (143:332) (149:269) (149:284) (149:288) (149:494) (164:230) (165:272) (165:340) (165:396) (165:483) (172:173) (173:453) (198:348) (230:239) (230:253) (230:256) (239:256) (239:422)
13 10 10 10 9 9 9 9 8 8 8 8 8 8 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7
0 25 0 0 0 11 0 0 1 0 0 1 0 0 2 0 0 0 0 0 7 1 5 7 1 7 1 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 2 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 7 8 4 3 3 1 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0
45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87.
(239:454) (248:448) (248:455) (253:256) (253:383) (253:393) (253:414) (256:422) (256:454) (261:269) (269:301) (269:302) (281:348) (287:307) (288:494) (301:302) (314:448) (315:363) (315:392) (315:422) (315:424) (315:452) (322:422) (332:494) (348:494) (361:424) (361:448) (385:392) (385:468) (392:399) (393:422) (396:483) (397:502) (414:422) (421:452) (422:452) (434:452) (438:445) (455:497) (482:487) (76:106) (93:165) (93:94) Rata-rata
7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7,62
0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 3 2 0 0 3 0 0 0 0 1 0 1 0 0 0 1 0 1 0 1 0 1 0 0 4 11 1,17
0 0 0 0 0 0 0 0 0 2 1 1 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0,47
10
Tabel 6. Kelompok pasangan dokumen dengan frekuensi pasangan bibliografi tinggi No.
Pasangan dokumen
Pasangan bibliografi
Kodesk
Kositasi
No.
Pasangan dokumen
Pasangan bibliografi
Kodesk
Kositasi
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.
(25,74) (30,162) (74,180) (5,28) (127,162) (13,14) (139,196) (196,237) (30,127) (7,237) (139,143) (337,429) (45,139) (5,44) (5,139) (143,196) (139,237) (120,371) (120,144) (5,15) (5,100) (335,359) (7,139) (301,317) (7,196) (162,284) (162,489) (45,196) (45,261) (44,139) (30,296) (28,44) (15,44)
18 15 14 13 11 10 10 10 9 8 8 8 8 8 7 7 7 7 6 6 6 6 5 5 5 5 5 5 5 5 5 5 5
1 1 3 4 3 5 5 3 1 4 7 5 1 2 4 5 4 7 1 4 2 4 3 2 3 4 3 1 2 2 1 2 3
10 0 0 13 0 16 1 0 0 0 5 0 2 11 3 4 1 1 0 7 0 4 1 1 1 0 0 0 3 4 0 10 6
34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64.
(144,349) (69,391) (25,180) (45,301) (5,45) (5,120) (329,363) (272,396) (329,340) (37,440) (165,183) (139,261) (45,302) (139,436) (37,301) (139,301) (37,196) (269,332) (436,457) (359,457) (30,120) (317,440) (45,143) (37,139) (260,277) (120,451) (5,436) (45,440) (196,301) (301,442) (301,440) Rata-rata
5 5 5 5 5 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 6,20
2 2 2 1 0 2 5 2 3 2 5 5 1 2 3 7 3 8 1 1 2 3 1 3 2 1 2 1 5 2 3 2,88
3 3 0 2 2 0 2 0 0 2 5 6 0 0 4 7 1 0 0 0 0 0 0 2 2 2 0 0 2 0 1 2,34
11
Tabel 7. Kelompok pasangan dokumen dengan frekuensi ko-sitasi tinggi No.
Pasangan dokumen
Kositasi
Pasangan bibliografi
Kodesk
No.
Pasangan dokumen
Kositasi
Pasangan bibliografi
Kodesk
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.
(145:168)
28 25 16 14 14 13 12 12 12 11 11 11 10 10 9 9 8 8 8 8 8 7 7 7 7 7 7 7 7 7 6 6 6
2 0 10 1 2 13 0 2 0 8 2 0 18 5 1 0 0 1 0 2 1 0 0 4 3 0 0 1 0 6 1 4 2
6 10 5 2 2 4 3 3 2 2 9 7 1 2 2 4 2 3 2 3 2 5 8 7 7 5 3 4 6 1 5 5 2
34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64.
(363:381)
6 6 6 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 7,87
0 1 2 1 2 5 0 0 0 1 1 0 1 0 2 0 1 2 0 4 3 0 0 1 0 0 1 1 8 1 0 1,98
2 1 3 4 3 5 6 2 5 5 5 1 2 4 4 4 3 4 2 5 1 2 4 3 2 4 2 3 7 2 2 3,69
(140:153) (13:14) (14,140) (14,153) (5:28) (13:140) (13:153) (197:222) (5:44) (363:392) (93:94) (25:74) (28:44) (361:363) (164:165) (69:153) (144:168) (14:69) (13:69) (69:140) (144:145) (94:165) (139:301) (143:301) (500:502) (306:502) (135:153) (500:501) (5:15) (135:361) (139:261) (69:277)
(14:156) (14:135) (306:500) (15:44) (15:28) (501:502) (168:445) (94:164) (154:301) (156:392) (69:263) (69:363) (350:501) (5:301) (259:306) (8:168) (338:359) (14:361) (165:183) (14:363) (153:419) (306:501) (69:260) (44:301) (28:301) (69:392) (69:121) (139:143) (44:143) (69:156)
Rata-rata
Tabel 8. Koefisien korelasi Pearson (ρ ρ ) antar dua variabel dan hasil pengujian hipotesis terhadap ρ ρ Variabel Ko-deskriptor vs Pasangan bibliografi 0,0183 Ko-deskriptor vs Ko-sitasi 0,221 Pasangan bibliografi vs Co- sitasi 0,331 Keterangan: n: jumlah pasangan dokumen yang untuk kedua variabel p: nilai peluang
n 1106 2394 303 mempunyai
p 0,0001 0,0001 0,0001 nilai tidak nol
12 HOME
KOMPUTASI DALAM SAINS DAN TEKNOLOGI NUKLIR XII