SLiMS Commeet 2015
Satu Pintu Pencarian Untuk Seluruh Perpustakaan Berbasis SLIMS di Indonesia Ismail Fahmi, PhD Konsultan Perpusnas RI Inisiator Indonesia OneSearch
[email protected]
SLiMS Community Meetup 2015 Malang, 7 November 2015
Perkenalan… Ismail Fahmi 2004 – 2009 2003 – 2004 1992 – 1997
S3, Information Science, Universitas Groningen, Belanda S2, Information Science, Universitas Groningen, Belanda S1, Teknik Elektro, ITB
2009 – Sekarang
Engineer di Weborama, Perusahaan Penyedia Platform Iklan berbasis big data audience (Paris/Amsterdam) Co-Founder Awesometrics, Media Monitoring & Analytics Company Founder PT. Media Kernels Indonesia, a Natural Language Processing- based Company Konsultan Perpustakaan Nasional, Inisiator Indonesia OneSearch
2012 – Sekarang
2014 – Sekarang 2015 – Sekarang
2000 – 2003
Inisiator IndonesiaDLN (Digital Library Network pertama di Indonesia) Mengembangkan Ganesha Digital Library (GDL) Mendirikan Knowledge Management Research Group (KMRG) ITB Membangun Digital Library ITB
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
3
Perpustakaan di Indonesia 25.728 Perpustakaan Indonesia memiliki jumlah perpustakaan yang luar biasa besar. Ada total 25.728 perpustakaan, yang terdiri dari 22 ribu perpustakaan sekolah, 845 perpustakaan perguruan tinggi, 1.5 ribu perpustakaan umum, dan seribu perpustakaan khusus.
Jenis Perpustakaan
Jenis Perpustakaan
Jumlah
Propinsi
Sekolah
PT
Umum
Khusus
ACEH
343
15
30
32
BALI
265
17
87
26
BANTEN
259
22
24
BENGKULU
365
13
DI. YOGYAKARTA
794
DKI JAKARTA
1044
GORONTALO
Jumlah
Propinsi
Sekolah
PT
Umum
Khusus
420
LAMPUNG
1096
18
35
48
1197
395
MALUKU
108
7
15
10
140
2
307
10
43
431
76
39
50
959
MALUKU UTARA NUSA TENGGARA BARAT NUSA TENGGARA TIMUR
0 445 264
0 17 13
10 34 53
0 45 25
10 541 355
121
21
143
1329
PAPUA
52
11
5
15
83
16
4
6
0
26
JAMBI
368
8
15
2
393
PAPUA BARAT RIAU
0 303
2 17
1 11
0 2
3 333
JAWA BARAT
4339
87
287
67
4780
SULAWESI BARAT
10
1
4
1
16
JAWA TENGAH
4022
91
114
41
4268
SULAWESI SELATAN
1158
34
62
21
1275
JAWA TIMUR KALIMANTAN SELATAN
1355 908
128 35
308 39
89 44
1880 1026
SULAWESI TENGAH
1091
10
59
41
1201
SULAWESI TENGGARA
363
8
21
44
436
KALIMANTAN TENGAH
190
12
19
28
249
SULAWESI UTARA
72
9
28
13
122
KALIMANTAN TIMUR
967
19
27
105
1118
SUMATERA BARAT
335
8
28
3
374
KALIMATAN BARAT KEP. BANGKA BELITUNG
852 82
12 3
31 10
38 1
933 96
SUMATERA SELATAN
428
9
21
4
462
SUMATERA UTARA
117
15
38
8
178
KEPULAUAN RIAU
364
3
14
11
392
Total
22375 845
1506
1002
25728
* Sumber data: Perpusnas
4
Disjoined
• • • • • • • • • • …
http://eresources.perpusnas.go.id/ index.php http://perpusnas.go.id/ BukuElektronik.aspx http://perpusnas.go.id/ LiteraturKelabu.aspx http://perpusnas.go.id/Majal ahOnline.aspx http://opac.perpusnas.go.id/ http://kin.perpusnas.go.id/ http://bni.perpusnas.go.id/ http://perpusmitra.pnri.go.id/
• •
…
http://lib.ui.ac.id/opac/ui/template cari.jsp?inner=formcari_depan.jsp http://uindonesia.summon.serialss olutions.com/search?s.q= http://journal.ui.ac.id/home/ http://lib.ui.ac.id/opac/ui/template .jsp?inner=dbonline.jsp?hal=1
• http://digilib.itb.ac.id/ • http://union.lib.itb.ac.id/ • http://www.lib.itb.ac.id/e-journal … • http://perpustakaan.kemkes.go.id/cgibin/koha/opac-whounioncat.pl? • http://perpustakaan.kemkes.go.id/ • http://perpustakaan.depkes.go.id/library/ • http://kink.depkes.go.id/kinkes/web …
Tidak Saling Terhubung (Disjoined) Dalam sebuah institusi perpustakaan, ada banyak portal pencarian (opac, digital library, e-resources, dll). Semuanya terpisah, sehingga pemustaka harus mengunjungi setiap portal satu per satu jika ingin mengakses. Dan antar institusi perpustakaan, tidak ada sambungan yang memungkinkan pemustaka bisa memanfaatkan koleksi-koleksi seluruh institusi.
5
Garuda.Dikti.go.id
6
PortalGaruda.org • Merupakan Indonesian Publication Index (IPI). • Diinisiasi oleh Institute of Advanced Engineering and Science Indonesia Section (IAES) Indonesia Section. • Khusus mengindeks jurnal publikasi ilmiah di Indonesia. • Jurnal dikelompokkan berdasarkan Subjek. • Saat ini telah mengindeks 2700 journal dan 250.000 artikel. 7
ISJD
8
Mengapa Masih Butuh Portal Baru? • Belum ada portal yang mengindeks seluruh jenis koleksi (jurnal, ILS, grey literatur / digital library). – PortalGaruda dan ISJD hanya khusus untuk journal – Garuda.dikti.go.id sudah tidak aktif lagi.
• Belum ada portal yang sangat mudah digunakan oleh pengguna dengan fitur informasi yang sangat kaya. – PortalGaruda yang paling bagus user interfacenya, namun belum lengkap fitur informasi yang disajikan. – Perlu portal yang sangat memudahkan pengguna mencari informasi yang dibutuhkan, dan bahkan bisa meningkatkan serendipity.
• Belum ada portal yang mobile friendly, padahal saat ini mobile device semakin banyak digunakan oleh pengguna. – PortalGaruda dan ISJD didesain untuk browser desktop. – Untuk meningkatkan diseminasi dan usability, portal harus semakin berorientasi pada pengguna.
9
Requirement untuk Portal Baru • Repository dan koleksi – Mencakup semua jenis repositori dan koleksi (journal, ILS, digital library)
• Interoperability dan update – OAI-PMH (Harvesting), satu-satunya metode harvesting – OAI-PMP (Posting), metode posting offline – Otomatis update
• User Interface dan fitur – Simple, mudah digunakan, powerful search engine, diperkaya dengan faceted search, dan informasi yang lengkap.
• Mobile – Mendukung mobile device (smartphone, tablet)
• Authority dan report – Informasi tentang pengarang, citation index, dan statistik yang penting dan menarik untuk kontributor.
• Sustainable – Didukung oleh sistem yang memungkinkan portal berkembang untuk jangka panjang. 10
Indonesia OneSearch
Any platforms
Any collections
11
Road Map Tahap 1 (2015): OneSearch Basic Input • Bibliography • Perpusnas tematic databases
Process • Harvesting • Search & Facet • Bibliography indexing
Output • Search bibliography • Search Summon • OAI Manager
Tahap 2 (2016): OneSearch Advanced Input
Tahap 3 (2017): NoPlagiarism
• PDF Fulltext
Process • • • • • • •
PDF crawling PDF to text and image converting Fulltext indexing Linguistics processing Semantic indexing Content analysis Statistics: collection, usage
Output • • • •
View fulltext online (eReader) Content analysis and research Citation Index View collection and usage statistics
Input • PDF Fulltext • Wikipedia (Bahasa Indonesia) • Online news (Bahasa Indonesia)
Process • • • • •
Wikipedia crawling Online news crawling Document fingerprint indexing Similarity analyzer Similarity Report builder
Output • Document upload • Document similarity detection report • Admin
12
Tahap 1 (Mulai 2015) • OneSearch Basic • Target – Teknis: • • • • • • •
Metadata Harvesting, otomatis, tidak ada penambahan manual. Interoperability menggunakan OAI-PMH Metadata Prefix: MARCXML dan OAI_DC Prototipe Server Database dan Form Registrasi Repository Reporting dan analytics Integrasi beberapa Software: – – – –
ILS: INLIS Lite, SLIMs, KOHA Journal: OJS Digital Library/Repository: Dspace, dll. Summon
– Non-Teknis: • • • •
Strategi pengelolaan dan sustainability Indonesia OneSearch Masukan dari komunitas Pembentukan Tim Kerjasama, sosialiasi
13
Tahap 2 (Mulai 2016) • OneSearch Advanced • Target: – Teknis: • • • •
Full-text Harvesting Penerapan teknologi NLP (Natural Language Processing) Content analysis terhadap full-text Pengguna mendapatkan banyak kemudahan dalam melakukan pencarian dan riset. • Authority index. • Citation parsing and indexing.
– Non-Teknis: • Kampanye tentang sharing full-teks, • Demo manfaat content analysis untuk pengguna.
14
Perl ParsCit • Parsing and indexing citation. • Using ParsCit open source software. – https://github.com/knmnyn/ParsCit – http://wing.comp.nus.edu.sg/parsCit/ – ParsCit is used by CiteseerX to parse document for citation.
15
CiteSeerX
16
Teknologi NLP di dalam OneSearch • Text mining, content analysis: – Terminologi extraction – Named entity extraction: person, organization, location, event, time – Quote extraction – Cooccurrence analysis – Relationship extraction: S-P-O (subject-predicate-object) relations, entity relations. – Clustering, topic mapping
17
Contoh S-P-O Relationship Extraction
18
Contoh Relationship Mapping
19
Co-occurrence kata kunci penting terkait “nilai tukar rupiah” dalam berita online.
Tahap 3 (Mulai 2017) • NoPlagiarism • Target: – Teknis: • Membangun sistem plagiarism detector. • Mengindeks news, wikipedia, blogs, dan seluruh full-teks dalam Indonesia OneSearch untuk plagiarism detector; paling lengkap untuk teks dalam bahasa Indonesia. • Menyediakan infrastruktur server dan data center untuk plagiarism detector. • Membangun interface seperti Turnitin untuk pengguna di PT, lembaga riset, dan individual.
– Non-Teknis: • Ujicoba dan sosialiasi NoPlagiarism ke dosen dan mahasiswa di perguruan tinggi. • Kampanye anti-plagiarism. 21
Turnitin Kemampuan mendeteksi plagiarisme sangat tergantung pada database artikel yang diindeks. Turnitin mengindeks sebagian besar artikel berbahasa Inggris, tetapi tidak untuk
yang berbahasa Indonesia dan tidak dishare.
22
Indonesia OneSearch + NoPlagiarism
23
Konfigurasi Lengkap Indonesia OneSearch
24
Program Perpustakaan Nasional
Indonesia OneSearch is a program by the National Library of Indonesia 25
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
26
Interoperability: OAI-PMH
MULTI-PLAFORM LIBRARY INFORMATION SYSTEM
Library Otomation servers (INLIS) Otomation/Digital Library servers (SLIMs) Digital Library servers (Eprints, Dspace, dll)
OAI PMH Harvesting (online)
Fulltext Files (PDF) Download
OAI PMH E-Journal (OJS) Harvesting Other Repository (Omeka, dll)
OAI PMP Posting (offline)
27
Skenario Interoperability
OAI-PMH
OAI-PMH
OAI-PMH
UCS A Open journal system
OAI-PMH
UCS B
slimsucs.onesearch.id UCS Upload
UCS Upload
OAI-PMH
29
OAI-PMH Structure Model
30
Skenario Interoperabilitas
31
OAI-PMH Untuk SLIMS (versi lama) http://wiki.onesearch.id/doku.php?id=oai-slims
32
Source Code OAI-PMH untuk SLIMs (lama) http://wiki.onesearch.id/doku.php?id=slims-oai-pmh
33
Source Code OAI-PMH untuk UCS SLIMS http://wiki.onesearch.id/doku.php?id=ucs-oai-pmh
34
Contoh Library OAI-PMH (SLIMs)
35
Contoh Response
36
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
37
Bergabung dengan Indonesia OneSearch • Aspek Legal: – Institusi Anda akan bekerja sama dengan Perpustakaan Nasional RI. – MOU dan Perjanjian Kerjasama (jika dibutuhkan) dapat dilakukan dengan Perpustakaan Nasional RI.
• Aspek Teknis: – Registrasi Online via situs OneSearch.id – Konsultasi/support dengan Tim teknis Indonesia OneSearch
38
Jenis Repositori • Journal • Integrated Library System (ILS) • Digital Repository/Library
39
Registrasi Jurnal http://onesearch.id/Repositories/AddJournal
40
Registrasi Jurnal (lanj.) Library Type
Software Platform
Metadata Prefix 41
Registrasi Jurnal (lanj.)
Subject Area mengadopsi ISJD PDII LIPI
42
Digital Repository
43
ILS
44
Contoh Registrasi: UCS Gorontalo
45
Manajemen Repositori
46
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
47
Harvesting & Indexing • Secara otomatis dan periodik dilakukan oleh server Indonesia OneSearch. • Selalu pastikan agar OAI-PMH anda aktif dan dapat diakses oleh server IOS.
48
Contoh: Harvesting & Indexing UCS Gorontalo root@onesearch# perl harvest_oai_dc.pl Usage: harvest_oai_dc.pl
root@onesearch# perl harvest_oai_dc.pl 2675 Processing IOS2675... Autodetecting date granularity... found YYYY-MM-DDThh:mm:ssZ. Processing 100 records... Processing 100 records... Processing 100 records... Processing 100 records... Processing 100 records... … Processing 100 records... Processing 100 records... Processing 60 records... Completed without errors -- 1 source(s) processed. Processing /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13078.xml ... Successfully imported /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13078.xml... Processing /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13079.xml ... Successfully imported /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13079.xml... Processing /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13080.xml ... Successfully imported /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13080.xml... Processing /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13081.xml ... Successfully imported /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13081.xml... Processing /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13082.xml ... Successfully imported /usr/local/vufind2/local/harvest/IOS2675/1446822608_oai_gorontalolibnet_com_slims_13082.xml... … 49
Response ListRecords UCS Gorontalo
50
XSLT untuk UCS SLIMS
51
SOLR/Lucene Schema
52
Backup Repositori di IOS root@onesearch# ls ArIndramayu IOS2679 BapusipSumbar IOS2680 BpadAceh IOS2682 BpadJambi IOS2702 BpadJatim IOS28 BpadPurbalingga Kemdikbud Citeseer Kemenkes InTech KemenkesDspace IOS2668 LitbangkesEjournal IOS2675 LitbangkesEjournalx IOS2676 LitbangkesTerbitan IOS2678 LitbangkesUcs
PerpusdaProbolinggo Perpusnas PoltekkesDenpasar PoltekkesJktII PoltekkesJktIII PoltekkesPdg PoltekkesSbyJGBI PoltekkesSbyJK PoltekkesSbyJPK PoltekkesTjgKrg PoltekkesTjgKrgJK Pubmed
UcsBanten UcsSulsellib UinMksrFah UinSby UinSbyDL UmmTesis UmsEtd UnsyiahJurnal UpnFk
Dapat digunakan sebagai DRC (Data Recovery Center) 53
Backup Records di IOS root@onesearch# ls IOS2675/processed | more 1446807339_oai_gorontalolibnet_com_slims_100.xml 1446807339_oai_gorontalolibnet_com_slims_101.xml 1446807339_oai_gorontalolibnet_com_slims_102.xml 1446807339_oai_gorontalolibnet_com_slims_103.xml 1446807339_oai_gorontalolibnet_com_slims_104.xml 1446807339_oai_gorontalolibnet_com_slims_105.xml 1446807339_oai_gorontalolibnet_com_slims_106.xml 1446807339_oai_gorontalolibnet_com_slims_107.xml 1446807339_oai_gorontalolibnet_com_slims_108.xml 1446807339_oai_gorontalolibnet_com_slims_109.xml 1446807339_oai_gorontalolibnet_com_slims_10.xml 1446807339_oai_gorontalolibnet_com_slims_110.xml 1446807339_oai_gorontalolibnet_com_slims_111.xml 1446807339_oai_gorontalolibnet_com_slims_112.xml 1446807339_oai_gorontalolibnet_com_slims_113.xml 1446807339_oai_gorontalolibnet_com_slims_114.xml 1446807339_oai_gorontalolibnet_com_slims_115.xml 1446807339_oai_gorontalolibnet_com_slims_116.xml
54
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
55
Search & Browse IOS
56
Integrasi dengan Summon®
Integration with Summon® Service
Home UCS Gorontalo di IOS IOS URL
Top Topik
Detail/Facet
58
Detail (Facet) Institusi Anggota Institusi Anggota Konsorsium
59
Detail Penerbit Top Publisher
60
Narrow Search Filter by Institution
61
Detail Record & Referensi
Similar Records
Link Referensi ke sumber
62
Dimana Buku/Resource Berada?
63
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
64
Contoh: KINK (Katalog Induk Nasional Kesehatan)
Alur data OneSearch dan KINK Onesearch.kink.kemkes.go.id
Filtering Indonesia OneSearch OAI PMH OAI PMH
UCS SLIMs
UCS upload Koha, Dspace, SLIMs, dll (Online)
SLIMs (Offline)
Tahap 1: repository online 1. Pusat Komunikasi Publik 2. Sekretariat Badan Litbang Kesehatan 3. Pusdiklat Aparatur 4. Poltekkes Jakarta II 5. Poltekkes Jakarta III 6. Poltekkes Malang Sebagian besar berbasis SLIMS 7. Poltekkes Surabaya 8. Poltekkes Semarang 9. Poletekkes Yogyakarta 10.Poltekkes Padang 11.Poltekkes Bandung 12.Poltekkes Tanjung Karang 13.Poltekkes Denpasar
Tahap 2: repository offline 1. Ditjen P2PL 2. Sekretariat Badan PPSDM 3. Poltekkes Jakarta I 4. Poltekkes Bengkulu 5. Poltekkes Aceh 6. Poltekkes Palembang 7. Poltekkes Tasikmalaya 8. Poltekkes Pontianak 9. Poltekkes Banjarmasin Sebagian besar berbasis SLIMS
Alamat URL Virtual Hosting Memiliki hostname sendiri
69
Detail Facet Institusi Anggota
Anggota komunitas/konsorsium
70
Video OneSearch KINK
71
Daftar Isi 1. 2. 3. 4. 5. 6. 7.
Roadmap Interoperabilitas Registration Harvesting & Indexing Searching Virtual Community Kesimpulan
72
Kesimpulan • Roadmap Indonesia OneSearch: – Satu Pintu Pencarian – Content Analysis: Citation Index, etc – NoPlagiarism
• OAI-PMH merupakah standard interoperabilitas • SLIMS versi lama dapat menggunakan library OAI yang disediakan IOS • UCS SLIMS membantu perpustakaan offline untuk tergabung ke dalam IOS • Registrasi dan status repositori dapat diakses online • Interface IOS sangat mudah digunakan dan membantu menelusuri informasi dengan menyenangkan dan cepat • Konsorsium/komunitas dapat memiliki hostname sendiri untuk onesearch koleksi mereka. • SLIMS dapat menggunakanIOS untuk mengintegrasikan seluruh repositori berbasis SLIMS di Indonesia. 73
Terimakasih
Ismail Fahmi Indonesia OneSearch, Inisiator Konsultan Perpusnas RI HP: 0812 8908 3894 Email: [email protected]
74