Lokakarya Perpustakaan Nasional 31 Agustus 2016
Indonesia OneSearch (IOS) – versi 2 Ismail Fahmi, PhD. Inisiator Indonesia OneSearch (IOS)
[email protected]
Ismail Fahmi, PhD.
[email protected] 1992 – 2007 2003 – 2004 2004 – 2009
S1, Teknik Elektro, ITB S2, Computational Linguistics, Universitas Groningen, Belanda S3, Computational Linguistics, Universitas Groningen, Belanda
2000 – 2003
Inisiator IndonesiaDLN (Digital Library Network pertama di Indonesia) Mengembangkan Ganesha Digital Library (GDL) Mendirikan Knowledge Management Research Group (KMRG) ITB Membangun Digital Library ITB
2009 – Sekarang 2012 – Sekarang 2014 – Sekarang 2015 – Sekarang
Engineer di Weborama, Perusahaan berbasis big data (Paris/Amsterdam) Co-Founder Awesometrics, Media Monitoring & Analytics Company Founder PT. Media Kernels Indonesia, a Natural Language Processing Company Konsultan Perpustakaan Nasional, Inisiator Indonesia OneSearch 2
Agenda •Open Access •Roadmap IOS •IOS versi 1.0 dan versi 2.0 •Struktur Informasi dalam IOS •Cara Bergabung •Format Data •Fitur-fitur IOS •Semantic Web 3
Open Access Around The World
4
Goal
INDONESIA
Discovery System
“To have a robust national open access repository discovery system” 5
Discovery System di Indonesia Katalog Buku
E-Journal
Digital Repository
Museum
Discontinued
6
Perpustakaan di Indonesia
Total: 66.000+
* Sumber: Perpusnas 2016
7
Road Map IOS Tahap 1 (2015): OneSearch Portal OneSearch Portal (Bibliografi)
Tahap 2 (2016-2017): Text Analysis Tahap 3 (2018-2020): Text Analysis (Full Teks) Layanan Anti Plagiarism
• Software Indonesia OneSearch • Crawling fullteks (PDF) TA, tesis, No Plagiarism (Services) • Harvesting data bibliografi disertasi, laporan penelitin, dan • Sistem dan Layanan artikel jurnal dari Intitusi di • Protokol standard OAI-PMH NoPlagiarism untuk karya Indonesia. • Repository: Katalog buku, berbahasa Indonesia. • Text analysis menggunakan Jurnal Online, Repositori teknologi NLP (Natural Language • Sumber: Wikipedia (Bahasa digital Indonesia), Online News, TA, Processing) • Information Extraction & Knowledge Mapping berbasis NLP • Research Mapping antar Institusi
Tesis, Disertasi, artikel jurnal, laporan penelitian (open access) • Layanan online plagiarism checking untuk mahasiswa dan peneliti di Indonesia
8
IOS Versi 1.0
9
Format Tidak Standard
10
Duplicate Records
11
Hanya Khusus untuk Perpustakaan
12
IOS Versi 2.0
13
Untuk Semua Jenis Repositori
14
Banyak Fitur Baru
15
Registrasi Repositori ke dalam IOS
16
Struktur Informasi
17
Institusi • Level tertinggi dari sebuah repositori yang didaftarkan di IOS adalah ‘Institusi’. • Ada banyak jenis institusi, namun di dalam IOS, institusi dikelompokkan berdasarkan 6 sektor yang terkait dengan repositori: • Library • Museum • Arsip
• Ada pemikiran untuk memasukkan juga:
• Kebun binatang (living documentation) • Taman tematik 18
Form Institusi
19
Library & Department • Di dalam sebuah institusi terdapat satu atau lebih perpustakaan/departemen yang memiliki pengelola masingmasing maupun terpusat. • Misal: • Sebuah Universitas memiliki: • • • •
UPT Perpustakaan Pusat Perpustakaan Fakultas A Perpustakaan Kampus B Dst.
20
Form Departemen
21
Repositori • Di dalam sebuah Institusi, database atau repositori itu biasanya dikelola oleh satu atau lebih departmen atau perpustakaan. • Misal: • UPT Perpustakaan Pusat mengelola:
• Database katalog buku • Repositori full teks untuk skripsi, tesis, dan disertasi • Repositori jurnal elektronik
• Jurusan Arkeologi mengelola: • Museum atau galleri artefak • Database koleksi
22
Form Repositori
23
Data OAI
24
Konsorsium / Group Repositori Repository Group ini memungkinkan pengelompokan repositori berdasarkan kebutuhan tertentu. Misal untuk konsorsium, untuk jurnal-jurnal yang diindex Scopus, dll.
25
Subject Area Beberapa repositori memiliki kontent khusus untuk subyek area tertentu. Misal sebuah jurnal, hanya berisi artikel tentang sebuah subyek area. Kita bisa menandai setiap jurnl dengan subyek area yang sesuai, sehingga akan memudahkan pengguna yang ingin mendapatkan jurnal untuk subyek area yang diminati.
26
Fitur-fitur IOS Versi 2.0
27
Temu Kembali • • • •
Auto-Suggest Relevancy Search Faceting Deduplication
28
Auto-Suggest
29
Relevancy & Facet
Sort by Relevancy, etc.
Facet
30
Duplicate Records
31
Deduplication Sebelum
Sesudah
32
Semantic Web
33
Contoh: Semantic Search
Fact Extraction
34
Fact Extraction
Fact extracted from document
35
Fact Extraction dalam Medical
Fact extracted from document
36
37
Knowledge Graph
38
Resource Description Framework (RDF)
39
IOS: Fact Extraction
40
Text Analysis Text Analysis is: • the process of analyzing unstructured text, • extracting relevant information • and then transforming that information into structured information • that can be leveraged in different ways
41
Contoh: Tesis “Hak Ulayat”
42
Contoh: Tesis dari UNDIP
Fullteks tesis: 112 halaman Bahasa: Indonesia 43
O P
S
44
Fact Graph
45
Fact Graph
46
Co-occurrence Analysis
47
Open vs Closed Access
48
Open vs Closed Access
49
Contoh: Tesis dari UAJ
50
Open Access: Enabling Innovation Tesis dari UNDIP
Tesis dari UAJ
51
Text Analysis: Manfaat Semoga bisa menjadi dasar pemahaman: • interdisiplinaritas, • cross-disciplinarity, • transdisciplinarity, dan multidisciplinarity - Edda Priyanto – Dosen Ilmu Perpustakaan UGM
52
Open Access Copyright 1.
2.
3.
Authors sign a publishing agreement where they will have copyright but grant broad publishing and distribution rights to the publisher. The author chooses an end user license under which readers can use and share the article. The publisher makes the article available online with the author's choice of end user license.
53
Text Analysis: Open Access Licensing
PDF, 55 pages, English
54
Knowledge Graph: Open Access
55
People
56
Kesimpulan • Open Access akan membantu mempercepat terjadinya INOVASI. • Open Access Indonesia – Discovery System (OAI-DS), dibutuhkan untuk mengelola seluruh repositori Open Access dan seluruh jenis data (tidak terbatas pada e-jurnal). • Indonesia OneSearch (IOS) adalah sebuah OAI-DS. • IOS versi 2.0 memiliki fitur yang lebih lengkap, dan organisasi informasi yang lebih baik. • Text Analysis dan Fact Extraction dalam IOS merupakan langkah awal membangun Knowledge Graph dari seluruh repositori Open Access di Indonesia. 57
Terimakasih
Ismail Fahmi, PhD
Email:
[email protected] Hp: 0812 8908 3894
58