Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
ANALISIS KESENJANGAN ANTARA TOPIK SKRIPSI MAHASISWA DAN TOPIK RISET DI PUBLIKASI ILMIAH Fardanuddin Sufyan1), Tubagus Mohammad Akhriza2), Evy Sophia3) 1)
Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang Email :
[email protected] 2) Teknik Informatika, STMIK Pradnya Paramita (STIMATA) Malang Email :
[email protected] 3) Sistem Informasi, STMIK Pradnya Paramita (STIMATA) Malang Email :
[email protected]
Abstrak Tingkat penyerapan mahasiswa terhadap perkembangan teknologi dapat diamati salah satunya dari topik skripsi yang diambil oleh mahasiswa dimaksud. Permasalahan yang sering dihadapi oleh perguruan tinggi adalah bagaimana metode yang secara efektif dan efisien mampu mengukur kesenjangan antara topik skripsi mahasiswa dengan perkembangan teknologi terkini. Penelitian ini mengusulkan metode untuk mengukur kesenjangan dimaksud dengan cara membandingkan topik skripsi dengan topik yang diangkat di publikasi ilmiah baik nasional maupun internasional. Metode yang digunakan adalah association rule mining, dimana kata-kata yang paling sering disebut (frequent termset) di dalam abstrak skripsi dan abstrak riset yang di publikasi ilmiah dieksploitasi. Dari frequent termset yang dikumpulkan, hubungan antara satu kata dengan yang lain ditemukan, untuk kemudian, perbedaan antara topik yang dibahas di dalam skripsi dengan yang diangkat oleh publikasi ilmiah dianalisis dan disimpulkan. Hasil analisis akan menunjukkan topik yang sering diangkat pada skripsi namun topik tersebut tidak pernah diangkat di riset, dan sebaliknya. Kata kunci: association rule, data mining, topik skripsi, topik publikasi ilmiah Abstract The level of student absorption on technological developments can be observed through their choice on their thesis topics. The problems commonly faced by universities are how to effectively and efficiently measure the gap between students' thesis topics and the latest technological development. This research proposes a method to measure the gap by comparing the students’ research topics with the scientific publication topics both nationally and internationally. The method used is association rule mining, where the most frequent words (frequent termset) in abstracts of the thesis and abstracts of scientific publications are exploited. From the frequent termset collected, the relationship between one word and the others is found, to then, the difference between the topics discussed in the thesis with those raised by the scientific publications is analyzed and summarized. The result of the analysis will show the topics usually found in thesis but rarely found in published researches and vice versa. Keyword: association rule, data mining, thesis topics, scientific publication topics.
1) pendidikan dan pengajaran 2) penelitian PENDAHULUAN Secara global, tugas perguruan tinggi
dan
pengembangan
3)
pengabdian
masyarakat (Djojodibroto, 2004). Salah satu
ada 3 yang tertuang dalam tri dharma, yaitu Copyright © SENASIF 2017
ISSN : 2597 - 4696
490
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
tugas perguruan tinggi adalah penelitian dan
TIK yang mutakhir. Para peneliti tersebut
pengembangan yang dilakukan oleh dosen
menggunakan
dan mahasiswa. Penelitan mahasiswa dapat
visualisasi informasi untuk menggambarkan
dilihat dari hasil skripsi mereka. Selain itu
kesenjangan antara topik penelitian dengan
penelitian mahasiswa melalui skripsi juga
topik yang dibicarakan di jejaring social
merupakan tolak ukur tingkat penyerapan
media.
kampus terhadap perkembangan teknologi
Artikel
teknik
ini
clustering
mengusulkan
dan
metode
yang terjadi saat ini. Namun demikian
untuk mengukur kesenjangan antara topik
perkembangan
penelitian
teknologi
informasi
dan
skripsi
mahasiswa
dengan
komunikasi (TIK) begitu cepat dan massif,
perkembangan TIK mutakhir dengan cara
dan masih sulit bagi mahasiswa khususnya
membandingkan
program
mengikuti
abstrak riset yang di publikasi ilmiah baik
Sebagai
jurnal maupun prosiding konferensi. Dataset
Sarjana
perkembangan
TIK
untuk dimaksud.
abstrak
skripsi
dengan
akibatnya,
terjadi
kesenjangan
antara
skripsi mahasiswa program Sarjana diambil
penelitian
skripsi
mahasiswa
dengan
dari STMIK Pradnya Paramita Malang
perkembangan TIK.
(STIMATA), sedangkan dataset abstrak riset
Permasalahan yang sering dihadapi
dikumpulkan dari IEEE Explore. Pendekatan
oleh perguruan tinggi adalah bagaimana
eksploitasi Association Rule (AR mining)
metode yang secara efektif dan efisien
digunakan untuk menemukan hubungan kata-
mampu
kata yang sering muncul (frequent termset)
mengukur
penelitian
skripsi
kesenjangan mahasiswa
antara dengan
dari kedua dataset tersebut.
perkembangan TIK terkini.
Hasil implementasi metode yang
Di sisi lain, informasi mengenai
diusulkan berhasil menemukan topik-topik
perkembangan TIK dapat diperoleh dari
penelitian yang sering dibahas di jurnal dan
berbagai sumber. Penelitian Akhriza dkk
prosiding konferensi namun belum pernah
(2017) dan litecky dkk (2010) menggunakan
dibahas di penelitian skripsi mahasiswa; dan
iklan
sebaliknya.
lowongan
kerja
sebagai
sumber
informasi mengenai skillset yang dibutuhkan oleh industry TIK. Di penelitian lain, Son dkk (2015) menggunakan social media sebagai sumber informasi perkembangan Copyright © SENASIF 2017
ISSN : 2597 - 4696
491
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
KAJIAN LITERATUR
menghitung
Association rule
asosiatif A → B.
bagaimana
suatu
ntara data atau
kelompok
aturan
Nilai confidence dari aturan A → B
Association rules digunakan untuk menemukan hubungan di
confidence
diperoleh dari rumus berikut. Confidence = P (B|A) = ∑ Transaksi mengandung A dan B
data
∑ Transaksi mengandung A
mempengaruhi suatu keberadaan data yang Apriori
lain. Metode ini dapat membantu mengenali
Apriori
pola-pola tertentu di dalam kumpulan data
adalah
dalam
algoritma
yang besar. Dalam association rules, suatu
digunakan
kelompok item dinamakan itemset. Support
frequent itemset untuk mendapatkan aturan
dari itemset X adalah persentase transaksi di
asosiasi. Sesuai dengan namanya, algortima
D yang mengandung X, biasa ditulis dengan
ini menggunakan prior knowledge mengenai
supp(X).
frequent
Metodologi dasar analisis asosiasi terbagi
diketahui
menjadi dua tahap:
informasi selanjutnya. Apriori menggunakan
itemset
melakukan
yang
properties
sebelumnya
pencarian
yang
telah
untuk memproses
pendekatan secara iterative yang disebut juga
1. Analisis pola frekuensi tinggi Tahapan ini mencari kombinasi item
sebagai level-wish search dimana k-itemset
yang memenuhi syarat minimum dari
digunakan untuk mencari (k+1)- itemset.
nilai support dalam database. Nilai
Pertama-tama dicari set dari frequent 1-
support sebuah item diperoleh dengan
itemset, set ini dinotasikan sebagai L1. L1
rumus berikut.
yaitu large itemset pertama yang digunakan untuk menemukan L2, kemudian set dari
Support (A) = Jumlah Transaksi Mengandung A Total Transaksi
frequent
Sementara itu, nilai support dari 2
ditemukan. Large itemset adalah itemset
∑ Transaksi
yang sering terjadi atau itemset-itemset yang
2. Pembentukan aturan asosiasi Setelah
ditemukan, asosiasi
frekuensi
barulah
yang
untuk
ada lagi frequent k-itemset yang dapat
Support (A,B) = ∑ Transaksi mengandung A dan B
pola
digunakan
menemukan L3, dan seterusnya sampai tidak
item diperoleh dari rumus 2 berikut.
semua
2-itemset
sudah melewati batas minimum support yang
tinggi
dicari
aturan
memenuhi
syarat
telah ditentukan. Adapun dua proses utama yang dilakukan dalam algoritma apriori, yaitu:
minimum untuk confidence dengan Copyright © SENASIF 2017
ISSN : 2597 - 4696
492
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
1. Join (penggabungan). Pada proses ini
Son dkk, (2015) pada jurnal yang
setiap item dikombinasikan dengan
berjudul Visualization of e-Health Research
item yang lainnya sampai tidak
Topics and Current Trends Using Social
terbentuk kombinasi lagi.
Network Analysis [6]. penelitian ini bertujuan
2. Prune (pemangkasan). Pada proses
untuk secara kritis meninjau topik penelitian
ini, hasil dari item yang telah
utama dan tren internasional e-kesehatan
dikombinasikan tadi lalu dipangkas
melalui analisis jaringan sosial. Dalam
dengan
penelitian
menggunakan
minimum
support yang telah ditentukan oleh
ini
menggunakan
pendekatan
clusterring atau pengelompokan.
user.
Penelitian tentang kesenjangan yang dilakukan oleh Akhriza dkk (2017), Litecky
Metode Penemuan Kesenjangan Akhriza dkk, (2017) pada jurnalnya
dkk, (2010) dan Son dkk (2015) belum
Revealing The Gap Between Skillset Of
mengukur frequent termset atau himpunan
Student And Evolving Skills Required By The
kata yang ada di dalam abstrak. Mereka
Industry
And
hanya fokus mengukur kesenjangan metode
Communication Technology dan juga Litecky
dangan menggunakan frequent itemset dan
dkk,
belum menggunakan Assocition Rule (AR
Of
(2010)
Computing
Information
pada
Jobs
jurnalnya
kedua
Mining
penelitian
ini
Mining), padahal association rule dapat
memiliki kesamaan yaitu mengeksploitasi
mengungkapkan hubungan topik yang satu
lowongan kerja yang dibutuhkan industri
dengan yang lain.
sebagai acuan perkembangan TIK, namun
Maka
diusulkan
penelitian
ini
untuk
mengungkapkan
yang membedakan, pada jurnal Akhriza dkk,
bertujuan
memiliki tujuan lain yaitu
kesenjangan tersebut dengan menggunakan
kesenjangan
siswa
Association Rule (AR Mining), dimana kata-
dengan keterampilan yang dibutuhkan pihak
kata yang paling sering muncul (frequent
industri, sehingga pihak sekolah atau kampus
termset) di dalam abstrak skripsi dan abstrak
bisa melakukan evaluasi terhadap kurikulum
riset dieksploitasi. Dari frequent termset yang
yang
dikumpulkan, hubungan antara satu kata
ada.
antara
menemukan
keterampilan
Namun
penelitian
ini
menggunakan frequent itemset saja, sehingga
dengan
hubungan keterkaitan topik satu dengan yang
kemudian, perbedaan antara topik yang
lain belum ditemukan.
dibahas di dalam skripsi dengan yang
Copyright © SENASIF 2017
yang
lain
ditemukan,
ISSN : 2597 - 4696
493
untuk
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
diangkat oleh publikasi ilmiah dianalisis dan
Proses ke-1 unduh abstrak skripsi dan
disimpulkan. Dari hasil simpulan tersebut,
abstrak riset. Pada proses ke-1 file
maka dibandingkan dan dihasilkan topik
abstrak di simpan dalam bentuk .txt.
yang sering diangkat di skripsi, namun tidak pernah
diangkat
di
riset
yang
Pada proses ke-2 setelah abstrak
sudah
sudah dalam bentuk .txt dilanjutkan
dipublikasi dan sebaliknya, topik yang tidak
dengan proses pre-processing yaitu
pernah diangkat di skripsi, namun sudah
pembersihan stopword dan tanda baca
sering diangkat di riset.
pada abstrak. Sehingga abstrak berisi inti dari pembahasan skripsi dan riset
METODE PENELITIAN
jurnal.
Framework Penelitian kerangka
kerja
penelitian
seperti
ke proses ke-3 yaitu menjalankan
Angka yang
aplikasi apriori, dengan menentukan
tertera pada gambar adalah urutan alur proses
ambang batasnya itu minsupp dan
penelitian.
minconf yang diinginkan.
framework pada Gambar 1.
ini
Dari proses pre-processing berlanjut
Mulai
Setelah proses aplikasi Apriori, maka proses ke-4 menghasilkan frequent
Unduh abstrak skripsi
1
Unduh abstrak artikel
Pre-processing : Menghilanngkan stopword dan tanda baca
2
Pre-processing : Menghilanngkan stopword dan tanda baca
Jalankan apriori: Input minsupp dan minconf
3
Jalankan apriori: Input minsupp dan minconf
termset dari aplikasi Apriori.
Setelah itu, hasil frequent termset dari apriori berlanjut ke tahap selanjutnya proses
ke-5
yaitu
analisis
kesenjangan antara topik skripsi dan topik riset. fokus disini adalah untuk
Himpunan apriori
4
Himpunan apriori
menemukan yang kata kunci sebelah kirinya adalah sistem informasi, yang
5. Analisis kesenjangan antara topik skripsi dan topik riset di publikasi ilmiah
disebut kesenjangan atau gap adalah seberapa banyak kata yang tidak sama
6. Hasil dan pembahasan
antara topik skripsi dan topik riset.
Selesai
Selanjutnya
proses
ke-6,
maka
diperoleh hasil analisis kesenjangan sehingga terlihat topik keterkaitan
Gambar 1. Kerangka kerja penelitian Copyright © SENASIF 2017
ISSN : 2597 - 4696
494
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
topik yang dibahas. Dan akan terlihat
support”, “database” dan “web”. Filtering
topik yang sering gunakan di skripsi,
digunakan sebagai acuan untuk menentukan
namun tidak pernah digunakan di
pola tertentu.
riset ataupun topik yang jarang diangkat
tetapi
menarik
Jika filtering sudah dilakukan dengan
untuk
menggunakan kata kunci dan diperoleh hasil,
dibahas.
maka selanjutnya dilakukan pembandingan antara hasil filtering data skripsi dan filtering abstrak publikasi. Dalam penelitian ini
Rancangan Eksperimen Data abstrak yang digunakan pada
pembandingan
menggunakan
operasi
penelitian ini ada dua macam, yaitu data
matematika, yaitu irisan, sehingga dapat
abstrak skripsi dan data abstrak riset yang di
mengungkap topik yang sering digunakan di
publikasi. Data abstrak skripsi diperoleh
riset, namun tidak pernah digunakan pada
abstrak skripsi program sarjana dari STMIK
skripsi dan topik yang sering digunakan di
PPKIA
skripsi, namun belum pernah digunakan di
Pradnya
Paramita
Malang
(STIMATA) prodi sistem informasi dengan 5
riset.
hal
tersebut
dapat
mengungkap
periode terakhir dan data abstrak riset
kesenjangan dengan membandingkan topik
diperoleh dari situs www.ieee.com dengan
yang dibahas.
kata kunci "Information System" filter tahun 2012-2017, dan artikel yang diambil hanya
HASIL
yang dipublikasi di Jurnal dan Konferensi
PEMBAHASAN
yang diindeks oleh IEEE Explore.
PENELITIAN
DAN
Hasil dari penelitian ini dapat di lihat
Pada penelitian ini, ambang batas
dari tabel berikut. Pada Tabel 1 adalah hasil
data abstrak skripsi diatur minsupp 3 dan
filtering dari frequent termset AR mining
minconf 30% dan pada data abstrak riset
data abstrak skripsi. Pada tabel tersebut ada
dengan minsupp 10 dan minconf
50%,
pembahasan scaffolding android informasi
skripsi
sistem (3, 33.3333) pada abstrak skripsi,
mengambil fokus pencarian kata kunci
artinya jika mahasiswa membahas android,
“sistem informasi”, “sistem penunjang”,
system dan informasi, maka mahasiswa juga
“sistem berbasis” dan “database”, dan pada
pasti
abstrak publikasi focus pencarian pada kata
didalam
kurung
adalah
support,
yaitu
menunjukkan
setelah
kunci
itu
pada
“system
data
abstrak
information”,
“decision
Copyright © SENASIF 2017
membahas
scaffolding.
Angka
menunjukkan
ISSN : 2597 - 4696
495
3
bahwa
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
keseluruhan
dari
mahasiswa
tentang
total
pembahasan
scaffolding
metode dari beberapa kumpulan prinsip
dengan
untuk pengembangan software di mana
android, system dan informasi muncul secara
persyaratan
bersamaan yaitu sebanyak 3 kali. Sedangkan
kolaboratif dari antar tim fungsional dan
angka 33.3% adalah confidence, artinya, ada
klien. Dan ada juga pemabahasan health
confidence (peluang) sebesar 33.3% bahwa
decision performance information (10, 50),
orang yang membahas android informasi
hal ini memberi penilaian baru, bahwa sistem
juga membahas scaffolding. Pembahasan
keputusan bukan hanya berhubungan dengan
yang sejenis dg ini bisa menyesuaikan..
bidang industri saja, namun juga bias masuk
scaffolding sendiri adalah suatu struktur
di bidang kesehatan.
sementara yang digunakan untuk menyangga
dan
solusi
melalui
upaya
Tabel 1. Hasil filtering data abstrak skripsi
manusia dan material dalam konstruksi atau
No.
perbaikan gedung dan bangunan-bangunan
1
besar lainnya. Pembahasan tersebut notabene
Hasil scaffolding android informasi sistem (3, 33.3333)
tidak ada hubungannya dengan TIK, namun
2
penelitian mahasiswa melalui skripsi sudah
bigbluebutton website pendukung sistem (3, 33.3333)
membahas hal tersebut. Terlihat juga ada
3
seo saw pemilihan additive
pembahasan seo saw pemilihan additive
simple pendukung keputusan sistem
simple pendukung keputusan sistem (3,
(3, 33.3333)
33.3333), penggabungan seo atau search
4
engine optimization dengan metode saw atau
(3, 66.6667)
simple additive weighting. Penggabungan
5
tersebut bisa dibilang jarang terjadi. 6
dari frequent termset AR mining data abstrak terdapat
7
system
information
sms android informasi sistem (3, 33.3333)
system information (10, 50). Pembahasan dan
akademik ahp penunjang keputusan sistem (3, 33.3333)
agile software development systems
Agile
ahp pengambilan penunjang keputusan sistem (3, 66.6667)
Pada Tabel 2 adalah hasil filtering
riset. Pada pembahasan tersebut
saw gerabah pendukung sistem
8
dapat
geografis website mysql informasi sistem (3, 66.6667)
dikatakan banyak dibahas dan confidence nya terbilang tinggi 50%. Agile adalah sebuah Copyright © SENASIF 2017
ISSN : 2597 - 4696
496
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
Dari hal ini kita dapat mengambil Tabel 2. Hasil filtering data abstrak riset No 1
simpulan kesenjangan antara kedua topik, yaitu topik skripsi dan topik publikasi.
Hasil agile software development
Tabel 3. hasil kesenjangan abstrstrak skripsi
systems system information (10, 50) 2
3
4
5
6
communication realize system
dan abstrak riset
information (10, 50)
No
Hasil
health decision performance
1
Agile
information (10, 50)
2
Hierarchy
mapping web software system
3
Evaluate
information (11, 54.5455)
4
Communication
hierarchy assessment risk process
5
Resources
system information (11, 63.6364)
6
Resources
analysis decisionmaking system
7
Study
information (13, 69.2308) Tabel
selanjutnya
menjelaskan
Tabel 4. hasil kesenjangan riset dan skripsi
tentang kesenjangan antara topik skripsi dan
No
topik riset yang di publikasi.seperti Pada
1
Scaffolding
Tabel 3 menjelaskan tentang topik yang
2
Bigbluebutton
dibahas publikasi, namun
tidak pernah di
3
Administrasi
angkat pada skripsi, seperti metodologi
4
Fuzzy
penelitian TIK semacam Agile software
5
Seo
development yang ternyata sudah banyak
6
Mysql
dipakai di publikasi.
7
Ahp
Hasil
Pada Tabel 4 menjelaskan tentang topik yang dibahas pada skripsi, namun
KESIMPULAN DAN SARAN
tidak ada pada topik publikasi, seperti
Kesimpulan
Bigbluebutton tidak pernah dibahas pada
Dari hasil penelitian terhadap analisis
publikasi.
kesenjangan antara topik skripsi dan topik riset
Copyright © SENASIF 2017
yang
di
pulikasi
menggunakan
ISSN : 2597 - 4696
497
Seminar Nasional Sistem Informasi 2017, 14 September 2017 Fakultas Teknologi Informasi – UNMER Malang
Apotek Setya Sehat Semarang) Journal Of Informatics And Technology, vol. 2, no. 2, pp. 22 28, 2013. Djojodibroto, R. D,. 2004. Tradisi Kehidupan Akademik. Galang Press. Yogyakarta. Hernanda, Fikhri. 2016, “Agile Software Development, salah satu metode pengembangan perangkat lunak”, https://www.dictio.id/t/agilesoftware-development-salah-satumetode-pengembangan-perangkatlunak/3242 , diakses 3 agustus 2017. Kusrini dan Luthfi, E. T. 2009. Algoritma Data Mining. CV. Andi Offset. Yogyakarta. Litecky, C. Aken, A. A. dan J. Nelson. Mining For Computing Jobs, IEEE Software 27(1) (2010) 78–85. Son, Youn-jun., Jeon. Senator, Kang. ByeonGwon, Kim. Sun-Hyung, dan Lee, Soo-Kyoung. 2015. Visualization of e-Health Research Topics and Current Trends Using Social Network Analysis. Mary Ann Liebert, Inc. Vol. 21 No. 5.
eksploitasi Association rule (AR Mining) dapat di simpulkan bahwa: 1. Penelitian
ini
berhasil
mengungkap
kesenjangan antara topik skripsi dan topik riset yang di publikasi dengan efektif dan efisien, sehingga hasil analisis dapat dipergunakan untuk mahasiswa atau perguruan tinggi ke depan. 2. Pada penelitian ini pula, dapat ditemukan keterkaitan topik satu dengan yang lain, sehingga dapat menambah wawasan dan pengembangan ranah penelitian untuk selanjutnya. Saran Untuk
meningkatkan
keakuratan
hasil, data abstrak skripsi dan abstrak riset ilmiah dapat ditambahkan lebih banyak lagi. REFERENSI Akhriza, T. M. Ma, Y. H. Dan Li. J. H. 2017. Revealing The Gap Between Skillset Of Student And Evolving Skills Required By The Industry Of Information And Communication Technology. International Journal Of Software Engineering And Knowledge Engineering. Vol 27, No. 5 2017: 675-698. Abhiesa, Alif. 2016, “Cara Instal Bigbluebutton Web Conferencing”, http://www.noobsgnu.com/2015/06/ cara-instal-bigbluebutton-web.html. diakses 3 Agustus 2017 Anggraeni, H. D. Saputra, Ragil. Dan Noranita, Beta. 2013. Aplikasi Data Mining Analisis Data Transaksi Penjualan Obat Menggunakan Algoritma Apriori ( Studi Kasus di Copyright © SENASIF 2017
ISSN : 2597 - 4696
498