Jurnal . ………….. Vol. XX …, No. X, Bulan 20XX, XX-XX
1
PEMBUATAN APLIKASI BROWSER BERBASIS SPEECH RECOGNITION DENGAN ALGORITMA MARKOV MODEL Rivan Chandra1, Yuli Fitrisia,S.T2 & Satria Perdana Arifin, S.T, M.TI3 1
Program Studi Teknik Informatika Politeknik Caltek Riau, Pekanbaru, Riau, 28265 2 Email :
[email protected],
[email protected],
[email protected]
Abstrak Berbicara merupakan salah satu faktor penting bagi manusia untuk berkomunikasi dan bersosialisasi dengan lingkungannya. Namun sampai saat ini pengguna komputer masih bergantung terhadap keyboard dan mouse dalam berinteraksi dengan komputer. Penggunaan keyboard dan mouse telah menyebabkan penyakit Repetitive Strain Injuries (RSI) dan Carpal Tunnel Syndrome (CTS). Walaupun mouse dan keyboard sudah didesain senyaman mungkin, namun penyakit RSI dan CTS belum dapat dihindari. Untuk itu dibutuhkan suatu teknologi yang dapat membantu aktivitas manusia dalam berinteraksi dengan komputer, mencegah timbulnya penyakit RSI dan CTS, yaitu speech recognition. Proyek akhir ini membahas tentang aplikasi speech recognition untuk membantu pengguna dalam membuka halaman web Alliance Consulting Group. Pada aplikasi ini, pengguna dapat menambah, mengubah, dan menghapus perintah–perintah yang akan dikenali oleh komputer nantinya. Kemudian untuk membuka halaman web, pengguna dapat menggunakan suara berdasarkan perintah yang sudah dikenali oleh komputer dengan menggunakan Markov Model sebagai algoritma pencarian dan mencari nilai probabilitas suatu kata. Dengan adanya apikasi ini, dapat membantu dalam pencegahan penyakit RSI dan CTS. Hasil dari penelitian ini adalah aplikasi user friendly dengan nilai skala 80%. Selain itu, aplikasi dapat menggantikan peranan mouse dengan persentase 89,33333% dan keyboard dengan persentase 90,66667%. Aplikasi juga memiliki keakuratan dengan persentase 76%. Dengan melakukan perbandingan algoritma Markov Model antara cara manual dengan coding, dapat disimpulkan bahwa konsep algoritma Markov Model sudah diterapkan dengan baik. Kata kunci: Speech Recognition, Alliance Consulting Group, Markov Model.
Abstract Talk is the important one for human to communicate and doing social with their neighborhood. However, users depend on keyboard and mouse to interact with computer. Use of keyboard and mouse can led to illness like Repetitive Strain Injuries (RSI) and Carpal Tunnel Syndrome (CTS). Although mouse and keyboard designed by human as comfortable as posibble, but RSI and CTS can not be avoid. For that situation, we need the technology that can avoid from RSI and CTS, and that technology is speech recognition. This final project discuss about speech recognition application for helping users to open Alliance Consulting Group web page. On this application, users can add, update and delete command that computer will recognize it. Then, for open the web page, users can use sound base the command that computer recognize with Markov Model as search algoritm and search the value of word probability. With this application, RSI and CTS can be avoid. The result of research is application is user friendly with value of scale 80 %. Moreover, application can change role to mouse with percentage 89,33333% and keyboard with percentage 90,66667%. Application has the accuracy with percentage 76%. With make comparison Markov Model algoritm between manual with coding, the conclusion is Markov Model algoritm concept been applied with good. Keywords: Speech Recognition, Alliance Consulting Group, Markov Model.
1
Pendahuluan
1.1
Latar Belakang
Pada era globalisasi ini, teknologi informasi berkembang dengan pesat. Perkembangan teknologi informasi mencakup perangkat keras (hardware) dan perangkat lunak (software) yang bertujuan untuk memberikan kemudahan bagi penggunanya. Adapun pengertian teknologi
2
Rivan Chandra1, Yuli Fitrisia,S.T2 & Satria Perdana Arifin, S.T, M.TI3
informasi adalah suatu teknologi yang digunakan untuk mengolah data termasuk memproses, mendapatkan, menyusun, menyimpan, dan memanipulasi data dalam berbagai cara untuk menghasilkan informasi yang berkualitas. Teknologi ini menggunakan perangkat komputer untuk mengolah data. Hampir semua bidang yang memanfaatkan perangkat komputer, menggunakan keyboard dan mouse sebagai media input-annya. Perkembangan teknologi informasi mendorong munculnya teknologi yang memungkinkan interaksi antara manusia dan komputer dengan menggunakan suara sebagai media input-annya. Teknologi ini dikenal dengan nama speech recognition. Speech recognition atau pengenalan suara adalah teknologi yang menggunakan peralatan dengan sumber masukannya adalah suara sebagai metode alternatif interaksi dengan komputer. Alasan lain yang mendorong munculnya teknologi speech recognition adalah karena dalam kehidupan seharihari, hal yang sering dilakukan oleh manusia adalah berbicara. Manusia merupakan makhluk sosial yang selalu berkomunikasi dengan sesamanya. Manusia dapat mengeluarkan suara tanpa memerlukan energi yang banyak. Selain itu, penggunaan keyboard dan mouse yang berkepanjangan memiliki dampak yang tidak sehat terhadap tubuh seperti munculnya penyakit Repetitive Strain Injury (RSI) dan Carpal Tunnel Syndrome (CTS). Algoritma Markov Model adalah suatu teknik matematika yang biasa digunakan untuk pembuatan model pada bermacam-macam sistem, seperti speech recognition. Markov Model digunakan sebagai algoritma pencarian data dan mencari nilai probabilitas suatu kata. Adapun alasan menggunakan algoritma Markov Model pada proyek akhir ini adalah algoritma Markov Model dapat membantu pengguna untuk mengetahui probabilitas suatu kata dalam database. Web Alliance Consulting Group merupakan sebuah web yang memberikan layanan berupa jasa konsultasi permasalahan dan strategi perusahaan. Hingga saat ini web Alliance Consulting Group telah memiliki beberapa klien seperti Disney, VISA, Nestle, Intel, At&t, dan sebagainya. Web ACG merupakan web yang berbahasa Inggris dan memiliki banyak menu sehingga kerap kali membutuhkan inputan mouse untuk berpindah dari satu menu ke menu lainnya. Oleh karena itu, penulis memilih tugas akhir dengan judul “Pembuatan Aplikasi Browser Berbasis Speech Recognition dengan algoritma Makrov Model (studi kasus : Alliance Consulting Group)”. Dengan aplikasi ini, pengguna tidak perlu menghabiskan waktu yang lama untuk mengetik di keyboard dan tidak perlu memindahkan mouse untuk membuka menu yang diinginkan. Karena hanya dengan input-an suara dan pengucapan Bahasa Inggris yang tepat dan jelas, pengguna dapat dengan mudah mengendalikan komputernya untuk membuka website Alliance Consulting Group dan pemilihan menu-menu yang ada didalamnya.
1.2
Tujuan dan Manfaat
Adapun tujuan yang ingin dicapai dalam pembuatan proyek akhir ini adalah membuat aplikasi browser yang berbasis speech recognition dengan menggunakan algoritma Markov Model untuk studi kasus Alliance Consulting Group. Sedangkan manfaat dari proyek akhir ini adalah sebagai berikut : 1. Menggantikan peranan keyboard dalam pengetikan alamat Alliance Consulting Group. 2. Menggantikan peranan mouse dalam pemilihan menu-menu di Alliance Consulting Group.
1.3
Perumusan Masalah Dalam pembuatan proyek akhir ini terdapat beberapa perumusan masalah antara lain : 1. Bagaimana membuat sebuah sistem aplikasi browser yang user friendly. 2. Bagaimana menghubungkan Windows Speech Recognition dengan browser yang dibangun dengan bahasa pemograman Visual Basic.NET (VB.NET). 3. Bagaimana menerapkan algoritma Markov Model sebagai algoritma pencarian data.
Pembuatan Aplikasi Browser Berbasis Speech Recognition dengan Algoritma Markov Model 3
2
Tinjauan Pustaka
2.1
Speech Recognition
Speech recognition atau teknologi pengenalan suara adalah teknologi yang menggunakan peralatan dengan sumber masukannya adalah suara, seperti microphone untuk menginterpretasikan suara manusia sebagai metode alternatif interaksi dengan komputer. Teknologi pengenalan suara tidak sama dengan teknologi voice recognition yang hanya mengenali suara sebagai identifikasi keamanan. Sistem komersial untuk pengenalan suara telah ada sejak 1990. Dengan menggunakan teknologi pengenalan suara memungkinkan pengguna untuk berbicara secara langsung dan cepat serta efisien [5].
2.2
Windows Speech Recognition
Windows Speech Recognition merupakan aplikasi untuk mengendalikan komputer atau laptop dengan bantuan suara. Fasilitas ini dirancang bagi pengguna yang ingin membatasi penggunaan mouse dan keyboard dengan tetap menjaga atau meningkatkan produktivitas kerja secara keseluruhan. Windows Speech Recognition sudah tersedia dalam sistem operasi Windows Vista, Windows 7, dan Windows 8. Hingga saat ini, aplikasi Windows Speech Recognition tersedia dalam beberapa bahasa yaitu bahasa Inggris, Jerman, Perancis, Spanyol, Jepang, dan Cina. Contoh penggunaan aplikasi Windows Speech Recognition adalah dalam mendikte dokumen di aplikasi utama, menggunakan perintah suara untuk memulai atau beralih di antara aplikasi, dan mengontrol sistem operasi [3].
2.3
Comma Separated Value (CSV)
Comma Separated Value (CSV) merupakan suatu format file yang berupa nilai-nilai yang dipisahkan dengan koma. Digunakan untuk penyimpanan data secara digital yang terstruktur dalam sebuah tabel yang berisi daftar, dimana tiap unit (anggota) tertentu dalam sebuah kelompok berhubungan dengan unit lain dan dipisahkan dengan koma dalam kelompoknya. Tiap baris dalam file CSV sesuai dengan sebuah baris dalam tabel tersebut. Dalam sebuah baris, area dibatasi dengan koma, tiap area termasuk ke dalam satu kolom tabel. File CSV sering digunakan untuk memindahkan data tubular antara dua program komputer yang berbeda, sebagai contoh antara sebuah program basis data dan sebuah program spreadsheet [6].
2.4
Markov Model
Markov Model adalah suatu teknik matematika yang digunakan untuk melakukan pembuatan model (modelling) bermacam-macam sistem dan proses bisnis. Pada awalnya, penerapan Markov Model adalah pada ilmu-ilmu pengetahuan fisik dan meteorologi. Teknik ini mula-mula digunakan untuk menganalisis dan memperkirakan perilaku partikel-partikel gas dalam suatu wadah (container) tertutup serta meramal keadaan cuaca. Markov Model tidak memberikan keputusan rekomendasi, melainkan hanya informasi probabilitas mengenai situasi keputusan yang dapat membantu pengambil keputusan. Dengan demikian, rantai markov bukanlah teknik optimasi, tetapi adalah teknik deskriptif yang menghasilkan informasi probabilitas dimasa mendatang [1]. Sebuah rantai markov adalah urutan variabel-variabel acak seperti X1, X2, X3,... dengan sifat Markov yaitu, mengingat keadaan masa depan dan masa lalu dengan keadaan yang independen, dengan kata lain : P(Xn+1=j/X1=x1,X2=x2,X3=x3,......,Xn=i) =P(Xn+1=j/Xn=i)= Pij Dimana i merupakan variabel yang ingin dicari dan j adalah variabel yang di ketahui. Sehingga dapatlah peluang munculnya variabel i jika di ketahui variabel j. Contoh :
4
Rivan Chandra1, Yuli Fitrisia,S.T2 & Satria Perdana Arifin, S.T, M.TI3
Di dalam database terdapat beberapa kata yaitu kata biasa, mau, makan, minum, norak. Sedangkan kata yang ingin di cari adalah kata “makan”. Dilakukan pencarian data dengan menggunakan Markov Model : Pada State I Biasa = P(I|B) =0 Mau = P(A|M) = 2/3 Makan = P(A|M) = 2/3 Minum = P(I|M) = 1/3 Norak = P(O|N) =0 Pada state I, total diketahuinya huruf M adalah 3 dan banyaknya huruf A dalam database adalah 2. Sehingga peluang munculnya A jika diketahui M adalah 2/3. Jika peluang yang dicari tidak benar atau peluang = 0, maka akan dieliminasi. Pada State II Mau = P(U|A) = 1/2 Makan = P(K|A) = 1/2 Pada state II, total diketahuinya huruf A adalah 2 dan banyaknya huruf K dalam database adalah 1. Sehingga peluang munculnya K jika diketahui A adalah 1/2. Pada State III Makan = P(A|K) =1 Pada state III, peluang munnculnya A jika diketahui K adalah 1. Pada State IV Makan = P(N|A) =1 Pada state III, peluang munnculnya N jika diketahui A adalah 1. Kemudian dicari total probabilitas masing-masing huruf. Total probabilitas untuk kata m-a-k-a-n adalah : = P(A|M).P(K|A).P(A|K).P(N|A) = 2/3.1/2.1.1 = 2/6 = 0.33333
2.5
Repetitive Strain Injuries
Sering kali kita berlama-lama dalam menggunakan komputer baik untuk bekerja, bermain game dan lain sebagainya yang tanpa kita sadari semua kegiatan tersebut akan mengakibatkan otot-otot dari sebagian tubuh kita menjadi tegang yang mengakibatkan rasa sakit, atau Repetitive Strain Injuries. Pengertian dari Repetitive Strain Injuries sendiri adalah sejenis cedera pada persendian akibat ketegangan pada otot atau saraf karena suatu aktivitas fisik tertentu yang dilakukan terus menerus dan dalam waktu yang lama [2].
2.6
Carpal Tunnel Syndrome
Menurut News Medical, Carpal Tunnel Syndrome (CTS) atau neuropati median di pergelangan tangan adalah kondisi medis di mana saraf median dikompresi di pergelangan tangan, menyebabkan parestesia, mati rasa dan kelemahan otot di tangan. Malam gejala dan bangun di malam hari merupakan karakteristik dari carpal tunnel syndrome didirikan. Mereka dapat dikelola secara efektif dengan waktu malam belat pergelangan tangan pada kebanyakan pasien [4].
Pembuatan Aplikasi Browser Berbasis Speech Recognition dengan Algoritma Markov Model 5
3
Perancangan
3.1
Use Case Diagram
Use case diagram menggambarkan fungsionalitas yang diharapkan dari sebuah sistem, yang ditekankan adalah “apa” yang akandiperbuat sistem, dan bukan “bagaimana”. Sebuah use case mempresentasikan sebuah interaksi antara aktor dengan sistem.
Lihat Daftar Perintah
Pengguna Buka Halaman Web
Tambah Perintah
Hapus Perintah
Ubah Perintah
Gambar 1 Use case diagram
3.2
Flowchart
Flowchart merupakan gambar atau bagan yang menggambarkan urutan proses pada aplikasi atau sistem yang dibangun secara berurutan sehingga mudah untuk dimengerti.
6
Rivan Chandra1, Yuli Fitrisia,S.T2 & Satria Perdana Arifin, S.T, M.TI3
3.2.1 Flowchart algoritma Markov Model Mulai
Pengguna menginputkan perintah dengan menggunakan suara
Suara diubah menjadi teks
Looping sebanyak teks-2
Teks akan disesuaikan terhadap semua isi database
Teks = sesuai
T
Y Konfirmasi error Nilai bawah di tambah 1
Teks akan di pindahkan dari variabel 1 ke variabel 2
Variabel 2 digunakan dari teks+1
Teks akan disesuaikan dengan kata yang dicari
Teks = sesuai
T
Konfirmasi Error
Y Nilai atas di tambah 1
Menjumlahkan total probabilitas
Pencarian URL terhadap hasil teks dan probabilitasnya
Mengkoneksikan berdasarkan hasil URL yang dicari
Selesai
Gambar 2 Flowchart algoritma Markov Model
Pembuatan Aplikasi Browser Berbasis Speech Recognition dengan Algoritma Markov Model 7
Pengguna akan melakukan input-an perintah berupa suara. Kemudian suara diubah ke teks. Lalu dilakukan looping sebanyak jumlah kata teks -2. Lalu teks akan disesuaikan dengan seluruh perintah yang berada dalam database. Jika teks tidak sesuai, maka sistem akan memberikan konfirmasi error. Jika sesuai, maka nilai variabel bawah akan ditambah 1. Kemudian teks yang disimpan dalam variabel 1 akan dipindahkan ke variabel 2. Kemudian teks akan disesuaikan dengan kata yang dicari dimulai dari teks +1. Jika teks tidak sesuai, maka sistem akan memberikan konfirmasi error. Jika sesuai, maka variabel atas akan ditambah 1 dan dilakukan pengulangan sebanyak teks -2. Ketika semua nilai variabel atas dan bawah sudah dicari semuanya, maka seluruh variabel atas dan bawah akan dikali sehingga mendapatkan jumlah probabilitas. Kemudian URL akan dicari sesuai dengan hasil teks dan probabilitasnya. Lalu sistem akan mengkoneksikan sesuai dengan URL yang dicari.
3.3
Format CSV
Id,Command,URL 1,fault,http://www.alliancecg.com/default.asp 2,consul,http://www.alliancecg.com/consulting_services.asp 3, idea,http://www.alliancecg.com/ideas_insights.asp … 4
Pengujian dan Analisa
4.1
Pengujian Kuisioner Pengguna
Pengujian tanggapan pengguna sebagai pengguna dilakukan dengan melakukan survey terhadap 30 responden kepada populasi mahasiswa PCR jurusan 2 TI, 4TI, 3TI, 1TE, 1SI, 2AKT, 3SI, 3TK. Dalam populasi tersebut, telah diambil sampel sebesar 4,84% (3 mahasiswa) dari 62 mahasiswa (2TI), 6,25% (3 mahasiswa) dari 48 mahasiswa (4TI), 6,78% (4 mahasiswa) dari 59 mahasiswa (3TI), 16,67% (7 mahasiswa) dari 42 mahasiswa (1TE), 8,77% (5 mahasiswa) dari 57 mahasiswa (1SI), 11,11% (6 mahasiswa) dari 54 mahasiswa (2AKT), 3,22% (1 mahasiswa) dari 31 mahasiswa (3SI), 3,70% (1 mahasiswa) dari 27 mahasiswa (3TK).
Gambar 3 Aplikasi user friendly
Gambar 4 Aplikasi Browser dapat mengganti peranan keyboard
8
Rivan Chandra1, Yuli Fitrisia,S.T2 & Satria Perdana Arifin, S.T, M.TI3
Gambar 5 Aplikasi Browser dapat mengganti peranan mouse
Gambar 6 Aplikasi akurat dalam menerima ucapan
Speech recognition pada aplikasi browser dapat menghemat waktu aktivitas Sangat Setuju Setuju Ragu-Ragu Tidak Setuju Sangat Tidak Setuju 7% 0% 0%
36% 57% Gambar 7 Aplikasi browser dapat menghemat waktu aktivitas
4.2
Analisa
Berdasarkan pengujian hasil dari kuisioner di atas, didapatkan tanggapan dari responden mengenai browser ini memberikan tampilan yang user friendly. Dari 6 orang responden atau sebesar 20% responden mengatakan sangat setuju, sedangkan 18 orang responden atau sebesar 60% mengatakan setuju dan 6 orang responden atau sebesar 20% mengatakan ragu-ragu. Kemudian, hasil tanggapan dari responden mengenai browser ini dapat mengganti peranan keyboard dalam membuka halaman web. Dari 16 orang responden atau sebesar 47% responden mengatakan sangat setuju, dan 14 orang responden atau sebesar 53% mengatakan setuju. Dalam hasil tanggapan dari responden mengenai browser ini dapat mengganti peranan mouse dalam membua halaman web. Dari 18 orang responden atau sebesar 58% responden mengatakan sangat setuju, sedangkan 8 orang responden atau sebesar 26% mengatakan setujudan 4 orang responden atau sebesar 16% mengatakan ragu-ragu. Berikutnya, hasil tanggapan dari responden mengenai browser ini akurat dalam menerima ucapan, serta akurat dalam menampilkan halaman web sesuai dengan kata kunci. Dari 5 orang responden atau sebesar 17% responden mengatakan sangat setuju, sedangkan 14 orang responden atau sebesar 46% mengatakan setuju dan 11 orang responden atau sebesar 37% mengatakan ragu-ragu.
Pembuatan Aplikasi Browser Berbasis Speech Recognition dengan Algoritma Markov Model 9
Dari poin evaluasi terakhir, hasil tanggapan dari responden mengenai browser ini dapat menghemat waktu aktivitas. Dari 11 orang responden atau sebesar 36% responden mengatakan sangat setuju, sedangkan 17 orang responden atau sebesar 57% mengatakan setuju dan 2 orang responden atau sebesar 7% mengatakan ragu-ragu. Berdasarkan data-data diatas, dibuktikan bahwa fungsi dari aplikasi browser dalam hal user friendly, pengganti mouse dan keyboard, keakuratan dan hemat waktu aktivitas cukup efektif dan efisien. Di samping itu dari hasil peninjauan, aplikasi browser ini mempunyai kelebihan dibanding aplikasi browser lainnya, yaitu dapat membuka halaman web dengan menggunakan suara. 5
Kesimpulan
Kesimpulan yang dapat diambil dari pengujian dan analisa perangkat lunak adalah sebagai berikut : 1. Aplikasi user friendly dengan persentase sebesar 80%. 2. Aplikasi dapat mengganti peranan keyboard dengan persentase sebesar 90,6667%. 3. Aplikasi dapat mengganti peranan mouse dengan persentase sebesar 89,33333%. 4. Aplikasi dapat menghemat waktu dalam beraktifitas dengan menggunakan bantuan suara dengan persentase sebesar 86%. 5. Aplikasi akurat dalam menerima inputan suara dengan persentase sebesar 76%. 6
Saran
Adapun saran dalam pengembangan lebih lanjut dari perancangan aplikasi browser antara lain : 1. Sebaiknya browser dapat mengakses website dinamis dengan menggunakan pembacaan terhadap html sehingga browser tidak perlu mengakses file CSV. 2. Algoritma Markov Model akan lebih optimal penggunaannya jika digabungkan dengan algoritma pencarian data yang lain seperti, Sequential Search atau Binary Search. 7
Daftar Pustaka
[1]
Findriani, F., "Analisis Perpindahan Konsumen Sebagai Sistem Pendukung Keputusan untuk Meningkatkan Usaha Pemasaran SIM Card GSM Prabayar dengan Metode Rantai Markov", Universitas Binus, 2006. JobsDB, http://id.jobsdb.com/ID/EN/Resources/JobSeekerArticle/Tips%20Karir?ID=456, (28 Februari 2011). Mungamar, A., Mengendalikan laptop dengan suara, http://www.mrmung.com/2010/02/mengendalikan-laptop-dengan-suara.html, (16 Februari 2010). News Medical, http://www.news-medical.net/health/What-is-Carpal-Tunnel-Syndrome%28Indonesian%29.aspx, (t.t). Permadi, T., "Pemanfaatan Microsoft Speech Application Programming Interface pada Pembuatan Aplikasi Perintah Suara", Universitas Pembangunan Nasional Veteran Jakarta, 2008. Sunardi, J., "Rancang Bangun Antarmuka Mikrokontroler Atmega32 dengan Multimedia Card", Sekolah Tinggi Teknologi Nuklir - BATAN, 2009.
[2] [3] [4] [5]
[6]