Tugas Akhir Pengembangan Perangkat Lunak Berbasis Suara Ucapan untuk Membuka dan Mencetak Dokumen
Oleh: Abd. Wahab 1208100064
Pembimbing: Drs. Nurul Hidayat, M.Kom 19630404 198903 1 002
BAB1 Pendahuluan
Latar Belakang
I
Kemajuan Ilmu Pengetahuan dan Teknologi
Bab 1 Pendahuluan
4
Rumusan Masalah
I
1
Bab 1 Pendahuluan
5
Rumusan Masalah
2
I
Bagaimana mengimplementasikan system menjadi perangkat lunak yang user friendly.
Bab 1 Pendahuluan
6
Batasan Masalah
I
1. Perintah berupa kata yang diucapkan oleh satu orang.
Bab 1 Pendahuluan
7
Batasan Masalah
2.
I
Perintah yang diucapkan hanya perintah dengan bahasa Indonesia yang telah dijadikan referensi.
Bab 1 Pendahuluan
8
Batasan Masalah
I
3.
Dokumen yang dibuka atau dicetak adalah dokumen yang berada pada folder C:/Document/Suara
4.
Dokumen bertipe : Word, Excel, dan PDF dengan nama yang berbeda Bab 1 Pendahuluan
9
Batasan Masalah
5.
I
Mencetak dilakukan sesuai pengaturan default pada PC.
Bab 1 Pendahuluan
10
Manfaat
1.
I
Proses mencetak dokumen dapat dilakukan oleh orang yang kurang terampil dalam mengoperasikan komputer. Bab 1 Pendahuluan
11
Manfaat
2.
I
Untuk dikembangkan sehingga aktifitas pada komputer dapat dilakukan melalui suara ucapan.
Bab 1 Pendahuluan
12
BABII Tinjauan Pustaka
II
Studi Penelitian Ramdani, R 2009 Jumadi, A 2008
Liu,Y dan Bao 2006
Kendali Gerak Interaktif Robot Mobil Berbasis Suara Ucapan
Perbandingan Antara Metode Klasterisasi Rls Dan Fuzzy Clustering Pada Sistem Pengenalan Individu Berbasis Suara Ucapan
A New Voice Activity Detection Algorithm Based On SOM & LVQ
Bab II Tinjauan Pustaka
14
Estimasi Trispektrum
II
Proses estimasi sinyal suara yang didasarkan pada korelasi tiga parameter frekuensi yaitu π1 , π2 , π3 .
Proses estimasi ini didasarkan pada persamaan berikut: 1 π π1 , π2 , π3 = π ((ππ (π1 ) (ππ (π2 )(ππ (π3 ) (ππ (π1 + π2 + π3 )) Bab II Tinjauan Pustaka
15
Proses Estimasi Trispektrum
II
Proses Chunk Sinyal Suara
Proses Windowing
Proses Fast Fourier Transform
Proses Trispektrum
Bab II Tinjauan Pustaka
16
Modified sa Randomized Local Search
II
Eksploitasi Struktur terpendam dalam vektor Mengkompresi data
Tinjauan Pustaka
17
Algoritma Modified sa Randomized Local Search
II
1. Inisialisasi klaster representatif: a. cari nilai maksimum dan minimum dari data objek max ο max(X) , min ο min(X) b. Hitung nilai kenaikan (Step) step (max min)/M c. Inisialisasi nilai awal klaster berdasarkan nilai kenaikan
ci ο min ; i = 1 ci οci-1 + step ; i = 2 to M 2. Tentukan indeks klaster untuk setiap anggota data objek sehingga membentuk partisi optimal P οOptimalPartition(C) Set Status iterasi dengan nilai false
Bab II Tinjauan Pustaka
18
Algoritma Modified sa Randomized Local Search
II
3. Ulangi langkah berikut jika status bernilai false a. Hitung nilai klaster swap dengan mengambil nilai centroid dari data objek berdasarkan indeks klasternya CNew ο CalculateNewCluster(P,C) ππ =π π₯π βπ β [1, π] πΆπ = 1 ππ=π b. Repartisi ulang data objek berdasarkan nilai klaster swap yang telah terbentuk.
PNew ο OptimalPartition(CNew) c. Hitung jumlah jarak kuadrat antara data objek dengan klaster representatif dan klaster swap. Jika jumlah jarak kuadrat klaster swap lebih kecil, maka set klaster representatif dengan klaster swap berikut indeks klasternya, tetapi jika jumlah jarak kuadrat klaster swap lebih besar maka set nilai status dengan true. Bab II Tinjauan Pustaka
19
Self Organizing Maps
Bab II Tinjauan Pustaka
II
20
Struktur Self Organizing Maps
II
X : vektor input pembelajaran. X = {π₯1, π₯2 ,β¦π₯π ,β¦, π₯π } Ξ± : learning rate R : radius neighborhood ππΌ : neuron/node input. π€ππ : bias pada neuron output ke-j ππ : neuron/node output ke-j C : konstanta Bab II Tinjauan Pustaka
21
Algoritma JST-SOM
II
Langkah 0 : Inisialisasi pembobotan wij dengan nilai random. Menset parameter learning rate (Ξ±), dan radius tetangga (R) Langkah 1 : Apabila kondisi selesai belum terpenuhi, lakukan langkah 2-8 Langkah 2 : Untuk tiap vektor input π₯ π₯π, π = 1, β¦ π , lakukan langkah 3-5 Langkah 3: Untuk tiap j π = 1, β¦ π , hitung jarak Euclidean π· π = ( π€ππ β π₯π )2 Langkah 4: Mencari indeks j dengan jarak π· π terdekat(minimum) Langkah 5: Melakukan perbaikan nilai π€ππ dengan nilai tertentu.Yaitu : π€ππ πππ€ = π€ππ πππ + πΌ[π₯π β π€ππ πππ ] (2) Langkah 6: Melakukan update learning rate. πΌπ‘+1 = πΌπ‘ (3) Langkah 7 : Mereduksi radius dari fungsi tetangga pada waktu tertentu (epoch). Langkah 8 : Menentukan kondisi STOP.
Bab II Tinjauan Pustaka
22
JST-Learning Vektor Quantization
II
Pembelajaran lapisan kompetitif terwarisi
Jarak antar vector input
Bab II Tinjauan Pustaka
23
Algoritma JST-LVQ
II
1. Tetapkan : bobot (W), maksimum epoch (MaxEpoch) error minimum yang diharapkan (eps), learning rate Ξ±) 2. Masukkan : - Input: x(m,n) - Target: T(1,n) 3. Tetapkan kondisi awal: - epoch = 0 -0 Ξ± 4. Kerjakan jika: (epoch < MaxEpoch) atau (Ξ± > eps) a. epoch = epoch +1 b. Kerjakan untuk i=1 sampai n Tentukan J sedemikian hingga ||x-wj|| minimum. Perbaiki wj dengan ketentuan: - Jika T = Cj maka: wj(baru)=wj(lama)+ Ξ±(x-wj(lama)) - Jika Cj maka: wj(baru)=wj(lama)- Ξ±(x-wj(lama)) c. Kurangi nilai Ξ± Bab II Tinjauan Pustaka
24
BAB III Metode Penelitian
III
Metode Penelitian
Analisi Sistem
Desain Sistem
Implementasi sistem Uji Coba
Bab III Metodologi Penelitian
26
BAB IV Analisis Sistem & Desain Perangkat Lunak
Spesifikasi Perangkat keras
IV
1. Philips SHM 1000 2. Notebook Toshiba Satelit L645 β’ Processor intel core i3 M370 2.4 GHz β’ RAM 2 GH
Bab IV Analisis Sistem dan Desain Perangkat Lunak
28
Spesifikasi Perangkat Lunak
IV
1. Windows 7 HP
2. NetBeans IDE 6.9.1
Bab IV Analisis Sistem dan Desain Perangkat Lunak
29
Skema Proses Perangkat Lunak
Bab IV Analisis Sistem dan Desain Perangkat Lunak
IV
30
Analisis Kebutuhan Perangkat Lunak
1
IV
Perangkat lunak mempunyai kemampuan untuk merekam suara dan menyimpannya dalam bentuk teks
Bab IV Analisis Sistem dan Desain Perangkat Lunak
31
Analisis Kebutuhan Perangkat Lunak
2
1
Perangkat lunak dapat membaca file dalam bentuk teks dan selanjutnya melakukan proses estimasi Trispektrum
Bab IV Analisis Sistem dan Desain Perangkat Lunak
32
Analisis Kebutuhan Perangkat Lunak
IV
3
Bab IV Analisis Sistem dan Desain Perangkat Lunak
33
Analisis Kebutuhan Perangkat Lunak
4
IV
Perangkat lunak dapat β’ uji coba (testing) β’ membuka dan mencetak dokumen
Bab IV Analisis Sistem dan Desain Perangkat Lunak
34
Rancangan Sitem
IV
Training Estimasi Trispektrum
Klusterisasi MSA-RLS
Klasifikasi SOM+LVQ
Testing Estimasi Trispektrum
Testing LVQ
Bab IV Analisis Sistem dan Desain Perangkat Lunak
35
Desain Perangkat Lunak
Bab IV Analisis Sistem dan Desain Perangkat Lunak
IV
36
BAB V Implementasi & Uji Coba
Proses Akuisisi Sinyal Suara
V
20 Sinyal suara direkam ο ο ο ο
5 suara ucapan 5 suara ucapan 5 suara ucapan 5 suara ucapan
βArtikelβ βBukuβ βDataβ βSkripsiβ
Hasil perekaman disimpan dalam file (*.rec)
Bab V Implementasi dan Uji Coba
38
Proses Akuisisi Sinyal Suara
Bab V Implementasi dan Uji Coba
V
39
Proses Estimasi Trispektrum
V
Chunk 256 20 file dalam waktu 1,758 detik Hasil Estimasi disimpan dalam file (*.tmg)
Bab V Implementasi dan Uji Coba
40
Proses Estimasi Trispektrum
Bab V Implementasi dan Uji Coba
V
41
Proses Klaster
V
20 file diklaster dalam waktu 1,617 detik Hasil Klasterisasi disimpan dalam file (*.kls)
Bab V Implementasi dan Uji Coba
42
Proses Klaster
Bab V Implementasi dan Uji Coba
V
43
Proses Klasifikasi
V
β’ Tiap 5 data memiliki satu target yang sama β’ 20 data diklasifikasi dalam waktu 1,740 detik β’ Hasil Klasifikasi disimpan dalam file (*.bkls) dan (*.rkls)
Bab V Implementasi dan Uji Coba
44
Proses Klasifikasi
Bab V Implementasi dan Uji Coba
V
45
Proses Membuka Dokumen
Implementasi dan Uji Coba
V
46
Proses Mencetak Dokumen
Bab V Implementasi dan Uji Coba
V
47
V
Hasil Uji Coba Toleransi : 10%
Ucapan
Akurasi
Artikel
97%
Buku
93%
Data
73%
Skripsi
87% Dapat mencapai : 87%
Bab V Implementasi dan Uji Coba
48
BAB VI Penutup
Kesimpulan 1.
VI
Rancangan sistem pengenalan suara ucapan 1. Proses training : proses estimasi trispektrum, klasterisasi MSA-RLS, dan klasikasi SOM+LVQ 2. Proses testing : estimasi trispektrum, testing JST-LVQ
Bab VI Penutup
50
Kesimpulan
2.
VI
Sistem dapat diimplementasikan menjadi perangkat lunak yang user friendly, dengan tingkat keberhasilan mencapai 87%
Bab VI Penutup
51
VI
Saran
1.
Menjadikan proses perekaman berjalan secara kontinue dan mengabaikan akuisisi mikrophone saat tidak ada suara pembicara.
Bab VI Penutup
52
VI
Saran
2.
Menggunakan lebih banyak jumlah data sinyal suara yang dijadikan referensi.
Bab VI Penutup
53
Saran
3.
VI
Sistem perangkat lunak dibuat tanpa adanya klik untuk memulai proses perekaman.
Bab VI Penutup
54
Terima Kasih