Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
IDENTIFIKASI SINYAL ELEKTRODE ENCHEPALO GRAPH PADA PERGERAKAN KURSOR MENGGUNAKAN REGRESI PARABOLIK DAN K-NEAREST NEIGHBOR Hindarto Jurusan Teknik Informatika, Fakultas Teknik Universitas Muhammadiyah Sidoarjo Email :
[email protected] Abstrak Dalam penelitian ini dijelaskan aplikasi dari k-nearest neighbor (Knn) sebagai klasifikasi dan Regresi Parabolik untuk ekstraksi fitur dari gelombang sinyal Electro Encephalo Graph (EEG). Penelitian ini bertujuan untuk mengembangkan suatu sistem yang dapat mengidentifikasi sinyal EEG yang digunakan pada pergerakan kursor. Data yang digunakan adalah data EEG yang merupakan dataset IA dari BCI kompetisi 2003 (BCI Kompetisi 2003). Data ini berisi data dari subyek, yaitu kelas 0 ( untuk pergerakan kursor ke atas dan kelas 1 ( untuk pergerakan kursor ke bawah ). Pengambilan keputusan dilakukan dalam dua tahap. Pada tahap pertama, Regresi Parabolik digunakan untuk mengekstrak fitur dari data sinyal EEG. Fitur ini sebagai input pada Knn. Penelitian ini menggunakan satu fitur dari metode Regresi Parabolik. Pada proses identifikasi ke dalam dua kelas file data sinyal EEG, terdapat 300 data training file sinyal EEG dan 300 d a ri d a ta te s t i n g file sinyal EEG, sehingga k e s e l u r u h a n menjadi 600 file data sinyal EEG. Hasil yang diperoleh untuk pengklasifikasian sinyal ini adalah 81 % dari 600 file data sinyal yang diuji. Kata kunci: Knn, Regresi Parabolik, Sinyal EEG.
Pendahuluan Otak sebagai struktur pusat pengaturan aktivitas manusia, bertanggung jawab terhadap segala aktivitas manusia. Bentuk sinyal Electro Encephalo Graph (EEG) untuk setiap orang adalah berbeda. Hal ini terjadi karena dipengaruhi oleh kondisi mental, frekuensi dan perubahan amplitude irama dari pola berpikir masing-masing individu dalam merespon rangsangan yang diterima oleh otak. EEG adalah sebuah sinyal yang dapat menghasilkan salah satu sumber informasi yang paling umum digunakan untuk mempelajari fungsi otak dan saraf gangguan. Brain Computer Interface (BCI) adalah system komunikasi yang tidak memerlukan kegiatan otot [1]. Memang system BCI memungkinkan subyek untuk mengirim perintah ke peralatan elektronik hanya dengan menggunakan aktifitas otak [2]. Sistem BCI juga dapat digunakan untuk memainkan game sederhana pada perangkat mobile [3]. Beberapa penelitian yang mengambil data set Ia dari comptetion BCI 2003 diantaranya pertama mengambil judul BCI Competition 2003—Data Set Ia: Combining Gamma-Band Power With Slow Cortical Potentials to Improve Single-Trial Classification of Electroencephalographic Signals. Penelitian ini, menggunakan empat channel, dengan mengambil empat fitur (dua dari rata – rata dari SPC dan dua dari gamma band power). Hasil dari proses klasifikasi sebesar 88,7 % [4]. Kedua dengan judul EEG feature extraction based on wavelet packet decomposition for brain computer interface. Penelitian ini menggunkan enam channel dan mengambil 17 ( tujuh belas ) fitur dengan neural network sebagai proses klasifikasi. Hasil dari proses klasifikasi sebesar 90,80 % [5]. Ketiga Dengan judul A polynomial fitting and k-NN based approach for improving classification of motor imagery BCI data. Penelitian ini menggunkan menggunakan satu channel sebagai data percobaan dan mengambil 2 fitur dari proses polynomial fitting dan KNN sebagai proses klasifikasi. Hasil dari proses klasifikasi sebesar 92,15 % [6]. 1.
IF-54
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
Diantara penelitian diatas mereka lakukan didasarkan pada data pengujian yang lengkap, lebih dari satu elektroda atau channel, dan fitur vektor yang banyak, sehingga penelitian yang peneliti lakukan menyajikan sebuah metode untuk meningkatkan klasifikasi data BCI dengan hanya menggunakan satu electrode atau satu channel saja dan fitur yang digunakan juga tidak banyak yaitu menggunakan satu fitur. Dalam penelitian yang akan diteliti, peneliti merancang untuk melakukan klasifikasi pergerakan kursor keatas dan kebawah menggunakan Brain Computer Interface (BCI) didasarkan pada pikiran otak manusia menggunakan Elektroencephalograph (EEG) dengan mengambil data dari kompetisi BCI 2003 data set Ia dan untuk mendapatakan fitur menggunakan metode regresi parabolik serta untuk proses klaisfikasi menggunakan metode Knn. 2. 2.1
METODOLOGI
Deskripsi Data Penelitian ini menggunakan data BCI Competition 2003 data set Ia, diambil dari subyek yang sehat dari universitas Tuebingen Jerman [7]. Subyek diminta menggerakkan kursor ke atas (kelas 0) dan ke bawah (kela 1) di depan layar komputer, sementara Potensial Korticalnya direkam secara perlahan – lahan. Subyek menerima umpan balik visual dari Potensial kortikalnya. Ini diamati dengan kortikal positif (negatif) menyebabkan penurunan (kenaikan) gerakan kursor pada layar. Aktifitas otak direkam dengan enam channel yang berbeda dengan frekwensi sampling 256 Hz. Enam Elektrode EEG diletakkan menurut system Internasional 10 – 20 yang ditunjukkan pada gambar 1 dan direferensikan titik elektrode Cz sebagai berikut : Channel 1: A1 (mastoid kiri); Channel 2: A2 (mastoid kanan); Channel 3: FC3 (2 cm dari frontal C3); Channel 4: CP3 (2 cm dari parietal C3); Channel 5: FC4 (2 cm dari frontal C4); and Channel 6: CP4 (2 cm dari parietal C4). Setiap percobaan mempunyai durasi enam detik. Selama percobaan, visualisasi diperlihatkan oleh tampilan layar komputer baik ke atas atau ke bawah selama 0.5 detik sampai berkhirnya percobaan. Umpan balik diperlihatkan visual dari detik ke dua sampai detik ke lima. Hanya interval 3.5 detik untuk setiap percobaan disediakan untuk pelatihan dan uji coba. Semua percobaan dipisahkan kedalam set pelatihan (268 percobaan, 135 untuk kelas 0 dan 133 untuk kelas 1) dan set uji coba (293 percobaan, 147 untuk kelas 0 dan 146 untuk kelas 1), keduanya terkandung data EEG hanya 3.5 detik fasa umpan balik dari setiap percobaan. Tujuan adalah untuk mengkatagorikan percobaan kedalam set uji coba dari kelas 0 atau kelas 1.
Gambar 1. Montase elektroda EEG sebagai sistem internasional 10-20. 2.2
Metode Regresi Parabolik Sinyal percobaan dalam set pelatihan dikategorikan untuk kelas nol untuk kursor IF-55
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
berpindah ke atas dan kelas satu untuk kursor berindah ke bawah. Peneliti mengamati bahwa sinyal dari Channel 1 pada umumnya dari kelas 0 memperlihatkan pola kurva ke atas sedangkan kelas 1 memperlihatkan pola kurva ke bawah. Dari pengamatan yang peneliti lakukan, peneliti berusaha untuk mengembangkan ciri atau fitur dari metode Regresi Parabolik dengan persamaan : Y = a + bx + cx2
(1)
Persamaan Regresi Parabolik akan mendapatkan koefisien a, b dan c. Dengan a, b dan c adalah konstanta yang nilainya dapat dihitung dengan menyelesaikan tiga sistem persamaan linier yang didapati dari analogi pada regresi garis lurus sebagai berikut : (2)
Jika diselesaikan akan menghasilkan koefisien sebagai berikut : (3)
Dengan D1 = (Sx2)2 – (Sx)(Sx3) D2 = (Sx2)(Sx3) – (Sx)(Sx4) D3 = (Sx2)3 – (Sx2)(Sx4) D4 = (Sx2)(Sxy) – (Sx)(Sx2y) D5 = (Sx2y)(Sx3) – (Sx4)(Sxy) D6 = (Sx2)(Sx2y) – (Sx3)(Sxy) D7 = (Sx2)(D1) – (Sx)(D2) + N (D3)
(4)
Sedangkan (5)
Dalam bentuk matriks persamaan (2) : (6)
2.3
Ekstrasi Ciri Menggunkan Metode Regresi Parabolik Data yang diambil dalam penelitian ini adalah 600 data file sinyal dari channel satu, 300 data file pelatihan dan 300 data file uji coba. Satu file sinyal untuk data pelatihan mempunyai durasi 3.5 detik dengan pembagian masing – masing 135 point data untuk kelas nol dan 133 point data untuk kelas satu, sedangkan satu file data uji coba mempunyai 147 point data untuk kelas nol dan 146 point data untuk kelas satu. IF-56
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
Dalam peneltian ini, percobaan sinyal yang ada diproses menggunakan proses Regresi Parabolik, sehingga dari proses tersebut didapatkan nilai koefisien dari persamaan regresi Parabolik yaitu nial a, b dan c. Gambar 2 dan gambar 3 merupakan percobaan sinyal EEG dari channel 1 pada data set percobaan. kelas 1 120
100
Ampitudo (Mikro Volt)
80
60
40
20
0
-20
0
0.5
1
1.5 2 Waktu (s)
2.5
3
3.5
Gambar 2. Data Sinyal EEG kelas 1 dan hasil Regresi Parabolik.
kelas 0 140 120
Ampitudo (Mikro Volt)
100 80 60 40 20 0 -20
0
0.5
1
1.5 2 Waktu (s)
2.5
3
3.5
Gambar 3. Data Sinyal EEG kelas 0 dan hasil Regresi Parabolik. Setelah proses Regresi parabolik, maka akan didapatkan nilai koefisien dari regresi tersebut yaitu nilai a, b, dan c. sehingga dengan menggunakan nilai a, b, dan c didapatkan satu nilai yang akan digunakan sebagai fitur atau cirri dari sinyal EEG. 2.5
Klasifikasi Menggunakan K-Nearest Neighbor Pada pemrosesan akhir ini, identifikasi sinyal EEG diproses dengan menggunakan k-nearest neighbor. Pemrosesan akhir ini dilakukan setelah proses awal yaitu pencarian fitur dengan Regresi Parabolik. Hasil ekstrasi ciri digunakan untuk masukan bagi knearest neighbor. Metode k-nearest neighbor adalah sebuah metode untuk melakukan klasifikasi terhadap objek, berdasarkan data pembelajaran yang jaraknya dekat dengan objek tersebut, sesuai jumlah tetangga terdekatnya atau nilai k. Dekat atau jauhnya tetangga tersebut biasanya dihitung berdasarkan jarak euclidean dengan persamaan sebagai berikut:
(7)
IF-57
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
dengan : d : jarak data uji ke data pembelajaran xj : data uji ke-j, dengan j = 1, 2, . . . , n yj : data belajar ke-j, dengan j = 1, 2, . . . , n Klasifikasi k-NN dilakukan dengan mencari k buah tetangga terdekat dari data uji dan memilih kelas dengan anggota terbanyak. Adapun langkah-langkah klasifikasi k-NN adalah sebagai berikut : 1. Jika sekumpulan data latih y memiliki N titik data secara keseluruhan, maka dilakukan pengenalan terhadap k buah tetangga terdekat dari data uji x. 2. Dari k buah tetangga terdekat tersebut, data x diidentifikasikan pada kelas ώi, i = 1, 2, …………, M. M adalah jumlah kelas yang ada. 3. Data uji x dimasukkan pada kelas dengan jumlah anggota terbanyak. 4. Jika terdapat dua atau lebih kelas ώ yang merupakan tetangga terdekat dari data uji x, maka terjadilah kondisi seimbang (konflik) dan digunakan strategi pemecahan konflik. 5. Untuk kelas-kelas yang terlibat konflik, jarak d ditentukan antara data uji x dengan anggota kelas ώi yang terlibat konflik, yang berjumlah E. 6. Jika data pelatihan dari kelas ώi yang terlibat dalam konflik ditunjukan dengan , maka jarak antara x dengan kelas ώi adalah :
7. Data uji x dimasukkan ke dalam kelas dengan jarak di paling kecil.
3.
HASIL DAN PEMBAHASAN Untuk menganalisa sistem yang telah dirancang maka digunakan metode seperti yang telah dijelaskan pada implementasi metode. Dalam penelitian ini menekankan pada identifikasi sinyal EEG menggunakan analisis Regresi Parabolik. Selanjutnya proses klasifikasi menggunakan k-nearest neighbor (k-NN). 3.1
Pengambilan Data Sinyal EEG Data BCI Competition 2003 data set Ia terdiri dari kelas 0 dan kelas 1, masing – masing kelas terdapat data training dan data testing. Gambar 4 adalah salah satu data sinyal EEG yang diambil dari subyek channel 1 untuk gerakan kursor yaitu gerakan kursor keatas (kelas 0) dan gerakan kursor ke bawah (kelas 1). 120 class 0 klass 1
100
Mikro Volt
80
60
40
20
0
-20
0
20
40
60 80 Data Point
100
120
140
Gambar 4. Sinyal EEG channel 1 Kelas 0 dan kelas 1 3.2
Metode Regresi Parabolik Dari sinyal EEG yang sudah dipilih berdasarkan kelas 0 dan kelas 1, kemudian dilakukan proses Regresi Parabolik yang masing-masing sinyal diproses menggunakan IF-58
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
Regresi Parabolik dan tiap sinyal didapatkan nilai a, b dan c. hasil nilai koefisien a, b dan c seperti tabel. Tabel 1. Hasil dari Regresi Parabolik diambil nilai koefisien a, diambil 10 sampel dari data Training. Sinyal 1 2 3 4 5 6 7 8 9 10 EEG ke Kelas 0 93 93 91 90 90 88 88 86 86 85 Kelas 1 69 67 66 66 65 65 65 65 65 65 Tabel 2. Hasil dari Regresi Parabolik diambil koefisien a, diambil 10 sampel dari data Testing Sinyal 1 2 3 4 5 6 7 8 EEG ke Kelas 0 84 85 85 84 84 82 80 78 Kelas 1 46 43 40 39 36 37 36 35 Tabel 3. Hasil dari Regresi Parabolik diambil nilai diambil 10 sampel dari data Training. Sinyal 1 2 3 4 5 6 7 EEG ke Kelas 0 -0.4 -0.5 -0.4 -0.4 -0.4 -0.3 -0.3 Kelas 1 -0.2 -0.2 -0.1 -0.1 -0.1 -0.1 0.0
nilai 9
10
75 37
73 35
koefisien b, 8
9
10
-0.3 -0.1
-0.3 -0.1
-0.3 -0.1
Tabel 4. Hasil dari Regresi Parabolik diambil nilai koefisien sampel dari data Testing Sinyal 1 2 3 4 5 6 7 8 EEG ke Kelas 0 -0.3 -0.3 -0.3 -0.3 -0.3 -0.3 -0.3 -0.3 Kelas 1 0.3 0.4 0.4 0.5 0.5 0.5 0.5 0.5
b, diambil 10 9
10
-0.3 0.4
-0.3 0.3
Tabel 5. Hasil dari Regresi Parabolik diambil nilai koefisien c, diambil 10 sampel dari data Training. Sinyal 1 2 3 4 5 6 7 8 9 10 EEG ke Kelas 0 0.5 0.4 0.4 0.4 0.3 0.3 0.3 0.3 0.3 0.2 Kelas 1 0.1 0.0 0.0 -0.1 -0.1 -0.2 -0.2 -0.3 -0.2 -0.2 Tabel 6. Hasil dari Regresi Parabolik diambil nilai koefisien c, diambil 10 sampel dari data Testing Sinyal 1 2 3 4 5 6 7 8 9 10 EEG ke Kelas 0 -0.1 -0.1 -0.1 0.0 0.0 0.0 0.0 0.0 0.0 0.1 Kelas 1
-0.6
-0.7
-0.8
-0.9
-0.9 IF-59
-0.9
-0.9
-0.8
-0.6
-0.6
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
Dari ketiga nilai koefisien dalam tabel menunjukkan bahwa nilai koefisien a mempunyai kecenderungan berbeda antara kelas 0 dan kelas 1 , sehingga nilai koefisien a ini yang digunakan sebagai fitur untuk inputan bagi k-NN. K-Nearest Neighbor (k-NN) Data input dari Regresi Parabolik dari tabel 1 dan 2 digunakan sebagai inputan proses klasifikasi, dalam sistem ini menggunakan metode k-NN. Dalam algoritma k-NN [8], klasifikasi dilakukan berdasarkan kelas tetangga k-terdekat dari vektor fitur. Untuk mencari parameter optimal yang mengahsilkan kinerja yang terbaik dari k-NN yaitu dengan melakukan penilaian menurut besaran k. Hasil kinerja dapat diperoleh pada tabel 7. 3.3
Tabel 7. Hasil akurasi dari k-NN dengan nilai k=1, data training 300 sampel dan banyaknya data testing berbeda-beda Data testing 50 100 150 200 250 300 akurasi 0,91 0,87 0,90 0,82 0,78 0,80 Dari tabel 7 dapat dilihat dengan semakin banyak data testing, maka tingkat akurasinya menurun. Tabel 8. Hasil akurasi dari k-NN dengan nilai k yang berbeda-beda. Data testing K=1 K=3 K=5 K=7 K=9 300 0,80 0,81 0,80 0,80 0,81 250 0,78 0,78 0,78 0,78 0,78 200 0,82 0,82 0,82 0,82 0,82 150 0,90 0,90 0,90 0,90 0,91 100 0,87 0,87 0,87 0,87 0,88 50 0,91 0,91 0,91 0,91 0,91
K=11 0,81 0,79 0,83 0,91 0,88 0,92
Dari tabel 8 menunjukkan k dengan nilai 11 memiliki nilai klasifikasi yang baik disbanding dengan nilai k yang lain. Klasifikasi dengan data sinyal EEG sebanyak 600 data file (300 data file training dan 300 data file testing) menghasilkan akurasi 81 % . Bila data yang diuji semakin sedikit, maka tingkat akurasinya semakin besar. 4.
KESIMPULAN Pada makalah ini peneliti memperkenalkan Regresi Parabolik untuk mengekstrak fitur dan proses pengklasifikasian sinyal EEG dibagi dalam dua kelas. Penelitian ini menggunakan 600 data file sinyal EEG untuk training dan testing data file sinyal EEG, ketepatan klasifikasi k-NN mencapai 81 % untuk data pengujian. Pekerjaan peneliti yang akan datang, meneliti teknik pencarian yang sesuai untuk ekstraksi fitur dan klasifikasi sinyal EEG, sehingga tingkat akurasi untuk perintah menggerakkan kursor akan lebih baik. Hasil yang diperoleh akan dibandingkan dengan metode yang sudah diteliti. DAFTAR PUSTAKA J. R. Wolpaw, N. Birbaumer, D. J. McFarland, G. Pfurtscheller, and T. M. Vaughan, “Braincomputer interfaces for communication and control”, Clinical Neurophysiology, 113(6):767{791), 2002. T. M. Vaughan, W. J. Heetderks, L. J. Trejo, W. Z. Rymer, M. Weinrich, M. M. Moore, A. K ubler, B. H. Dobkin, N. Birbaumer, E. Donchin, E. W. Wolpaw, and J. R. Wolpaw, “Brain-computer interface technology”, a review of the second IF-60
Simposium Nasional Teknologi Terapan (SNTT)2 2014
ISSN: 2339-028X
international meeting. IEEE Transactions on Neural Systems and Rehabilitation Engeneering, 11(2):94{109, 2003. Payam Aghaei Pour, Tauseef Gulrez, Omar AlZoubi, Gaetano Gargiulo and Rafael A. Calvo, “Brain-Computer Interface: Next Generation Thought Controlled Distributed Video Game Development Platform”, IEEE Symposium on Computational Intelligence and Games (CIG, ), 2008. Mensh, B.D., Werfel, J., Seung, H.S, BCI competition 2003—Data set Ia: Combining gamma-band power with slow cortical potentials to improve single- trial classification of electroencephalographic signals. IEEE Trans. Biomed. 2004 Eng. 51, 1052–1056. Ting, W., Guo-Zheng, Y., Bang-Hua, Y., Hong, S, EEG feature extraction based on wavelet packet decomposition for brain computer interface. Measurement, 2008. 41 (6), 618–625. Temel Kayikcioglu, Onder Aydemir, “A polynomial fitting and k-NN based approach for improving classification of motor imagery BCI data”. 0167-8655/$ - see front matter 2010 Elsevier B.V. All rights reserved. doi:10.1016/j.patrec.2010.04.009. Blankertz, B, Mueller, K.R, Curio, G, Vaughan, T.M, Schalk, G, Wolpaw, J.R, Schloegl, A, Neuper, C, Pfurtscheller, G, Hinterberger, T, Schroeder, M, Birbaumer, N, 2004. The BCI competition 2003. IEEE Trans. Biomed. Eng. 51,1044–1051. K. Fukunaga, Introduction to Statistical Pattern Recognition, second ed. Academic Press, 1990
IF-61