SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
Sistem Kendali pada Pendulum Terbalik Menggunakan Feedback Error Learning Saida Ulfa Jurusan Teknologi Pendidikan, Universitas Negeri Malang Jl. Surabaya 6 Malang 65145 Indonesia Email:
[email protected] Abstrak Pendulum terbalik merupakan salah satu contoh kasus sistem nonlinear yang sering digunakan untuk menguji kehandalan sebuah sistem kendali. Posisi kesetimbangan pendulum ini berada pada posisi tegak berlawanan arah grafitasi. Untuk menjaga pendulum berada pada posisi kesetimbangannya, diperlukan sebuah sinyal kendali. Dalam makalah ini penulis menggunakan teknik kendali feedback error learning (FEL). Konsep FEL ini mengadopsi sistem kendali pada otak manusia. Teknik ini menggabungkan conventional feedback controller atau kendali umpan balik konfensional dan feedforward controller atau kendali umpan maju. Umpan maju yang digunakan disini, menggunakan model artificial neural network atau jaringan syaraf tiruan yang digunakan untuk menghitung inverse model atau model balikan dari pendulum terbalik. Kata Kunci: Feedback error learning, neural network, system nonlinear, pendulum terbalik
1. Pendahuluan Pendulum terbalik adalah pendulum yang yang titik beratnya berada diatas titik tumpunya sehingga mempunyai kesetimbangan yang labil. Untuk menjaga pendulum tetap berada pada posisi kesetimbangannya, pada makalah ini digunakan sebuah teknik kendali yang disebut Feedback Error Learning (FEL). Teknik FEL yang dikemukakan oleh Kawato [1,2] adalah penggabungan pembelajaran dan efesiensi kendali. Sistem kendali ini adalah two degree of freedom (TDOF) control atau kendali adaptif dua derajat kebebasan neural network feedforward controller (NNFC) atau pengendali umpan maju jaringan syaraf dan sebuah conventional feedback controller (CFC) atau kendali umpan balik konfensional. NNFC digunakan untuk memperoleh inverse model atau nilai balikan dari plant atau objek yang dikendalikan sedangkan CFC digunakan untuk menjamin kestabilan global asymptotic dan sebagai sinyal error untuk NNFC [3,4]. Jika inverse model diperoleh secara tepat, keluaran dari plant akan menghitung sinyal referensi dengan menggunakan umpan maju. Sebuah sistem kendali dikatakan bagus jika telah dicoba dan dievaluasi oleh beberapa teknik kendali yang berbeda, pada tulisan ini, penulis membandingkan hasil kendali FEL dengan CFC. Pengujian dilakukan dengan menggunakan graphical user interface (GUI) pada komputer yang didisain menggunakan software Borland C++ Builder. Garis besar dari makalah ini adalah: Pada bab 2 dibahas pemodelan pendulum terbalik secara fisik dan matematika. Inti dari system kendali FEL yang digunakan akan dijelaskan pada bab 3. Hasil pengujian dengan menggunakan FEL ditampilkan pada bab 4 dan bab 5 merupakan kesimpulan dari makalah ini.
2. Pemodelan Pendulum Terbalik Sebuah sistem dikatakan nonlinear ketika karakteristik dari sistem tersebut menggunakan pemodelan matematika secara nonlinear. Pemodelan secara nonlinear digunakan untuk menjelaskan sifat dan pola dari sistem yang di modelkan. 2.1. Pemodelan Fisik Sistem kendali terdiri atas sebuah plant atau objek yang dikendali, controller atau pengendali dan trainer atau pelatih yang saling berhubungan sehingga membentuk sebuah loop umpan balik. pengendali mempunyai parameter yang adaptif seperti pembobotan yang terdapat pada NNFC. NNFC akan memantau performa plant yang nilainya ditentukan oleh nilai umpan balik system sehingga mampu mengoptimasi pengendali yang bertindak sebagai pengendali adaptif. Seperti yang terlihat pada Gambar 1, servo motor AC akan menjalankan kereta, sinyal kendali pada servo motor AC ini harus diberikan secara tepat karena akan mempengaruhi pergerakan kereta yang turut mempengaruhi posisi sudut θ pendulum. Untuk mempertahankan pendulum pada posisi tegak diperlukan sebuah control force f atau gaya yang diberikan ke kereta untuk membawa pendulum tersebut. Pendulum dikatakan berhasil distabilkan ketika sudut θ pendulum kecil atau bahkan mendekati nol, sin θ≈0 dan cos θ≈1.
A2-55
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
θ r
komput
r
θ
V
2l, m
Servo amplifi
f I
M
AC servo motor
A2-56
fungsinya sebagai sebuah aproksimasi linear untuk inverse model dari plant. Fungsi dari Feedfarward controller membuat nilai balikan dari plant dengan mengurangi feedback error. Pada teori FEL ini, feedback error sebagai sebuah teaching signal pada proses pembelajaran untuk model balikan plant. Tujuan dari pengendalian sistem secara umum adalah mengurangi nilai error e antara sinyal masukan r dan sinyal keluaran y. 3.1 Pembelajaran on-line pada FEL
Pendulum dapat di kendalikan pada posisi tersebut dan membuat kereta berada pada posisi acuan (r = 0) dengan menggunakan kendali umpan balik untuk sistem linear. Akan tetapi, masalah akan timbul ketika muncul viscous friction force yang tidak diketahui antara rel dan kereta. Apalagi parameter uncertain friction berubah bergantung pada arah pergerakan kereta. 2.1 Pemodelan Matematika Ketika parameter uncertain friction antara rel dan kereta diperhitungkan, diperoleh persamaan linear untuk pendulum terbalik sebagai berikut: (M + m) +
+ ml
Gambar 3: Skema sistem kendali FEL
= f – friction term , (1)
= gθ
(2)
dimana, r adalah kereta dari pusat rel, M dan m adalah massa kereta dan pendulum, 2l adalah panjang pendulum dan f adalah gaya yang diberikan kepada kereta yang berasal dari servo motor AC. 3. Disain Sistem Kendali FEL Gambar 2 merupakan konsep dasar FEL yang terdiri atas: linear feedback controller K atas CFC, plant P atau objek, adaptive nonlinear feedfarwad controller Q atau kendali umpan balik maju nonlinear yang merupakan model balikan dari plant.
Gambar 3 merupakan skema FEL yang menggunakan jaringan syaraf sebagai feedfarward controller. Plant dikendalikan oleh CFC dan NNFC.
Pole placement regulator yang di adopsi dari CFC, adalah ,
(3)
Dimana, nilai K = [ K1 K2 K3 K4] dan x = [θ r ]. Feedback gain K berasal dari persamaan (1) dengan mengabaikan istilah nonlinear dan persamaan (2). Parameter K diperoleh dengan menggunakan Matlab [6]: K = [-5.6082 -5.3963 -0.8433 -2.4315] (4) Untuk memperbaiki kinerja CFC, NNFC bertindak sebagai adaptive controller. Neural Network di update setiap satu kali putaran yang bergantung pada waktu cuplik dari komputer. Setiap satu kali proses pembelajaran disebut epoch. Waktu cuplik berkisar 20 ms yang merupakan nilai standar untuk pengendalian pada pendulum terbalik. Learning law berasal dari metode gradient descent dengan fungsi error [5] sebagai berikut:
Gambar 2: Konsep dasar FEL Feedback controller tidak hanya menjamin kestabilan sistem tetapi yang terpenting adalah
Dimana, = untuk plant. menghasilkan:
(5) y merupakan nilai masukan Metode gradient descent
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
(6) Hasil untuk tuning rule:
A2-57
h 1 L m n E = ∑∑ t kj − f 2 ∑wjs f1 ∑wsi xik 2L k =1 j=1 i=1 s=1 (9) Perhitungan bobot tersembunyi :
atau (8) merupakan keluaran dari neural network yang akan dijelaskan lebih detail pada bagian selanjutnya. merupakan keluaran dari CFC yang digunakan untuk sinyal error untuk neural network. w(t) adalah bobot neural network yang berisi parameter yang tidak diketahui yang akan di update secara on-line pada setiap epoch. Scaling factor (s.f) yang diberikan pada masukan neural network, hal ini dikarenakan nilai masukan sangat kecil sehingga nilai masukan di . Nilai ini tambah sampai mendekati berhubungan dengan nilai maksimum fungsi bipolar sigmoid sehingga membantu dalam proses pembelajaran
untuk
lapisan
∂E 1 L = − ∑ δ 2kq z rk ∂Wqr L k =1
(10)
δ 2kq = (t qk − y qk ) f 2' (netqk )
(11)
Perhitungan lapisan tersembunyi :
masukan
ke
lapisan
8
6
4
Angle[deg]
(7)
keluaran
2
2
0
-2
-4
-6
4
6
8
10
12
14
16
18
20
Time[s]
3.1 Jaringan syaraf Tiruan Pada makalah ini, penulis menggunakan model jaringan syaraf tiruan berlapis banyak dengan empat lapisan seperti pada Gambar 4. Pemilihan jumlah neuron pada lapisan tersembunyi sangat menentukan kemampuan dari sebuah jaringan sayaraf tiruan. Akan tetapi dalam sebuah eksperimen, penulis tidak menemukan perbedaan hasil yang mendasar antara 20 neuron dan 10 neuron pada lapisan tersebunyi. Oleh karena itu, untuk lapisan masukan digunakan 4 neuron, 2 lapisan tersembunyi yang masing-masing menggunakan 10 neuron dan 2 lapisan keluaran menggunakan masing-masing 1 neuron.
Gambar 5: Fungsi aktifasi
1 L ∂E = − ∑ δ 1kq x rk ∂W qr L k =1
(12)
dimana :
δ 1kq = f1' (net qk )∑ w jqδ 2k j '
m
(13)
j =1
Untuk menghitung nilai bobot pada layar tersembunyi, error pada lapisan keluaran di propagasi balik menggunakan metode backpropagation. Hasil dari propagasi balik akan dibandingkan dengan sinyal target untuk memperoleh nilai mean square error. Proses ini di ulang untuk setiap sampel pada training set.
Gambar 6: Data pelatihan
Gambar 4: Jaringan syaraf tiruan dengan banyak lapisan
Fungsi aktifasi yang digunakan adalah fungsi sigmoid untuk lapisan tersembunyi dan fungsi linear untuk lapisan keluaran seperti pada Gambar 5. Untuk proses pembelajaran secara on-line, jaringan syaraf di latih sebagai persiapan awal
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
A2-58
sehingga mempunyai fungsi yang sama dengan CFC. Data yang digunakan adalah seperti yang tampak pada Gambar 6 dibawah ini. 4. Hasil Pengujian Hasil pengujian dengan menggunakan CFC seperti pada Gambar 7 dan 8, nilai sudut θ mempunyai nilai antara -5 sampai 5 derajat dan posisi kereta berada pada jarak -0.06 sampai -0.06 m. Berdasarkan kedua data yang diperoleh, pendulum akan berada pada posisi tegak akan tetapi mengalami vibrasi pada nilai tersebut. Untuk memperbaiki performa dari sistem kendali dengan menggunakan CFC, P e n d u l u m 's P o s it i o n
0.2 0.15
Position[m]
0.1
0.05
0 -0.05
-0.1
-0.15
-0.2
Gambar 10: Keluaran FEL berupa sudut pendulum
0
1000
2000
3000
4000
5000
6000
7000
8000
FEL diterapkan untuk mencapai hasil yang maksimal seperti yang tampak pada Gambar Pada Gambar 9 dan 10 , tampak pada iterasi 8500 nilai sudut θ dan jarak kereta terhadap posisi acuan mencapai stabil. Berdasarkan data ini, pendulum akan stabil pada posisi tegak tanpa mengalami vibrasi. Akan tetapi pada iterasi diatas 8500, kereta dan pendulum akan mengalami vibrasi lagi kemudian akan stabil pada iterasi diatas 10.500. Hal ini diakibatkan adanya gaya gesek antara rel dan kereta.
It e r at i o n s
Gambar 7: Keluaran CFC berupa posisi kereta 8
6
Angle[deg]
4
2
0
-2
-4
-6
1000
2000
3000
4000
5000
6000
7000
8000
9000
Iterations
Gambar 8: Keluaran CFC berupa sudut pendulum
Gambar 9: Keluaran FEL berupa posisi kereta
5. Kesimpulan Konsep feedback error learning (FEL) mengadaptasi cara kerja motorik pada otak manusia. Pada sistem kendali, teknik FEL diaplikasikan pada sistem nonlinear. Dengan hanya menggunakan CFC, pendulum dapat berada pada posisi tegak namun tidak stabil pada posisi tersebut. Pendulum mengalami vibrasi: kereta akan bergerak pada jarak -0.06 sampai 0.06 meter dan sudut θ pendulum bergerak pada kisaran -5 sampai 5 derajat. Nilai vibrasi kereta terhadap jarak acuan (r = 0) dan sudut θ pendulum dapat diperkecil hingga mendekati nol dengan cara menggunakan konsep FEL, teknik ini menggabungkan feedback controller atau kendali umpan balik dan feedforward controller atau kendali umpan maju. Pada umpan maju digunakan jaringan syaraf tiruan untuk menghitung nilai model balikan dari objek yang dikendalikan. Daftar Pustaka [1] Kawato M., Furakawa K., Suzuki R., :“A Hierarchial Neural Network Models and Learning Voluntary Movements”, Biol., Cybernet. 57, pp. 169-185, 1987. [2] Kawato M.,: “Feedback Error Learning Neural Network for Supervised Motor Learning”, Advanced Neural Computers/ R. Eckmiller (Ed), Neural Network for Sensory and Motor Systems, North-Holland, pp. 365-372, 1990 [3] Gomi H., Kawato M.,: “Neural Network Control for a Clossed-Loop System Using Feedback Error Learning” Neural Networks Vol. 6, pp. 933-946, 1993.
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
[4] Areolino et,al: “Feedback Error Learning for Controlling a Flexible Link”, Proc. Of the Sixth Brazilian Symposium on Neural Networks, IEEE, 2000. [5] Miyamura A., Kimura H.,:”Stability of Feedback Error Learning Scheme", Systems & Control Letters, 45, pp.303316,2002. [6] Jinnai K.,: “A study of Double Inverted Pendulum System”, Master Thesis of Saga University, Faculty of Culture and Education, Technology Education Department, 2002.
A2-59