J . Mat h. and It s A ppl . ISSN: 1829 -605X Vol . 12, No. 1, Mei 2015, 23โ33
PENGGUNAAN PENYELESAIAN PERSAMAAN ALJABAR RICCATI WAKTU DISKRIT PADA KENDALI OPTIMAL LINIER KUADRATIK Dita Marsa Yuanita1, Soleha2 1,2
Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111
[email protected] Abstrak
Permasalahan kendali optimal linier kuadratik adalah mendapatkan aturan kendali optimal ๐(๐) dengan mendapatkan penyelesaian Persamaan Aljabar Riccati Waktu Diskrit (PRAWD) ๐ท(๐) yang definit positif dan matriks gain umpan balik ๐ฒ(๐). Untuk proses kendali berhingga, matriks-matriks ๐ท(๐) dan ๐ฒ(๐) adalah varian waktu. Akan tetapi, jika proses tersebut tidak berhingga maka matriks tersebut menjadi matriks konstan ๐ท dan ๐ฒ. Untuk mendapatkan penyelesaian kendali optimal steady state, diperlukan suatu penyelesaian PRAWD steady state. Penyelesaian PRAWD steady state didapat dengan membalik waktu dari PRAWD non steady state. Pendiskritan juga diperlukan untuk menyelesaikan kendali optimal waktu diskrit apabila diberikan sistem waktu kontinu dengan indeks performansi kontinu, contoh kasus adalah sistem servo dengan plant pendulum terbalik. Analisis pada PRAWD menunjukkan sifat invariant dari PRAWD jika matriks pemberat indeks performansi diganti. Perlu diketahui juga bahwa PRAWD memiliki penyelesaian minimum yang unik. Kata kunci: Kendali optimal linier kuadratik, Pendulum terbalik, Persamaan Aljabar Riccati waktu diskrit, Penyelesaian persamaan Aljabar Riccati waktu diskrit, Sistem servo
1. Pendahuluan Sejak awal tahun 60-an, Kalman telah menjelaskan dalam jurnal-jurnal terdahulunya bahwa persamaan Aljabar Riccati memiliki peran krusial dalam penyelesaian masalah kendali optimal linier kuadratik, pemfilteran serta estimasi. Bahkan, pada 50 tahun terakhir persamaan Riccati ditemukan muncul dalam permasalahan linear dinamis dengan kriteria indeks performansi kuadratik, masalah faktorisasi spektral, teori perturbasi singular, teori stokastik realisasi dan identifikasi, 23
24
Penggunaan Penyelesaian Persamaan Aljabar Riccati Waktu Diskrit โฆ
masalah nilai batas untuk persamaan differensial biasa, teori embedding dan scattering invariant. Untuk alasan tersebut, persamaan Riccati secara universal dianggap sebagai landasan dari teori kendali modern. Pada masalah kendali optimal, persamaan Aljabar Riccati muncul pada beberapa permasalahan yaitu masalah optimal kuadratik, Kalman Filter, ๐ป2 dan ๐ปโ . Penelitian sebelumnya [1], memberikan salah satu bahasan pada kendali optimal yang memunculkan persamaan Aljabar Riccati yaitu masalah optimal kuadratik pada sistem yang berupa persamaan differensial yang memenuhi sifat kelinieran, atau disebut sistem linier invariant waktu kontinu. Permasalahan tersebut diselesaikan dengan mengoptimalkan indeks performansi menggunakan penyelesaian persamaan Aljabar Riccati waktu kontinu. Penyelesaian dapat diperoleh apabila sistem dalam keadaan terkontrol dan stabil. Dengan cara sama, penyelesaian persamaan Aljabar Riccati waktu diskrit (PRAWD) berbentuk ๐ = ๐ + ๐น โ ๐๐น โ ๐น โ ๐๐บ (๐
+ ๐บ โ ๐๐บ )โ1 ๐บ โ ๐๐น (1.1) dengan ๐ matriks definit positif, digunakan untuk mendapatkan penyelesaian dari permasalahan kendali optimal linier kuadratik waktu diskrit. Sistem waktu diskrit berbentuk persamaan beda ๐ฅ (๐ก + 1) = ๐น๐ฅ (๐ก) + ๐บ๐ข(๐ก), ๐ฅ (0) = ๐ (1.2) Dan asumsikan sistem terkontrol. Permasalahan kendali optimal kuadratik waktu diskrit adalah mendapatkan vektor ๐ข(๐ก) sedemikian hingga indeks performansi kuadratik yang diberikan dapat diminimalkan menggunakan aturan umpan balik ๐ข(๐ก) = โ๐พ๐ฅ (๐ก) (1.3) dengan ๐พ adalah matriks invarian waktu apabila proses kendali optimal tak berhingga. Misal diberikan salah satu contoh indeks performansi kuadratik โ
๐ฝ = โ[๐ฅ โ (๐ก)๐๐ฅ (๐ก) + ๐ข โ (๐ก)๐
๐ข (๐ก)]
(1.4)
๐ก=0
Matriks ๐ dan ๐
secara terurut, adalah matriks Hermit (simetris) definit positif. Matriks tersebut merupakan pemberat dari vektor keadaan ๐ฅ (๐ก), dan vektor kendali ๐ข(๐). Diasumsikan bahwa vektor kendali ๐ข(๐ก) tidak memiliki kendala. Pada tugas akhir ini, diberikan salah satu bahasan pada kendali optimal yang memunculkan persamaan Aljabar Riccati yakni masalah optimal kuadratik dari sistem (1.2) yaitu kendali optimal kuadratik waktu diskrit, kemudian kendali optimal kuadratik waktu diskrit pada keadaan steady state, dengan contoh kasus pada sistem pendulum terbalik mengenai penyelesaian PRAWD
2. Sistem Pendulum Tebalik Proses-proses kimiawi, mekanik, elektronik dan lain-lain dapat dimodelkan dengan suatu sistem yang dapat direpresentasikan sebagai berikut ๐ฅ(๐ก + 1) = ๐น๐ฅ (๐ก) + ๐บ๐ข(๐ก), ๐ฅ(0) = ๐ฅ0 (2.1) ๐ฆ(๐ก) = ๐ถ๐ฅ (๐ก) + ๐ท๐ข(๐ก) (2.2) Persamaan ini disebut sistem linier invariant waktu diskrit. Persamaan (2.1) disebut persamaan keadaan. Persamaan (2.2) disebut persamaan output. Vektor ๐ฅ (๐ก) adalah vektor keadaan pada waktu ๐ก. Vektor ๐ข(๐ก) adalah vektor input bebas linier dari sistem. Vektor ๐ฆ(๐ก) adalah output dari sistem. Matriks ๐น โ ๐๐ร๐ , ๐บ โ ๐๐ร๐ , ๐ถ โ ๐๐ร๐ dan ๐ท โ ๐๐ร๐ adalah matriks yang mengandung parameter dari keseluruhan sistem.
Dita Marsa Yuanita, Soleha
25
Sistem di atas memiliki sifat linier dan invariant waktu. Linier artinya untuk suatu operator ๐ berlaku jika input ๐ข1 (๐ก) memiliki output ๐ฆ1 (๐ก) dan ๐ข2 (๐ก) memiliki output ๐ฆ2 (๐ก), maka ๐(๐ผ๐ข1 (๐ก) + ๐ฝ๐ข2 (๐ก)) = ๐ผ ๐ฆ1(๐ก) + ๐ฝ ๐ฆ2 (๐ก) = ๐ผ ๐(๐ข1 (๐ก)) + ๐ฝ ๐(๐ข2 (๐ก))
Sedangkan invariant waktu berarti jika input ๐ข(๐ก) menghasilkan output ๐ฆ(๐ก), maka ๐ข(๐ก โ ๐) menghasilkan output ๐ฆ(๐ก โ ๐) untuk setiap ๐ โ โค. [4] Dalam paper ini, akan diberikan salah satu sistem yang dapat diselesaikan dengan persamaan Riccati, yakni pendulum terbalik.
Gambar 1. Pendulum terbalik Pendulum terbalik adalah pendulum yang porosnya ditempelkan pada kereta yang dapat bergerak dengan arah horizontal. Kereta digerakkan oleh suatu motor kecil yang pada saat ๐ก, bekerja suatu gaya ๐ข(๐ก) pada kereta. Gaya tersebut adalah variabel input pada sistem. Massa kereta dinotasikan dengan ๐, sedangkan ๐ adalah massa pendulum. Jarak antara titik poros pendulum ke pusat gravitasi massa adalah ๐. Sudut yang dibentuk oleh pendulum dengan sumbu vertikal adalah ๐. Sudut tersebut selalu diasumsikan bernilai kecil untuk menjaga pendulum terbalik tetap vertikal. (๐ฅ๐บ , ๐ง๐บ ) menyatakan koordinat (๐ฅ, ๐ง) dari pusat gravitasi. Maka, ๐ฅ๐บ = ๐ฅ + ๐ sin ๐ ๐ง๐บ = ๐ cos ๐ Dengan menggunakan hukum kedua Newton, persamaan gerak pendulum pada arah sumbu ๐ฅ sebagai berikut ๐2 ๐ฅ ๐2 ๐ฅ๐บ ๐ 2 +๐ = ๐ข, ๐๐ก ๐๐ก 2 2 ๐ (๐ + ๐) 2 (๐ฅ + ๐ sin ๐) = ๐ข, (2.3) ๐๐ก Persamaan (2.3) dapat ditulis sebagai berikut (๐ + ๐ )๐ฅฬ โ ๐๐(sin ๐)๐ฬ 2 + ๐๐(cos ๐)๐ฬ = ๐ข (2.4) Kemudian, persamaan gerak massa ๐ pada arah ๐ง didapat dengan menggunakan hukum kedua Newton untuk gerak melingkar sehingga ๐ 2 ๐ฅ๐บ ๐2 ๐ง๐บ ( ) (๐ sin ๐) = ๐๐๐ sin ๐, ๐ ๐ cos ๐ โ ๐ ๐๐ก 2 ๐๐ก 2 ๐๐ฅฬ cos ๐ + ๐๐๐ฬ = ๐๐ sin ๐ (2.5) Dengan melakukan pendekatan untuk sin ๐ = ๐, cos ๐ = 1, dan ๐๐ฬ = 0 , persamaan (2.4) dan (2.5) dapat dilinierisasi menjadi (๐ + ๐ )๐ฅฬ + ๐๐๐ฬ = ๐ข (2.6) ๐๐ฅฬ + ๐๐๐ฬ = ๐๐๐ (2.7) Linierisasi tersebut berlaku selama ๐ dan ๐ bernilai kecil. Persamaan (2.6) dan (2.7) mendefinisikan suatu model matematika dari sistem pendulum terbalik.
26
Penggunaan Penyelesaian Persamaan Aljabar Riccati Waktu Diskrit โฆ
Didefinisikan variabel keadaan sebagai berikut ๐ฅ1 = ๐ ๐ฅ2 = ๐ฬ ๐ฅ3 = ๐ฅ ๐ฅ4 = ๐ฅฬ ๐ฅ adalah lokasi dari kereta, sehingga ๐ฅ merupakan output dari sistem, dapat ditulis ๐ฆ = ๐ฅ = ๐ฅ3 Dari persamaan (2.6) dan (2.7) didapat bentuk persamaan matriks-vektornya 0 0 1 0 0 ๐ฅ1 1 ๐+๐ โ ๐ 0 0 0 ๐ฅ ๐๐ [๐ฅ2 ] + ๐๐ ๐ข 0 0 0 0 1 3 ๐ 1 ๐ฅ4 0 0 0 ] [ โ๐๐ [ ๐ ] ๐ฅ1 ๐ฅ2 ๐ฆ = [0 0 1 0] [๐ฅ ] 3 ๐ฅ4
๐ฅฬ 1 ๐ฅฬ [ 2] = ๐ฅฬ 3 ๐ฅฬ 4
(2.8)
(2.9)
Persamaan (2.8) dan (2.9) memberikan salah satu representasi ruang keadaan dari sistem pendulum terbalik. 2.1 Desain Sistem Servo Pada bagian ini, akan dijelaskan mengenai masalah pendekatan penempatan pole pada desain dari sistem servo.
G F
Gambar 2. Denah Sistem Servo Gambar 2 menunjukkan konfigurasi antara suatu sistem servo dengan keadaan umpan balik dan kontroler integral. Dari gambar tersebut didapat ๐ฅ (๐ก + 1) = ๐น๐ฅ (๐ก) + ๐บ๐ข(๐ก) (2.10) ๐ฆ(๐ก) = ๐ถ๐ฅ (๐ก) (2.11) Persamaan keadaan integratornya adalah ๐ฃ (๐ก) = ๐ฃ(๐ก โ 1) + ๐(๐ก) โ ๐ฆ(๐ก) Vektor kendali ๐ข(๐) diberikan oleh ๐ข (๐ก) = โ๐พ2 ๐ฅ (๐ก) + ๐พ1 ๐ฃ (๐ก) (2.12) Desain sistem servo adalah menentukan matriks ๐พ1 dan ๐พ2 sedemikian hingga sistem memiliki pole loop tertutup yang diinginkan. Perhatikan bahwa ๐ข (๐ก) adalah kombinasi linier dari vektor keadaan ๐ฅ(๐ก) dan ๐ฃ(๐ก) , definisikan suatu vektor keadaan baru yang mengandung ๐ฅ(๐ก) dan ๐ข(๐ก) . Kemudian didapat dari (2.10) dan (2.12) persamaan berikut [
๐น ๐ฅ(๐ก + 1) ]=[ ๐พ2 โ ๐พ2 ๐น โ ๐พ1 ๐ถ๐น ๐ข(๐ก + 1)
๐บ 0 ๐ฅ(๐ก) ][ ] + [ ] ๐(๐ก + 1) ๐ผ โ ๐พ2 ๐บ โ ๐พ1 ๐ถ๐บ ๐ข(๐ก) ๐พ1
Persamaan output, (2.11), dapat ditulis sebagai berikut
(2.13)
Dita Marsa Yuanita, Soleha
๐ฆ(๐ก) = [๐ถ
0] [
27
๐ฅ(๐ก) ] ๐ข(๐ก)
Untuk persamaan berikutnya, didefinisikan vektor ๐(๐ก) adalah vektor konstan ๐. Dan didefinisikan vektor error sebagai berikut ๐ฅ๐ธ (๐ก) = ๐ฅ (๐ก) โ ๐ฅ(โ) ๐ข๐ธ (๐ก) = ๐ข(๐ก) โ ๐ข(โ) Perhatikan bahwa, untuk input ๐ฅ(๐ก), ๐ข(๐ก), dan ๐ฃ(๐ก) mencapai nilai konstan pada ๐ฅ (โ), ๐ข(โ), dan ๐ฃ(โ). Jadi, dari persamaan (2.13), didapatkan persamaan representasi errornya berupa ๐ฅ (๐ก) ๐น [ ๐ธ ]=[ ๐พ2 โ ๐พ2 ๐น โ ๐พ1 ๐ถ๐น ๐ข๐ธ (๐ก)
๐บ ๐ฅ (๐ก) ][ ๐ธ ] ๐ผ โ ๐พ2 ๐บ โ ๐พ1 ๐ถ๐บ ๐ข๐ธ (๐ก)
(2.14)
Persamaan (2.14) dapat ditulis sebagai ๐ฅ (๐ + 1) ๐น [ ๐ธ ]=[ ๐ข๐ธ (๐ + 1) 0
๐บ ๐ฅ๐ธ (๐) 0 ][ ] + [ ] ๐ค(๐ก) 0 ๐ข๐ธ (๐) ๐ผ
(2.15)
jika didefinisikan ๐ค(๐ก) = [๐พ2 โ ๐พ2 ๐น โ ๐พ1 ๐ถ๐น
โฎ ๐ผ โ ๐พ2 ๐บ โ ๐พ1 ๐ถ๐บ] [
๐ฅ๐ธ (๐ก) ] ๐ข๐ธ (๐ก)
Kemudian definisikan juga ๐ฅ (๐ก) ๐น ๐บ 0 ], ๐ (๐ก) = [ ๐ธ ] , ๐นฬ = [ ๐บฬ = [ ] ๐ข๐ธ (๐ก) 0 0 ๐ผ ฬ โ ๐พ ๐น โ ๐พ ๐ถ๐น โฎ ๐ผ โ ๐พ ๐บ โ ๐พ ๐พ = โ[๐พ2 2 1 2 1 ๐ถ๐บ] : Sehingga persamaan (2.15) menjadi ๐ (๐ก + 1) = ๐นฬ ๐(๐ก) + ๐บฬ ๐ค(๐ก) ฬ ๐ (๐ก) ๐ค(๐ก) = โ๐พ Perhatikan bahwa โฎ ๐พ1 ] [๐น โ ๐ผ ๐ถ๐น
[๐พ2
๐บ] ฬ [ = ๐พ + 0 โฎ ๐ผ] ๐ถ๐บ
(2.16)
Matriks ๐พ1 dan ๐พ2 yang diinginkan dapat diperoleh dari persamaan (2.16). 2.2 Kendali Optimal Linier Kuadratik Pada bagian ini dianalisis mengenai hubungan kendali optimal linier kuadratik dengan penyelesaian PRAWD. Sebelumnya, pandang suatu sistem terkontrol ๐ฅ (๐ก + 1) = ๐น๐ฅ (๐ก) + ๐บ๐ข(๐ก), ๐ฅ (0) = ๐ dengan ๐ก = 0,1,2, โฆ , ๐ โ 1 . Akan ditentukan vektor ๐ข(๐ก) sehingga indeks performansi kuadratik yang diberikan dapat diminimalkan. Misal diberikan indeks performansi kuadratik untuk waktu terbatas adalah ๐โ1 โ(
๐ฝ = ๐ฅ ๐)๐๐ฅ(๐) + โ[๐ฅ โ (๐ก)๐๐ฅ (๐ก) + ๐ข โ (๐ก)๐
๐ข(๐ก)] ๐ก=0
dengan ๐ โ ๐๐ร๐ , ๐ โ ๐๐ร๐ , dan ๐
โ ๐๐ร๐ adalah matriks simetris (Hermit) definit (semidefinit positif). Permasalahan kendali optimal pada bagian ini diselesaikan dengan menggunakan pengali Lagrange ๐(1), ๐(2), โฆ , ๐(๐) . Kemudian dapat didefinisikan Indeks Performansi: ๐ฟ = ๐ฅ โ (๐)๐๐ฅ(๐) + โ
๐โ1
[{๐ฅ โ (๐ก)๐๐ฅ(๐ก) + ๐ขโ (๐ก)๐
๐ข(๐ก)}๐โ (๐ก + 1){๐น๐ฅ(๐ก) + ๐บ๐ข(๐ก)
๐ก=0
โ ๐ฅ(๐ก + 1)} + {๐น๐ฅ(๐ก) โ ๐บ๐ข(๐ก) โ ๐ฅ(๐ก + 1)}โ ๐(๐ก + 1)]
Untuk meminimalkan fungsi ๐ฟ, ๐ฟ didiferensialkan terhadap ๐ฅฬ
(๐ก), ๐ขฬ
(๐ก) dan ๐ฬ
(๐ก) dengan hasil sama dengan 0.
Penggunaan Penyelesaian Persamaan Aljabar Riccati Waktu Diskrit โฆ
28
๐ฟ๐ฟ = 0; ๐(๐ก) = ๐๐ฅ(๐ก) + ๐น โ๐(๐ก + 1) ๐ฟ๐ฅฬ
(๐ก) ๐ฟ๐ฟ = 0; ๐๐ฅ(๐) = ๐(๐) ๐ฟ๐ฅฬ
(๐) ๐ฟ๐ฟ = 0; ๐ข(๐ก) = โ๐
โ1 ๐บ โ ๐(๐ก + 1) ๐ฟ๐ขฬ
(๐ก) ๐ฟ๐ฟ = 0; ๐ฅ(๐ก + 1) = ๐น๐ฅ(๐ก) + ๐บ๐ข(๐ก) ๐ฟ๐ฬ
(๐ก)
(2.17) (2.18) (2.19) (2.20)
Vektor ๐ข(๐ก) dapat ditemukan dari persamaan ๐ข(๐ก) = โ๐พ (๐ก)๐ฅ(๐ก) matriks ๐พ(๐ก) adalah matriks anggota ๐๐ร๐ . Asumsikan ๐(๐ก) sebagai fungsi dari vektor keadaan ๐ฅ (๐ก) dalam bentuk berikut: ๐(๐ก) = ๐ (๐ก)๐ฅ (๐ก) ๐(๐ก) adalah matriks Hermit (real simetris) anggota ๐๐ร๐ Dengan menyelesaikan persamaan (2.17) sampai (2.20) secara simultan didapat ๐(๐ก) = ๐ + ๐น โ ๐(๐ก + 1)๐น โ ๐น โ ๐(๐ก + 1)๐บ[๐
+ ๐บ โ ๐(๐ก + 1)๐บ]โ1 ๐บ๐(๐ก + 1)๐น
(2.21)
Persamaan (2.21) disebut juga persamaan Riccati dengan ๐(๐) = ๐. Persamaan (2.21) bisa diselesaikan secara mundur dari ๐ก = ๐ ke ๐ก = 0 sampai didapat nilai yang konstan. Dari persamaan (2.21), vektor kendali optimal menjadi: ๐ข(๐ก) = โ[๐
+ ๐บ โ ๐(๐ก + 1)๐บ]โ1 ๐บ โ ๐(๐ก + 1)๐น๐ฅ(๐ก)
dengan ๐พ(๐ก) = [๐
+ ๐บ โ ๐(๐ก + 1)๐บ]โ1 ๐บ โ ๐(๐ก + 1)๐น
(2.22)
matriks ๐พ(๐ก) dinamakan matriks umpan balik. Kemudian, dicari nilai minimum dari indeks performansi ๐โ1
min ๐ฝ = min {๐ฅ โ (๐)๐๐ฅ(๐) + โ[๐ฅ โ (๐ก)๐๐ฅ(๐ก) + ๐ขโ (๐ก)๐
๐ข(๐ก)]} ๐ก=0
dengan mensubtitusikan persamaan yang telah didapatkan pada bagian sebelumnya. ๐ฅ โ (๐ก)๐๐ฅ(๐ก) + ๐ขโ (๐ก)๐
๐ข(๐ก) = ๐ฅ โ (๐ก)๐(๐ก)๐ฅ(๐ก) โ ๐ฅ โ (๐ก + 1)๐(๐ก + 1)๐ฅ(๐ก + 1)
(2.23)
Dengan mensubtitusikan persamaan (2.23) ke persamaan indeks performansi ๐ฝ, diperoleh ๐โ1
๐ฝ๐๐๐ = ๐ฅ
โ (๐)๐๐ฅ(๐)
+ โ[๐ฅ โ (๐ก)๐(๐ก)๐ฅ(๐ก) โ ๐ฅ โ (๐ก + 1)๐(๐ก + 1)๐ฅ(๐ก + 1)] ๐ก=0
= ๐ฅ โ (๐)๐๐ฅ(๐) + ๐ฅ โ (0)๐(0)๐ฅ(0) โ ๐ฅ โ (๐)๐(๐)
Ingat bahwa ๐(๐) = ๐ , sehingga nilai minimum dari indeks performansi ๐ฝ adalah ๐ฝ๐๐๐ = ๐ฅ โ (0)๐(0)๐ฅ(0)
(2.24)
2.3 Penyelesaian PRAWD Setelah mengetahui bentuk dari penyelesaian persamaan Aljabar Riccati, berikut ini diberikan teorema mengenai keberadaan dan keunikan penyelesaian Aljabar Riccati. Terlebih dahulu, definisikan persamaan Aljabar Riccati waktu diskrit sebagai fungsi berikut ๐(๐) = ๐ โ ๐น โ ๐๐น + (๐ + ๐บ โ ๐๐น)โ (๐
+ ๐บ โ ๐๐บ)โ1 (๐ + ๐บ โ ๐๐น) โ ๐ = 0 (2.25) dengan matriks ๐น โ โ๐ร๐ , ๐ โ โ๐ร๐ , ๐บ โ โ๐ร๐ , ๐
= ๐
โ โ โ๐ร๐ , ๐ = ๐โ โ โ๐ร๐ .
Dita Marsa Yuanita, Soleha
29
Suatu matriks ๐ โ โ๐ร๐ disebut penyelesaian dari ๐(๐ ) apabila ๐ merupakan matriks Hermit, det(๐
+ ๐บ โ ๐๐บ ) โ 0 dan ๐(๐ ) = 0 . Sehingga didapat vektor kendali optimal โ1 ๐ข๐๐๐ก (๐ก) = [๐น โ ๐บ(๐
+ ๐บ โ ๐๐๐๐ก ๐บ) (๐ + ๐บ โ ๐๐๐๐ก ๐น)] ๐ฅ (๐ก) yang akan meminimumkan indeks performansi โ
๐ โ ) ๐ฅ (๐ก) ( ) ๐
๐ข(๐ก)
๐ ๐ฝ(๐ฅ0 , ๐ข) = โ(๐ฅ โ (๐ก) ๐ข โ (๐ก)) ( ๐ ๐ก=0
dengan ๐ฝ semidefinit positif. Indeks performansi optimal diberikan oleh ๐ฝ๐๐๐ก = ๐ฅ0โ ๐๐๐๐ก ๐ฅ0 ๐๐๐๐ก adalah penyelesaian semidefinit terkecil dari persamaan Aljabar Riccati waktu diskrit dan ๐ฅ (0) = ๐ฅ0 . Serta definisikan suatu matriks loop tertutup terkait penyelesaian ๐ dari (2.25) ๐น๐ = ๐น โ ๐บ (๐
+ ๐บ โ ๐๐บ )โ1 (๐ + ๐บ โ ๐๐น) dan ๐(๐น๐ ) adalah himpunan seluruh nilai eigen yang berbeda dari ๐น๐ . Maka keadaan optimal memenuhi ๐ฅ (๐ก + 1) = (๐น๐๐๐๐ก ) ๐ฅ(๐ก). Suatu penyelesaian ๐ dikatakan sebagai penstabil jika |๐| < 1 untuk seluruh nilai eigen ๐ dari ๐น๐ . Misal ๐ป = {๐ง; |๐ง| < 1} adalah unit disk terbuka dan ๐ฟ๐ป = {๐ง; |๐ง| = 1} adalah unit circle.
3. Hasil dan Pembahasan 3.1 Kendali Optimal Kuadratik Steady State Pada bagian ini diberikan kasus ketika proses kendali tidak berhingga atau ๐ = โ, sehingga matiks gain varian waktu ๐พ(๐ก) menjadi suatu matriks konstan ๐พ. Serta matriks penyelesaian PRAWD ๐(๐ก) menjadi ๐. Pandang persamaan (1.2) 0] 1 2 dengan ๐น = [ 0 , ๐บ = [ ], nilai awal ๐ฅ(0) = [ ] , serta indeks performansi โ0.5 1
0
2
yang akan diminimumkan โ
๐ฝ = โ [๐ฅ โ (๐ก) [ ๐ก=0
1 0] ๐ฅ(๐ก) + ๐ขโ (๐ก)๐ข(๐ก)] 0 0.5
(3.4)
Bentuk ๐ฅ โ (๐)๐๐ฅ(๐) tidak ada di persamaan (3.4) dikarenakan jika sistem stabil maka ๐ฅ(โ) bernilai nol sehingga ๐ฅ โ (โ)๐๐ฅ (โ) = 0. Salah satu cara untuk menyelesaikan persamaan Riccati untuk kendali optimal steady state adalah dengan membalik waktu dari persamaan Riccati non steady state pada persamaan (1.1) menjadi ๐ (๐ก + 1) = ๐ + ๐น โ ๐ (๐ก)๐น โ ๐น โ ๐ (๐ก)๐บ[๐
+ ๐บ โ ๐(๐ก)๐บ]โ1 ๐บ๐(๐ก)๐น dan iterasi persamaan tersebut dengan MATLAB mulai dari ๐ (0) = 0 hingga ๐ mencapai nilai konstan dengan syarat batas 0 0 ] ๐=[ 0 0 dan menghasilkan nilai yang tetap yaitu 1.5664 โ1.1328 ] ๐=[ โ1.1328 2.7556 Kemudian, matriks gain steady state ๐พ dapat ditentukan dari persamaan (2.22) dapat diperoleh nilai ๐พ = [0.2207 โ0.4414]
30
Penggunaan Penyelesaian Persamaan Aljabar Riccati Waktu Diskrit โฆ
Indeks performansi ๐ฝ yang bersesuaian dengan aturan kendali optimal steady state didapat dari persamaan (2.24) dengan mensubtitusikan ๐ untuk ๐(0) 1.5664 โ1.1328] [2] ๐ฝ๐๐๐ = [2 2] [ = 8.2656 โ1 โ 1328 2.7556 2
3.2 Kendali Optimal Kuadratik dari Sistem Servo Diinginkan untuk mendapatkan model ruang keadaan kontinu kemudian mendiskritkan model tersebut sehingga didapat model diskrit. Misalkan diketahui ๐ = 2.5๐๐, ๐ = 0.25๐๐, ๐ = 2๐ Pada bab 2 didapat representasi ruang keadaan dari pendulum terbalik pada persamaan (2.8) dan (2.9). Subtitusikan nilai dari ๐, ๐, ๐ dan ๐ = 9.81 didapat persamaan keadaan dan output dari pendulum terbalik adalah 0 0 ๐ฅ1 0 ] [๐ฅ2 ] + [โ0.2] ๐ข 1 ๐ฅ3 0 0 ๐ฅ4 0.4 ๐ฅ1 ๐ฅ2 ๐ฆ = [0 0 1 0] [๐ฅ ] 3 ๐ฅ4
๐ฅฬ1 0 ๐ฅฬ 2 5.3955 [ ]=[ ๐ฅฬ 3 0 โ0.981 ๐ฅฬ 4
1 0 0 0
0 0 0 0
Untuk mendisain sistem kendali, diperlukan suatu model terdiskritisasi. Persamaan sistem terdiskritisasi adalah ๐ต ๐ฅ(๐ + 1) = ๐ ๐ด ๐ฅ (๐) + (๐ ๐ด โ 1)๐ข (๐) ๐ด Pendiskritan juga dapat dilakukan dengan menggunakan command pada MATLAB. Perintah ini digunakan untuk mendiskritkan suatu sistem linier invariant waktu kontinu, dengan dimisalkan periode sampel adalah ๐ = 0.1 ๐๐๐ก๐๐ [๐น, ๐บ] = ๐2๐(๐ด, ๐ต, ๐) Sehingga, model ruang keadaan terdiskritisasi adalah ๐ฅ (๐ก + 1) = ๐น๐ฅ (๐ก) + ๐บ๐ข(๐ก) ๐ฆ(๐ก) = ๐ถ๐ฅ (๐ก) + ๐ท๐ข(๐ก) dengan 1.0271 0.5444 ๐น=[ โ0.0049 โ0.0990
0.1009 1.0271 โ0.0002 โ0.0049
0 0 1 0
โ0.0005 0 0 ] , ๐บ = [โ0.0101] , ๐ถ = [0 0 1 0], dan ๐ท = 0 0.1 0.002 1 0.04
Berikutnya adalah mendisain sistem servo dari sistem pendulum terbalik. Disain sistem servo adalah menentukan matriks ๐พ dan konstanta ๐พ1 sedemikian hingga sistem memiliki pole loop tertutup yang diinginkan. Persamaan integrator ditunjukkan oleh persamaan (2.10) sehingga diperoleh ๐ฅ (๐ก + 1) ๐น 0 ๐ฅ (๐ก) ๐บ 0 [ ]=[ ][ ]+[ ] ๐ข(๐ก) + [ ] ๐(๐ก + 1) ๐ฃ(๐ก + 1) โ๐ถ๐น 1 ๐ฃ(๐ก) โ๐ถ๐บ 1 Misalkan ๐ adalah fungsi tangga dan definisikan ๐ฅ๐ธ (๐ก) = ๐ฅ (๐ก) โ ๐ฅ (โ) ๐ฃ๐ธ (๐ก) = ๐ฃ(๐ก) โ ๐ฃ(โ) Dapat diperoleh persamaan error seperti berbentuk [
๐ฅ๐ (๐ก + 1) ๐น ]=[ ๐ฃ๐ (๐ก + 1) โ๐ถ๐น
0 ๐ฅ๐ธ (๐ก) ๐บ ][ ]+[ ] ๐ข (๐ก) 1 ๐ฃ๐ธ (๐ก) โ๐ถ๐บ ๐
dengan ๐ข๐ (๐ก) = โ๐พ๐ฅ๐ธ (๐ก) + ๐พ1 ๐ฃ๐ธ (๐ก) = โ[๐พ
๐ฅ (๐ก) ๐พ1 ] [ ๐ธ ] ๐ฃ๐ธ (๐ก)
Dita Marsa Yuanita, Soleha
31
Sehingga dapat didefinisikan ๐น ๐นฬ = [ โ๐ถ๐น
0] , 1
๐บ ] ๐บฬ = [ , โ๐ถ๐บ
ฬ = โ[๐พ ๐พ1 ] ๐พ ๐ฅ1๐ธ (๐ก) ๐ฅ2๐ธ (๐ก) ๐ฅ๐ (๐ก) ] = ๐ฅ3๐ธ (๐ก) ๐(๐ก) = [ ๐ฃ๐ (๐ก) ๐ฅ4๐ธ (๐ก) [ ๐ฃ๐ธ (๐ก) ]
๐ค(๐ก) = ๐ข๐ธ (๐ก),
Maka representasi ruang keadaan dari sistem dapat ditulis ๐ (๐ก + 1) = ๐นฬ ๐(๐ก) + ๐บฬ ๐ค(๐ก) ฬ ๐(๐ก) ๐ค(๐ก) = โ๐พ dengan 1.1048 ๐นฬ = [ 2.1316 โ0.0025 โ0.0508
0.1035 0 0 1.1048 0 0 ] , โ0.0001 1 0.1 โ0.0025 0 1
โ0.0051 โ0.1035 ๐บฬ = 0.0025 0.0501 [โ0.0025]
Perhatikan bahwa representasi awal sistem pendulum terbalik berada pada waktu kontinu, maka harus dipertimbangkan suatu indeks performansi waktu kontinu. Indeks performansi waktu kontinu berbentuk โ
๐ฝ = โซ [๐ โ (๐ก)๐๐(๐ก) + ๐ค โ (๐ก)๐
๐ค (๐ก)] ๐๐ก 0
Indeks performansi tersebut didiskritkan menjadi โ
๐ฝ = โ[๐(๐ก)โ ๐๐(๐ก) + ๐ค(๐ก)โ ๐
๐ค(๐ก)] ๐ก=0
Ambil 10 0 ๐= 0 0 [ 0
0 0 0 0 1 0 0 0 0 100 0 0 , 0 0 1 0 0 0 0 1]
๐
=1
Dapat diperoleh matriks gain umpan balik ๐พ dan konstanta gain integral ๐พ1 sebagai berikut ๐พ = [โ116.5430 โ74.1883 โ17.2665 โ20.0594 ], ๐พ1 = [โ0.6623] Dari matriks gain ๐พ yang diketahui dapat diperoleh respon tangga satuan dengan cara sebagai berikut. Karena ๐ข(๐ก) = โ๐พ๐ฅ (๐ก) + ๐พ1 ๐ฃ(๐ก) maka [
๐ฅ(๐ก + 1) ๐ฅ(๐ก) ] = ๐น๐น [ ] + ๐บ๐บ๐ ๐ฃ(๐ก + 1) ๐ฃ(๐ก) ๐ฅ(๐ก) ] ๐ฆ(๐ก) = [๐ถ 0] [ ๐ฃ(๐ก)
dengan ๐ = 1. Definisikan ๐น โ ๐บ๐พ ๐บ๐พ1 0 ], ๐น๐น = [ ๐บ๐บ = [ ] โ๐ถ๐น + ๐ถ๐บ๐พ โ๐ถ๐บ๐พ1 + 1 1 ๐ถ๐ถ = [๐ถ 0] = [0 0 1 0 0] Untuk mendapatkan response ๐ฅ1 (๐ก), notasikan ๐ฅ(๐ก) ] ๐ฅ1 (๐ก) = [1 0 0 0 0] [ ๐ฃ (๐ก) dengan mendefinisikan ๐ป๐ป = [1 0 0 0 0]
(3.11) (3.12)
Penggunaan Penyelesaian Persamaan Aljabar Riccati Waktu Diskrit โฆ
32
Konversikan persamaan ruang keadaan (3.11) dan (3.12) ke fungsi transfer dengan ๐
(๐ง)
๐1(๐ง)
[๐๐ข๐1, ๐๐๐1] = ๐ ๐ 2๐ก๐ (๐น๐น, ๐บ๐บ, ๐ป๐ป, 0) Kemudian gunakan perintah filter untuk mendapatkan respon tangga ๐ฅ1 = ๐๐๐๐ก๐๐(๐๐ข๐1, ๐๐๐1, ๐) Dengan cara sama, untuk mendapatkan ๐ฅ2 (๐ก), ๐ฅ3 (๐ก) = ๐ฆ(๐ก), ๐ฅ4 (๐ก), dan ๐ฅ (๐ก) ] dengan mendefinisikan basis ๐ฅ5 (๐ก) = ๐ฃ(๐ก), kalikan basis liniernya dengan [ ๐ฃ(๐ก) linier tersebut sebagai ๐ฝ๐ฝ = [0 1 0 0 0] ๐ถ๐ถ = [0 0 1 0 0] ๐ฟ๐ฟ = [0 0 0 1 0] ๐๐ = [0 0 0 0 1] Selanjutnya dilakukan hal yang sama untuk
๐2 (๐ก) ๐(๐ก) ๐4(๐ง)
,
,
๐
(๐ก) ๐
(๐ก) ๐
(๐ง)
๐(๐ง)
, dan ๐
(๐ง).
Plot respon tangga satuan versus ๐ก ditunjukkan pada gambar berikut
Gambar 3. Grafik Respon Tangga Satuan ๐ฅ1 (๐ก) versus ๐ก
Gambar 4. Grafik Respon Tangga Satuan ๐ฅ2 (๐ก) versus ๐ก
Gambar 5. Grafik Respon Tangga Satuan ๐ฅ3 (๐ก) versus ๐ก
Dita Marsa Yuanita, Soleha
33
Gambar 6. Grafik Respon Tangga Satuan ๐ฅ4 (๐ก) versus ๐ก
Gambar 7. Grafik Respon Tangga Satuan ๐ฅ5 (๐ก) versus ๐ก Jika dimisalkan periode sampel adalah 0.1 detik, maka dari gambar di atas didapat bahwa keadaan steady state tercapai saat 7 detik.
4. Kesimpulan 1. Persamaan keadaan dan output dari sistem pendulum terbalik berbentuk persamaan kontinu dengan indeks performansi kontinu, pendiskritan dilakukan untuk membentuk suatu sistem linier invariant waktu diskrit dari sistem. 2. Desain servo diselesaikan dengan mendapatkan penyelesaian PRAWD ๐, matriks ๐พ dan konstanta integral ๐พ1 dari persamaan ruang keadaan ๐(๐ก + 1) = ๐นฬ ๐(๐ก) + ๐บฬ๐ค(๐ก) ฬ๐(๐ก) ๐ค(๐ก) = โ๐พ
3. Dari matriks ๐พ dan ๐พ1 dapat diperoleh respon tangga satuan ๐ฅ1 (๐ก), ๐ฅ2 (๐ก), ๐ฅ3 (๐ก) = ๐ฆ(๐ก), ๐ฅ4 (๐ก), dan ๐ฅ5 (๐ก) = ๐ฆ(๐ก) . Kemudian dapat diberikan grafiknya versus ๐ก dengan menggunakan software MATLAB.
5. Daftar Pustaka [1] Bellon, J. (2008) "Riccati Equations in Optimal Control Theory". Mathematics Theses, Georgia State University. [2] Clements, D. J., Wimmer, H.K. (2003). โExistence and Uniqueness of Unmixed Solutions of the Discrete-time Algebraic Riccati Equationsโ. Systems and Control Letters, Vol. 50, Hal 343-340. [3] Ogata, K. (1995). โDiscrete-Time Control Systemโ. Prentice-Hall International, London. [4] Subiono. (2010). โMatematika Sistemโ. Jurusan Matematika, FMIPA ITS.