Bab III Plant Nonlinear Dengan Fase Nonminimum
Pada bagian ini dibahas mengenai penurunan learning controller untuk sistem nonlinear dengan derajat relatif yang diketahui. Dalam hal ini hanya diperhatikan pada sistem-sistem nonlinear yang invarian terhadap waktu.
III.1 Deskripsi Sistem
Perhatikan sistem nonlinear yang stabil pada aproksimasi pertama di x = 0 dan juga masukan pada keadaan stabil: xi ( t ) = f ( xi ( t ) ) + g ( xi ( t ) ) ui ( t ) ,xi ( 0 ) = 0
( 3.1)
yi ( t ) = h ( xi ( t ) ) dimana i adalah indeks iterasi dari ILC, {ui }i =0 merupakan barisan masukan, ∞
xi ( t ) ∈ f :
n
n
→
, ui ( t ) ∈ n
, g:
m
n
, yi ( t ) ∈
→
n× m
m
, h:
, n
→
m
.
Untuk penyederhanaan, perhatikan kasus derajat relatif r = 1 . Tujuan dari learning adalah untuk membangun barisan dari trayektori masukan
{ui }i =1 ∞
sedemikian sehingga ui → u ∗ , dimana u ∗ ( t ) akan menyebabkan sistem menuju jalur trayektori yang diinginkan yd ( t ) agar “sedekat mungkin” pada [ 0,T ] dan xd ( t ) = f ( xd ( t ) ) + g ( xd ( t ) ) ud ( t ) ,xd ( 0 ) = 0 yd ( t ) = h ( xd ( t ) )
( 3.2 )
yang dipenuhi untuk setiap t ∈ [ 0, T ] . Untuk model masukan gangguan, persamaan plant (3.1) dimodifikasi menjadi : xi ( t ) = f ( xi ( t ) ) + g ( xi ( t ) ) ui ( t ) + b ( xi ( t ) ) wi ( t ) ,xi ( 0 ) = 0 yi ( t ) = h ( xi ( t ) ) di mana
11
( 3.3)
b:
n
→
n
dan wi ( t ) ∈
.
Fungsi wi ( t ) merepresentasikan deterministik dan gangguan yang terbatas secara acak dari sistem. Asumsikan : (A1) Fungsi f ( ⋅) , g ( ⋅) , h ( ⋅) , hx ( ⋅) merupakan fungsi yang memiliki turunan yang kontinu dan b ( ⋅) kontinu. (A2) yd ( ⋅) ∈C r dimana r = 1 merupakan derajat relatif dari sistem. (A3) u0 ∈ L∞ ∩ C 0 ∩ Br . (A4) Sistem stabil pada aproksimasi pertama dan masukan untuk keadaan stabil. (Perhatikan bahwa, jika sistem tidak stabil, maka sistem mungkin bisa distabilkan untuk diaplikasikan pada metode ini). (A5) Sistem memiliki dinamika nol hiperbolik yaitu fase nonminimumnya tidak stabil. (A6) Gangguan wi ( ⋅) kontinu dibatasi oleh bw , yaitu wi ( t ) ≤ bw . Untuk suatu sistem, algoritma learning diajukan seperti pada gambar berikut. N
ui ( i )
yd ( i )
yi ( i )
P
+ d⎞ ⎛ ⎜1 + ⎟ ⎝ dt ⎠
δ ui ( ⋅)
ui +1 ( ⋅)
+
−1
T
DN 0
Gambar III.1. Skema algoritma learning.
12
r
III.2 Formulasi Learning Controller pada Plant −1
Pada bagian ini, akan diturunkan learning controller DN 0 (ditunjukkan pada gambar III.1) dengan linearisasi plant. Dari sistem linear yang stabil pada (3.3) definisikan suatu masukan ke keluaran pada plant nonlinear P (stabil pada aproksimasi pertama) sebagai berikut : P : ui
Jika
xi
∞
xi ( t )
yi .
merupakan solusi untuk persamaan diferensial (3.3), maka
< M < ∞ (dengan asumsi kestabilan masukan ke keluaran).
Dari kekompakan xi dan kekontinuan fungsi h dan menggunakan Teorema 4.15 pada [7]:
yi ( ⋅) ∈ L∞ . Dengan menggunakan aturan rantai didapat :
yi ( t ) = hx ( xi ( t ) ) xi ( t ) . Juga dari keterdiferensialan xi , h dan hx (asumsi A1), dan menggunakan Teorema 5.5 pada [7], didapat :
yi ( ⋅) ∈ C1 . Karena itu
yi ( ⋅) ∈ C 0 . Dari Teorema 4.15 pada [7] didapat :
yi ( ⋅) ∈ L∞ . Oleh karena itu didapat: P : ui
yi .
P : C 0 ∩ L∞ → C1 ∩ L∞ .
( 3.4 ) ( 3.5)
d ⎞ ⎛ Definisikan operator linear DT := ⎜ d + ⎟ . Jadi dt ⎠ ⎝
DT (δ yi ) = δ yi + δ yi . dimana
13
( 3.6 )
δ yi = yd − yi . dan
δ yi = yd − yi . Asumsikan yd ∈ C r .
( r = 1 adalah derajat relatif) dan yd ∈ L∞ .
dimana yd merupakan trayektori keluaran yang diinginkan. Telah dibuktikan bahwa yi ∈ C 1 ∩ L∞ .
Karena itu,
δ y = yd − yi ∈ C 1 ∩ L∞ . Dengan alasan yang sama, dapat dikatakan
δ y = yd − yi ∈ C 0 ∩ L∞ . Oleh karena itu DT : δ yi
δ yi + δ yi
DT : C1 ∩ L∞ → C 0 ∩ L∞
Definisikan operator nonlinear N sebagai :
N := − ( DT P ) : ui
− (δ yi + δ yi )
C 0 ∩ L∞ → C 0 ∩ L∞
( 3.7 )
Operator linear DN 0 didefinisikan dengan melinearkan sistem (3.3) disekitar
( x = 0,u = 0,w = 0 )
sebagai berikut :
δ xi ( t ) = Aδ xi ( t ) + b δ ui ( t ) , δ xi ( 0 ) = 0 δ yi ( t ) = Cδ xi ( t ) dimana
A := f x ( 0 ) ;b := g ( 0 ) ;C := hx ( 0 ) .
14
( 3.8)
Karena plant stabil pada aproksimasi pertama, A adalah Hurwitz di (3.8), maka
δ xi ( 0 ) = 0 dapat diganti dengan δ xi ( ±∞ ) = 0 dan juga tanpa mengubah masukan-keluaran pada pemetaan yang didefinisikan oleh (3.8).
Sekarang definisikan operator linear DN 0 sebagai :
DN 0 := DT DP |0 : δ ui
( 3.9)
δ yi + δ yi .
Jadi DN
0
(δ ui ) ( C + CA ) δ xi ( t ) + Cb δ ui ( t ) = δ yi + δ yi .
dimana δ xi merupakan solusi untuk (3.8) dan
δ y ∈ C 0 ∩ L∞ Oleh karena itu
DN 0 : C 0 ∩ L∞ → C 0 ∩ L∞ Operator linear DN 0 memiliki invers, karena r = 1 , Cb ≠ 0 (lihat bukti Lemma 3.2.1). Learning Control ( DN 0 ) didefinisikan oleh persamaan berikut :
δ xi ( t ) = Aδ xi ( t ) + b ( Cb ) ⎡⎣δ yi ( t ) + δ yi ( t ) − ( C + CA ) δ xi ( t ) ⎤⎦ ,xi ( ±∞ ) = 0 −1
( ) ( C + CA )⎤⎥⎦ δ x ( t ) + b ( Cb )
= ⎡ A − b Cb ⎢⎣
−1
−1
i
⎡⎣δ yi ( t ) + δ yi ( t ) ⎤⎦
δ ui ( t ) = ( Cb ) ⎡⎣δ yi ( t ) + δ yi ( t ) − ( C + CA ) δ xi ( t ) ⎤⎦ −1
( 3.10 )
Karena sistem hiperbolik (asumsi A5), dengan kondisi batas bisa didapatkan solusi untuk sistem di atas menggunakan ”stable noncausal” yang diambil dari pendekatan [3]. Karena itu operator linear DN 0 didefinisikan sebagai: −1
DN 0 : C 0 ∩ L∞ → C 0 ∩ L∞
(δ y + δ y ) i
i
δ ui
Notasikan δ xi = xd − xi , δ yi = yd − yi dan δ ui = ud − ui , dan turunkan (dengan ekspansi deret Taylor) plant yang dilinearisasi dari (3.3) sebagai berikut :
15
xi ( t ) + δ xi ( t ) = f ( xi ( t ) + δ xi ( t ) ) + g ( xi ( t ) + δ xi ( t ) ) ⋅ ⎡⎣ui ( t ) + δ ui ( t ) ⎤⎦ ≈ f ( xi ( t ) ) + f x ( xi ( t ) ) δ xi ( t )
( 3.11)
+ ⎣⎡ g ( xi ( t ) ) + g x ( xi ( t ) ) δ xi ( t ) ⎦⎤ ⎡⎣ui ( t ) + δ ui ( t ) ⎤⎦
Yang didapat dengan ekspansi deret Taylor dan pengabaian bagian orde yang tinggi, dimana f x ( xi ( t ) ) :=
∂f ∂g xi ( t ) ) ; g x ( xi ( t ) ) := ( ( xi ( t ) ) . ∂x ∂x
Juga
yi ( t ) + δ yi ( t ) = h ( xi ( t ) + δ xi ( t ) ) . Kurangi (3.11) dari (3.3) dan diabaikan orde yang tingginya, maka akan didapatkan plant yang dilinearisasi di sekitar solusi xi ( t ) untuk (3.3) sebagai:
δ xi ( t ) = f x ( xi ( t ) ) δ xi ( t ) + g ( xi ( t ) ) δ ui ( t ) + g x ( xi ( t ) ) δ xi ( t ) ui ( t ) − b ( xi ( t ) ) wi ( t )
δ xi ( 0 ) = 0
( 3.12 )
δ yi ( t ) = hx ( xi ( t ) ) δ xi ( t ) Karena (3.8) stabil, dimana ini dapat dibuktikan dengan metode Lyapunov bahwa (3.7) juga stabil pada masukan terbatas–keluaran terbatas, jika xi tidak termasuk dalam batas yang ditentukan. Perhatikan bahwa, disini δ xi ( 0 ) = 0 juga dapat diganti
(seperti di (3.8)) dengan δ ( ±∞ ) = 0 dan tidak mengubah pemetaan
masukan-keluaran. Definisikan
Ai := f x ( xi ( t ) ) + g x ( xi ( t ) ) ui ( t ) . Bi := g ( xi ( t ) ) . Ci := hx ( xi ( t ) ) . bi := b ( xi ( t ) ) . Maka sistem linear yang stabil pada (3.12) memiliki solusi kemudian definisikan pemetaan masukan-keluaran linear : DP u : δ ui → δ yi i
C ∩ L∞ → C 1 ∩ L∞ 0
16
.
δ y ( t ) = hx ( xi ( t ) ) δ xi ( t ) + hxx ( xi ( t ) ) xiδ xi ( t ) . Dapat dibuktikan
δ y ( ⋅) ∈ C 0 ∩ L∞ . Definisikan operator linear DN u sebagai : i
DN u := DT DP u : δ ui i
δ yi + δ yi .
i
( 3.13)
C 0 ∩ L∞ → C 0 ∩ L∞ .
Dalam suatu proses iterative learning control, seperti yang ditunjukkan pada gambar III.1, pada setiap langkah learning ke-i, masukan kontrol ui diperbarui menjadi ui +1 = T ( ui + δ ui ) . Jumlah dari galat pada sinyal keluaran yaitu
δ yi := yd − yi . dan galat pada turunannya yaitu
δ yi := yd − yi . menjadi masukan untuk operator learning, dimana δ ui merupakan keluaran learningnya. Pada bagian ini diasumsikan bahwa sistem nonlinear memiliki derajat relatif 1, hal ini diperlukan untuk mengambil turunan dari keluaran untuk membalikkan
sistem.
Dalam
prakteknya,
pendiferensialan
hanya
dapat
diaproksimasi karena adanya gangguan sensor keluaran. Untuk mengklarifikasi diskusi sebelumnya, parameter fungsi akan ditunjukkan dalam notasi dibawah garis dengan kebergantungan dari waktu yang disebabkan keadaan lain yang dikecualikan.
Sekarang aturan iteratif yang diperbarui dari ILC dapat ditulis dalam istilah −1
operator N dan DN 0 sebagai berikut :
(
( )
ui +1 = T ( ui + δ ui ) = T ui + Cb
(
= ui + T DN
−1 0
−1
⎡δ yi + δ yi − ( C + CA ) δ xi ⎤ ⎣ ⎦
(δ y + δ y ) ) = u − T ( DN i
i
i
dimana δ xi merupakan solusi untuk (3.13).
17
−1 0
N ( ui )
)
) ( 3.14 )
Lemma berikut akan menentukan dimana solusi nonkausal diperlukan untuk plant yang linear. Lemma 3.2.1. Jika suatu sistem nonlinear dengan derajat relatif yang terdefinisi
dengan baik dan dinamika nol hiperbolik merupakan fase nonminimum (yaitu dinamika nol tidak stabil), plant yang dilinearisasi (dengan titik ekuilibrium (0,0)) memiliki zero yang tidak stabil. Bukti : Perhatikan sistem nonlinear yang diberikan oleh : x = f ( x) + g ( x) u y = h (h)
( 3.15)
dengan derajat relatif terdefinisi untuk r ≤ n . Misalkan bentuk normal dari sistem di atas diberikan oleh
ξ1 = ξ 2 ξ 2 = ξ3 =
ξ r = b (ξ ,η ) + a (ξ ,η ) u
( 3.16 )
η = q (ξ ,η ) y = ξ1 Pertama, perlu ditunjukkan bahwa aproksimasi linear dari persamaan dalam bentuk normal adalah sama dengan bentuk normal dari aproksimasi linear dari deskripsi awal sistem. Hal ini ekuivalen dengan menunjukkan bahwa derajat relatif dari sistem dan aproksimasi linearnya adalah sama. Untuk mengakhiri, misalkan medan vektor f ( x ) memiliki ekuilibrium di x = 0 yakni f ( 0 ) = 0 dan perhatikan untuk f ( x ) suatu ekspansi dalam bentuk
f ( x ) = Ax + f 2 ( x )
⎡ ∂f ⎤ ⎡ ∂f ⎤ dengan A = ⎢ ⎥ dan ⎢ 2 ⎥ = 0 . ⎣ ∂x ⎦ x =0 ⎣ ∂x ⎦ x =0
dengan memisahkan aproksimasi linear Ax dari bentuk derajat tertinggi f 2 ( x ) . Dengan cara yang sama ekspansikan
h ( x ) = Cx + h2 ( x ) , dimana
18
h ( 0 ) = 0 ; C = [ ∂h ∂x ]x =0 dan [ ∂h2 ∂x ]x =0 = 0 . Demikian halnya ekspansi g ( x ) menjadi g ( x ) = B + g1 ( x ) dengan B = g ( 0 ) . Oleh karena itu, aproksimasi linear dari sistem di x = 0 , didefinisikan sebagai
x = Ax + Bu . y = Cx .
Ini dapat dibuktikan dengan induksi bahwa :
Lkf h ( x ) = CAk x + d k ( x ) . dimana d k ( x ) memenuhi [ ∂d k ∂x ]=0 = 0 . Dari sini, dapat dideduksi bahwa
CAk B = Lg Lkf h ( 0 ) = 0 untuk semua k < r − 1 . CAr −1 B = Lg Lrf−1h ( 0 ) ≠ 0 . yakni derajat relatif dari aproksimasi linear dari sistem di x = 0 tepat sama dengan r. Dari fakta ini, dapat disimpulkan bahwa dengan mengambil aproksimasi linear dari persamaan dalam bentuk normal (3.16) berdasarkan ekspansi dari bentuk : b (ξ ,η ) = Rξ + Sη + b2 (ξ ,η ) a (ξ ,η ) = K + a1 (ξ ,η ) q (ξ ,η ) = Pξ + Qη + q2 (ξ ,η ) dihasilkan sistem linear dalam bentuk normal
ξ1 = ξ 2 ξ 2 = ξ3 =
ξ r = Rξ + Sη + Ku η = Pξ + Qη y = ξ1
( 3.17 )
Ditunjukkan oleh [4] bahwa nilai eigen dari Q bersesuaian dengan zero dari sistem linear yang diberikan oleh (3.17). Juga dicatat bahwa matriks Jacobi
[∂q
∂η ](ξ ,η )=0 menjelaskan aproksimasi linear pada η = 0 dari dinamika nol dari
sistem nonlinear awal (3.16). Oleh karena itu, jika sistem nonlinear merupakan fase nonminimum (pelinearan dinamika nol memiliki paling sedikit satu nilai
19
eigen yang tidak stabil): nol dari fungsi transfer dari aproksimasi linear dari sistem awal di x = 0 tidak semua stabil. Dari Lemma 3.2.1 dapat disimpulkan bahwa jika diberikan sistem −1
nonlinear dengan dinamika nol yang tidak stabil, maka DN 0 memiliki positif yang tidak stabil, dan hal itu diperlukan untuk mengaplikasikan proses inversi noncausal [4] pada DN 0 yang dijelaskan pada bagian sebelumnya.
20