Tải bản đầy đủ
1 Nguyên lý cực đại Pontryagin

1 Nguyên lý cực đại Pontryagin

Tải bản đầy đủ

Đồ án tốt nghiệp Đại Học
Khang
Hàm

ρ

GVHD: GS.TSKH. Nguyễn Văn

được gọi là hàm mục tiêu

Trong đó

x(t f ) = x f

(3.4)
Pontryagin đã đề xuất nguyên lý để giải bài toán đặt ra được gọi là nguyên lý
cực đại Pontryagin, thường được gọi tắt là nguyên lý tối ưu Pontryagin, hay
nguyên lý Pontryagin

3.1.2 Nguyên Lý
Nếu hàm u là điều khiển tối ưu, tức là đảm bảo phiếm hàm (3.3) cực tiểu (cực
đại) thì hàm Hamilon H:
n

H (x,u,p, t) = ( p,f ) ≡ ∑ pi f i
i =1

(3.5)
đạt cực đại (cực tiểu), trong đó biến liên hợp

pi ( j = 1...n)

cần thỏa mãn

phương trình liên hợp:
n

p&j = −∑ pi
i =1

∂fi
;
∂x j

( j = 1...n)

(3.6)
Với
p j (t f ) = -b j

(3.7)

SV: Hoàng Kim Đức
46

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

Từ (3.5) khi tính đạo hàm của hàm Hamilton đối với các biến liên hợp ta nhận
được

∂H
= f i (t , x, u)
∂pi
n
∂f
∂H
= ∑ pj j
∂xi
∂xi
j =1

(3.8)
Dựa vào hệ phương trình (6.8) và các phương trình (6.1) và (6.6) ta có
∂H
∂pi

x&i =

p&i = −

∂H
∂xi

(3.9)
3.1.3 Lộ trình giải bài toán tối ưu theo nguyên lý Pontryagin
a) Bài toán
Phương trình mô tả quá trình (3.1) và hàm mục tiêu có dạng:
tf

J = ∫ I ( x, u, t ) dt + g ( x f , t f ) → max ( min )
t0

(3.10)
Bằng cách đưa vào biến mới
tf

xn +1 = ∫ I ( x, u, t ) dt + g ( x f , t f
t0

)

(3.11)
Lúc đó phiếm hàm (3.11) tương đương với phương trình vi phân
SV: Hoàng Kim Đức
47

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

x&n+1 = I ( x, u, t )
(3.12)
Bài toán tối ưu phiếm hàm (3.10) với điều kiện biên (3.2) đưa về xét tối ưu của
phiếm hàm
tf

J = J + ∫ p T [ f (t , x,u) − x&] dt
*

t0

x&

Trong đó J có dạng (3.10), f , phù hợp với (3.1), p là ma trận cỡ

( ( n + 1) × n )

Từ đó ta được
tf

J = ∫ { I ( x, u, t ) + p T [ f (t , x,u) − x&] } dt + g ( x f , t f )
*

t0

tf

= ∫  I ( x, u, t ) + p Tf (t , x,u) − p T x& dt + g ( x f , t f
t0

)

(3.13)
Ta đặt:

H ( x, u, t ) = I ( x, u, t ) + pTf (t , x,u)
(3.14)
Từ (3.13) và (3.14) ta suy ra
tf

J = ∫ { I ( x, u, t ) + p T [ f (t , x,u) − x&] } dt + g ( x f , t f )
*

t0

tf

= ∫  H ( x, u, t ) − p T x& dt + g ( x f , t f
t0

)

(3.15)
SV: Hoàng Kim Đức
48

Lớp: KSTN-CĐT-K55

Trang

.

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

Sử dụng tích phân từng phần ta có

∫p

T

x&dt =pT x − ∫ p&T xdt

Từ đó biểu thức (3.15) có thể viết lại dưới dạng
tf

J = ∫  H ( x, u, t ) − p&T x  dt + g ( x f , t f ) − p(t f )x(t f ) − p(t0 ) x(t0 ) 
*

t0

(3.16)
Phiếm hàm J đạt cực trị thì

J*

cũng đạt cực trị, tức là gia số của nó bằng

không. Do đó
T
 ∂H T

 ∂g

 ∂H 
T
&
δ J = ∫ 
δ
u
+
δ
x
+
p
δ
x
dt
+

p
(
t
)


f δ x f = 0
÷

÷

u

x

x







f
t0 



tf

*

(3.17)
Từ đây ta có điều kiện để phiếm hàm J đạt cực trị là
∂H
= 0;
∂u

(3.18)
p&=

∂H
= 0;
∂x

∂g
= p (t f )
∂x f

(3.19)
Chú ý
1. Phương trình chuyển động của đối tượng điều khiển dạng (3.1) có thể

được viết dưới dạng sau:

SV: Hoàng Kim Đức
49

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

x&=

GVHD: GS.TSKH. Nguyễn Văn

∂H
∂p

2. Hàm Hamilton thường được viết dưới dạng
n

H = p0 I + ∑ pifi
i =1

(3.20)
Trong trường hợp yêu cầu phiếm hàm (3.10) đạt cực tiểu (tức là hàm H
đạt cực đại), chọn

p0

=1. Trong trường hợp ngược lại, tức là yêu cầu

phiếm hàm (3.10) đạt cực đại (tức là hàm H đạt cực tiểu), chọn

p0

=-1

b) Lộ trình giải bài toán
Từ khảo sát trên, có thể thấy xây dựng lộ trình giải bài toán tối ưu như sau:
1. Xây dựng phương trình chuyển động của đối tượng điều khiển có dạng

phương trình (3.1)
2. Xây dựng hàm mục tiêu có dạng (3.13)
3. Xây dựng hệ biến mở rộng (x,z) trong đó biến z có dạng
tf

z = ∫ I ( x, u, t ) dt + g ( x f , t f )
t0

Chú ý rằng
z&= I ( x, u, t )
Với
z ( t0 ) = z0
4. Xây dựng hàm H

H = I + pT f

Trong đó:
T
f = [ f1 , f 2 , ..., f n ]

SV: Hoàng Kim Đức
50

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

5. Xây dựng các tham số điều khiển tối ưu được tìm từ điều kiện

max H
u∈Ω

Trong trường hợp riêng (không có các ràng buộc đặt lên các biến điều
khiển) thì điều khiển tối ưu sẽ là nghiệm của phương trình sau:
∂H
=0
∂u
6. Xây dựng hệ phương trình

∂H
∂x
∂H
x&=
∂p
z&= I

p&= −

7. Giải hệ phương trình trên ta được lời giải.

Thí dụ 3.1
Khảo sát chuyển động của đối tượng, phương trình chuyển động trong hệ biến
chính tắc có dạng

x&1 = x2
x&2 = u
Với phiếm hàm mục tiêu
tf

1
J = ∫ ( x12 + u 2 ) dt
2 t0
Các điều kiện biên:

SV: Hoàng Kim Đức
51

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

x1 (t0 ) = x10 ; x2 (t0 ) = x20
x1 (t f ) = x1 f ; x2 (t f ) = x2 f

Trong điều kiện vị trí cuối có ràng buộc thêm điều kiện
x1 f = x2 f
tf

Đưa vào thêm biến phụ

Với

1
z (t ) = ∫ ( x12 + u 2 ) dt
2 t0

z ( t0 ) = 0

Hàm Hamilton có dạng
H = − I + pT f = −0.5 ( x12 + u 2 ) + p1 x2 + p2u
Điều khiển tối ưu được xác định từ hệ thức sau:
∂H
= 0 ⇒ u = p2
∂u

Phương trình đối với các biến liên hợp
p&1 = −

∂H
= x1
∂x1

p&2 = −

∂H
= − p1
∂x2

Vậy hệ phương trình để giải bài toán sẽ là

SV: Hoàng Kim Đức
52

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

 x&1 = x2 (t )
 x& = u (t )
 2

2
2
 z&= −0.5 ( x1 (t ) + u (t ) )

 p&1 = x1 (t )
 p&2 = − p1 (t )
Với các điều kiện biên như đã nêu ở đầu bài.
3.2 Điều khiển tối ưu các hệ tuyến tính liên tục bằng bộ điều khiển LQR
(Linear Quadratic Regulator)
3.2.1 Thiết lập bài toán
Cho hệ có mô hình tuyến tính
x&= Ax + Bu, A ∈ R n×n , B ∈ R n×r , x ∈ R n , u ∈ R r

(3.21)
Hệ phương trình (3.21) khi không bị kích thích
hệ là ổn định, thì khi u nhỏ thì

x→0

u=0

có nghiệm. Nếu

. Điểm này được gọi là điểm cân bằng.

Bài toán: Giả sử khi có nhiễu động, trạng thái của hệ bị đánh bặt ra khỏi
vị trí cân bằng

x=0

chuyển động đến vị trí

x0

điều khiển u=u(x) để đưa trạng thái của hệ từ

nào đó. Bài toán đặt ra: tìm bộ
x0

trở về điểm cân bằng 0, sao

cho trong quá trình này sự tổn hao năng lượng được đánh giá bởi phiếm hàm
mục tiêu


1
J (x, u) = ∫ (xT Qx + uT Ru + 2xT Nu )dt → min
20

(3.22)
SV: Hoàng Kim Đức
53

Lớp: KSTN-CĐT-K55

Trang

Đồ án tốt nghiệp Đại Học
Khang

GVHD: GS.TSKH. Nguyễn Văn

Trong đó
Q = QT , xT Qx ≥ 0, Q ∈ R n×n ∀x
R = R T , xT Rx > 0, ∀x ≠ 0

(3.23)
N là ma trận cỡ

n×r

Bài toán này là bài toán điều khiển tối ưu tuyến tính bằng bộ điều khiển LQR
(Linear quadractic regulator).
3.2.2Xây dựng điều kiện cần của phiếm hàm mục tiêu
Giả sử

u* (t )

, là một tín hiệu điều khiển được tạo ra từ bộ điều khiển F và

thõa mãn điều kiện cực tiểu của hàm mục tiêu (3.22). Điều kiện có nghĩa là
trong tập các tính hiệu

u(t )

đưa trạng thái của hệ từ

x0 → 0

thì

u* (t )

là vector

thỏa mãn điều kiện
J (u* ) =



1
(x*T Qx* + u*T Ru* + 2x*T Nu* )dt ≤J (u)

20


1
= ∫ (xT QTx + uT Ru + 2x T Nu) dt
20

(3.24)
SV: Hoàng Kim Đức
54

Lớp: KSTN-CĐT-K55

Trang