23
6.3 用用用用用用用用用用用用 用用1 用用用用用用用用用用用用用 用用用用用 用用用用用用用用用用用用用用 、一, 用用用2 用用用用用用用用用用 用用用用用用用用用 、:; 用用用用用用用用用 用用用用用用用用用用用用用用用用用用用 :。 用用用用用用用用 用用用用用用用用用用用用 ,。 3 用用用用用用用 u(t) 用用用用用用用用 用用用用用 r 用用用用用 R r 用用用用

6.3 用变分法求解最优控制问题

Embed Size (px)

DESCRIPTION

6.3 用变分法求解最优控制问题. 引言:. 1 、动态最优控制中目标函数是一个泛函数,最优控制问题就是求泛函数的极值问题。. 2 、对无约束的最优控制:通常用变分法求解; 对有约束的最优控制:通常用以变分法为基础的极小值原理求解。. 以上两种最优控制,都可以用动态规划法求解。. 3 、 无约束是指控制 u(t) 不受不等式的约束,可以在整个 r 维向量空间 R r 任意取值。. 一、变分法的基本概念. 变分法--求泛函极值的方法. - PowerPoint PPT Presentation

Citation preview

Page 1: 6.3    用变分法求解最优控制问题

6.3 用变分法求解最优控制问题引言:

1 、动态最优控制中目标函数是一个泛函数,最优控制问题就是求泛函数的极值问题。

2 、对无约束的最优控制:通常用变分法求解;

对有约束的最优控制:通常用以变分法为基础的极小值原理求解。以上两种最优控制,都可以用动态规划法求解。

3 、无约束是指控制 u(t)不受不等式的约束,可以在整个 r维向量空间 Rr 任意取值。

Page 2: 6.3    用变分法求解最优控制问题

一、变分法的基本概念变分法--求泛函极值的方法

1 、泛函定义:对某一类函数集合中的每一个函数y(x),有一个确定的数 J与之对应,就称 J为依赖于函数 y(x)的泛函,记 J=J[y(x)]。

讨论:

( 1)性能指标 J取决于向量函数 x(t)及 u(t)的选取而定,称指标泛函,记作 J[u(t),x(t)] 。 ( 2)因为 x(t)和 u(t)必须满足一定的关系(状态方程), u(t)的选取又影响到 x(t)的选取,一般又将指标泛函记作 J[u(t)]

Page 3: 6.3    用变分法求解最优控制问题

( 3)函数 u(t)称为泛函 J[u(t)]的宗量。(或自变量)

( 4)泛函与函数的区别:

泛函宗量是函数,而函数的宗量是变数。

( 5)求最优控制 u*(t),就是求使 J[u(t)]取极小值的 u(t)。

Page 4: 6.3    用变分法求解最优控制问题

2 、泛函的极值

曲线上达到极小值。在则称,-

接近的曲线,有或对于任何一条与

,或写成

定义:如果泛函

)()]([

0)]([)]([

)()(

],,[)]([

],,[)]([

0

0

00

0

xyxyJ

xyJxyJ

txxxyy

dttxxLtxJ

dxxyyLxyJ

f

b

a

t

t

x

x

曲线上达到极大值。在则称,-反之,若

)()]([

0)]([)]([

0

0

xyxyJ

xyJxyJ

Page 5: 6.3    用变分法求解最优控制问题

阶接近度。称两个函数具有

,且若

具有零阶接近度;与称两个函数

,若

,的一切接近度:对于定义域中

1

)()()()(

)()(

)()(

00

0

0

xyxyxyxy

xyxy

xyxy

xxxx ba

数的接近程度越好。接近度的阶次越高,函

3 、泛函的变分(相当于函数的微分)

)]([)]()([)]([

1

xyJxyxyJxyJ )泛函的增量(

Page 6: 6.3    用变分法求解最优控制问题

22

2

0

])[!2

1][][

)(

yyydy

Jdyyy

dy

dJyJ

xy

()(

点展开,得应用泰勒公式在

的高阶无穷小。是主部),的线性连续泛函(线性是

的变分。为宗量=其中:

yR

yL

xyxyxyxy

)()()()( 0

)](),([

2

xyxyLJ

L

=记作量的线性主部)泛函的变分:泛函增(

](),([)](),([

)]([!2

1)( 2

2

2

)xyxyRxyxyL

xydy

Jdxy

dy

dJ

Page 7: 6.3    用变分法求解最优控制问题

的变分。试求泛函-例 dxxyJ )(]36[1

0

2

dxxyxy

dxxyaxya

dxxyaxya

xyaxyJa

J

a

a

a

)()(2

)]()([

)]()([

)]()([

1

1

0

0

21

0

0

1

0

2

0

解:根据引理

)(证明见

的变分也可定义为泛函引理

223)]()([

)]([:1

0pxyaxyJ

aJ

xyJ

a

Page 8: 6.3    用变分法求解最优控制问题

的变分。求泛函-例 1

0

]),(),([]46[x

xdxxxyxyLJ

1

0

1

0

]),,(),,(

[

],,[

][

0

0

x

x

a

x

x

a

dxyy

xyyLy

y

xyyL

dxxyayyayLa

yayJa

J

解:

yydx

d

x

xyxy

导数变分的性质,即

了宗量变分的导数等于。在证明过程中,应用而不是,和式。这里泛函的宗量这是计算泛函的普遍公 )()(

Page 9: 6.3    用变分法求解最优控制问题

4 、泛函极值定理:

的导数为零。极值点值存在的必要条件:在类比:连续光滑函数极

。(证明略)=的必要条件是值)上达到极小值(或极大在:泛函定理

0

)()]([1 0

J

xyxyJ

Page 10: 6.3    用变分法求解最优控制问题

ft

t

ff

dtttxtxLtxJ

xtx

xtxtx

0

]),(),([)]([

,)(

)()( 00

则使性能泛函,终点为的始点为定理:设曲线

二、端点固定时的 Euler 方程

至少应两次连续可微。应有连续的二阶导数其中],,[

,)(

txxL

tx

的解。为二阶微分方程

取极值的必要条件是:

0)(

x

L

dt

d

x

Ltx

Page 11: 6.3    用变分法求解最优控制问题

0

0

0

],,[

)](),([

0

a

t

t

a

f

dttxaxxaxLa

txatxJa

J

J

=在的必要条件是证明:因为泛函极值存

0)(0

0

f

ft

t

t

t

xdtx

L

dt

d

x

Lx

x

L

ff

f t

t

t

t

t

txdt

x

L

dt

dx

x

Lxdt

x

L0

00

ft

tdtx

x

txxLx

x

txxLJ

J

0

]),,(),,(

[

的线性主部表示:用泛函增量

Page 12: 6.3    用变分法求解最优控制问题

00)(

01

00

f

f

t

t

t

tx

x

Lxdt

x

L

dt

d

x

L

的必要条件是:使上式推论

0

0)(20

x

L

dt

d

x

L

xdtx

L

dt

d

x

Lft

t

的必要条件是:使推论

(横截条件))(

分方程)(欧拉方程)(二阶微)(

条件是即:泛函取极值的必要

02

01

0

xxL

ft

t

x

L

dt

d

x

L

Page 13: 6.3    用变分法求解最优控制问题

讨论:

0)(0)(

)(,)(1

0

00

f

ff

txtx

xtxxtx

,可求得

,)固定端点问题中:(

00

00

0)(0)(

)2(

0

0

0

f

f

tt

tt

f

x

L

x

L

xx

Lx

x

L

txtx

Euler

得横截条件为:,可由

,或或两个端点为自由时,点截条件确定。若一个端积分常数待定,可由横

程,求解时有两个方程是一个二阶微分方

Page 14: 6.3    用变分法求解最优控制问题

分条件。充所以,一般不需要使用以判断是极大或极小。可题而言,仅从概念上就要条件,对多数工程问

只是泛函极值存在的必)欧拉方程和横截条件(3

ft

f

dtuxJ

tuxx

ux

0

22

*0

)(

)(

]56[

小值。,使下列性能泛函取极为边界条件,求和以

为设受控对象的状态方程例

ff tt

dtxxdtuxJ

ux

0

22

0

22 )()(

代入性能泛函解:将状态方程

Page 15: 6.3    用变分法求解最优控制问题

022

],[ 22

xxx

L

dt

d

x

L

xxxxL

,故欧拉方程为在此

ff ttf

tt

eCeCx

CCx

eCeCtx

21

210

21)(

将边界条件代入得可解得

ff

f

ff

f

tt

ft

tt

tf

ee

xexC

ee

exxC

0

20

1 ,

解出积分常数

Page 16: 6.3    用变分法求解最优控制问题

f

ff

ttt

ft

ttt

tf

t

ttxtx

eee

xexe

ee

exxtx

ff

f

ff

f

sinh

)sinh(sinh

)(

0

00*

故极值曲线为

f

ff

ttt

ft

ttt

tf

t

ttxtx

eee

xexe

ee

exxtxtu

ff

f

ff

f

sinh

)cosh(cosh

][)()(

0

00**

极值控制曲线为

Page 17: 6.3    用变分法求解最优控制问题

三、多元泛函的极值条件(变量为向量的情况)

(边界条件)

(欧拉方程)写成向量形式:

ff

ii

ffT

n

xtxxtxX

L

dt

d

X

L

x

L

dt

d

x

L

xtxxtxxxxX

)(,)(

0

0

)(,)(,

00

0021

Page 18: 6.3    用变分法求解最优控制问题

为常数。横截条件。为极小值的欧拉方程和

试写出为使

自由。给定,已知系统状态方程例

ra

dturxxJ

txtxxuaxx

ft

ff

,

)(2

1)(

)(,)0(,

]76[

0

222

0

])([2

1

])([2

1)(

,

222

0

222

axxrxL

dtaxxrxxJ

uJ

ft

其中,

得消去解:将状态方程代入

Page 19: 6.3    用变分法求解最优控制问题

0)]([))((

:0

22

axxrdt

daaxxrx

x

L

dt

d

x

L

得根据

0)()( 22 xaxxarxaxr

为故极值条件的欧拉方程

0))(2(

0)(

)0()1(

2

0

f

f

f

t

tt

axx

axxrx

L

xx

得由

边界条件为

联立求解上述方程可求得 x*(t),u*(t)

Page 20: 6.3    用变分法求解最优控制问题

四、求解连续系统最优控制

思路:由于泛函 J所依赖的函数总要受到受控系统状态方程的约束,应用拉格朗日乘子法,将有约束泛函极值问题转化为无约束的泛函极值问题。

0)(]),(),([

]),(),([

)(,)(

],[],),(),([)(

1

0

00

0

txttutxf

dtttutxLJ

txxtx

tttttutxftx

ft

t

f

f

程式得:将状态方程写成约束方

自由终端状态初始状态

对系统式、拉格朗日法求极值公

Page 21: 6.3    用变分法求解最优控制问题

维拉格朗日乘子向量为待定的

构造增广泛函:

nt

dttxttutxftttutxLJft

t

T

)(

)](]),(),([)[(]),(),([0

ft

t

T

T

dttxtuxHJ

tuxftuxLtuxH

Hamilton

0

)(],,,[:

],,[],,[),,,(

)函数顿(定义纯量函数,哈密尔

ff

fff

tt

Tt

t

T

tt

t

t

TTt

t

T

txdttxtuxHJ

txdttxdttx

00

000

)()(],,,[

)()()(

其中

Page 22: 6.3    用变分法求解最优控制问题

fft

t

Tt

t

TT xdtu

Hu

x

HxJ

Jxuxu

txtutxtu

00

)()]()()()[(

,

)()()()( **

的变分为引起和则由、为的变分、相对于最优控制的和设

)横截条件(

为任意时))控制方程((

伴随方程

必有不受约束)(即,,取=由

30

20

)1(0

,000

0

t

t

uu

Hx

H

uuxJ

Page 23: 6.3    用变分法求解最优控制问题

2 、求解最优控制的步骤

],[~3

2

),(~01

*****

**

*

*

xuux

x

u

xuuu

H

=代入得,)再将(

,求

程解两点边值,代入伴随方程和状态方)将(

,解出)由控制方程(

)状态方程(即

又由

4)(],,,[),(

)(],,[

],,[],,[],,,[

00

xtxtuxfxtxH

txtuxfH

tuxftuxLtuxH T