Contrôle Optimale

Embed Size (px)

Citation preview

Chapitre 1

Contrle OptimaleIntroductionLa thorie du contrle (ou commande) analyse les proprits des systmes dynamiques sur lesquels on peut agir au moyen d'une commande (ou contrle). Le but est alors d'amener le systme d'un tat initial donn un certain tat nal, en respectant ventuellement certains critres. L'objectif peut tre de dtrminer des solutions optimales pour un certain critre d'optimalit (contrle optimale, ou commande optimale). Les domaines d'applications sont multiples : arospatiale, automobile, robotique, aronotique, internet et les communications en gnral, mais aussi le secteur mdical, chimique, gnie des procds,...etc. Du point de vue mathmatique, un systme contrle est un systme dynamique dpendant d'un paramtre dynamique appel le contrle. Pour le modliser, on peut avoir recours des equations direntielles, intgrales, fonctionnelles aux dirences nies, aux drives partielles, stochastiques,..etc. Pour cette raison, la thorie du contrle est l'interconnexion de nombreux domaines mathmatiques. Les contrles sont des fonctions ou des paramtres, habituellement soumis des contraintes. Une fois le problme de contrlabilit rsolu, on peut de plus vouloir passer de l'tat initial l'tat nal en minimisant un certain critre ; on parle alors d'un problme de contrle optimale. La thorie moderne du contrle optimale a commenc dans les annes 50, avec la formulation du principe du maximum de Pontryagin, qui gnralise les quations d'Euler-Lagrange du calcul des variations. De nos jours, les systmes automatiss font compltement partie de notre quotidien, ayant pour but d'amliorer notre qualit de vie et de faciliter certaines tches : systme de freinage ABS, assistance la conduite, servomoteurs, thermostats, circuits frigoriques, contrle des ux routiers, ferroviaires, ariens, bour-

siers, photographie numrique, lecteurs CD et DVD, rseaux informatiques, moteurs de recherche internet, circuits lectriques, lectroniques, tlcommunications en gnral, ranage ptrolier, chanes industrielles de montage, peacemakers et autres systmes mdicaux automatiss, oprations au laser, robotique, satellites, guides arospatiaux,... la liste est innie, les applications concernent tout systme sur lequel on peut avoir une action, avec une notion de rendement optimal.

1.1 Formulation du problmeSoit un systme (S) (physique, biologiquee, conomique,...) caractris chaque instant t par un tat x(t) Rn et que l'on peut contrler l'aide d'une commande u(t) Rm . Evolution du systme : x(t) = f (t, x(t), u(t)). On cherche la commande u qui fait passer (S) d'un tat initial un tat nal donn en minimisant un certain critre (objectif) (consommation,nergie,...).

1.1.1 Formulation gnrale (Problme de Bolza)On appelle problme de contrle optimal sous forme de Bolza, tout problme not (P ) du type : tf M in J(x, u) = g(t0 , x(t0 ), tf , x(tf )) + t0 F (t, x(t), u(t))dt, x(t) = f (t, x(t), u(t)), t [t0 , tf ] u(t) U Rm , (t , x(t )) = 0, 0 0 0 1 (tf , x(tf )) = 0,

0 :R Rn Rp 1 :R Rn Rq Le cas linaire : x(t) = Ax(t) + Bu(t), t [t0 , tf ] x(0) = x0avec A dans Mn (R) et B dans Mn,m (R)

1.2 ContrlabilitDnition 1.1 (Ensemble Accessible)L'ensemble des points accessibles partir de x0 en un temps T > 0 est dnie par :Acc(x0 , T ) = xu (T )\u L ([0, T ], U )

o xu (.) est la solution du systme contrl associe u. Autrement dit Acc(x0 , T ) est l'ensemble des extrmits des solutions du systme contrl au temps T , lorsqu'on fait varier le contrle u. Pour la cohrencee, on pose Acc(x0 , 0) = x0 .2

Thorme 1

Soient T > 0 et x0 Rn . Alors pour tout t [0, T ], Acc(x0 , t) est compact, convexe et varie continment avec t [0, T ].

Proposition 1.1

On suppose que x0 = 0 et U = Rm . Alors, pour tout t > 0, l'ensemble Acc(0, T ) est un sous-espace vectoriel de Rn . De plus, pour tout 0 < t1 < t2 , on a Acc(0, t1 ) Acc(0, t2 ).

Dnition 1.2 (Contrlabilit)Rn ,

Le systme contrl est dit contrlable en temps T si Acc(x0 , T ) = i.e, pour tous x0 , x1 Rn , il existe un contrle u tel que la trajectoire associe relie x0 x1 en temps T .

Thorme 2

On suppose U = Rm (pas de contrainte sur le contrle). Le systme x(t) = Ax(t) + Bu(t) est contrlable en temps T quelconque si et seulement si la matrice C = (B, AB, . . . , An1 B) est de rang n. La matrice C est appele matrice de Kalman, et la condition rg C = n est appele condition de Kalman.

1.2.1 Cas avec contraintes sur le contrleCorollaire 1.1Sous la condition de Kalman prcdente, si 0 U 0 alors l'ensemble accessible Acc(x0 , t) en temps t contenant un voisinage du point exp(tA)x0 .

Remarque 1.12. 0 U 0 ,

Les proprits de contrlabilit globale sont relies aux proprits de la stabilit de la matrice A. Par exemple, il est clair que si : 1. La condition de Kalman est remplie, 3. Toutes les valeurs propres de la matrice A sont de partie relle strictement ngative (i.e la matrice A est stable), alors tout point de Rn peut tre conduit l'origine en temps ni.

Thorme 3

Soit b Rn et U R un intervalle contenant 0 dans son intrieur. Considrons le systme x(t) = Ax(t) + bu(t), avec u(t) U . Alors tout point de Rn peut tre conduit l'origine en temps ni si et seulement si la paire (A, b) vrie la condition de Kalman et la partie relle de chaque valeur propre de A est infrieur ou gale 0.

1.2.2 Contrlabilit dans le cas non lineaireDnition 1.3Considrons pour le systme :x(t) = f (t, x(t), u(t)); x(t0 ) = x0(1.1)

le problme de contrle suivant : tant donn un point x1 Rn , trouver un temps T et un contrle u sur [0, T ] tel que la trajectoire xu associe 3

u, solution de (1.1) vrife : xu (0) = x0 , xu (T ) = x1 . Ceci conduit la dnition suivante : Soit T > 0. L'application entre-sortie en temps T du sytme contrl (1.1) initialis x0 est l'application : ET : U Rn u xu (T )

o U est l'ensemble des contrles admissibles, i.e l'ensemble de contrles u tels que la trajectoire associe est bien dnie sur [0, T ]. Autrement dit, l'application entre-sortie en temps T associe un contrle u le point nal de la trajectoire associe u.

Dnition 1.4

L'ensemble accessible en temps T pour le systme (1.1), not Acc(x0 , T ), est l'ensemble des extrmits au temps T des solutions du systme partant de x0 au temps t = 0. Autrement dit c'est l'image de l'application entre-sortie en temps T .

Dnition 1.5depuis x0 si :

Le systme (1.1) est dit contrlable (en temps quelconque)Rn = T 0 Acc(x0 , T )

Il est dit contrlable en temps T si Rn = Acc(x0 , T )

Proposition 1.2A=f x (x0 , u0 )

Considrons le systme (1.1) o f (x0 , u0 ) = 0. Notons et B = f (x0 , u0 ). On suppose que : urg(B\AB\ . . . \An1 B) = n

Alors le systme est localement contrlable en x0 .

Dnition 1.6

Soit u un contrle dni sur [0, T ] tel que sa trajectoire associe xu issue de x(o) = x0 est dnie sur [0, T ]. On dit que le contrle u (ou la trajectoire xu ) est singulier sur [0, T ] si la direntielle de Frchet dET (u) de l'application entre-sortie au point u n'est pas surjective. Sinon on dit qu'il est rgulier.

1.3 DnitionsDnition 1.71. On appelle commande admissible toute fonction u M es([t0 , tf ], Rm ), M es([t0 , tf ], Rm ) tant l'espace des fonctions mesurables [t0 , tf ] Rm , telle qu'il existe x AC([t0 , tf ], Rn ), AC tant l'espace des fonctions dites "absolument continues", vriant : (a) l'application t f (t, x(t), u(t)) appartient L1 ([t0 , tf ], Rn ).

4

(b) x(t) = f (t, x(t), u(t)), 0 (t0 , x(t0 ) = 0, 1 (tf , x(tf )) = 0,

(c) u(t) U presque partout sur [t0 , tf ]. 2. la fonction x associe est appele trajectoire admissible. 3. On appelle commande optimale, toute commande admissible solution de (P ) et tat optimal l'tat associ.

1.4 Temps-Optimalit

1.4.1 Existence de trajectoires temps-optimalesIl faut tout d'abord formaliser, l'aide de Acc(x0 , t), la notion de temps minimal. Considrons le systme contrl dans Rn o les contrles u sont valeurs dans un compact d'intrieur non vide U Rm . Soient x0 et x1 deux points de Rn . Supposons que x1 soit accessible depuis x0 , c'est dire qu'il existe au moins une trajectoire reliant x0 x1 , on aimerait caractriser celles qui le font en temps minimal t . Si t est le temps minimal, alors pour tout t < t , x1 Acc(x0 , t) (en eet sinon x1 serait accessible partir de x0 en un temps infrieur t ). Par consquent, t = inf {t > 0\x1 Acc(x0 , t)}.

1.5 Condition ncessaire d'optimalit : principe du maximum dans le cas linaireLe thorme suivant donne une condition ncessaire et susante pour qu'un contrle soit optimal.

Thorme 4

Considrons le systme de contrle linaire :x(t) = A(t)x(t) + B(t)u(t) x(0) = x0 .

o le domaine de contraintes U Rm sur le contrle est compact. Soit T > 0. Le contrle u est optimale sur [0, T ] si et seulement s'il existe une solution non triviale p(t) de l'quation : telle que p(t)B(t)u(t) = maxvU p(t)B(t)v.p(t) = p(t)A(t) (1.2)

pour presque tout t [0, T ]. Le vecteur ligne p(t) Rm est appel vecteur adjoint.5

Remarque 1.2 Dans le cas mono-entre (contrle scalaire), et si de plus U = [a, a] o a > 0, la condition de maximisation implique immdiatement que u(t) = asigne(p(t)B(t)). La fonction (t) = p(t)B(t) est appele fonction de commutation, et un temps tc auquel le contrle optimal change de signe est appel un temps de commutation. C'est en particulier un zro de la fonction .

1.6 Thorie linaire-quadratiqueOn s'interesse aux systmes de contrle linaires avec un cot quadratique. Ces systmes sont d'une grande importance en pratique. En eet un cot quadratique est souvent trs naturel dans un problme, par exemple lorsqu'on veut minimiser l'cart au carr par rapport une trajectoire nominale (problme de poursuite). Par ailleurs mme si les systmes de contrle sont en gnral non linaires, on est souvent amen linariser le systme le long d'une trajectoire, par exemple dans des problmes de stabilisation. Nous allons donc considrer un systme de contrle linaire dans Rn :

x(t) = A(t)x(t) + B(t)u(t), muni d'un cot quadratique du type :T

x(0) = x0 ,

(1.3)

C(u) = x(T )T Qx(T ) +0

(x(t)T W (t)x(t) + u(t)T U (t)u(t))dt,

(1.4)

o T > 0 est x, et o, pour tout t [0, T ], U (t) Mm (R) est symtrique dnie positive, W (t) Mn (R) est symtrique positive, et Q Mn (R) est une matrice symtrique positive. On suppose que les dpendances en t de A, B, W et U sont L sur [0, T ]. Par ailleurs le cot tant quadratique, l'espace naturel des contrles est L2 ([0, T ], Rm ). Le problme de contrle optimal est alors le suivant , que nous appelerons problme LQ (Linaire-Quadratique).

1.6.1 Problme LQUn point initial x0 Rn tant x, l'objectif est de dterminer les trajectoires partannt de x0 qui minimisent le cot C(u). Notons que l'on n'impose aucune contrainte sur le point nal x(T ). Pour toute la suite, on pose : x(t) 2 = x(t)T W (t)x(t), u(t) 2 = u(t)T U (t)u(t), et g(x) = xT Qx ; de W U sorte que :T

C(u) = g(x(T )) +0

( x(t)

2 W

+ u(t)

2 U )dt

6

1.6.2 Existence de trajectoires optimalesIntroduisons l'hypothse suivante sur U :T T

> 0\u L2 ([0, T ], Rm )0

u(t)

2 U dt

0

u(t)T u(t)dt

(1.5)

Par exemple cette hypothse est vriie si l'application t U (t) est continue sur [0, T ] et T < +, ou encore qu'il existe une constante c > 0 telle que pour tout t [0, T ] et pour tout vecteur v Rm on ait v T U (t)v cv T v . On a le thorme d'existence suivant :

Thorme 5

Sous l'hypothse (1.5), il existe une unique trajectoire minimisante pour le problme LQ.

Remarque 1.3 (Extension du thorme) Si la fonction g apparaissant dans le cot est une fonction continue quelconque de Rn dans R, et/ou si le systme de contrle est pertub par une fonction r(t), alors le thorme prcdent reste vrai. Remarque 1.4 (Cas d'un intervalle inni) Proposition 1.3lution de : Le thorme est encore valable si T = +, avec g = 0, pourvu que le systme (1.3) soit contrlable (en temps quelconque). Considrons le problme de dterminer une trajectoire sox(t) = A(t)x(t) + B(t)u(t) + r(t)

sur [0, +] et minimisant le cot :+

C(u) =0

( x(t)

2 W

+ u(t)

2 U )dt

Si le systme est contrlable en un temps T > 0, et si l'hypothse (1.5) est vrie sur [0, +], alors il existe une unique trajectoire minimisante.

1.6.3 Condition ncessaire et susante d'optimalit : principe du maximum dans le cas LQLa trajectoire x, associe au contrle u, est optimale pour le problme LQ si et seulement s'il existe un vecteur adjoint p(t) vriant pour presque tout t [0, T ] :p(t) = p(t)A(t) + x(t)T W (t) (1.6) (1.7) (1.8)

Thorme 6

et la condition nale :

p(T ) = x(T )T Q u(t) = U (t)1 B(t)T p(t)T7

De plus le contrle optimal u s'crit, pour presque tout t [0, T ] :

Remarque 1.5

Si le systme de contrle est pertub par une fonction r(t), alors le thorme prcdent reste vrai. Il le reste, de mme, si la fonctiong apparaissant dans le cot est une fonction C 1 quelconque de Rn dans R, sauf que la condition nale sur le vecteur adjoint (1.7) devient :p(T ) = 1 g(x(t)) 2(1.9)

Remarque 1.6devient :

Dans le cas d'un intervalle inni (T = +), la conditionlimt+ p(t) = 0(1.10)

Remarque 1.7

Dnissons la fonction H : Rn Rn Rm R par :

1 H(x, p, u) = p(Ax + Bu) (xT W x + uT U u), 2

en utilisant toujours la convention que p est un vecteur ligne de Rn . Alors les quations donnes par le principe du maximum LQ s'crivent :x= p= H = Ax + Bu p

H = pA + xT W x H =0 u

et puisque pB uT U = 0.

1.7 Thorie du contrle optimal non linaire

1.7.1 Problme de Lagrange

Ce problme simpli est le suivant. On cherche des conditions ncessaires d'optimalit pour le systme :

x(t) = f (t, x(t), u(t)),

(1.11)

o les contrles u(.) U sont dnis sur [0, T ] et les trajectoires associes doivent vrier x(0) = x0 et x(T ) = x1 , le problme est de minimiser un cot de la forme :T

J(u) =0

f 0 (t, x(t), u(t))dt

(1.12)

o T est x. Associons au systme (1.11), le systme augment suivant :

x(t) = f (t, x(t), u(t)), x (t) = f 0 (t, x(t), u(t)), 80

(1.13)

et notons x = (x, x0 ), f = (f, f 0 ). Le problme revient donc chercher une trajectoire solution de (1.13) joignant les points x0 = (x0 , 0) et x1 = 0 (T )) et minimisant la dernire coordonne x0 (T ). L'ensemble des tats (x1 , x accessibles partir de x0 pour le systme (1.13) est : x Acc(0 , T ) = u(.) x(T, x0 , u)

Si le contrle u associ au systme de contrle (1.11) est optimal pour le cot (1.12), alors il existe une application p(.) absolument continuee sur [0, T ], valeurs dans Rn , appele vecteur adjoint, et un rel p0 0, tels que le le couple (p(.), p0 ) est non trivial, et les quations suivantes sont vries pour presque tout t [0, T ].H (t, x(t), p(t), p0 , u(t)) p H (t, x(t), p(t), p0 , u(t)) p(t) = x H (t, x(t), p(t), p0 , u(t)) = 0 u x(t) = (1.14) (1.15) (1.16)

Thorme 7 (Principe du maximum faible)

o H est le hamiltonien associ au systme (1.11) et au cot (1.12).H(t, x, p, p0 , u) =< p, f (t, x, u) > +p0 f 0 (t, x, u)(1.17)

Dnition 1.8

Le Hamiltonien associ au problme (P) est la fonction :H : R Rn (Rm Rn R

(t, x, p, u) H(t, x, p, u) = F (t, x, u)+ < p, f (t, x, u) >

o < . > est le produit scalaire usuel de Rn .Le problme de contrle optimal (P ) est un problme d'optimisation en dimension innie que l'on peut crire : M in J(x, u), (x, u) AC([t0 , tf ], Rn ) M es([t0 , tf ], Rm ), (P ) u Uad M es([t0 , tf ], Rm ), A(x, u) = 0, o : Uad =ensemble des commandes admissibles. S(x, u) A(x, u) = 0 (x) 1 (x) avec :

S:

AC([t0 , tf ], Rn ) M es([t0 , tf ], Rm ) L1 ([t0 , tf ], Rn ), (x, u) (t x(t) f (t, x(t), u(t)), 9

0 :

AC([t0 , tf ], Rn ) Rp , x 0 (t0 , x(t0 )), AC([t0 , tf ], Rn ) Rq , x 1 (tf , x(tf )),

1 :

Le lagrangien associ au problme (P ), s'crit :

L(x, u, ) = J(x, u)+ < A(x, u), >Si on note = (p, 0 , 1 ) on a :tf

L(x, u, ) = g(t0 , x(t0 ), tf , x(tf )) +t0 tf

l(t, x(t), u(t))dt

+t0

(x(t) f (t, x(t), u(t))\p(t))dt

+ (0 (t0 , x(t0 ))\0 ) + (1 (tf , x(tf ))\1 )Les conditions ncessaires de solution du problme (P ) ont t tablies par pontryaguine en 1962.

Thorme 8 (Thorme de Pontryaguin(Principe du Maximum))Sous les hypothses suivantes : 1. Il existe une paire (x, u) AC([t0 , tf ], Rn ) M es([t0 , tf ], Rm ) admissible pour le problme (P ). 2. f et l sont de classe C 0 par rapport u et de classe C 1 par rapport t et x. 3. g, 0 et 1 sont de classe C 1 par rapport x si (x , u ) est une paire optimale pour (P ) alors : (a) Il existe p = 0 AC([t , t ], Rn ) tel que (x , p ) vrie : 0 f H x (t) = p (t, x (t), u (t), p (t)) = f (t, x (t), u (t)), p (t) = H (t, x (t), u (t), p (t)), x T T = fx (t, x (t), u (t)) p (t) + lx (t, x (t), u (t)),

(b) Pour presque tout t [t , t ] la commande u (t) minimise l'Ha0 f miltonien :u (t) = argmin H(t, x (t), v, p (t))

,

10

(c) Il existe ( , ) = 0 Rp Rq tel que : Conditions de transver0 1 salit :

p (t ) = x0 (t , x (t0 ), t , , ), 0 0 1 0 f (t ) = (t , x (t ), t , x (t ), , ), p f 0 0 1 f f x1 0

avec

R Rn R Rn Rp Rq (t0 , x0 , tf , xf , 0 , 1 ) (t0 , x0 , tf

Si t est libre on a : 0H(t , x (t ), u (t ), p (t )) 0 0 0 0 (t , x (t0 ), tf , x (tf ), , ) = 0 0 1 t0 0

Si t est libre : fH(t , x (t ), u (t ), p (t )) + f f f f (t , x (t0 ), tf , x (tf ), , ) = 0 0 1 tf 0

1. On cherche les commandes H -minimales : Pour t [t0 , tf ] x on rsout :M invU H(t, x(t), v, p(t)) u (t) = u (t, x(t), p(t)),

2. On injecte la solution obtenue en (1) dans les systmes direntiels en (x, p) et on obtient un systme direntiel aux deux bouts. (Two Point boundary value ProblemTPBVP) de 2n quations.

1.8 Mthodes numriques en contrle optimaleOn distingue deux types de mthodes numriques en contrle optimal : les mthodes directes et les mthodes indirectes. Les mthodes directes consistent discrtiser l'tat et le contrle, et rduisent le problme un problme d'optimisation non linaire (programmation non linaire, ou "nonlinear programming"). Les mthodes indirectes consistent rsoudre numriquement, par une mthode de tir ("shooting method"), un problme aux valeurs limites obtenu par application du principe du maximum, il existe aussi des mthodes hybrides, qui sont un mlange des deux approches.

1.8.1 Mthodes IndirectesMthode de tir simpleLe principe est le suivant. Considrons le problme de contrle optimal sous forme de Bolza, et supposons que le temps nal tf est x. Le principe du maximum donne une condition ncessaire d'optimalit et arme 11

que toute trajectoire optimale est la projection d'une extrmale. Si l'on est capable, partir de la condition de maximum, d'exprimer le contrle extrmal en fonction de (x(t), p(t)), alors le systme extrmal est un systme direntiel de la forme z(t) = F (t, z(t)), o z(t) = (x(t), p(t)), et les condi tions initiales, nales, et les conditions de transversalit, se mettent sous la forme R(z(0), z(tf )) = 0. Finalement, on obtient le problme aux valeurs limites

z(t) = F (t, z(t)), R(z(0), z(tf )) = 0,Notons z(t, z0 ) la solution du problme de Cauchy.

(1.19)

z(t) = F (t, z(t)),

z(0) = z0

et posons G(z0 ) = R(z0 , z(tf , z0 )). Le problme (1.19) aux valeurs limites est alors quivalent G(z0 ) = 0 i.e, il s'agit de dterminer un zro de la fonction G. Ceci peut se rsoudre par une mthode de Newton.

Si le temps nal tf est libre, on peut se ramener la formulation prcedante en considrons tf comme une inconnue auxiliaire. On augmente alors la dimension de l'tat en considrons l'quation supplmendtf taire dt = 0. On peut utiliser le mme artice si le contrle est bang-bang, pour dterminer les temps de commutation. Il peut cepedant s'avrer prfrable, lorsque le temps nal est libre, d'utiliser la condition de transversalit sur le Hamiltonien.

Remarque 1.8

Mthode de tir multiplePar rapport la mthode de tir simple, la mthode de tir multiple dcoupe l'intervalle [0, tf ] en N intervalles [ti , ti+1 ], et se donne comme inconnues les valeurs z(ti ) au dbut de chaque sous-intervalle. Il faut prendre en compte des conditions de recollement en chaque temps ti (condition de continuit). Lintrt est d'amliorer la stabilit de la mthode. De manire plus prcise, considrons un problme de contrle optimal gnrale. L'application du principe du maximum rduit le problme un problme aux valeurs limites du type F0 (t, z(t)), si t0 t < t1 F1 (t, z(t)), si t1 t < t2 z(t) = F (t, z(t)) = . . (*) . Fs (t, z(t)), si ts t tf o z = (x, p) R2n (p est le vecteur adjoint), et t1 , t2 , . . . , ts [t0 , tf ]. 12

Remarque 1.9

A priori le temps nal tf est inconnu. Par ailleurs dans la mthode de tir multiple le nombre s de commutations doit tre x ; on le dtermine lorsque c'est possible par une analyse gomtrique du problme.La mthode de tir multiple consiste subdiviser l'intervalle [t0 , tf ] en N sous-intervalles, la valeur de z(t) au dbut de chaque sous-intervalles tant inconnue. Plus prcisemment, soit t0 < 1 < . . . < k < tf une subdivision xe de l'intervalle [t0 , tf ]. En tout point j la fonction z est continue. On peut considrer j comme un point de commutation xe, en lequel on a :+ z(j ) = z(j ), , j = j x

On dnit maintenant les noeuds

{1 , . . . , m } = {t0 , tf } {1 , . . . , k } {t1 , . . . , ts }

(1.20)

Finalement on est conduit au problme aux valeurs limites. si 1 t < 2 F1 (t, z(t)), F2 (t, z(t)), si 2 t < 3 z(t) = F (t, z(t)) = . . (**) . Fm1 (t, z(t)), si m1 t m + j 2, . . . , m 1 rj (j , z(j ), z(j )) = 0

rm (m , z(1 ), z(m )) = 0o 1 = t0 est x, m = tf , et les rj reprsentent les conditions intrieures ou limites prcedentes.

Remarque 1.10

On amliore la stabilit de la mthode en augmentant le nombre de noeuds. C'est l en eet le principe de la mthode de tir multiple, par opposition la mthode de tir simple o les erreurs par rapport la condition initiale voluent exponentiellement en fonction de tf t0 . Bien sr dans la mthode de tir multiple il y a beaucoups plus d'inconnues que la mthode de tir simple, mais ventuellement l'intgration du systme (*) peut se parrallliser.+ + + Posons zj = z(j ), et soit z(t, j1 , zj1 ) la solution du problme de Cauchy.

z(t) = F (t, z(t)), On a

+ z(j1 ) = zj1

+ z(j ) = z(j , j1 , zj1 ).

13

Les conditions intrieures et frontires s'crivent + + j {2, . . . , m 1} rj (j , z(j , j1 , zj1 ), zj ) = 0, + + rm (m , z1 , z(m , m1 , zm1 )) = 0

(1.21)

Posons maintenant+ + + Z = (z1 , m , z2 , 2 , . . . , zm1 , m1 )T R(2n+1)(m1)

(o z R2n ). Alors les conditions (1.21) sont vries si : + + rm (m , z1 , z(m , m1 , zm1 )) + + r2 (2 , z(2 , 1 , z1 ), z2 ) G(Z) = =0 . . . + + rm1 (m , z(m1 , m2 , zm2 ), zm1

( )

On s'est donc ramen dterminer un zro de la fonction G, qui est dnie sur un espace vectoriel dont la dimension est proportionnelle au nombre de points de commutation et de points de la subdivision. L'quation G = 0 peut alors tre rsolue itrativement par une mthode du type Newton.

1.8.2 Mthodes DirectesLes mthodes directes consistent transformer la problme de contrle optimale en un problme d'optimisation non linaire en dimension nie.

Discrtisation totale : tir directC'est la mthode la plus vidente lorsqu'on aborde un problme de contrle, on se ramne un problme d'optimisation non linaire en dimension nie (ou problme de programmation non linaire) de la forme

minZC F (Z)o Z = (x1 , . . . , xN , u1 , . . . , un ), et

(1.22)

C = {Z\gi (Z) = 0, i {1, . . . , r} gj (Z) 0, j {r + 1, . . . , m}(1.23)

Plus prcisement, la mthode consiste choisir les contrles dans un espace de dimension nie, et utiliser une mthode d'intgration numrique des quations direntielles. Considrons donc une subdivision 0 = t0 < t1 < . . . < tN = tf de l'intervalle [0, tf ]. Rduisons l'space des contrles en considrons (par exemple) des contrles constants par morceaux selon cette subdivision. Par ailleurs, choisissons une discrtisation de l'quation 14

direntielle, par exemple choisissons ici pour simplier la mthode d'Euler explicite. On obtient alors, en posant hi = ti+1 ti ,

xi+1 = xi + hi f (ti , xi , ui )La discrtisation prcedante conduit donc au problme de programmation non linaire :

xi+1 = xi + hi f (ti , xi , ui ), i = 0, . . . , N 1 minC(x0 , . . . , xN , u0 , . . . , uN ), ui U, i = 0, . . . , N 1i.e un problme du type (1.22).

Remarque 1.11

Cette mthode est trs simple mettre en oeuvre. De plus l'introduction d'ventuelles contraintes sur l'tat ne pose aucun problme.Le tableau suivant rsume les caractristiques des mthodes directes et indirectes : Mthodes Directes Mise en oeuvre simple, sans connaissance priori Peu sensibles au choix de la condition initiale Facilit de la prise en compte de contraintes sur l'tat Contrles (globalement) optimaux en boucle frme Prcision numrique basse ou moyenne Ecacit en basse dimension Gourmandise en mmoire Problme des minima locaux Mthodes Indirectes

Connaissance priori de la structure de la trajectoire o Trs sensibles au choix de la condition initiale

Dicult thorique de la prise en compte de contrainte Contrles (localement) optimaux en boucle ouverte Trs grande prcision numrique Ecaces en toute dimension Calculs parralllisables Petit domaine de convergence

15