Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 230

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

200 ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА [Гл. А

принадлежит Д(;<c,t),

то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(+Д*

 

 

 

 

 

 

 

 

 

В (х, t) <

J* (х,

и (т)) = .

J(х (х,

и*), ы* (т), т) dx +

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

+

B(x(t + At,u*),

t + At) =

t + A t

 

 

 

 

 

 

 

 

J /°(х(т,

u*),

w*(t),

+

 

 

 

 

 

 

 

 

*+Д<

 

 

 

 

(t), t) dx +

+

У*+А‘ (X (f +

Д£, и’), и**) <

j

/ °(*(T, и*). «*

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

+

Ji+At (x(t +

Ы, U * ) , U*) =

Jt ( X , «*) =

В (X ,

t).

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t+ A t

 

 

 

 

 

 

 

 

 

 

В (x, t) =

Jt (x,

 

u*) =

j

f° (x (т,

и*),

и* (t), t) dx +

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

~\- В {x(t -(- At, u*), t -j- At).

 

 

(8)

Далее,

 

возьмем

произвольное

w e V

и

составим управление

w (-t)eA (x,£)

согласно предположению

(7).

Пусть этому управле­

нию соответствует траектория х(х,и)

из

(5).

При сделанных пред­

положениях

существует

управление

в * (т ) е А (х(£+Д£, и) Д +А О

такое,

что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Д+д* (х (t +

At, и), и* (т)) — B(x(t -{- At, ti),

t - f

At).

Тогда управление

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

й ( т ) = { “ .

 

« ! «

 

+ * ,

 

 

 

 

 

 

 

 

 

 

1 о*(т), t + Д * < т < 7 \

 

 

 

принадлежит A(x,t),

поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t + A t

 

 

 

 

 

 

 

 

 

B(x,t) <CJ* (х, и(х))

=

J

 

f° (x(x, u),u,

x) d x B { x ( t

+ At,u), t + At).

Отсюда и из

(8) следует

 

 

 

 

 

 

 

 

 

 

 

 

t + A t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

/° (х(т, и*), и*(х), x)dx-\-B{x{t +

At, u'),t +

At) ■

t + A t

— В (x, t) = 0 < j

f°(x(x,u),u, x)'dx]+

В (x(t + At, u),

t + At)— В (x, t).


§ 3]

 

 

 

Дифференциальное уравнение Р. Веллмана

 

 

201

Разделим

это

неравенство

на

>

0

и

перейдем к

пределу

при

At -*• +

0.

Получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(х, и* (t + 0), 0 +

d- -& £ +-0, u*h

 

= 0 <

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

< f° (X,

U,

t)

+

(*■(* + о, «0. О t и 6 V,

и < / <

Т.

 

(9)

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

производная

dB(x(t

 

0, и *), t)

с

учетом

уравнения (5) пред-

Полная

— v

 

ставляется

в виде

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d_B ( x ( t +

0 , u * ) , t )

=

 

^

0> /(Х)

 

+

0)> t ) ) + B (

{Xt

t)

 

 

 

at

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d B ( x ( t + 0, u ),t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

= (В х ( х , t ) , f { x , и , f ) ) + B t ( X , t ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из (9) тогда имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

f° (х,

и*(t +

0), t) +

(Bx (x,

t),

f (x,

и* {t +

0), t) + B t (x,

f) =

0 <

 

 

 

<

f°(x,

u, t) +

(Bx ix, t),

f ix, u,

t)) +

B( (x, t)

 

 

 

при всех

и 6 V.

Так

как

V замкнуто и и'

-f- 0) 6 V, то последнее

неравенство может быть переписано в виде

 

 

 

 

 

 

min [Bt ix,

t) +

(Bx ix,

t), f ix,

u, t)) +

(x, u, *)] = 0, t0 <

/ <

T.

(10)

u€V

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Полученное

соотношение

называется

уравнением

Веллмана.

К этому уравнению добавим начальное условие

 

 

 

 

 

 

 

 

 

В ix,

Т) =

Ф (х).

 

 

 

 

 

(11)

Таким образом, для определения функции Веллмана имеем задачу (10), (11), которую естественно назвать задачей К.оиш Веллмана [14— 18, 24, 27, 34, 195, 206, 233] и др.). Заметим, что присутствие знака min в левой части (10) весьма осложняет изу­ чениетаких уравнений, и на-сегодняшний день задача Коши — Веллмана исследована недостаточно. В тех случаях, когда удается найти решение задачи (10), (11), то нетрудно получить оптималь­ ные решения задачи (1) — (3) и (4) — (6), а также указать синте­ зирующую функцию для задачи (1) — (3). Об этом речь пойдет в следующем параграфе.

Упражнения. 1. Показать, что к задаче минимизации функции

 

N—1

J i u o> u i> ••• у u n ) —

J i i U i , Щ + 1) + J n iu ij)

(=0


202

ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА

[Гл. 4

векторных переменных [«„, ult ■■■, un при щ 6 У,- (i — 0, 1, . . . , N) можно применить метод динамического программирования.

У к а з а н и е .

Ввести функцию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N—1

 

 

 

 

 

 

 

 

 

 

Bk (u) =

min [ J ]

/, (uh u;+i)]+ J N jv)],

 

 

 

 

 

 

 

 

 

 

 

i=k

 

 

 

 

 

 

 

 

где минимум берется по всем наборам

(uk — и, uk+u . . .

 

, uN), щ 6 V;

(i = k,

k + 1, . . .

,N),

и показать,

что

 

 

 

 

 

 

 

 

Bk (u )= min

[/*(«, о ) +

Дж

(и)],

(k =

.0, l , ..., N — 1),

 

 

 

 

vSVk n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BN (и) = J N (и).

 

 

 

 

 

 

2. Написать и исследовать

уравнения

(1.13),

(2.5),

(3.10)

для

 

 

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

задачи:

минимизировать

функционал

/ (и) = \x2(t)dt

при усло-

 

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

виях

х — А (t)x-{-K(t)u{t)+f(,t),

0s^.tz^T,

х(0) = х 0,

где

х =

{х\

..., хп), A(t), K(i),

f ( t ) — матрицы с

известными

непрерывными

элементами, х0, Т заданы;

управление u(t) — (u](t),

..., ur(t))

ку­

сочно-непрерывно

и

удовлетворяет

ограничениям

 

| ы '(/)[^1,

 

 

 

 

Г

 

 

 

 

 

 

 

 

 

 

 

 

£=1, 2,

г,-или

£

I

 

|2 < 1 .

 

 

 

 

 

 

 

 

3.

Решить

 

£=1

 

 

задачу,

заменив

функционал

на

предыдущую

J(u) =

 

(c,x(T)),

где

c = { c i ,

...,

сп) — заданный

вектор,

или

на

J ( u ) = x 2(T).

 

 

 

 

 

 

J(u)z=G>(x(T)),

'(f°(x, и, t) = 0 ) .

4.

Пусть в задаче

(1.1—4)

Показать, что схема Веллмана позволяет решить проблему синтеза для этой задачи. Провести аналогичные исследования для схемы Моисеева.

5. Найти функцию Веллмана В (х, t) для задачи: минимизиро­ вать функционал

т

J{u) = $ u 2(t)dt + x2(T)

о

при условиях x ( t ) = u , д:(0)=л:о, ( п = г = 1 ) .

6. Вывести дифференциальное уравнение Веллмана для зада­ чи быстродействия: минимизировать J ( u ) = T 10 (t0 задано) при

условиях x = f ( x , и d), t o ^ t ^ /Г, x(t0) = x о, x ( T ) = x h u(t)^.V, t^ .t0.

7. Показать, что функция Веллмана B(x;t) для задачи из при­ мера 3.2.2. не является непрерывно дифференцируемой.


§ 4]

Проблема синтеза. Оценка погрешности

203

§ 4. ПРОБЛЕМА СИНТЕЗА ДЛЯ СИСТЕМ С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ. ОЦЕНКА ПОГРЕШНОСТИ

Проблема синтеза для задачи (1.1—4) с непрерывным време­ нем заключается в построении функций u— u(x,t), представляю­ щей собой значение оптимального управления при условии, что в момент t объект (1.2) находится в точке х фазового пространства. Как отмечалось в § 1, такая функция u(x,t) называется синтези­ рующей, и с ее помощью дальнейшее оптимальное движение объ­

екта определяется

условиями

х(х) = f ( x ( x ) , и(х, т), т),

 

x ( t ) = x .

 

 

 

 

 

 

Решение проблемы синтеза для

задачи

(1.1—4)

экви­

валентно решению

следующих

задач:

определить управление

и(х) = и * { х , t, т), доставляющее функционалу

 

 

 

т

 

 

 

 

 

J* (х, и (х)) = | /° (т), и (т), х) dx + Ф (х (Т))

(1)

 

t

 

 

 

 

 

минимальное значение при условиях

 

 

 

х (х) — f (х (т), и(х),

т),

t < х <

Т\ х (0

= х,

(2)

 

x(x)EG(x),

/ < т < Г ,

 

(3)

и = и (т) 6 V (т), t < т < Г ; управление и (х) кусочно-непрерывно, (4)

для каждого фиксированного x^G(t) и для каждого фиксирован­ ного момента времени /, t0^ t c T . Зная функцию и*(х, t,x), синте­ зирующую функцию можно получить сразу: u ( x ,t ) = u * ( x ,t ,t ) для

всех x^G(t) и всех

Т],

для которых задача (1)— (4) имеет

решение.

 

 

При решении проблемы

синтеза для дискретных систем важ ­

ную роль сыграло уравнение Веллмана (1.13). По аналогии попро­ буем использовать дифференциальное уравнение Веллмана для ре­ шения проблемы синтеза для задачи (1.1—4) с непрерывным вре­ менем. Для этого отвлечемся от тех ограничительных условий, при

которых выводилось

уравнение

Веллмана

(3.10), и рассмотрим

следующую задачу Коши — Веллмана:

 

 

 

«екщ

^

^

+

В{

*)] =

°»

(5)

 

x£G(t),

t0 < t < T ,

 

 

 

 

В ( х , Т ) =

Ф(х), xEG (T)

 

 

(6)

для определения функции В (х, t) . Если ввести функцию

 

 

R (х, и, t) г (Вх (х, 0 ,

f (х, и, t)) + Bt {х,

t ) + f ° (х, и,

t),

(7)


204

ДИНАМ И ЧЕСКО Е

ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА

\Гл. 4

то задача (5), (6) перепишется в виде

 

 

 

inf

R(x,u,t) =

0,

xeG {t),

В (х ,Т )

= Ф (х), x £ G {T ) . (8)

uev(0

 

 

 

 

 

 

 

Оказывается, решение задачи

Коши — Веллмана

(5),

(6), (или

(8))

равносильно решению проблемы синтеза для задачи

(1.1— 4).

Точнее, справедлива

 

 

 

 

 

 

Т е о р е м а

1.

Пусть функция B(x,t)

кусочно-непрерывна,

кусочно-гладка

и удовлетворяет условиям (5), (6),

(или

(8)) при

x ^ G ( t ) ,

 

Пусть для

каждой пары (х (т ),ы (т )),

удовлет­

воряющей условиям

(2)— (4),

функция Л (х (т ),т )

переменной т

непрерывна и кусочно-гладка на отрезке

 

при всех x e G ( t )

и t, t ( ^ t < . T . Пусть u = u ( x ,t )

кусочно-непрерывная функция, на

которой реализуется нижняя грань в (б)

или (8).

Тогда

функция.

u — u(x,t)

представляет собой решение проблемы

синтеза

для

за ­

дачи

(1.1— 4).

 

 

 

Возьмем некоторый момент t, t<ys^.t<T,

Д о к а з а т е л ь с т в о .

точку

x e G (f)

и через

D£t, Т\ обозначим

множество всех

пар

(х(т), ы (т)),

 

 

удовлетворяющих условиям

(2) — (4). Р ас­

смотрим задачу Коши:

 

 

 

 

 

 

 

 

 

 

X(т) =

/ (т), и (х (т), т), т),

t < т

<

Т; х (t) = х.

 

(9)

Пусть эта

задача

имеет

решение

х *(т ),

 

определенное

на

от­

резке

 

 

 

и

пусть

л* ( т) ё

6 ( т),

 

 

Положим

« * ( т )= ы ( х * ( т ),г ),

 

 

 

 

Очевидно,

(х *(т ),

и * (т )) eZXJf, Т].

Покажем,

что пара (х* (т),

и* (т )) является

оптимальным

решени­

ем задачи

(1) — (4)-. Для этого прежде всего выведем формулу

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

J 1(х, и(т)) =

J R (x( т), и (т), r)dx-\- В{х,

0 ,

 

(Ю)

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

справедливую при всех

(х (т), ы (т))еД Д ^, Т] и при всех

фиксиро­

ванных x ^ G ( t ) ,

t o ^ t c T - , здесь R(x,u,t)

взята из

(7).

 

 

Всюду

на отрезке

 

 

за исключением, быть может, ко­

нечного числа точек,

имеем

 

 

 

 

 

 

 

 

 

 

dB - . (T),T)

= R ( x (т), и (т), т) — /°( х (т), и (т), т).

 

 

 

 

dr

 

 

 

 

 

 

 

 

 

 

 

Так как по условию В ( х (г ), г)

непрерывна на \t, Т], то, интегрируя

последнее тождество с учетом условия (6), получим

 

 

 

 

 

 

 

т

 

 

 

 

 

т

 

 

 

Ф ( х ( Т )) — В(х,

t) = f

R(x(r), и (г), г)dr—f /°(х(т), и (г), г) dr,

j

<