Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.10.2024

Просмотров: 98

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Вспомним, что max (— X) — —min X, и перепишем теперь (1-2-3):

О = max JG (х, и, хп+1) ( - 1) - <grad £ •/> -

(+ 1)} .

Можно видеть, что это легко записать так:

О - max { < " * • / > }• «eu

Обозначим if-функцию Гамильтона, или гамильтониан

 

71+1

я

= ор-/> = 2 %/7,

где

о

•фіі fi — i-ö координаты

векторов.

О= тахН — принцип максимума, «eu

Оптимальное управление в любой момент времени максимизирует гамильтониан.

Процедура применения принципа максимума состоит в следую­ щем:

уравнение объекта

X =

АХ

+BU;

X

(0), X (T);

U <= U; '

функционал

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

=

^

G(x,u,t)dt;

 

 

 

 

 

 

 

о

 

 

 

 

 

сопряженная система

¥ =

А*^¥.

 

 

 

 

Гамильтониан

H =

(G-W}

+ (АХ-W)

+

(BU,

¥>.

 

Условие максимума

 

 

 

 

 

 

 

 

3 { < Л Х , У > }

 

Э.{<ДУ,У>}-

9{<G,Y>}

_

п

0(7

~^

 

dU

 

'

3J7

~

 

Оптимальное

управление

U*

= f

(X*).

 

 

 

Основное практическое преимущество принципа максимума перед динамическим программированием состоит в том, что нет необходимости решать уравнение в частных производных, что яв­

ляется достаточно сложным

для систем произвольного порядка.

В процедуре

использования

принципа

максимума

решается

си­

стема сопряженных линейных уравнений Y = —A*W, что, ко­

нечно, гораздо легче.

 

 

 

 

Определенную трудность представляет, однако, определение

граничных

условий

этой системы.

 

 

 

Одним

из

путей

преодоления этих

трудностей

является

ис- !

пользование

(для задач оптимального

быстродействия), т. е.

при

G (х, u, t)

=

1 итерационных

методов.

 

 

 

28


В основе итерационного метода (Eaton) лежат следующие геометрические положения. Пусть в 7г-мерном эвклидовом про­ странстве Rn: g (t) есть n-мерный вектор, изображающий положе­ ние цели, причем g (t) — непрерывно в интервале 0 ^ t ^ оо; V (t) есть /г-мерный вектор, характеризующий выход системы;

С/[о,(] — управляющая

n-мерная векторная

функция,

принадле­

жащая

ограниченному

множеству

&цъ,і),

если

| £/£

(т) |

1;

0 < т < / и

Г,- (г) = 0

 

вне интервала [0,

І\;

S) — множество, оп­

ределяемое

равенством

 

 

 

 

 

 

 

 

 

 

 

 

 

St =

{V(t,

CWtf(o,o е

О»./)},

 

 

 

 

где V (t,

£/(<),()) —

выход^системы в момент

t при заданной

функции

управления

Uqj).

^(о,(°) G= Ц о , г ) —

оптимальная

управляющая

функция, если V

(t°, £/(0 ,н)

— g (f)

и не существует

t'

<

f

тако­

го , что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

(t',

£/(„,,-)) =

g ( О

 

 

 

(1-2-4)

для некоторой управляющей функции, принадлежащей Q(o,o- Проблема заключается в нахождении управляющей функции,

принадлея?ащей Q, которая совмещала бы выход системы V (tU) с целью g(t) (или соответственно х (t) и z (t) за минимальное время).

Необходимое условие оптимальности управления может быть записано в форме

 

 

 

 

 

 

Лу(х)1Г(х)ах,ц°\=

 

 

max

\

U (т) Y'

(т)

rfdx),

где Y' (т) — транспонированная

матрица

Y (т);

— наименьшее

время, при котором g (t)

ЕЕ St;

ц°

— внешняя нормаль St« в точке

S (1°).

 

 

 

 

 

 

 

Выражение оптимального управления имеет вид

 

U*

(т) =

sign {Y'

(t)i)}.

 

 

Таким образом, геометрически задача сводится к

определению

минимального времени t°, для которого пересечение S, и g (t) не

пусто, а также г\° — внешней нормали St

в точке g

(t°).

 

 

 

По

известным

значениям

и т]° оптимальное

управление

Z7(o,(°)

может

быть

определено

путем

максимизации

скаляр­

ного

произведения

по [ / ( о д Е й ц д .

Этот

итерационный

ме­

тод является достаточно надежным для определения

оптимального

управления, переводящего систему в фазовом пространстве

со­

стояний из исходного положения в конечное положение

за

мини­

мальное время. Идеи,

лежащие в основе метода, были

использо­

ваны

Итоном

при

определении

оптимального

управления

в

ди­

скретных системах.

Определение

оптимального

управления

и

оп-

20



тимальнои траектории этим итерационным методом производится следующим образом (Шапиро, 1966).

Динамика системы описывается уравнением

-%- = A(t)x + B(t)U(t),

причем решается оно по формуле Коши:

 

 

 

:{t) =

 

 

X{t){x0+^Y(i)U{T)dx},

 

где

 

 

 

 

 

 

 

 

 

 

 

 

X (0)== I — единичная матрица.

 

и

 

 

 

 

 

 

 

 

 

 

 

 

Y(t)

=

X-i(t)B{t).

 

 

Необходимо

найти управление

£/(*о,о такое,

чтобы

 

 

 

 

x(t,U[0,t))

=

z(t)

 

(1-2-5)

при наименьшем возможном

t

(z (t) — вектор

цели).

 

Известно, что

 

 

 

 

 

 

 

 

 

V(t, U{ù>i)

=

^Y(x)U(x)dx

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

g(t) =

 

X-i(t)z(t)~x0.

 

 

Выражение

оптимального

управления имеет вид

 

 

 

 

U'{x)

=

sign { У (т) іі}.

 

 

Здесь

Y'

(т) — транспонированное

значение

матрицы

Y (т) и

0 < т <

t°.

 

 

 

 

 

 

 

На каждом т-м шаге итерационный процесс состоит из

двух эта­

пов:

 

 

 

 

 

 

 

 

 

— поиск следующего момента времени

tm+1,

 

— поиск следующего значения вектора

r | m + 1 .

 

На

первом шаге m = 1 соответствующее значение вектора т)1

определяется как

 

 

 

 

 

 

 

 

 

 

n

-

g ( 0

)

 

 

 

 

 

 

11

 

U (0) I '

 

 

а значение момента времени tx есть первое значение времени t ^> 0, для которого выполняется условие

П і > = о,

где функция ошибки

30


На втором шаге m -(- 1 =

2 (и последующих) значения вектора

ï]m+i определяются по формуле

 

 

 

 

 

,

КрЕ{ітцт)

 

 

 

_

 

1тЧг\\КрЕ(іпПт)\\

 

+ 1

IL

I

КрЕ(ітГ]т)

|f

 

 

Чт "Г і

 

 

 

Полученное значение т ) т

+ 1 должно

удовлетворять

условию

 

 

 

m+l

 

 

 

где е ^> О заранее выбрано.

 

 

 

 

 

Если это условие выполняется, то осуществляется

этап опреде­

ления следующего значения времени

tm+v

 

 

При невыполнении этого условия производится новое опре­

деление

значения вектора ï | m + 1 ,

причем в формуле значение Кр

заменяется значением

Кр+Х.

 

Для

ускорения сходимости

этого этапа целесообразно опре­

делять

значение Кр+1

соотношением

 

 

л р + 1

- 2 р .

Этот этап продолжается до тех пор, пока не удовлетворится условие. Затем осуществляется этап определения значения вре­ мени tm+1, которое представляет собой первое значение t ^> tm, удовлетворяющее условию

где функция ошибки есть

 

Е (tm+1, T J m + 1 ) = g (tm+1) — V {tm+1,

J\m+1).

Заканчивается итерационная процедура выполнением соотно­ шения (1-2-5).

Данная итерационная процедура была применена к решению ряда конкретных задач определения оптимального управления аналитическим путем и с помощью ЦВМ.

Ниже приведены результаты решения двух простейших за­ дач.

а) і" =

17;

|t7|<l ;

a (і) =

0;

*„ = [ J ] Î

Л =

[ о о ] ;

 

X

(

^ [ o î ] ;

б) Ï =

U;

| * 7 | < 1 ;

z{t)

=

a 2

i 2 '

 

 

31