Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.10.2024
Просмотров: 98
Скачиваний: 0
Вспомним, что max (— X) — —min X, и перепишем теперь (1-2-3):
О = max JG (х, и, хп+1) ( - 1) - <grad £ •/> - |
(+ 1)} . |
Можно видеть, что это легко записать так:
О - max { < " * • / > }• «eu
Обозначим if-функцию Гамильтона, или гамильтониан
|
71+1 |
я |
= ор-/> = 2 %/7, |
где |
о |
•фіі fi — i-ö координаты |
векторов. |
О= тахН — принцип максимума, «eu
Оптимальное управление в любой момент времени максимизирует гамильтониан.
Процедура применения принципа максимума состоит в следую щем:
уравнение объекта |
X = |
АХ |
+BU; |
X |
(0), X (T); |
U <= U; ' |
|||
функционал |
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
= |
^ |
G(x,u,t)dt; |
|
|
|
|
|
|
|
|
о |
|
|
|
|
|
сопряженная система |
¥ = |
—А*^¥. |
|
|
|
|
|||
Гамильтониан |
H = |
(G-W} |
+ (АХ-W) |
+ |
(BU, |
¥>. |
|
||
Условие максимума |
|
|
|
|
|
|
|
|
|
3 { < Л Х , У > } |
|
Э.{<ДУ,У>}- |
9{<G,Y>} |
_ |
п |
||||
0(7 |
~^ |
|
dU |
|
' |
3J7 |
~ |
|
|
Оптимальное |
управление |
U* |
= f |
(X*). |
|
|
|
Основное практическое преимущество принципа максимума перед динамическим программированием состоит в том, что нет необходимости решать уравнение в частных производных, что яв
ляется достаточно сложным |
для систем произвольного порядка. |
||||||
В процедуре |
использования |
принципа |
максимума |
решается |
си |
||
стема сопряженных линейных уравнений Y = —A*W, что, ко |
|||||||
нечно, гораздо легче. |
|
|
|
|
|||
Определенную трудность представляет, однако, определение |
|||||||
граничных |
условий |
этой системы. |
|
|
|
||
Одним |
из |
путей |
преодоления этих |
трудностей |
является |
ис- ! |
|
пользование |
(для задач оптимального |
быстродействия), т. е. |
при |
||||
G (х, u, t) |
= |
1 итерационных |
методов. |
|
|
|
28
В основе итерационного метода (Eaton) лежат следующие геометрические положения. Пусть в 7г-мерном эвклидовом про странстве Rn: g (t) есть n-мерный вектор, изображающий положе ние цели, причем g (t) — непрерывно в интервале 0 ^ t ^ оо; V (t) есть /г-мерный вектор, характеризующий выход системы;
С/[о,(] — управляющая |
n-мерная векторная |
функция, |
принадле |
||||||||||
жащая |
ограниченному |
множеству |
&цъ,і), |
если |
| £/£ |
(т) | |
1; |
||||||
0 < т < / и |
Г,- (г) = 0 |
|
вне интервала [0, |
І\; |
S) — множество, оп |
||||||||
ределяемое |
равенством |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
St = |
{V(t, |
CWtf(o,o е |
О»./)}, |
|
|
|
|
|||
где V (t, |
£/(<),()) — |
выход^системы в момент |
t при заданной |
функции |
|||||||||
управления |
Uqj). |
^(о,(°) G= Ц о , г ) — |
оптимальная |
управляющая |
|||||||||
функция, если V |
(t°, £/(0 ,н) |
— g (f) |
и не существует |
t' |
< |
f |
тако |
||||||
го , что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
(t', |
£/(„,,-)) = |
g ( О |
|
|
|
(1-2-4) |
для некоторой управляющей функции, принадлежащей Q(o,o- Проблема заключается в нахождении управляющей функции,
принадлея?ащей Q, которая совмещала бы выход системы V (tU) с целью g(t) (или соответственно х (t) и z (t) за минимальное время).
Необходимое условие оптимальности управления может быть записано в форме
/о |
|
|
|
'о |
|
|
|
Лу(х)1Г(х)ах,ц°\= |
|
|
max |
\ |
U (т) Y' |
(т) |
rfdx), |
где Y' (т) — транспонированная |
матрица |
Y (т); |
t° — наименьшее |
||||
время, при котором g (t) |
ЕЕ St; |
ц° |
— внешняя нормаль St« в точке |
||||
S (1°). |
|
|
|
|
|
|
|
Выражение оптимального управления имеет вид |
|
||||||
U* |
(т) = |
sign {Y' |
(t)i)}. |
|
|
||
Таким образом, геометрически задача сводится к |
определению |
минимального времени t°, для которого пересечение S, и g (t) не
пусто, а также г\° — внешней нормали St |
в точке g |
(t°). |
|
|
|
||||||
По |
известным |
значениям t° |
и т]° оптимальное |
управление |
|||||||
Z7(o,(°) |
может |
быть |
определено |
путем |
максимизации |
скаляр |
|||||
ного |
произведения |
по [ / ( о д Е й ц д . |
Этот |
итерационный |
ме |
||||||
тод является достаточно надежным для определения |
оптимального |
||||||||||
управления, переводящего систему в фазовом пространстве |
со |
||||||||||
стояний из исходного положения в конечное положение |
за |
мини |
|||||||||
мальное время. Идеи, |
лежащие в основе метода, были |
использо |
|||||||||
ваны |
Итоном |
при |
определении |
оптимального |
управления |
в |
ди |
||||
скретных системах. |
Определение |
оптимального |
управления |
и |
оп- |
20
тимальнои траектории этим итерационным методом производится следующим образом (Шапиро, 1966).
Динамика системы описывается уравнением
-%- = A(t)x + B(t)U(t),
причем решается оно по формуле Коши:
|
|
|
:{t) = |
|
|
X{t){x0+^Y(i)U{T)dx}, |
|
||
где |
|
|
|
|
|
|
|
|
|
|
|
|
X (0)== I — единичная матрица. |
|
|||||
и |
|
|
|
|
|
|
|
|
|
|
|
|
Y(t) |
= |
X-i(t)B{t). |
|
|
||
Необходимо |
найти управление |
£/(*о,о такое, |
чтобы |
|
|||||
|
|
|
x(t,U[0,t)) |
= |
z(t) |
|
(1-2-5) |
||
при наименьшем возможном |
t |
(z (t) — вектор |
цели). |
|
|||||
Известно, что |
|
|
|
|
|
|
|||
|
|
|
V(t, U{ù>i) |
= |
^Y(x)U(x)dx |
|
|
||
|
|
|
|
|
|
о |
|
|
|
|
|
|
g(t) = |
|
X-i(t)z(t)~x0. |
|
|
||
Выражение |
оптимального |
управления имеет вид |
|
||||||
|
|
|
U'{x) |
= |
sign { У (т) іі}. |
|
|
||
Здесь |
Y' |
(т) — транспонированное |
значение |
матрицы |
Y (т) и |
||||
0 < т < |
t°. |
|
|
|
|
|
|
|
|
На каждом т-м шаге итерационный процесс состоит из |
двух эта |
||||||||
пов: |
|
|
|
|
|
|
|
|
|
— поиск следующего момента времени |
tm+1, |
|
|||||||
— поиск следующего значения вектора |
r | m + 1 . |
|
|||||||
На |
первом шаге m = 1 соответствующее значение вектора т)1 |
||||||||
определяется как |
|
|
|
|
|
|
|||
|
|
|
|
n |
- |
g ( 0 |
) |
|
|
|
|
|
|
11 |
|
U (0) I ' |
|
|
а значение момента времени tx есть первое значение времени t ^> 0, для которого выполняется условие
П і > = о,
где функция ошибки
30
На втором шаге m -(- 1 = |
2 (и последующих) значения вектора |
|||||
ï]m+i определяются по формуле |
|
|
|
|
||
|
„ |
, |
КрЕ{ітцт) |
|
|
|
|
_ |
|
1тЧг\\КрЕ(іпПт)\\ |
|
||
+ 1 |
IL |
I |
КрЕ(ітГ]т) |
|f |
|
|
|
Чт "Г і |
|
|
|
||
Полученное значение т ) т |
+ 1 должно |
удовлетворять |
условию |
|||
|
|
|
m+l |
|
|
|
где е ^> О заранее выбрано. |
|
|
|
|
|
|
Если это условие выполняется, то осуществляется |
этап опреде |
|||||
ления следующего значения времени |
tm+v |
|
|
При невыполнении этого условия производится новое опре
деление |
значения вектора ï | m + 1 , |
причем в формуле значение Кр |
|
заменяется значением |
Кр+Х. |
|
|
Для |
ускорения сходимости |
этого этапа целесообразно опре |
|
делять |
значение Кр+1 |
соотношением |
|
|
|
л р + 1 |
- 2 р . |
Этот этап продолжается до тех пор, пока не удовлетворится условие. Затем осуществляется этап определения значения вре мени tm+1, которое представляет собой первое значение t ^> tm, удовлетворяющее условию
где функция ошибки есть |
|
Е (tm+1, T J m + 1 ) = g (tm+1) — V {tm+1, |
J\m+1). |
Заканчивается итерационная процедура выполнением соотно шения (1-2-5).
Данная итерационная процедура была применена к решению ряда конкретных задач определения оптимального управления аналитическим путем и с помощью ЦВМ.
Ниже приведены результаты решения двух простейших за дач.
а) і" = |
17; |
|t7|<l ; |
a (і) = |
0; |
*„ = [ J ] Î |
|
Л = |
[ о о ] ; |
|
X |
( |
^ [ o î ] ; |
|
б) Ï = |
U; |
| * 7 | < 1 ; |
z{t) |
= |
a 2 |
i 2 ' |
|
|
31