Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 65

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

.. год

2.

Скалярное произведение градиента аУ (Т* )

на £{{.) для любо­

го

равно

нулю

 

 

т

 

 

J

У>/ШЛ)

( я м )

3.

Норма

функции ъ(Ъ равна единице

 

Нормировать ^ ( 1 ) можно по-разному. Чаще воего испольвуют квадратичную норму

Здесь К - размерность вектор-функции Каждое из этих выражений является функциональным аналогом

формул (7.5), (7.3) и (7Л) соответственно. Найдя направление условного градиента, переходят к следующему приближению

Таким образом,решение исходной задачи сводится к последователь­ ности вспомогательных экстремальных задач, линейных относитель­ но искомой вектор-функции £(-t) с условием нормирования (21.5).

Размерность же вектора равна размерности После несколь ких шагов необходимо минимизировать возникающую невязку в уравне­ нии связи (21.2), потребовав

3

X,

о

 

 

и решив

численно эту

задачу

с начальным

приближением ^ j ( 4 ) , ко­

торое мы нашли после

первой

серии поиска

по методу проектирования

градиента.

 

 

 

 


2f"2. Аналог метода Ньютона для определения условного макси­ мума -

Рассмотренный в предыдущей пункте подход использовал условный градиент функционала I , движение осуществлялось малыш шагами вдоль направления градиента. Скорость сходимости таких методов обычно невелика, особенно в окрестности максимума, когда величина градиента мала. В задачах нелинейного программирования для уско­ рения сходимости используют те или иные разновидности алгоритма Ньютона, смысл которого состоит коротко в том, что целевая функция аппроксимируется квадратичной формой, а уравнения связи, как и в методе проектирования градиента, линеаризуются. Затем решается вспомогательная задача о минимуме квадратичной функции при линей­

ных связях. Величину шага уже не приходится выбирать. Решение

и-

воломогательной задачи ^

дает очередное приолижение.

Иногда,

правда,

оходимость улучшается, е оли

очередное

приближение

выби­

рается

о "недоходом", т . е . движение

осущес'хвляеюя не в точку ми-

шшуме,

а по направлению к ней,в точку,

отстоящую от начального

приближения на некоторую

долю К (к=0,5

* 0,8)

расстояния

д о ^ * *

Аналог этого метода часто используют и в задачах о максимуме-

Функционалов

C ^ ' J -

Пусть вектор-функция

удовлет­

воряет

набору

связей (24t2). Приложим

 

 

 

подставим э*о выражена*: в функцию J-0 и упростим ее, разложив в ряд Тэйлора в окрестнооти i^(-i)' и удержав лишь квадратичные слагаемые этого ряда* То же проделаем и о каждой из составляющих

функции J-,'однако, ограничимся для них лишь

линейным приближением,

«ункциояалн I и CJ примут вид; I » K y J

%(ФУ(ЪЧ)*&3(тМ


причем

Л I

квадратичный, а

& £3

- линейный

функционал.

Так как

о /

( ^ а

) =

О и

находят среди допустимых

функций,

то

 

 

 

 

A Zlfc^J^

0,

 

 

 

(21.6)

• и

задача

сводится к

определению

вектортфункции

1 ^ , доставляющей

максимум

функционалу

A l

( V

)

при условии

(21.6). Очередное

приближение

находим

по формуле

 

 

 

 

 

 

где К - положительное число

меньшее

единицы

(коэффициент

"недо­

хода") . Читателю предоставляется показать, что

для связей

в фор­

ме

дифференциальных

уравнений

условия

(2/.6)

оказываются

линейны­

ми дифференциальными уравнениями с линеаризованными краевыми усло­

виями. Очень близок к этому подходу

кетод квааилинеаризации

( 3

j ,

предложенный Беллманом.

Им же получены условия

сходимости

для

от­

дельных

случаев,

впрочем,довольно

жесткие.

 

 

 

 

 

 

21,3.

Аналог

способа

вычисления

условного

градиента с

 

 

 

 

 

использованием

множителей

Лагранжа.-

 

 

 

 

 

 

Как это неоднократно делалось в

предыдущих

параграфах,

разобь­

ём все составляющие решения на зависимые »У(4)

 

и свободные

 

U(4)

 

так,чтобы первые из них определялись условиями

(24.2) при

подста­

новке в

последние K(-t). Пусть »У0(4) и U,(4)

-

начальное

прибли­

жение, удовлетворяющее'связям. Выберем вектор-функцию^ (4>

так,

чтобы подинтегральное выражение

£

функционала

Лагранжа

AS

было

стационарно по

в окрестности

начального приближения.

Получим

 

где

производные вычисляют при ^Х=У0; U = K 0 .Свободные составляю­

щие

решения разобьем,в свою очередь,на составляющие 1 ( с , по ко-


 

 

 

 

212

 

 

 

 

 

 

 

торым

задача

сингулярна, и составляющие

Ц р ,

по которым она регу­

 

лярна. По первым из них

находим

градиент

Q

в окрестности началь-"

ного

приближения V U t Q

и делаем шаг вдоль этого направления.

 

По регулярным составляющим, на первый взгляд, можно искать мак­

 

симум

R.

на

множестве

\Дд.р и *

Допустимых

аначений и переходить

 

в эту

точку. В действительности

это

не

так.

Не только новое управ-*

ление Up, ("£),найденное

таким путем, будет

отличаться от Wpo(-t)

 

на конечную величину, но и соответствующие ему эавиоимые

составляй

щие t X (

{{).

Между тем

вычисление

jj

(

•{

) ив условий

(2/.?)

 

гарантировало

стационарность fS

по

 

лишь поблизооти

от

.

Поэтому при таком выборе алгоритм в общем случае приводит к расхо*

дящейся процедуре. Чтобы улучшить сходимость, выбирают вместо ( / *

новое

значение

р (

(4)

по формуле:

 

 

 

 

а величину Е находят

таким

образом,

чтобы

после

подстановки

в уравнения связей и определения Xj

выполнялось

условие:

 

Таким

обраэом,в

начальной

точке ^„(4)

{ - У о , 1 ^ ^

 

определяются

t .// ft)

из условия (;2/.}0.

По ним находится новое

значение

Hj( - t),

сингулярные составляющие которого изменяются пропорционально

градиенту,, а-регулярные-по

условиям

 

(2.1.9).

Затем

из

уравнений связей

(2/. 2) определяются Xt(-k)

и т . д .

Такой

подход

для

задач со связями в форме дифференциальных уравнений предло­

гов

И.А.Крыловым и Ф.Л.Черноусько £ 4 6 ). Применительно.к

системам, содержащим дифференциальные уравнения и конечные соотношения такого типа,алгоритмы развиты в работах Г.М.Остров­ ского и Ю.М.Волина {. 1*3 J .


213

21.4. Использование штрафных функций..

Методы,использующие функции штрафа,для замены задачи условного

иаксииуиа

задачей безусловного ыаксинуиа 1; как правило, редко

позволяют

найти решение £f*(~k) точно. Но

по

величине

функционала полученное приближение оказывается чаото вполне

удовлетворительный. Образуем

функционал

 

 

где _//(^"J>0, а функционалы

I и У (tr) соответствуют

выражениям

(2./.I) и (2(f.2). Будем искать безусловный макоимум этого функцио­

нала п о ^ ( { ) , например,

методом градиента. Для многих видов задач

докааано

£ , 1?

3» ч т о

при росте

JI (х)

полученное решение

стремится к решению задачи

( 2 i . I )

и {2.1.2). Практически по мере

решения

задачи на ЦВМ выводят на печать

значение I

) и

величину

максимальной ординаты £f ( Т

) . По характеру измене­

ния этих

кривых

при увеличении Л

( t ) можно

выбрать'момент

окончаний счета.

 

 

 

 

 

 

 

 

 

2/.5. Аналог

алгоритма поиска оедловой точки

функции

 

 

 

Лагранжа..

 

 

 

 

Так как решение

задачи

(21 Л ) ,

(21.2)

является

оедловой точкой

функционала Лагранжа

£

,

в которой этот функционал максимален

по ^-(4)

и минимален

n O i / / ( T ) , то для поиска

уоловного макси­

мума может быть

использован алгоритм, подобный

изложенному в

 

 

 

 

 

 

 

 

 

 

i

п . 7 . 3 . Аналогично формулам (7.9), (7.10) подучим для данной задачи выражения

. т-