Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 65
Скачиваний: 0
.. год
2. |
Скалярное произведение градиента аУ (Т* ) |
на £{{.) для любо |
|
го |
равно |
нулю |
|
|
т |
|
|
J |
У>/ШЛ) |
( я м ) |
|
3. |
Норма |
функции ъ(Ъ равна единице |
|
Нормировать ^ ( 1 ) можно по-разному. Чаще воего испольвуют квадратичную норму
Здесь К - размерность вектор-функции Каждое из этих выражений является функциональным аналогом
формул (7.5), (7.3) и (7Л) соответственно. Найдя направление условного градиента, переходят к следующему приближению
Таким образом,решение исходной задачи сводится к последователь ности вспомогательных экстремальных задач, линейных относитель но искомой вектор-функции £(-t) с условием нормирования (21.5).
Размерность же вектора равна размерности После несколь ких шагов необходимо минимизировать возникающую невязку в уравне нии связи (21.2), потребовав
3 |
X, |
о |
|
|
|
и решив |
численно эту |
задачу |
с начальным |
приближением ^ j ( 4 ) , ко |
|
торое мы нашли после |
первой |
серии поиска |
по методу проектирования |
||
градиента. |
|
|
|
|
2Ю
2f"2. Аналог метода Ньютона для определения условного макси мума -
Рассмотренный в предыдущей пункте подход использовал условный градиент функционала I , движение осуществлялось малыш шагами вдоль направления градиента. Скорость сходимости таких методов обычно невелика, особенно в окрестности максимума, когда величина градиента мала. В задачах нелинейного программирования для уско рения сходимости используют те или иные разновидности алгоритма Ньютона, смысл которого состоит коротко в том, что целевая функция аппроксимируется квадратичной формой, а уравнения связи, как и в методе проектирования градиента, линеаризуются. Затем решается вспомогательная задача о минимуме квадратичной функции при линей
ных связях. Величину шага уже не приходится выбирать. Решение
и-
воломогательной задачи ^ |
дает очередное приолижение. |
Иногда, |
|||||
правда, |
оходимость улучшается, е оли |
очередное |
приближение |
выби |
|||
рается |
о "недоходом", т . е . движение |
осущес'хвляеюя не в точку ми- |
|||||
шшуме, |
а по направлению к ней,в точку, |
отстоящую от начального |
|||||
приближения на некоторую |
долю К (к=0,5 |
* 0,8) |
расстояния |
д о ^ * * |
|||
Аналог этого метода часто используют и в задачах о максимуме- |
|||||||
Функционалов |
C ^ ' J - |
Пусть вектор-функция |
удовлет |
||||
воряет |
набору |
связей (24t2). Приложим |
|
|
|
•подставим э*о выражена*: в функцию J-0 и упростим ее, разложив в ряд Тэйлора в окрестнооти i^(-i)' и удержав лишь квадратичные слагаемые этого ряда* То же проделаем и о каждой из составляющих
функции J-,'однако, ограничимся для них лишь |
линейным приближением, |
«ункциояалн I и CJ примут вид; I » K y J |
%(ФУ(ЪЧ)*&3(тМ |
причем |
Л I |
квадратичный, а |
& £3 |
- линейный |
функционал. |
Так как |
|||||||
о / |
( ^ а |
) = |
О и |
находят среди допустимых |
функций, |
то |
|||||||
|
|
|
|
A Zlfc^J^ |
0, |
|
|
|
(21.6) |
||||
• и |
задача |
сводится к |
определению |
вектортфункции |
1 ^ , доставляющей |
||||||||
максимум |
функционалу |
A l |
( V |
) |
при условии |
(21.6). Очередное |
|||||||
приближение |
находим |
по формуле |
|
|
|
|
|
|
|||||
где К - положительное число |
меньшее |
единицы |
(коэффициент |
"недо |
|||||||||
хода") . Читателю предоставляется показать, что |
для связей |
в фор |
|||||||||||
ме |
дифференциальных |
уравнений |
условия |
(2/.6) |
оказываются |
линейны |
ми дифференциальными уравнениями с линеаризованными краевыми усло
виями. Очень близок к этому подходу |
кетод квааилинеаризации |
( 3 |
j , |
||||||||
предложенный Беллманом. |
Им же получены условия |
сходимости |
для |
от |
|||||||
дельных |
случаев, |
впрочем,довольно |
жесткие. |
|
|
|
|
|
|
||
21,3. |
Аналог |
способа |
вычисления |
условного |
градиента с |
|
|
|
|
||
|
использованием |
множителей |
Лагранжа.- |
|
|
|
|
|
|
||
Как это неоднократно делалось в |
предыдущих |
параграфах, |
разобь |
||||||||
ём все составляющие решения на зависимые »У(4) |
|
и свободные |
|
U(4) |
|
||||||
так,чтобы первые из них определялись условиями |
(24.2) при |
подста |
|||||||||
новке в |
последние K(-t). Пусть »У0(4) и U,(4) |
- |
начальное |
прибли |
|||||||
жение, удовлетворяющее'связям. Выберем вектор-функцию^ (4> |
так, |
||||||||||
чтобы подинтегральное выражение |
£ |
функционала |
Лагранжа |
AS |
было |
||||||
стационарно по |
в окрестности |
начального приближения. |
Получим |
|
где |
производные вычисляют при ^Х=У0; U = K 0 .Свободные составляю |
щие |
решения разобьем,в свою очередь,на составляющие 1 ( с , по ко- |
|
|
|
|
212 |
|
|
|
|
|
|
|
торым |
задача |
сингулярна, и составляющие |
Ц р , |
по которым она регу |
|
||||||
лярна. По первым из них |
находим |
градиент |
Q |
в окрестности началь-" |
|||||||
ного |
приближения V U t Q |
и делаем шаг вдоль этого направления. |
|
||||||||
По регулярным составляющим, на первый взгляд, можно искать мак |
|
||||||||||
симум |
R. |
на |
множестве |
\Дд.р и * |
Допустимых |
аначений и переходить |
|
||||
в эту |
точку. В действительности |
это |
не |
так. |
Не только новое управ-* |
||||||
ление Up, ("£),найденное |
таким путем, будет |
отличаться от Wpo(-t) |
|
||||||||
на конечную величину, но и соответствующие ему эавиоимые |
составляй |
||||||||||
щие t X ( |
{{). |
Между тем |
вычисление |
jj |
( |
•{ |
) ив условий |
(2/.?) |
|
||
гарантировало |
стационарность fS |
по |
-У |
|
лишь поблизооти |
от |
. |
Поэтому при таком выборе алгоритм в общем случае приводит к расхо*
дящейся процедуре. Чтобы улучшить сходимость, выбирают вместо ( / * |
|||||||||
новое |
значение |
р ( |
(4) |
по формуле: |
|
|
|
|
|
а величину Е находят |
таким |
образом, |
чтобы |
после |
подстановки |
||||
в уравнения связей и определения Xj |
выполнялось |
условие: |
|
||||||
Таким |
обраэом,в |
начальной |
точке ^„(4) |
{ - У о , 1 ^ ^ |
|
определяются |
|||
t .// ft) |
из условия (;2/.}0. |
По ним находится новое |
значение |
Hj( - t), |
|||||
сингулярные составляющие которого изменяются пропорционально |
|||||||||
градиенту,, а-регулярные-по |
условиям |
|
(2.1.9). |
Затем |
из |
||||
уравнений связей |
(2/. 2) определяются Xt(-k) |
и т . д . |
Такой |
подход |
для |
задач со связями в форме дифференциальных уравнений предло |
гов |
И.А.Крыловым и Ф.Л.Черноусько £ 4 6 ). Применительно.к |
системам, содержащим дифференциальные уравнения и конечные соотношения такого типа,алгоритмы развиты в работах Г.М.Остров ского и Ю.М.Волина {. 1*3 J .
213
21.4. Использование штрафных функций..
Методы,использующие функции штрафа,для замены задачи условного
иаксииуиа |
задачей безусловного ыаксинуиа 1; как правило, редко |
|||
позволяют |
найти решение £f*(~k) точно. Но |
по |
величине |
|
функционала полученное приближение оказывается чаото вполне |
||||
удовлетворительный. Образуем |
функционал |
|
|
|
где _//(^"J>0, а функционалы |
I и У (tr) соответствуют |
выражениям |
(2./.I) и (2(f.2). Будем искать безусловный макоимум этого функцио
нала п о ^ ( { ) , например, |
методом градиента. Для многих видов задач |
|||||||||
докааано |
£ , 1? |
3» ч т о |
при росте |
JI (х) |
полученное решение |
|||||
стремится к решению задачи |
( 2 i . I ) |
и {2.1.2). Практически по мере |
||||||||
решения |
задачи на ЦВМ выводят на печать |
значение I |
) и |
|||||||
величину |
максимальной ординаты £f ( Т |
) . По характеру измене |
||||||||
ния этих |
кривых |
при увеличении Л |
( t ) можно |
выбрать'момент |
||||||
окончаний счета. |
|
|
|
|
|
|
|
|
|
|
2/.5. Аналог |
алгоритма поиска оедловой точки |
функции |
||||||||
|
|
|
Лагранжа.. |
|
|
|
|
|||
Так как решение |
задачи |
(21 Л ) , |
(21.2) |
является |
оедловой точкой |
|||||
функционала Лагранжа |
£ |
, |
в которой этот функционал максимален |
|||||||
по ^-(4) |
и минимален |
n O i / / ( T ) , то для поиска |
уоловного макси |
|||||||
мума может быть |
использован алгоритм, подобный |
изложенному в |
||||||||
|
|
|
|
|
|
|
|
|
|
i |
п . 7 . 3 . Аналогично формулам (7.9), (7.10) подучим для данной задачи выражения
. т-