Файл: Специальные разделы теории управления. Оптимальное управление.pdf

Скачать файл (1,34Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 05.05.2024

Просмотров: 62

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

4.1. Краткая формулировка задачи Пусть даны: • система дифференциальных уравнений движения ),,,(auxfxtdtd =, (11) где ),,,(auxf t определены для всех ,)...,,,(2 1nnTnRXxxx⊂∈=xrmAUttt∈∈≤≤au,,1 0, непрерывны по совокупности переменных (t, x, u, a) и непрерывно дифференцируемы по (x, a); • соотношения, которым удовлетворяют начальные ),(0 0xtи конечные ),(1 1xt фазы движения системы (11): )2 2...,,2,1(0),,,,(1 01 0rnljttgj++<==axx, (12) где функции jg непрерывно дифференцируемы по всем своим аргументам; • критерий качества управления (функционал) ∫+Φ=2 1),,,(),,,,(]),([0 10 10ttdttftttJauxaxxau, (13) где 0, fΦ обладают всеми необходимыми производными. Множество mU представляет собой замкнутую и ограниченную область евклидова m-мерного пространства mR. Функ- ция u(t) считается допустимой, если она кусочно-непрерывна и ее значения принадлежат множеству mmUtU∈)(: u, т.е. та- кие управления ui(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция ui (t) может терпеть разрывы первого рода. Во избежание недоразумений отметим, что, по определению разрывов первого рода, в точке разрыва τ предполагается существование конечных пределов: )(lim)0(),(lim)0(tuutuuttttτ>τ→τ<τ→=+τ=−τ4.2. Некоторые вспомогательные построения и терминология Вводятся: • зависящий от времени вектор сопряженных координат (вектор-функция множителей Лагранжа) Tntttt))(...,),(),(()(1 0λλλ=λ; (14) • постоянный вектор µ: Tl)...,,,(2 1µµµ=µ; (15) • вспомогательные функции (гамильтониан задачи оптимизации и функция Лагранжа) ),,,(),,,(),,,,(0 01auxauxaλuxtftftHniiiλ+λ=∑= (16) и ∑=Φλ+µ=ljjjttttgttL1 10 10 01 01 01 01 0),,,,(),,,,(),,,,,(axxaxxµaxx; (17) • система дифференциальных уравнений, сопряженная к (11) (13) и определяющая изменение вектора )(tλ, ),0(),,,(0nixtfxHdtdiknkkii=∂∂λ−=∂∂−=λ∑=aux. (18) З а м е ч а н и е . Система линейных дифференциальных уравнений yy)(tB=& называется сопряженной для системы x& = A(t)x + f(t), если )()(tAtBT−= и размерность векторов x и y (а также матриц B(t) и A(t)) одинаковы. Таким образом, система (18) является фактически сопряженной к линеаризованной системе (11), (20): )()(),()(),((ttutxtutxuufxxfxδ∂∂+δ∂∂=δ))))&, где )(ˆ),(ˆtt ux – некоторая опорная траектория и опорное управление, соответственно. С помощью функции H исходная система уравнений (1) записывается в виде ),0(),,,(nitfHdtdxiii==∂λ∂=aux. (19) Индексу i = 0 соответствует новая переменная )(0tx, определяемая скалярным уравнением ),,,(0 0auxtfdtdx =, (20) с начальным условием ),,,,()(1 01 000 00axxttxtxΦ==. (21) Система уравнений ∂∂−=∂∂−==∂∂=,;λxfxλfλxTTTHH&& (22) где xffλ∂∂=,TH – матрица Якоби, )...,,,(1 0nxxx=x, )...,,,(1 0nfff=f; 1+∈nXx, называется канонической системой дифференциальных уравнений, связанной с основной задачей. 4.3. Принцип максимума Л.С. Понтрягина Пусть ],[,))(...,),(()(1 0**1*ttttututTm∈=u – такое допустимое управление, а Traaa)...,,,(**2*1*=a – такое допустимое значение вектора параметров, что соответствующая им траектория x*(t) системы (11) удовлетворяет условиям (12) для кон- цов. Для оптимальности (в смысле минимума) критерия качества (13) управления u*(t), траектории x*(t) и вектора управ- ляющих параметров а*необходимо существование такого ненулевого переменного вектора 0const)(,))(...,),(),(()(0 10≥=λλλλ=tttttTnλ (обычно можно принимать 1 0=λ, см. следствие 2, п. 4.4) и такого постоян- ного вектора Tl)...,,,(2 1µµµ=µ, что выполняются следующие условия. 1. Вектор-функции x*(t), u*(t), )(tλ и вектор a* удовлетворяют системе =∂∂−=λλ∂∂=),0()),(),(),(,(;)),(),(),(,(*******1nixttttHdtdttttHdtdxiiiaλuxaλux (23) 2. Функция )),(,),(,(**aλxtuttH переменного mU∈u при каждом ],[1 0ttt∈, т.е. при фиксированных x* и λ и при фиксированном векторе а* достигает при u = u*(t) минимума): )),(,),(,(min)),(),(,()),(),(),(,(********aλuxaλxaλuxutttHtttHttttHmU∈=== (24) Случай максимума функционала J[u, a] сводится к задаче в данной постановке путем рассмотрения функционала ],[],[1auauJJ−=З а м е ч а н и е . В отличие от классической формулировки принципа максимума Л.С. Понтрягина в данном случае опе- рация max в (24) заменена на min. В соответствии с такой заменой необходимое условие (24) можно было бы назвать прин- ципом минимума. Следует обратить внимание, что в данном случае 0 0≥λ, тогда как в классической формулировке 0 0≤λТаким образом, оптимальное управление определяется как )),(,),(,(min arg)),(),(,()(******aλuxaλxuuutttHttttmU∈==. (25) Принцип максимума, следовательно, утверждает, что оптимальное управление u*(t) в каждый момент времени t мини- мизирует проекцию фазовой скорости ),,(uxfxt=& управляемого процесса (т.е. проекцию скорости изображающей точки 1+∈nXx) на направление, задаваемое вектором )(tλ; напомним, что ),,,(0auxfλxλtfHTniTii==λ=∑=& – скалярное произведение векторов )(tλи x&3. Сопряженные переменные )(tiλ и функция )),(),(),(,(***aλuxttttH непрерывны вдоль оптимальной траектории (аналог условия Эрдмана-Вейерштрасса классического вариационного исчисления). 4. Условия трансверсальности. Для концевых точек ),(0 0xt, ),(1 1xt и вектора параметров а* при произвольных вариа- циях концевых точек и параметров выполняются обобщенные условия трансверсальности 0 10 10 10=δ∂∂++δλ−δρ=ρρ=∑ ∫∑dtaaHdLxtHr ttttniii. (26) Здесь dL – полная вариация функции ),,,,,(1 01 0aµxxttL, определяемой уравнением (17): )27(,)()()()(1 10 10 00 11 00ρ=ρρ==δ∂∂+δ∂∂++δ∂∂+δ∂∂+δ∂∂=∑∑∑aaLtxtxLtxtxLttLttLdLriniiinii где ρδδδδδatxtxttii),(),(,,1 01 0 – произвольные вариации концевых точек и параметров. Обобщенные условия трансверсальности (26) с учетом выражения (27) приводят в силу независимости δt0, δt1, δti(t0), δti(t1), δaρ к следующим 2n + 2 + r соотношениям: 0 00 0=δ∂∂+−ttLHt; (28) 0 11 1=δ∂∂+ttLHt; (29) ),1(0)(0 0nitxxLitii==δ∂∂+λ; (30) ),1(0)(1 1nitxxLitii==δ∂∂+λ−; (31) ),1(0 10radtaHaLtt=ρ=δ∂∂+∂∂ρρρ∫. (32) Если какое-либо конечное условие )(),(1 0txtxii или параметр ρa закреплены (не варьируются), то соответствующая вариация равна нулю: )),(),(,,(0 10 10ρ==δatxtxttzzii. Если какое-либо конечное условие )(0txi, )(1txi или управляющий параметр ρa свободны, то равен нулю коэффициент при свободной вариации zδ в (30) – (32). Таким образом, совокупность условий, выражающих принцип максимума (23), (25), условий трансверсальности (26), дают необходимые условия оптимальности программного управления. Условия принципа максимума позволяют среди множества всех траекторий и управлений, переводящих систему из ),(0 0xt в ),(1 1xt, выделить те отдельные, вообще говоря, изолированные траектории и управления, которые могут быть оп- тимальными. В формулировке принципа максимума участвует 2n + 2 + m + 1 неизвестных функций )(...,),(),(:)(...,),(),(1 01 0ttttxtxtxnnλλλ; )(...,),(1tutum, для определения которых имеется (n + 1) дифференциальных уравнений физической системы (11), (20), (n + 1) дифференциальных уравнений сопряженной системы (18) и m конечных соотношений для ju, вытекающих из (24). Следовательно, для (2n + 2 + m) неизвестных функций имеется (2n + 2 + m) соотношений. Если известны все начальные условия λλλλ==Φ==TnTnttttttxtxtxt))(...,),(),(),(()(;))(...,),(),(,()(0 02 01 00 00 00 20 10 01 2 3 4 5 6 7 8 9 ... 15

λλxx (33) и фиксированное значение управляющего параметра а, то система (23) может быть проинтегрирована. Однако начальный и конечный моменты времени t0, t1, начальное и конечное значения вектора фазовых координат )...,,(),...,,(1 11 10 10 0nnxxxx==xx, начальное и конечное значения вектора сопряженных переменных )...,,,1(0 10 0nλλ=λ, )...,,,1(1 11 1nλλ=λ, постоянный вектор )...,,,(2 1lµµµ=µ и вектор управляющих параметров )...,,,(2 1raaa=a для опти- мального решения заранее неизвестны. Они могут быть определены из условий трансверсальности (28) – (32) и граничных условий (12). В самом деле, для определения (2 + 4n + l + r) неизвестных aµλλxx,,,,,,,1 01 01 0tt имеется два условия (28), (29), 2n условий (30), (31), r условий (32) и l условий (12); кроме того, 2n соотношений вида ),,,()(0 01 01 1xλxtttϕ=, ),,,()(0 01 02 1xλλtttϕ= будут получены в результате интегрирования системы (23). Таким образом, для полученной крае- вой задачи имеется достаточное число соотношений, позволяющих считать ее, по крайней мере, теоретически разрешимой. Необходимо также отметить, что принцип максимума дает глобальный минимум. Численные методы решения краевых задач приведены в [20, 23]. 4.4. Некоторые следствия принципа максимума 1. Непосредственным следствием системы (23) и условия (24) является выполнение между точками разрыва функции u(t) соотношения tHdtdH∂∂=. (34) Это условие для автономных систем (т.е. систем, не зависящих явно от t) приводит к первому интегралу: H = const вдоль всей оптимальной траектории, хотя в общем случае условие (34) неверно, условия скачка обоснованы и получены. 2. В большинстве практических случаев 0 0>λ (так называемый нормальный случай), и поэтому без нарушения общ- ности в силу однородности функции H по переменным λi можно принять λ0 = 1. П р и м е ч а н и е . Из-за однородности H по λi управление u из (25) определяется не самими величинами λi, а их отно- шениями к одной из них, например, к λ0. Это эквивалентно принятию λ0 = 1. Случай λ0 = 0 является особым (анормальным) и здесь не рассматривается. 3. Условия (24), (25) принципа максимума позволяют найти оптимальные значения всех m компонент вектора u. Если минимум H по u достигается во внутренней точке множества Um и функции if дифференцируемы по u, то *ju опре- деляются из условия ),1(0*mjuHj==∂∂=uu. (35) Это условие совместно с (23) образует условие Эйлера-Лагранжа классического вариационного исчисления для задачи (11) – (13) [24 – 27]. П р и м е ч а н и е . Минимум H по u далеко не всегда достигается во внутренней точке множества mU, а в тех случаях, когда он достигается во внутренней точке, последняя не обязательно является стационарной (рис. 7). Типы минимизирую- щих точек довольно разнообразны. Из них особо следует отметить случаи нестрогого минимума, так как принцип максиму- ма не позволяет для них однозначно определить u*. Этот случай в теории оптимального управления является особым. а – внутренний min H(u) в стационарной точке; б, в – граничный min H(u); г – граничный min H(u); uс1, uс2 – стационарные точки локальных max и min; д – внутренний min H(u) в угловой точке; uс3 – точка перегиба; е – две изолированные минимизирующие точки 2 и 3; ж – нестрогий min H(u) на отрезке 4 – 5 и изолированный min H(u) в точке 6 Если функция H достигает минимального значения в точке на границе mUГ области mU, то условие (35) не является более необходимым в этой точке. При этом возможны три случая: а) множество mU описывается системой связей в виде равенств )...,,2,1(0)...,,,(2 1msuuumS<ν==χ; (36) тогда минимум H при условиях (36) находится методом неопределенных множителей Лагранжа; б) множество mU задано системой неравенств ...),3,2,1(0)...,,,(1 21 1=≤ℵsuuums; (37) тогда задача сводится на каждом шаге интегрирования к проблеме нелинейного программирования; в) множество mU является ограниченной областью, не имеющей границ (например, замкнутой двумерной поверхно- стью типа сферы или эллипсоида в трехмерном пространстве). Для всякой непрерывной функции H(u), имеющей непрерыв- ные частные производные, заданной на замкнутой поверхности и выраженной через параметрические координаты этой по- верхности, точка максимума H по этим параметрическим координатам принадлежит к числу решений (35), где роль ju иг- рают параметрические координаты поверхности. П р и м е р . Пусть ),,(3 21uuuH задана на сфере. Тогда замена ϕθ=cos sin1ru, ϕθ=sin sin2ru, θ= cos3ru приводит к ),,(),,(3 21rHuuuHϕθ= – периодической функции с периодом π2 по θ и ϕ и в точке минимума HH= имеют место равенства 0=∂ϕ∂=∂θ∂HH4. Условия (35) определяют лишь внутреннюю стационарную точку функции H. Если u* = u удовлетворяет системе (35) и доставляет минимум функции H(u), то должны быть выполнены необходимые условия второго порядка: матрица ча- стных производных второго порядка функции H(u) ),1,(2mjiuuHHji=∂∂∂=uu (38) должна быть неотрицательно определенной в точке u* минимума функции H(u). Положительная определенность матрицы Нuu при выполнении условий (35) в точке u* является достаточным условием для относительного (но не абсолютного!) минимума H(u) в этой точке. Условие (38) неотрицательной определенности мат- рицы Нuu представляет собой условия Лежандра-Клебша классического вариационного исчисления [25 – 27]. Проверка положительной определенности матрицы Нuu может проводиться по критерию Сильвестра: для положитель- ной определенности матрицы Нuu необходимо и достаточно, чтобы ее угловые миноры были положительными. В частности, для положительно определенной матрицы Нuu выполняется условие 0det2>∂∂∂u*jiuuH, (39) являющееся аналогом условия Гильберта неособенности (невырожденности) вариационной задачи (см. п. 9.4). 5. Приведенная формулировка принципа максимума остается справедливой и для случая, когда область mU зависит явным образом от времени t: )(tUUmm=З а м е ч а н и е . Принцип максимума является, вообще говоря, лишь необходимым условием. Любое допустимое опти- мальное управление, если оно существует, удовлетворяет принципу максимума. Однако не всякое допустимое управление, удовлетворяющее принципу максимума, является оптимальным. Поэтому после определения управления на основе необхо- димых условий следует убедиться в его оптимальности. Для этого служат достаточные условия оптимальности. В некоторых случаях принцип максимума является не только необходимым, но и достаточным условием оптимально- сти управления u(t). Пусть, например, найдено допустимое управление u*(t), которое переводит заданное начальное состоя- ние 0 0)(xx=t линейной относительно фазовых координат системы mUttA∈+=uuhxx),,()(&, (40) где mU – замкнутое ограниченное множество; A(t), h(u, t) – непрерывные функции t, u; ),...,,(2 1nxxx=x, )...,,,(2 1muuu=uв заданное конечное состояние 1 1)(xx=t. Введем такую систему начальных значений сопряженных переменных 0,),...,,()(00 010 00 0>λλλλ=Tntλ, что u*(t) минимизирует в каждый момент t функцию ),()(),(0 00ttthHTuhλu+λ=по всем mU∈u, где xxλλ∂∂λ−−=)),(()()()(*0 00ttfttAtTT&Тогда управление u*(t) минимизирует на траекториях x*(t) системы (40), проходящих через 1 0,xx, критерий качества ∫+=1 0)],(),([)]([0 0ttdtthtftJuxu, если только ),(0tfx является однозначной выпуклой вниз функцией x для всех ],[1 0ttt∈З а м е ч а н и е . Функция ),(0tfx называется выпуклой вниз по x при ],[1 0ttt∈, если для всех nnRR∈∈xx,),(),()(),(0 00tftftfxxxxxx≤+−∂∂Контрольные вопросы 1. Приведите формулировку принципа максимума. 2. Расскажите о следствиях принципа максимума. 3. Каким условием является принцип максимума? Г л а в а 5 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ СИНТЕЗА ЗАКОНА УПРАВЛЕНИЯ. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 5.1. Задача синтеза оптимального закона управления Для синтеза оптимального закона управления систем с обратной связью, оптимальных замкнутых контуров управления, оптимальных законов наведения и т.д. более естественен другой подход, чем использованный при решении задач, описан- ных в гл. 4, 9. В отличие от уравнений Эйлера–Лагранжа и принципа максимума Понтрягина, использующих временное представле- ние оптимального управления [в форме u* = u(t)] для единичного объекта управления, этот подход рассматривает оптималь- ное управление в форме закона u* = v*(x, t) (координатное управление, управление в форме обратной связи) для множества однородных объектов, отличающихся различными начальными состояниями. С точки зрения механики, этот подход соответствует рассмотрению распространения «волн возбуждения» от некоторо- го источника в неоднородной среде. Общность обоих подходов устанавливает проективная геометрия, с точки зрения кото- рой траектория точки в фазовом пространстве может рассматриваться и как последовательность точек и как огибающая сво- их касательных. Последовательное применение описываемого подхода к задачам оптимального управления приводит для непрерывных процессов к дифференциальному уравнению (нелинейному) в частных производных первого порядка типа уравнения Га- мильтона–Якоби [25 – 27]. Один из возможных способов получения этого уравнения состоит в использовании принципа оптимальности динамиче- ского программирования. Динамическое программирование является довольно общим методом, разработанным для решения общих задач многоэтапного выбора (т.е. задач, в которых результаты предыдущих операций можно использовать для управ- ления ходом будущих операций). 5.2. Принцип оптимальности динамического программирования Принцип оптимальности. В основе динамического программирования лежит сформулированный Р. Беллманом прин- цип оптимальности: «Оптимальная политика обладает тем свойством, что каковы бы ни были начальное состояние и перво- начально принятое решение, последующие решения должны составлять оптимальную политику относительно состояния, получившегося в результате первоначально принятого решения» [19, 28]. Или, оптимальное управление не зависит от того, каким образом пришла система к данному состоянию при tt′= (т.е. не зависит от «предыстории» движения) и для будущих моментов времени полностью определяется лишь состоянием системы в рассматриваемый момент времени. Как частный случай в динамическом программировании рассматриваются задачи управления непрерывными процесса- ми (основная задача оптимального координатного управления). Краткая формулировка задачи. Пусть дана система уравнений движения ),,(uxfxtdtd =, (41) где mTmUuuu∈=)...,,,(2 1u; nTnXxxx∈=)...,,,(2 1x; Tntftftf)),,(...,),,,(),,,((2 1uxuxuxf=, и граничные условия 1 10 0)(;)(xxxx==tt. (42) Требуется синтезировать закон оптимального управления u* = v*(x, t), минимизирующий значение функционала dttftJtt∫=1 0),,(],,[0 00uxux. (43) Необходимые условия. Пусть в (n + 1)-мерном пространстве ),(TXn имеется некоторая область G(x, t) начальных значений )),(),((,0 00 0tGttxxx∈, для каждой точки которой существует оптимальное (в смысле минимума ],,[0 0uxtJуправление u*(t), переводящее эти начальные точки в некоторую фиксированную точку ),)((1 11ttxx=; 1 1, tx – заданы. На таких оптимальных управлениях минимальное значение критерия качества (43) будет зависеть лишь от начальных значений 0 0, tx. Таким образом, ),(0 0*minxtVJJ==, где ),(0 0xtV – некоторая функция (n + 1) переменного 0 10 0...,,,nxxtИмея в виду произвольную точку области G(x, t), в дальнейшем, в целях упрощения записи, нижний индекс «0» будем опускать. Таким образом, функция V(t, 1 2 3 4 5 6 7 8 9 ... 15

ηuℵ. (111) Здесь ∂∂∂∂∂∂∂∂∂∂=∂∂2 12 11 21 12 21 12 21 2,,,,mmmuHuuHuuHuHHLLLLLuУсловия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения 0 0,det)(2 12=∂∂∂∂−∂∂=uuuℵℵTsEHsD. (112) Неравенство нулю определителя матрицы ∂∂∂∂∂∂0 21 2uuuℵℵTH (113) во всех точках x*(t), u*(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u*(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы- вается невырожденной. С л е д с т в и я . 1. Условия для открытого ядра области ),( xtUm (условия (95) – (99)) означают, что во всех точках тра- ектории, в которых минимум H по u, ),( tUmxu∈ достигается при выполнении строгих неравенств ),1(0),,(viti=>ℵux (114) (т.е. в так называемом открытом ядре области ),( tUmx) справедлив принцип максимума (см. п. 4.3), не учитывающий нали- чие связей (89). Здесь все ),1(0 1vii==β и дифференциальные уравнения (95)–(96) при условии (99), дающем ),,(λxuut=имеют единственное решение: λλ=λλ=).,,,();,,,(0 00 00 0iiiiiittttxxxx (115) В этом случае ),,,(0 00ittλ=xuu (116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров ),,,(0 00iixttλ, по крайней мере, непрерывно. Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци- руемо по ),,,(0 00iixttλ2. Если ),,(uxtiℵ не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае ),( tUmx зависит лишь от t: )(tUUmm=3. Условия для границы области ),( tUmx находятся следующим образом. Если при определении минимума H по u часть компонент вектора ℵ удовлетворяются в виде равенств, то недостающие множители jβ могут быть найдены из усло- вий (102). Если минимум H по u достигается во внутренней точке области mU, то управление ju и множители jβ нахо- дятся из условий (102) и тех из (89), которые выполняются в виде равенств 0),,(;0==∂∂+∂∂uxβuutHTℵℵ (117) Из (117) находятся u и β. При этом ),(),,(λxββλxuu== непрерывны в точке соединения, если только в ней нет раз- рыва в функции u(t). Контрольные вопросы 1. Типы граничных условий. 2. Необходимые условия оптимальности. 3. Аналог необходимого условия Клебша. Г л а в а 9 ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав- нений первого порядка, разрешенных относительно производных)*, а управляющие функции u(t) явно не введены (и по ка- ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно- го исчисления. Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен- но для такой системы разработаны эффективные алгоритмы численного интегрирования. 9.1. Задачи Больца, Майера, Лагранжа Задача Больца. Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем. Пусть класс траекторий определяется: 1) кривыми x(t) c координатами 1 0),,1()(tttnitxi≤≤=; 2) параметрами ),1(rjaj=Параметры ja можно рассматривать как некоторые постоянные координаты кривой С: Ytt)),(()(axz= в (n + r)-мерном пространстве, Trnaaxxxz)...,,,...,,,(1 21=Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида ),1(0),,,(nmjtFj<===axx& (118) и условиям ),1(0),,,()),(,),(,(1 01 10 0ρ==+Φ=∫kdttfttttIttkkkaxxaxx&, (119) где Tnxxdtd)...,,(1&&&==xxНеобходимо найти кривую из указанного класса траекторий, которая минимизирует функционал ∫+Φ=1 0),,,(),,,,(1 10 0ttdttfttJaxxaxx&. (120) Задача Майера. Эта задача формально получается из задачи Больца при ),1(0,0ρ=≡≡kffk. В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть 2 2++=ρrn. Если фиксирован век- тор параметров а, то число степеней свободы σ системы дифференциальных уравнений (118), равное разности между чис- лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно: mn−=σЗадача Лагранжа. Эта задача вытекает из задачи Больца при ρ=≡≡Φ,1,0,0kfkВиды связей и граничных условий. Связи вида (119) при )(akkΦ=Φ, т.е. при ∫Φ−=tttkkdttf0)(),,,(aaxx &, где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если 0≡kf, то связи типа (119) задают под- вижные граничные условия. Если связи типа (119) имеют вид ,,0);,1(0)();,1(0)(10 12 200 01 22 11 10 02 22 11 1ttttnkxtxnkxtxnnkkkkkk−≡Φ=−≡Φ==−≡Φ==−≡Φ++где 10 0...,,1txk – заданные числа, то граничные условия называются закрепленными. Если 0;0;,1;,1 10 100 01 21=−=−<==ttttnnknk, то 1n концов закреплено, а остальные условия называются свобод- ными граничными условиями. Если граничные условия 0),,,(1 01 0=Φxxttk при ),1,0(ρ==kfk можно разбить на две группы 0),(0 01=Φxtk; 0),(1 12=Φxtk; nkk<ρρ+ρ=ρ=1 12 11,...,,1,,1 и если ),(),(0 01 1xxthtq−≡Φ, то задача называется задачей с разделенными условиями для концов. Общие условия (119) называются смешанными граничными условиями. 9.2. Первое необходимое условие экстремума функционала в задаче Больца Первое необходимое условие экстремума состоит из: • правила множителей Лагранжа; • уравнений Эйлера–Лагранжа; • условий Эрдмана–Вейерштрасса; • условий трансверсальности. Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по )(tx&) ва- риации )()()(),()()(ttttttxxxxxx&&&−=δ−=δ по любым совместимым со связями (118) направлениям в пространстве nnXX∈x, и функции kkffΦΦ,,, обладают непрерывными производными до третьего порядка. Тогда необходимые ус- ловия экстремума формулируются следующим образом. Правило множителей Лагранжа: существуют функции µ0, µk, )(tjλ и функции ∑∑ρ==++=1 10),,,()(kmjjjkktFtffFaxxλµµ&; (121) ∑ρ=Φ+Φ=1 11 00 11 00 0)),(,),(,()),(,),(,(kkkttttttttLaxxµaxxµ (122) такие, что множители kµµ,0 0≥ – постоянные и решение исходной задачи на условный экстремум лежит среди решений задачи на безусловный экстремум для вспомогательного функционала ∫+=1 0ttFdtLJВсегда можно считать 1 0=µ, за исключением особых (анормальных) случаев. Уравнения Эйлера–Лагранжа. Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа: tnixiFFxFdtdi=−∑=1&&; (123) ),1(0niFdtdFiixx==−&, (124) где tFFxFFxFFtixixii∂∂=∂∂=∂∂=;;&&З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все )(txi обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу. CFxFnixii=−∑=1&& (125) в силу (127), (128), непрерывному при переходе через угловую точку. Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119). Условия Эрдмана–Вейерштрасса. Величины ∑=−nixiiFxF1&& и ),1(niFix=& непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при tt′= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте )(txi имеет место разрыв (перво- го рода) в производной: ++′=−′==≠=ittittiixdttdxdttdxx&&0 0)()(, (126) то справедливы соотношения ),1(niFxFxFFiiiiiixxxixxix==∂∂=∂∂=+==+&&&&&&&& (127) и 1 11 1∑∑∑∑=+++=====−=−=−=−+−nixixxnixixxnixinixiiiiiiiiiFxFFxFFxFFxF&&&&&&&&&&&&(128) Здесь ),...,(;),...,,(;),,,(;),,,(2 12 1TnTnxxxxxxtFFtFF−−−−++++=+=−=====+−&&&&&&&&&&&&&&xxaxxaxxxxxxУсловие трансверсальности. Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство ∑∫∑∑====+++−rjttjaniixnixidtdaFdLdxFdtFxFjii1 10 11 10 0&&& (129) выполняется тождественно для jiiiidatdxdxtdxdxdtdt),(),(,,1 10 01 0== (т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции ),),(),(,,(1 01 0kttttL1 ... 7 8 9 10 11 12 13 14 15

µaxx: ∑∑∑===∂∂+∂∂+∂∂+∂∂+∂∂=rjjjniiiniiidaaLdxxLdttLdxxLdttLdL1 11 11 11 00 00. (130) З а м е ч а н и е . Если )(),(1 10 0aatttt==, то jrjjdaatdt∑=∂∂=1 00)(a, ∑=∂∂=rjjjdaatdt1 11)(a. В силу независимости величин 1 01 0,,,iidxdxdtdt условие (129) эквивалентно 2n + 2 + r равенствам вида ),1(0,...,0 11 11 1nidxxLFdttLFxFittixttnixiii==∂∂+=∂∂+−===∑&&&; (131) ),1(0...,,0 01 00nidxxLFdttLFxFittixttnixiii==∂∂+∂∂+−===∑&&&; (132) ),1(0 10nidadtaFaLjttjj==∂∂+∂∂∫, (133) число которых достаточно для того, чтобы совместно с уравнениями (118), (119), (124) определить недостающие значения ),1(),,1()(),,1()(),,1(,0rjanitxmjtkjijk===ρ=λµµ9.3. Второе необходимое условие минимума функционала в задаче Больца (условие Вейерштрасса) для случая f≡ 0, fk≡ 0 Для допустимой кривой С: {x = x(t), a}, реализующей минимум в задаче Больца, всегда существует такая система мно- жителей ),1()(),,0(mjtkjk=ρ=λµ, что для кривой С с этими множителями выполняется правило множителей (см. п. 9.2), а для всякого элемента ),,,,(λµxx &t (в том числе и в угловых точках) кривой С функция Вейерштрасса ),,,,(XλxxE&&t: ∑=−−−=nixiitFxXtFtFti1),,,()(),,,(),,,(),,,,(λxxλxxλXxXλxxE&&&&&&&& (134) удовлетворяет неравенству 0),,,,(≥XλxxЕ&&t. (135) Неравенство (135) имеет место при всех возможных допустимых элементах ),,,(λXx&t, не совпадающих с элементами ),,,(λxx&t кривой С, но удовлетворяющих условиям ),1(0),,,(mjtFj==axx &Если минимизирующая кривая C: {x = x(t), a} нормальна, то система множителей ),1,,1()(λ,µ,1µ0ρ===kmjtjk – единственна и условие Вейерштрасса для этой системы выполняется. 9.4. Третье необходимое условие минимума в задаче Больца (условие Лежандра–Клебша) для случая f = 0, fk = 0 Если кривая С: {x = x(t), a} реализует минимум в задаче Больца, то всегда найдется такая система множителей µ0, µk),1(ρ=k, ),1()(λmjtj=, что для этой кривой С удовлетворяется правило множителей, а для всякого ее элемента ),,,,(λµxx&tвыполняется неравенство 0ξξ),,,(1 1≥∑∑==ninkkixxtFkiλxx&&& (136) при любых )0...,,0,0()...,,,(2 1≠ξξξ=nξ, удовлетворяющих уравнениям ),1(0),,(1mjtFinixjj==∑=ξxx&&, (137) где kixxijjxxxFFxFFkii&&&&&∂∂∂=∂∂=2;В рассматриваемой задаче важную роль играет матрица =αγ0)(0TxxxxFFFFFFkikixxxx&&&&&&&& (138) ),1,(;),...,,(),...,,(),,1,(2 21 21mxxFFxxxFFFFnkikinm=γα∂∂∂=∂∂==&&&&&&&&xxxОпределитель этой матрицы называется определителем Гильберта. Вариационные задачи с отличным от нуля опреде- лителем Гильберта называется регулярными (невырожденными). 9.5. Четвертое необходимое условие в задаче Больца (условие Якоби–Майера–Кнезера) Условие Якоби–Майера–Кнезера носит нелокальный (интегральный) характер и характеризует экстремальность всей кривой в целом на основе рассмотрения поведения экстремалей, лежащих в малой окрестности от данной экстремали. Условие Якоби–Майера–Кнезера. Чтобы экстремаль C: {x(t)} доставляла на отрезке ],[1 0tt минимум функционалу в задаче Больца, необходимо, чтобы отрезок ],[1 0tt не содержал точек, сопряженных с 0tСопряженная точка. Считается, что экстремаль C: {x(t)} имеет на интервале ),(1 0tt точку t, 1 0 ttt<<, сопряженную с 0t, если существует последовательность экстремалей, выходящих из той же начальной точки ))(,(0 0ttx и бесконечно близких к данной экстремали x(t), такая, что каждая из этих экстремалей пересекает данную экстремаль x(t) и последова- тельность точек пересечения имеют точку tсвоим пределом. Сопряженная точка ))(,(ttx является точкой касания экстре- мали x(t) с огибающей семейства экстремалей, в которое данная экстремаль x(t) включена (заметим, что огибающая может вырождаться в точку). Это показывает, что в сопряженной точке ))(,(tt x расстояние между данной экстремалью x(t) и про- извольной близкой экстремалью )( tx, выходящей из той же начальной точки ))(,(0 0ttx, есть величина выше первого поряд- ка малости по сравнению с указанным расстоянием вне сопряженной точки ))(,(ttx (т.е. при ttt0<≤). Методы определения сопряженных точек весьма трудоемки. В частности, они могут основываться на вычислении опре- делителей Майера–Кнезера. Для задачи Майера (см. п. 9.1) с закрепленными концами ,),,1(0),,(1 0tttmjtFj≤≤==xx & (139) где 1 0, tt – заданные числа, ))(...,),((ˆ)(ˆ,)(1 11 11 10 0txtxttn−===xxxx, (140) где 1 0ˆ,xx – заданные векторы, и с функционалом )(),,,(1 10 10txttJn=Φ=xx (141) сопряженная точка tможет быть вычислена как момент времени, в который обращается в нуль определитель Кнезера: 0),(),(),(),(),...,,(),...,,(),(0,1 01 10 01 0,1 01 10 010,1 20 10 12 10=∂λλ∂∂λλ∂∂λλ∂∂λλ∂=λλλ∂∂=λ=−−−−=−−ttnnnnttnntxtxtxtxxxxtDLLLLL, (142) Tn)...,,,(0,1 20 10 0−λλλ=λ; (143) где )),(...,),,((),(0 10 10λλλxtxtxxn−=) – экстремаль, удовлетворяющая при 0λλ= заданным условиям (140). З а м е ч а н и е . При применении численных методов решения краевой задачи иногда [например, в методе Ньютона] од- новременно с основной экстремалью x(t) вычисляется (n – 1) дополнительных экстремалей )(1tn−x, лежащих в близкой окре- стности к основной и выходящих из той же точки (начальной) ),(0 0xt по линейно-независимым направлениям (соответст- вующим линейно-независимым начальным условиям для множителей Лагранжа 0λ). В этом случае можно утверждать, что точка t будет сопряженной с точкой 0t в сформулированной выше задаче, если в точке t определитель ttnnnnnnnnntxtxtxtxtxtxtxtxtxtxtxtxtxtxtxtxtxtxt1 11)1(2 2)1(1 1)2(1 1)2(2 2)2(1 1)1(1 1)1(2 2)1(1 10)()(,),()(),()()()(,),()(),()()()(,),()(),()(),(=−−−−−−−−−−−−−−−−−−=λ∆LLLLLLL(144) представляет бесконечно малую величину более высокого порядка, чем при ttt0≤≤Контрольные вопросы 1. Задачи Больца, Майера, Лагранжа; привести формулировки. 2. Первое необходимое условие экстремума функционала в задаче Больца. 3. Второе необходимое условие минимума функционала в задаче Больца (условие Вейерштрасса) для случая f ≡ 0, fk≡ 0. 4. Третье необходимое условие минимума в задаче Больца (условие Лежандра–Клебша) для случая f = 0, fk = 0. 5. Четвертое необходимое условие в задаче Больца (условие Якоби–Майера–Кнезера). Г л а в а 1 0 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ С РАЗРЫВНЫМИ ФАЗОВЫМИ КООРДИНАТАМИДля ряда технических систем, в частности механики полета (особенно для ракетодинамики) важен случай, в котором допускаются конечные разрывы (разрывы первого рода) в фазовой траектории (например, мгновенный «сброс» массы после отделения ступени). При расчете ступенчатых ракет, химических реакторов, а также целого ряда химико-технологических и информационных процессов, полезны результаты следующей задачи с фиксированным заранее числом разрывов и варьи- руемой переменной величиной «скачка» в точке разрыва. 10.1. Краткая формулировка задачи Пусть q – 1 – число интервалов, внутри которых траектория непрерывна; ),1(qjtj= – моменты времени, в которые на- ступают разрывы фазовых координат. Точки jt считаются в общем случае неизвестными. Индекс j указывает, что функции рассматриваются на j-ом отрезке времени 1+≤≤jjtttНа каждом j-ом отрезке задана система связей 0))(),(,()(=tttjxxF&, (145) где ,)...,,,(;)...,,,(;)...,,,(2 12 1)()(2)(1)(TnTnTjmjjjxxxxxxFFF&&&& ===xxFи краевые условия в точке разрыва функций )(txi0))(),(,(=−+srjtttxxg, (146) где )1(2;;2;;1 1;;,1;)...,,,(2 12 1qnqpttttqjjsqjjrqjgggqjTp+−≤<<<<<≤≤=−≤≤===gТребуется минимизировать функционал ))(),(,(−+Φ=srjtttJxx. (147) З а м е ч а н и е . Здесь величины )(+rt1 ... 7 8 9 10 11 12 13 14 15

x
t
может толковаться либо как связь, наложенная на начальные значения
)
,
(
0 0
x
t
, либо как связь, наложенная на конечные значения
)
,
(
1 1
x
t
, в зависимости от порядка следования участков с
0 1
>
φ
и
0 1
=
φ
При трех участках, если сначала идет граничный участок, затем участок с
0 1
>
φ
и далее снова граничный участок, множители тоже непрерывны вдоль всей траектории. При всех других порядках следования участков, если последних боль- ше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях
)
(t
i
λ
можно осуществить на любом конце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, на котором происходит скачок, не имеет значения). Если этот конец выбран в момент времени
2
t′
, то условия скачка имеют вид
x
λ
λ
∂
φ
∂
−
=
−
+
)
(
)
(
)
(
2 1
2 2
t
C
t
t
; (81)
t
t
C
t
H
t
H
∂
′
∂φ
+
′
=
′
−
+
)
(
)
(
)
(
2 1
2 1
2
; (82)
0
)
(
2 1
=
′
φ
−
t
, (83) где С – произвольная постоянная; индексы «+» и «–» обозначают пределы справа и слева, соответственно.
Если условия (81) подставить в (82), то коэффициент при С будет
1
φ&
и, таким образом, условие (82) не зависит от С, а содержит только значения
)
(
2
t′
λ
−
. После указанной подстановки уравнение (82) может быть использовано в качестве экви- валентного необходимого условия.

В данной задаче решение
)
(
),
(
t
t λ
x
не зависит от
0
i
λ
, С как от параметров
)
,
,
(
);
,
,
(
0 0
C
t
C
t
i
i
λ
=
λ
=
λ
λ
x
x
В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина С не может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точку схода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом пара- метров, что существенно усложняет ее практическое решение даже с помощью ЭВМ.
П р и м е р 3. Пусть имеются три участка оптимальной траектории, следующие в таком порядке:
1 участок – траектория в открытой области,
0 1
>
φ
;
2 участок – граничная траектория,
0 1
=
φ
;
3 участок – снова траектория в открытой области,
0 1
>
φ
Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных
C
t
i
,
,
1 0
λ
. Условия
(82), (83) и
0
)
0
(
2
=
+
′
β t
(84) определяют точку
2
t′
и дают дополнительное уравнение относительно неизвестных
C
t
i
,
,
1 0
λ
. Задача, таким образом, све- лась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными.
Если участков больше, чем три, задача сводится к многоточечной краевой проблеме.
7.4. Второй тип необходимых условий для оптимальности
управления на граничных участках
Пусть вх
t
– момент входа траектории на границу допустимой области, сх
t
– момент схода с этой границы. Гамильтони- ан
2
H
для граничных участков может быть представлен в следующем виде:
1 2
1 1
1 1
2 1
1 0
0 2
φ
β
+
φ
β
+
=
φ
β
+
φ
β
+
λ
+
λ
=
∑
=
&
&
H
f
f
H
n
i
i
i
, где
,
0 2
1
=
β
=
β
если
0 1
>
φ
;
0
,
0 2
1
≠
β
≠
β
, если
0 1
=
φ
, а
1
φ&
определяется правой частью соотношения (78).
На граничном участке (т.е. при сх вх
t
t
t
≤
≤
) вдоль оптимальной траектории выполняются условия
0
,
0
,
,
1 1
2 2
=
φ
=
φ






∂
∂
−
=






∂
∂
=
&
&
&
T
t
H
H
x
λ
λ
x
. (85)
Оптимальное управление на граничном участке определяется из условия минимума H по
)
,
(
1
x
u
t
U
m
∈
, где
)
,
(
1
x
t
U
m
– та часть значений u из области
m
U
, которая удовлетворяет условию
0
)
,
,
(
1
=
φ
u
x
t
Если минимум H по u в области
)
,
(
1
x
t
U
m
достигается в ее внутренней точке, то
0
)
,
,
(
,
0
)
,
(
,
0
))
,
,
(
(
1 1
2 2
=
φ
=
φ
=
φ
∂
∂
β
+
∂
∂
=
∂
∂
u
x
x
u
x
u
u
u
t
t
t
H
H
&
&
Значения вектора
λ
и гамильтониана
2
H
непрерывны в точке входа на границу допустимой области:
)
0
(
)
0
(
);
0
(
)
0
(
вх
2
вх
2
вх вх
−
=
+
−
=
+
t
H
t
H
t
t
λ
λ
Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см. п. 4.3). В частности, из этих условий следует, что при
1
t
t
=
))
(
,
(
))
(
,
(
;
)
(
1 1
1 1
1 1
t
t
t
t
L
L
t
T
t
t
T
x
q
µ
x
x
λ
+
Φ
=






∂
∂
=
=
;
0
)
(
1 2
1
=
+
∂
∂
t
H
t
L
(если
1
t
– не задано).
Кроме того, к этим условиям надо добавить заданное граничное условие (76):
0
))
(
,
(
1 1
=
t
t
x
q
Контрольные вопросы
1. Необходимые условия оптимальности.

2. Первый тип необходимых условий оптимальности для граничных участков траектории.
3. Второй тип необходимых условий для оптимальности управления на граничных участках.
Г л а в а 8
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ
ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО
ФАЗОВЫЕ КООРДИНАТЫ
x И УПРАВЛЕНИЕ u
При рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функ- ций не должны превосходить пределов, зависящих от текущего состояния системы.
Ограничения рассматриваемого типа можно записать в виде
0
)
,
,
(
≤
u
x
t
ℵ
, (86) где
ℵ
явным образом зависит от состояния x и управления u. Принцип максимума, сформулированный в п. 4.3, справедлив лишь для неравенств типа
0
)
,
(
≤
u
t
i
ℵ
, (87) т.е. не содержащих фазовых координат x явно.
Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86).
8.1. Краткая формулировка задачи
Пусть эволюция системы S описывается векторным дифференциальным уравнением
)
,
(
u
x,
f
x
t
dt
d =
, (88) где
T
n
x
x
x
)
...,
,
,
(
2 1
=
x
– n-мерный вектор состояния;
T
m
u
u
u
)
...,
,
,
(
2 1
=
u
– m-мерный вектор управления.
На значения управляющего вектора u наложены ограничения
0
)
,
,
(
≥
u
x
t
ℵ
, (89) где
T
v
)
...,
,
,
(
1 2
1
ℵ
ℵ
ℵ
=
ℵ
–
1
v
-мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, не превосходит m.
Область
m
U
допустимых значений u зависит от t, x:
)
,
( x
t
U
U
m
m
=
и задается уравнением (89). Предполагается, что вектор u явно входит в уравнение (89).
В начальный момент времени
0
t
t
=
задано состояние системы
0 0
)
(
x
x
=
t
. (90)
Необходимо перевести систему S из состояния
0
x
в некоторое конечное состояние, определяемое соотношениями
0
))
(
,
(
1 1
=
t
t
x
q
, (91) где
1
),
...,
,
,
(
2 2
1 2
+
≤
=
n
l
q
q
q
l
q
Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционал
∫
+
Φ
=
1 0
)
,
,
(
))
(
,
(
]
[
0 1
1
t
t
dt
t
f
t
t
J
u
x
x
u
(92) принимает минимальное значение на решениях системы (88).
Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывными производными. Точки
α
t
, где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точ- ками. Точки
s
t
, в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (89), называют- ся точками соединения.
8.2. Типы граничных условий
Задача, в которой
0
))
(
,
(
1 1
≡
Φ
t
t
x
, а граничные условия (97) имеют вид
)
,
1
(
0
)
(
2 1
1
n
l
i
x
t
x
i
i
≤
=
=
−
(93) или
)
1
,
1
(
0
)
(
2 1
1
n
l
i
x
t
x
i
i
≤
−
=
=
−
, (94)

0
зад
1
=
− t
t
, где зад
1
, t
x
i
– заданные числа, называется иногда простейшей.
При
n
l
=
2
условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При
n
l
<
2
условия
(93) приводят к задаче с частично свободным правым концом и свободным временем
1
t
. Условия типа (94) относятся к зада- че с закрепленным временем зад
1
t
t
=
и частично свободным правым концом траектории.
8.3. Необходимые условия оптимальности
Если
)
,
(
)
(
*
t
U
t
m
x
u
∈
[
m
U
определяется условиями (89)] является управлением, минимизирующим функционал J[u], то найдутся такие постоянные числа
T
l
)
...,
,
(
,
1 2
1 0
µ
µ
=
=
λ
µ
, не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы
T
n
t
t
t
))
(
...,
),
(
)
(
1
λ
λ
=
λ
(непрерывный на
]
,
[
1 0
t
t
) и
T
v
t
t
t
))
(
...,
),
(
(
)
(
1 1
β
β
=
β
(непрерывный на
]
,
[
1 0
t
t
всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосторонние пределы), что на
]
,
[
1 0
t
t
имеют место соотношения
T
T
T
H
H
dt
d






∂
∂
−
=






∂
∂
−






∂
∂
−
=
x
β
x
x
λ
1
ℵ
; (95)
T
T
H
H
dt
d






∂
∂
=






∂
∂
=
λ
λ
x
1
; (96)
)
,
1
(
0 1
v
j
j
j
=
=
ℵ
β
, (97) где
0
≤
β
. (98)
Для всех фиксированных
)
,
,
(
λ
x
t
и u, удовлетворяющих (89), выполняется принцип максимума (см. п. 4.3)
)
,
,
,
(
)
,
,
,
(
*
u
λ
x
u
λ
x
t
H
t
H
≤
, (99) т.е.
)
,
,
,
(
)
,
,
,
(
min
*
u
λ
x
u
λ
x
t
H
t
H
m
U
u
=
∈
, где гамильтониан H определяется, как и в п. 4.2, выражением
f
λ
T
f
H
+
λ
=
0 0
, (100) а
ℵ
T
H
H
β
+
=
1
. (101)
Если минимум H достигается во внутренней точке области
m
U
, то
β
u
u
u
T
H
H






∂
∂
+
∂
∂
=
∂
∂
ℵ
1
. (102)
В угловых точках
α
t
выполняются следующие условия: а) сопряженный вектор
)
(t
λ
непрерывен, т.е.
)
0
(
)
0
(
−
=
+
α
α
t
t
λ
λ
; (103) б) функция H непрерывна, т.е.
))
0
(
),
(
),
(
,
(
))
0
(
),
(
),
(
,
(
*
*
−
=
+
α
α
α
α
α
α
α
α
t
t
t
t
H
t
t
t
t
H
u
λ
x
u
λ
x
(104)
(условие (99) соблюдается со знаком равенства); в) уравнения (97) и (102) сохраняются.
Условия a) – в) являются аналогом условий Вейерштрасса–Эрдмана.
В конечной точке
(
)
1 1
, x
t
для любых значений
)
(
,
1 1
t
d
dt
x
выполняются условия трансверсальности
0
)
(
1 1
1 1
0 1
1
=








−






∂
∂
+






∂
Φ
∂
+






∂
∂
+
∂
Φ
∂
+
+
=
=
t
d
dt
t
t
f
T
t
t
T
T
t
t
T
T
x
λ
µ
x
q
x
q
µ
f
λ
;
(105)
0
))
(
,
(
1 1
=
t
t x
q
Из (105) следует, что

1 1
1 1
0 1
)
(
)
(
t
T
t
T
t
t
f
t
H






∂
∂
+
∂
Φ
∂
−
=
+
=
q
µ
f
λ
; (106)
1
)
(
1
t
T
T
t














∂
∂
+






∂
Φ
∂
=
µ
x
q
x
λ
. (107)
Для простейшей задачи условия (106) и (107) упрощаются. Так, например, в случае (93) они имеют вид





+
=
=
λ
=
µ
=
λ
=
).
,
1
(
0
)
(
);
,
1
(
)
(
;
0
)
(
2 1
2 1
1
n
l
i
t
l
i
t
t
H
i
i
i
(108)
8.4. Аналог необходимого условия Клебша
Обозначим через
ℵ
те компоненты вектора ограничений
ℵ
, которые в каждой точке минимизирующей кривой x
*
(t),
u
*
(t) удовлетворяются в виде равенств. Пусть β – соответствующий им вектор множителей. Тогда
ℵ
T
H
H
β
+
=
1
(109) и для внутренних точек области
m
U
на минимизирующем управлении u
*
(t) имеет место неравенство
0 2
1 2
≥
∂
∂
η
u
η
H
T
(110) для всех
0
)
...,
,
,
(
2 1
≠
η
η
η
=
T
m
η
, удовлетворяющих условию
0
=
∂
∂

1 ... 7 8 9 10 11 12 13 14 15

η
u
ℵ
. (111)
Здесь
















∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
∂
∂
2 1
2 1
1 2
1 1
2 2
1 1
2 2
1 2
,
,
,
,
m
m
m
u
H
u
u
H
u
u
H
u
H
H
L
L
L
L
L
u
Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения
0 0
,
det
)
(
2 1
2
=












∂
∂






∂
∂
−
∂
∂
=
u
u
u
ℵ
ℵ
T
sE
H
s
D
. (112)
Неравенство нулю определителя матрицы












∂
∂






∂
∂
∂
∂
0 2
1 2
u
u
u
ℵ
ℵ
T
H
(113) во всех точках x
*
(t), u
*
(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u
*
(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы- вается невырожденной.
С л е д с т в и я . 1. Условия для открытого ядра области
)
,
( x
t
U
m
(условия (95) – (99)) означают, что во всех точках тра- ектории, в которых минимум H по u,
)
,
( t
U
m
x
u
∈
достигается при выполнении строгих неравенств
)
,
1
(
0
)
,
,
(
v
i
t
i
=
>
ℵ
u
x
(114)
(т.е. в так называемом открытом ядре области
)
,
( t
U
m
x
) справедлив принцип максимума (см. п. 4.3), не учитывающий нали- чие связей (89). Здесь все
)
,
1
(
0 1
v
i
i
=
=
β
и дифференциальные уравнения (95)–(96) при условии (99), дающем
)
,
,
(
λ
x
u
u
t
=
имеют единственное решение:




λ
λ
=
λ
λ
=
).
,
,
,
(
);
,
,
,
(
0 0
0 0
0 0
i
i
i
i
i
i
t
t
t
t
x
x
x
x
(115)
В этом случае
)
,
,
,
(
0 0
0
i
t
t
λ
=
x
u
u
(116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
, по крайней мере, непрерывно.
Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци- руемо по
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
2. Если
)
,
,
(
u
x
t
i
ℵ
не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае
)
,
( t
U
m
x
зависит лишь от t:
)
(t
U
U
m
m
=
3. Условия для границы области
)
,
( t
U
m
x
находятся следующим образом. Если при определении минимума H по u часть компонент вектора
ℵ
удовлетворяются в виде равенств, то недостающие множители
j
β
могут быть найдены из усло- вий (102). Если минимум H по u достигается во внутренней точке области
m
U
, то управление
j
u
и множители
j
β
нахо- дятся из условий (102) и тех из (89), которые выполняются в виде равенств
0
)
,
,
(
;
0

=
=






∂
∂
+
∂
∂
u
x
β
u
u
t
H
T
ℵ
ℵ
(117)
Из (117) находятся u и
β

. При этом
)
,
(

),
,
(
λ
x
β
β
λ
x
u
u
=
=
непрерывны в точке соединения, если только в ней нет раз- рыва в функции u(t).
Контрольные вопросы
1. Типы граничных условий.
2. Необходимые условия оптимальности.
3. Аналог необходимого условия Клебша.
Г л а в а 9
ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО
ИСЧИСЛЕНИЯ
Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав- нений первого порядка, разрешенных относительно производных)
*
, а управляющие функции u(t) явно не введены (и по ка- ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно- го исчисления.
Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен- но для такой системы разработаны эффективные алгоритмы численного интегрирования.
9.1. Задачи Больца, Майера, Лагранжа
Задача Больца
.
Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.
Пусть класс траекторий определяется:
1) кривыми x(t) c координатами
1 0
),
,
1
(
)
(
t
t
t
n
i
t
x
i
≤
≤
=
;
2) параметрами
)
,
1
(
r
j
a
j
=
Параметры
j
a можно рассматривать как некоторые постоянные координаты кривой С:
Y
t
t
)
),
(
(
)
(
a
x
z
=
в (n + r)-мерном пространстве,
T
r
n
a
a
x
x
x
z
)
...,
,
,
...,
,
,
(
1 2
1
=
Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида
)
,
1
(
0
)
,
,
,
(
n
m
j
t
F
j
<
=
=
=
a
x
x
&
(118) и условиям

)
,
1
(
0
)
,
,
,
(
)
),
(
,
),
(
,
(
1 0
1 1
0 0
ρ
=
=
+
Φ
=
∫
k
dt
t
f
t
t
t
t
I
t
t
k
k
k
a
x
x
a
x
x
&
, (119) где
T
n
x
x
dt
d
)
...,
,
(
1
&
&
&
=
=
x
x
Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал
∫
+
Φ
=
1 0
)
,
,
,
(
)
,
,
,
,
(
1 1
0 0
t
t
dt
t
f
t
t
J
a
x
x
a
x
x
&
. (120)
Задача Майера
.
Эта задача формально получается из задачи Больца при
)
,
1
(
0
,
0
ρ
=
≡
≡
k
f
f
k
. В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть
2 2
+
+
=
ρ
r
n
. Если фиксирован век- тор параметров а, то число степеней свободы
σ системы дифференциальных уравнений (118), равное разности между чис- лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно:
m
n
−
=
σ
Задача Лагранжа
.
Эта задача вытекает из задачи Больца при
ρ
=
≡
≡
Φ
,
1
,
0
,
0
k
f
k
Виды связей и граничных условий. Связи вида (119) при
)
(a
k
k
Φ
=
Φ
, т.е. при
∫
Φ
−
=
t
t
t
k
k
dt
t
f
0
)
(
)
,
,
,
(
a
a
x
x &
, где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если
0
≡
k
f
, то связи типа (119) задают под- вижные граничные условия. Если связи типа (119) имеют вид
,
,
0
);
,
1
(
0
)
(
);
,
1
(
0
)
(
10 1
2 2
00 0
1 2
2 1
1 1
0 0
2 2
2 1
1 1
t
t
t
t
n
k
x
t
x
n
k
x
t
x
n
n
k
k
k
k
k
k
−
≡
Φ
=
−
≡
Φ
=
=
−
≡
Φ
=
=
−
≡
Φ
+
+
где
10 0
...,
,
1
t
x
k
– заданные числа, то граничные условия называются закрепленными.
Если
0
;
0
;
,
1
;
,
1 10 1
00 0
1 2
1
=
−
=
−
<
=
=
t
t
t
t
n
n
k
n
k
, то
1
n
концов закреплено, а остальные условия называются свобод- ными граничными условиями.
Если граничные условия
0
)
,
,
,
(
1 0
1 0
=
Φ
x
x
t
t
k
при
)
,
1
,
0
(
ρ
=
=
k
f
k
можно разбить на две группы
0
)
,
(
0 0
1
=
Φ
x
t
k
;
0
)
,
(
1 1
2
=
Φ
x
t
k
;
n
k
k
<
ρ
ρ
+
ρ
=
ρ
=
1 1
2 1
1
,
...,
,
1
,
,
1
и если
)
,
(
)
,
(
0 0
1 1
x
x
t
h
t
q
−
≡
Φ
, то задача называется задачей с разделенными
условиями для концов.
Общие условия (119) называются смешанными граничными условиями.
9.2. Первое необходимое условие экстремума функционала
в задаче Больца
Первое необходимое условие экстремума состоит из:
• правила множителей Лагранжа;
• уравнений Эйлера–Лагранжа;
• условий Эрдмана–Вейерштрасса;
• условий трансверсальности.
Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по
)
(t
x&
) ва- риации
)
(

)
(
)
(
),
(

)
(
)
(
t
t
t
t
t
t
x
x
x
x
x
x
&
&
&
−
=
δ
−
=
δ
по любым совместимым со связями (118) направлениям в пространстве
n
n
X
X
∈
x
,
и функции
k
k
f
f
Φ
Φ,
,
,
обладают непрерывными производными до третьего порядка. Тогда необходимые ус- ловия экстремума формулируются следующим образом.
Правило множителей Лагранжа
: существуют функции
µ
0
,
µ
k
,
)
(t
j
λ
и функции
∑
∑
ρ
=
=
+
+
=
1 1
0
)
,
,
,
(
)
(
k
m
j
j
j
k
k
t
F
t
f
f
F
a
x
x
λ
µ
µ
&
; (121)
∑
ρ
=
Φ
+
Φ
=
1 1
1 0
0 1
1 0
0 0
)
),
(
,
),
(
,
(
)
),
(
,
),
(
,
(
k
k
k
t
t
t
t
t
t
t
t
L
a
x
x
µ
a
x
x
µ
(122) такие, что множители
k
µ
µ
,
0 0
≥
– постоянные и решение исходной задачи на условный экстремум лежит среди решений

задачи на безусловный экстремум для вспомогательного функционала
∫
+
=
1 0
t
t
Fdt
L
J
Всегда можно считать
1 0
=
µ
, за исключением особых (анормальных) случаев.
Уравнения Эйлера–Лагранжа
.
Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа:
t
n
i
x
i
F
F
x
F
dt
d
i
=








−
∑
=1
&
&
; (123)
)
,
1
(
0
n
i
F
dt
d
F
i
i
x
x
=
=
−
&
, (124) где
t
F
F
x
F
F
x
F
F
t
i
x
i
x
i
i
∂
∂
=
∂
∂
=
∂
∂
=
;
;
&
&
З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все
)
(t
x
i
обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу.
C
F
x
F
n
i
x
i
i
=
−
∑
=1
&
&
(125) в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
Условия Эрдмана–Вейерштрасса
.
Величины
∑
=
−
n
i
x
i
i
F
x
F
1
&
&
и
)
,
1
(
n
i
F
i
x
=
&
непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при
t
t
′
= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте
)
(t
x
i
имеет место разрыв (перво- го рода) в производной:
+
+
′
=
−
′
=
=
≠
=
i
t
t
i
t
t
i
i
x
dt
t
dx
dt
t
dx
x
&
&
0 0
)
(
)
(
, (126) то справедливы соотношения
)
,
1
(
n
i
F
x
F
x
F
F
i
i
i
i
i
i
x
x
x
i
x
x
i
x
=
=
∂
∂
=
∂
∂
=
+
=
=
+
&
&
&
&
&
&
&
&
(127) и
1 1
1 1
∑
∑
∑
∑
=
+
+
+
=
=
=
=
=
−
=








−
=








−
=
−
+
−
n
i
x
i
x
x
n
i
x
i
x
x
n
i
x
i
n
i
x
i
i
i
i
i
i
i
i
i
F
x
F
F
x
F
F
x
F
F
x
F
&
&
&
&
&
&
&
&
&
&
&
&
(128)
Здесь
)
,...,
(
;
)
,...,
,
(
;
)
,
,
,
(
;
)
,
,
,
(
2 1
2 1
T
n
T
n
x
x
x
x
x
x
t
F
F
t
F
F
−
−
−
−
+
+
+
+
=
+
=
−
=
=
=
=
=
+
−
&
&
&
&
&
&
&
&
&
&
&
&
&
&
x
x
a
x
x
a
x
x
x
x
x
x
Условие трансверсальности
.
Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство
∑∫
∑
∑
=
=
=
=
+
+








+








−
r
j
t
t
j
a
n
i
i
x
n
i
x
i
dt
da
F
dL
dx
F
dt
F
x
F
j
i
i
1 1
0 1
1 1
0 0
&
&
&
(129) выполняется тождественно для
j
i
i
i
i
da
t
dx
dx
t
dx
dx
dt
dt
),
(
),
(
,
,
1 1
0 0
1 0
=
=
(т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции
)
,
),
(
),
(
,
,
(
1 0
1 0
k
t
t
t
t
L
1 ... 7 8 9 10 11 12 13 14 15

Смотрите также файлы

Место и роль в современном обществе информационных технологий.rtf

Внеклассное мероприятие для учащихся 68 классов.ppt

Вещное право.docx

Лекция 6. Диагностирование и то рулевого управления. Составитель В. В. Кострицкий, ст преподаватель Новополоцк 2015.pdf

Выбор профессии. Использование терминов и профессионализмов в тексте.docx

Файл: Специальные разделы теории управления. Оптимальное управление.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно