Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 101

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Ю2

,

H

- i

,

+Z,b"i-n

J" ,

 

(11.12a)

а условия

оптимальности

(Il.ICja)

и

( I I . Н а )

почти не изме­

нятся

 

 

~ •.

 

 

 

 

 

 

 

 

Ш

^

6

°

 

 

 

 

 

^ К

 

 

 

1 - 0 , 1

л - i

 

Л

'

-

 

 

 

 

 

i =

0,2,

. . . , П ,

J =

1,2

, , . . , m .

Необходимые условия оптимальности в такой форке составляют оодеркание дискретного принципа максимума

Н . Э . Связь, разрешенная относительно управления ;

Условия оптимальности для ограниченных фазовых координат примут вид:

2,1^.

'Л'' о

 

( П Л 4 )

/ЪАО'А;*)

, b/fiyrf.,;

.

)

Последнее условие с учетом ( I I . 14) можно переписать в фор­

ме

15)


щ

Применить необходимые условия

оптимальности (II . 13) или

( I I . 15) оовместно о уравнениями

связи для аналитического оп­

ределения оптимального управления удается сравнительно редко.

Причина этого как в

сложности решения системы нелинейных раз -

ноотных уравнений о

краевыми условиями

д л я ^ х ^

и \Jij

» ~

данными в разных концах интервала, так

и в

том,

что

уоловия

локального максимума или стационарности

W

по

%

выде­

ляют "разветвляющийся" набор претендентов на решение. Однако эти условия можно с успехом использовать для поисковых алго­ ритмов.

ПЛ. Вычисление градиента о использованием функционала Лагранжа

Один из алгоритмов поиска условного максимума, рассмотрен­ ный в п. 7.2, состоял в следующем:

1. Выбирались начальные значения переменных, удовлетво­ ряющие связям.

2.Множители Лагранжа находились таким образом, чтобы в начальной точке функция Лагранжа не изменялась при изменении одной группы переменных (зависимых).

3.Вычислялся градиент функции Лагранжа по переменным

второй

группы (свободным) и делался шаг по ним.

4.

Из уравнений

связи определялись новые значения 'зави­

симых

переменных.

Потом процедура повторялась.

По той же схеме может быть проведен поиск макоимума фун­ кционала I в дискретной задаче оптимального управления.

Так, для прямой формы связи ( I I . 9 ) эта последовательность приводит к таким вычислениям.


 

 

 

 

 

• 104

 

 

 

 

 

 

 

I .

Выбирают

управление

^ U.^ |

возможно более

близкое к

предполагаемому

оптимальному, и по уравнению

связи

и

известному

начальному оостоянию подсчитывают ооответст

 

траекторию

2.

Уравнение

( И Л 1 )

решают

относительно

^ц- ,

 

приняэ

 

№ls

facl,{lkl

'

И

^ n

+ i

=

0.

Получают

последователь­

ность

Jy/Oj'.

 

 

 

 

 

 

 

 

 

 

 

3.

Вычисляют

градиент функционала

^

по управлениям

. А

так как от управления на i-ом

шаге

зависит

только

выражение

Н

( i,^C,

1^, Ji ) , то^одставив

в

выражение (11.12)

ч.

находят

его

градиент

по

К

и новое

приближение

 

 

 

 

 

 

 

 

 

 

 

 

г = 0 , 1 , 2 , . . . . i

 

Ограничения на управления могут быть учтены теми же мето­

дами,

что и в общей задаче

нелинейного

программирования

 

(см. п . 7 . 2 ) .

 

 

 

 

 

 

 

 

 

 

 

4. Из уравнений связи определяют новые значения переменных

состояния

|

J .

 

 

 

 

 

 

 

 

 

 

Не вдаваясь детально в возможные разновидности и модерни­

зации

этого алгоритма, сделаем два замечания:

 

 

 

I .

Не всегда удобно считать управления свободными, а фа­

зовые

координаты

зависимыми

составляющими решения.

 

За свобод­

ные составляющие можно принять, вообще говоря, любой набор из управлений и фазовых координат такой, что оставшиеся управле­ ния и фазовые координаты определяются при их задании уравнениями связей. Естественно, что уравнения для выбора г//± , будут иными Так как при поиске удобнее учитывать ограничения на сгсоодные составляющие, то характер ограничений существенно влияет на


выбор этих составлявших.

Вторым фактором является вид уравнений связей. Желательно, чтобы зависимые составляющие входили туда в явной форме. •Тогда при подстановке свободных составляющих определение за­ висимых не требует решения уравнений.

2. Не обязательно после наждого шага возвращаться на мно­ жество Д, определяя зависимые составляющие из уравнений связей. Если они сложны, их можно заменить линеаризованными уравне­ ниями, проводя уточнение через несколько шагов.

I I . 5 . Алгоритм поиска седловой точки функции ЛагранжаАналогично задаче нелинейного программирования для дискрет­

ной оптимальной задачи ( I I . I ) , ( I I . 2 ) может быть использован алгоритм Эрроу-Гурвица, причем могут быть учтены и ограни­

чения типа

Р(^с,

 

и.,

О

4

О

 

( п . 1 6 )

 

Каждому

такому

ограничению соответствует слагаемое

£i

Р

в функционале

/S

,

причем

множители

@i равны нулю внутри

и

неотрицательны

на

границе множества,

выделяемого

условием

 

( И . 1 6 ) .

 

 

 

 

 

 

 

 

 

 

1-Й шаг. Задаются начальным управлением

j

и тра­

екторией

\^с^

 

'

 

 

Желательно, чтобы

они

были

 

близки к предполагаемому решению. И,во всяком случае,были

 

допустимы

по ограничениям.

 

 

 

 

 

В отличие от предыдущего алгоритмауНеобязательно,

чтобы

 

эти последовательности

были

связаны

друг с другом

уравнениями

( I I . 2 ) . Одновременно

задают

последовательности

\J{1

 

^

О.

 

 

 

 

 

 

 


ТОЬ

2-й

 

шаг. Определяют

градиент функционала

по У,-

,

Ь-1

,

J i n

в окрестности начальной точки. Причем

по

пергым

 

двум переменным

делают шаг по направлению, а по

и

<di

 

против

направления градиента. Получают

следующую

точ-

Частные производные функционала Лагранжа, определяющие градиент, подсчитываются из выражения

1=0 1-0

Частная производная /S по аУ/ и Q обращается в нуль при выполнении соответствующей связи или ограничения.

Упражнение. Получить необходимые условия оптимальности для задания свя8ей(Й!2) в инверсной форме и ограничении на управ­ ление.

Замечание. При использования градиентных методов бывает по ­ лезно введение "зоны нечувствительности" [ 17 ] . При этом из­

меняют переменные лишь для тех

L , для которых величина гради­

ента по модулю превосходит некоторую величину £

. Благодаря

такому подходу на (К +1}-ом нате

можно использовать

результаты,

полученные на К -ом шаге, по тем переменным, для которых гра­

диент оказался мал. После серии из нескольких шагов вновь вы­

числяется

"малый" градиент. Величина £ уменьшается с

прибли- .

жеаием к

экстремуму.

 

Упражнение. Составить блок-схемы алгоритмов этого параграфа

с использованием "зоны нечувствительности" в процессе

поиска.