Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 80

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

56

(7.2) можно вернуться > допустимую область, найдя точку I j , удовлетворяю^» связям, ш сделать следующий шаг поиска. Поо. ледовательность поиска приведет к локальному условному мавд|

«уму

 

 

/ о ( Х ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Остановимся неоколько подробнее на определении направле­

ния уоловного градиента. Линейное подпространство,

касатель­

ное к поверхности (7.1), обладает тем овойотзом, что любой

вектор

 

£

,

лежащий

в нем,

нормален

к любому из

градиентов

функций

J.^

в

точке

 

Х0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

-

i,

2, . . .

v n

 

 

 

Будем

считать градиенты

 

^ .

линейно

независимыми, так

что

число уравнений

( 7 . 3 )

 

равно

Тп .

 

 

 

 

 

 

 

Так как нао интересует только направление наискорейшего

роста

j.0

,

 

нормируем вектор

£

потребовав,

чтобы

 

 

 

 

 

 

 

 

ft

"

'

1

 

 

 

 

 

 

 

 

 

 

Л )

Величина

 

пронвводной функции

Jc

 

по

направлению

t?

оп­

ределяется как скалярное произведение градиента

 

/ 0

 

на

век­

тор

i

 

 

 

 

 

 

 

 

 

 

 

 

_

 

 

 

 

 

 

 

Таким

образом,

необходимо

найти

такой

У\ -мерный вектор &%

который

доставляет

максимум

 

( 7 . 5 ) при

(W- )-OM условиях

( 7 . 3 )

и

( 7 . 4 ) .

Зто

задача

условного

экстремума,

облегченная

 

 

 

 

 

 

 

Z

 

 

 

 

 

тем

обстоятельством,

что выражения

( 7 . 5 ) и

1 7 . 3 )

линейны, а

( 7 . 4 )

квадратично

зависят

от

 

 

.

Таким

образом,

решение

сводится к последовательности вспомогательных задач об услов­ ном максимуме, каждая из которых значительно проще исходной.


s?

7.2. Локальный метод исключения зависимых составляющих

Разобьем

П. составляющих вектора

У

на

гл.

)

свободных

У с

и

УЛ - зависимых

У 9 .

'Гак что

при

задан­

ных переменных первой группы,вторые могут быть определены

ив уравнений

(7 . 1) .

 

 

 

 

 

Запишем

функцию

Лагранжа

 

 

 

 

R - 1Л*) +24-A-W,

 

 

'

(7.6)

 

 

 

 

 

I -

'

 

 

 

 

 

 

 

 

 

содержащую

ТУ]

добавочных переменных

^//- .

 

 

 

Пусть

в

начальной

точке

У0

 

, как

и раньие,

удовлет­

ворялись

условия (7 . 1), а

значит

Q

к

)

=

/ 0

0).

Вдоль

поверхности

(7.1)

второе

слагаемое

в (7.6)

равно

кулю, а значит

градиент

V

R

вдоль

этой

поверхности равен

уоловноыу

градиенту

 

. Выберем

теперь

 

jf«

так,

чтобы

функция

R.

в

точке

^

не

зависела

 

от составляющих J<^

о Изо

 

 

 

-7,

 

Ъ**о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^ = 1. 2 , . . . l r w

вычисляем

составляющие

градиента

 

 

по

направлениям

^

5 5

 

I ,

2 . . . .

( Г \ . - Щ ) ) иQ

изменяем

каждую И8

них.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

* г ^ У « / Х . »

 

 

 

( 7 ' 8 )

где £ - величина шага. Найдя новые значения свободных

составляющих,. определим зависимые составляющие из уравнений


зованы в окрестности д(„

, и переменные d(s найдены из сис­

темы линейных уравнений

(19).

Отметим, что при поиске условного максиму!-», основанном на использовании функции Лагранжа, все переменные входят в R сим­ метрично, поэтому им удобнее пользоваться, когда некоторые из переменных содержатся только в уравнениях связей и отсутствуют

вцелевой функции.

Вкачестве зависимых удобно выбирать переменные, которые леще определить из уравнений связей, и ограничения, которые или отсутствуют вовсе, или менее жесткие, чем на свободные переменные.

При поиске по свободным составляющим учет ограничений на

зависимые

составляющие

затрудняет решение.

 

В этом случае удобен алгоритм, изложенный ниже, где все

составляющие вектора -X

равноправны.

 

7;3.

Поиск седаовой

точки функции Лагранжа

[ 22 ]

Представление о решении задачи условного максимума как о

седаовой

точке функции

Лагранжа полезно не только потому, что

приводна

к возможности

вычислять оценку искомого

решения.

Седдовуи точку можно находить поисковыми методами. Процедура поиска сходится к абсолютному максимуму J-0 на и лишь при вы­ полнении условий выпуклости.В остальных случаях, как и во всех поисковых нетодах, шкно лишь гарантировать, что полученное ре ­ шение не хуже других, допустимых и лежащих пососедству.

 

Обозначим составляющую градиента

функции Лагранжа

I?

по

JC

черев

,

а

составляющую

градиента этой

функции

no

J

через

£ j

.

При поиске

седловой точки мы должны

двигаться

в направлении роста

/2

 

при изменении

У

и

уменьшении

Q

при изменении

J

,

что приводит к

оледующе -

цу

алгоритму

 

 

 

 

 

 

 

 

где величина шага £ положительна.

Возможны и различные модификации этого алгоритма, обеспе­ чивающие не окольно более быструю сходимость. Так, еоли в ок­ рестности максимума зависимость функции Лагранжа ст.Х близ­

ка к квадратичной,

то может быть использован алгоритм поиска

максимума по JC ,

приводящий в случае квадратичной зависимо­

сти в точку максимума за один шаг

~

? f e x (te)]4QM>X)

C7.II)

Здесь Q.xx -

квадратичная форма (аналог второй

производ­

ной для функции одной переменной). Множители Лагранжа меня7

ЕТСЯ

согласно зависимости

(7.10).

 

В задачах, где нахождение безусловного максимума

1^ по

У

на множестве V ,

определяемом ограничениями,

реали­

зуется сравнительно просто, эффективен алгоритм, согласно кото

рому

на каждом

шаге

Х^ (

находится из условия абсолют­

ного

максимума

Q

, а

по

jj

проводятся итерации согласно

(7.10) с ограничением

на

 

 

J; ( jf.- ^ о).



60

(7.12)

Так как функция Лагранжа ниаах вид

 

 

if

 

 

(7.14)

 

Rjfe^)

 

как оильяо в точке -X ,

*о_величина

показывает,

нарушены уравнения

связей.

Изменение и у/

стремятся

ввести точку поиска в допустимое мнряеотво.

 

Алгоритм

(7.12),

(7,10)

може? быть назван алгоритмом управ­

ления в децентрализованной

системе. Именно яакой

алгоритм мс-

пользоваяся гкономнотом, меняющим цены, и потребителем,

мак­

симизирующим на каждом шаге свою прибыль

X? .

 

Причем формула (7.IG) (правило действий экономиста)

никак

не 8азиоит от целевой функции потребителя

J-0 .

 

Пример;

 

 

Последние два ограничения определяют множество

V

 

Зададим

некоторое

tA0

= I

и,ооглаоно aarc ритму

(7.12),

(7.10)^ найдем

Х0

как точку

иаконмума

на V по

 

a tX5

каа иезависииыы переменный

 

 

 

Этот

аакоимум,

легко видеть, достигается в точке

(2.2).

Теперь,

вшбрав

а

0,1,

например, можно

оделать

шаг по

J

Ум

= I

+ 0,1

(23 -2) -

I -0,6 = 0,4