Файл: Осипов В.М. Математические основы кибернетики. Начала вариационного исчисления и элементы теории оптимального управления учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 01.08.2024

Просмотров: 49

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

- 75 -

ме ещё одно уравнение

= Fix,,--- ССп ; U,, • Um ; І J

Наконец, задача о максимальном быстродействии также являет­ ся частным случаен; задачи о минимизации одной координаты, действительно, присоединяя к.системе уравнение

убеждаемся,

что минимизация времени означает минимизацию ко­

ординаты X„tl

„ ири этом конечные

значения остальных коорди­

нат

заданы,

а время Т

не должно

быть фиксированным.

 

Таким образом, весью широкий класс задач сводится к

задаче об оптимизации одной координаты в момент t

- Т , при­

чем

Т

может быть как фиксированным так и свободным.

Весьма

вижко

подчеркнуть

следующее

обстоятельство,

ІХУШ на

управление не накладывать никаких ограничений, т . е . областью допустимых управлений считать все пространство, то задача об оптимизации одной координсты в принципе может быть решена методами классического вариационного исчисления. Искомое управление в этом случае получается в виде непрерывной и глад­ кой функции времени как решение уравнений оіілсрь. і- .летим, что задачи оптимального управлеішя с отсутствием ограничений на управление называются задачами с открытой областью управ­

ления. Цели же на управляющие

параметры

наложены ограниченны

типа неравенств

 

 

 

 

y>.{U,,Ui,...UmJ$0

 

(i-/,2,...^J

или более простого

вода

 

 

 

г<- ь U;

£ J.

Д" -

f. 2, . .. m

J,

то область допустимых управлений оказывается замкнутой т . е . вкдичае':' в с сон не .'о.;ъки вкутргьже точки, но JJ іу»нпци


 

-

76

-

 

 

 

с/. (и,,...щМо[ѵиш

ui-ßi

 

и

и£ = л£ (it

m/]

, a это

означает, что управление

U

как

точка

m -мерного

эвкли­

дова пространства может находиться как внутри области, так и

на её

границах,

за пределы же границ области

ока выйти

не

может.

Наличие

замкнутой области управления

вносит-весьма

су­

щественные коррективы в характер изменения управляющих пара­ метров. Окѳз' іается, как правило, управляющие параметры s про­ цессе управл =іия большую часть времени находятся на границахобласти управления, причем переход с одной границы на другую осуществляется мгновенно, т . е . управление как функция времени оказывается кусочно-непрерывной.. Кусочно-непрерывные управле­ ния в принципе не могут быть получены аз классических уравнении Эйлера, которые в этом классе функций просто не существуют. Таким образом, задачи с замкнутой областью управления не мо- • гут , вообще говоря, решаться методами крассического вариаци­ онного исчисления. А поскольку реальные задачи управления всег­ да, как правило содержат ограничения, то и получается , что реальные т . е . наиболее важные задачи оптимального управления не могут быть решены методами классического вариационного ис­ числения. Потребовался поиск новых неклаесических неводов оп­ тимизации. Наиболее важное значение имеют два метода: привдиѳ максимума Понтрягина и метод динамического программирования Беллм>ліа.

 

-

ft -

Ш .

ОРИНЦШ МАКСИМУМА ИОНТРііГША

I .

Предварительные соображения

Мы уже знаем, что

весьме широкий круг задач оптимально­

го управления сводится к задаче об оптимизации одной коорди- ЙЭТЫП Нам удобней, однако, рассмотреть несколько более общую задачу об оптимизации линейной функции конечных значений всех координат т . е . величины

где

Сх -

нехоторые

постоянные.

 

 

Введем

п - мерные векторы: х(Т/-[x,(r},Xi(Tj,...

x„(Tj]

и

С ' (cf.,

Сц,...

С/7 J

'

Вектор x(Tj

есть г очевидно,

ко­

нечное состояние объекта, т . е , конечная точка траектории

х(і).

Величину

S

можно трактовать как скалярной произведение

вектора

X (Т)

ж вектора

С

:

 

 

5 = {с, ж (г))

т. е . как проекцию вектора х(Т) на вектор С . Требование максимума (или минимума) величины S означает,

таким образом, что мы стремимся перевести систему как можно "дальше" в направлении вектора С (или же как можно"дальше" э азиравлании веатора - С ) „ В самой общем случае', на конечное фазоЕое состояние объекта

лТовс на зодохензе конечной точки фазовой траектории в прост­ ранстве) могут быть наложены различные ограничения. Эти огра­ ничения могут быть сформулированы как требование перевода объекта из начального фиксированного состояния на некоторое


-

78 -

 

множество фазового пространства,

описываемого системой равенств

л нерьвенств.

 

 

В самой общей постановке

задача

может быть сформулированы

так.

 

 

Из множества допустимых управлений найти таксе управ­ ление U(tJ, которое бы переводило объект &І ТОЧКИ ЗС(%>)*& на 4ліксироь& . юе замкнутое множество фазового пространства к притом так, гобьі функционал

в заданный

момент

времени t = Т принимал минимальное ( ш

мак­

симальное)

значение.

 

 

 

Будем предполагать, что время управления

T-t0

фиксировано.

Позднее

мк увидим,

что в тех задачах, где

время

заранее

ке

задано

(например,

в задаче о максимальном

быстродействии} ло-

лучаются совершенно аналогичные результаты. Ш. рассмотрим част­ ный случай нашей основной задачи, а именно, будем считать, что ка положение конечной точки фазовой траектории не наложе­ но никаких ограничений, т . е . правый конец траекторий -^зооодвн

и, следовательно, множество,

яа которое мы переводим

объект,

занимает все фазовое пространство. Отсутствие ограничений

 

означЕет,

что концы кривых SC,(i)\x;(cj\. .. xn(ij

при І- T

\Х

ixJiJ

могут скользить

по вер-

 

 

He путать с правым концом

 

 

фазовой траектории,

кото­

 

 

рый Moser оказаться

в лю­

 

 

бой точке фагового зрост-

 

 

ранстна'. J

 

 

Рис .14


Результаты, которые мы получим при рассмотрении этой задачи ^..-ду,-. полностью аналогичіш результатам, получаемым при ре­ шении общей задачи, отличаясь от последних лишь s деталях, касающихся граничных условий, и вмести с теы допускают бо­ лее простые доказательства.

2.Вывод принципа максимума для задачи со свободным правым концом траектории

Итак, сформулируем згдачу оптимальном управления со свободным правым концом фазовой траектории.

Задан объект, описываемый системой дифферинциалынис уравне­ ний П -го порядка

X, fa,-- Хп ; U,, . Um : àj ( L = 1, Z... п ) i Требуется найти такое управление і/ЛУаз «олое-ти допустимых, которое ou переводило объект из заданного НІ.ЧЬЛЫІОІЧЭ состоя­

ния

x(é,/s

X '

jj некоторое заранее

нсфиксирона*иое

конеч­

ное

состояние х(Т)ъь

фиксированное

время

T-t„

,

причем '

так,

что величина

 

 

 

 

 

 

 

 

 

 

Сххк(Т)-

(С,сс(т>)

 

 

принимала минимальное (или максимальное ) значение.

 

Для решения

этой

задачи

з;*ышем величину S

a вад^

интегра­

ла

 

г

 

п

 

 

 

 

"to

и найдем условия экстремума этого функционала п^и условиях і. Эзо задачь Jiat'paKÄ. Составляем всоомшательнкіі аункнионал


- 80 -

г

 

 

•é,

 

r

C u

 

 

i U

 

 

 

 

 

 

 

 

•6.

іч

 

 

 

 

 

 

 

где

 

 

Ai

- множители Лагранжа (функции

времени).

 

Система

уравнешй)

Эйлера имеет вид

(имеем

П неизвестных

функций

SCк и

/77 функций

UK

 

)

 

 

 

 

 

 

 

1.2, ...пJ

 

-

і,2,

...m).

 

 

К этим уравнениям мы должны добавить

условия

трансверсальнос­

ти. Для рассматриваемого случая

, когда правке

концк

XK(é)

(

К

= 1,

2 ... п)

скользят по

вертикальной

прямой,ати

ус­

ловия

имеют вид

 

 

 

 

 

 

 

 

что

даег

 

Л)(т)--С;

(

 

 

2 . . .

л

>.

 

 

 

 

 

 

 

 

Итак мы получили решение ѵюшей задачи в виде дьух систем уравнений

И

п

 

 

 

О/-

 

 

 

^Яі-Ягт

( « = і ѵ 2 . . . . т ) ,

 

i-.l <7iS«

 

 

Зашгаем пергую систему, как систему уравнений Эйлера, з каяо-

щіческой

форме.

Введем пункцию Гамильтона

и канонические пе­

ременные

Р.

 

(

/ = I ,

2

. . . . П

)

 

 

H

(t.

X,

P,UУ

 

= - F*'* j

Pj X;

 

 

P

Fl

 

 

J

 

 

 

*

 

* J

'

с •

 

 

 

для нашего функционала

о

имеем