Файл: Основы автоматического управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 311

Скачиваний: 15

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 16,4. П РИ М Е Н Е Н И Е ДИ Н А М И ЧЕСК О ГО П РО ГРА М М И РО ВА Н И Я

661

или, с точностью до бесконечно малых высшего порядка,

S (У (0 . <) =

= min [F (у (Z), u (t), t) At + S (у (t + At), і + Дг)]. (16.4.4)

«£К

Предположим, что функция S непрерывна и имеет всюду непре­ рывные частные производные по всем своим аргументам yt, t. Это основное допущение при применении метода динамического программирования к непрерывным системам, которое теоретически пока полностью не обосновано [80]. Разложим второй член в квад­ ратных скобках в (16.4.4) в ряд Тейлора в окрестности t и ограни­ чимся членами не выше первого порядка относительно At. Тогда, учитывая (16.4.1), получим

 

П

dS {у, 0 U (V .

 

d S

(у , t) At.

s ( у . о +

2

и, t) At +

 

І=1

 

дУі

 

 

 

d t

 

 

 

 

 

 

 

Подставим это выражение

в

(16.4.4)

и

учтем, что

S (у , t)

и öS (у, t)ldt не зависят от и,

вследствие чего их можно

вынести

за знак минимума по и.

В

результате

получим

 

 

S ( y t 0 = S ( y , f ) + - ^ ! H - A*+

 

 

 

 

+ mm { F( y( t),

u[{t),

<) A<+ 2

- S

ft (y,

u,

*)Д*} .

Разделив это уравнение на At после сокращения S (у, t) и устре­ мив At к нулю, получим

__ АД (у, f ) =min { F { y , и ,

« ) + 2 ^ д у ’і t] . <)} • (16.4.5)

Mgfi

i = l

Это уравнение называется уравнением Р. Веллмана. Его можно переписать в векторной форме

öt

= m i n ^ ( y ,

t) + (gr&d S ( у , t ) , f ( y, и, 0)}, (16.4.6)

иея

 

где

второй член в правой части представляет собой скалярное

произведение

вектора grad S (у, t) с компонентами

öS (у, t)/dyt

и вектора / {у,

и, t)

с компонентами (у, и, t). Граничное усло­

вие

для уравнения

Веллмана

имеет вид

 

 

 

 

5 (;у , *„)

= Q (У («„))•

(16-4-7)

В частном случае, когда в минимизируемом функционале (16.4.2) отсутствует второй член, Q (у (tK)) = 0, условие (16.4.7) принимает вид S (у, tK) = 0.


662 Г Л . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

Оптимальный вектор управления и определяется путем мини­ мизации правой части в (16.4.6). При этом оптимальное управле­ ние и будет зависеть от grad S (г/, t). Подставляя найденное выра­ жение для и в (16.4.6), получаем уравнение в частных производ­ ных, в которое не входит и. Решив это уравнение и определив S (у, и, t), найдем явный вид оптимального управления и.

Решение уравнения Веллмана само по себе связано с серьез­ ными трудностями. Решить его аналитически можно только в очень немногих частных случаях. Поэтому, как правило, его приходится решать численными методами.

П р и м е р 16.4.1. Пусть объект описывается уравнениями

Уі = иУі + Уг, Уг = иг .

Требуется выбрать управление и, минимизирующее функционал

1 (*к) = j F (уі (t), у2(t), t) dt

 

to

 

 

на заданном интервале (to,

tK) при заданных начальных значениях у, (г0) =

= Уіо> Уі (to) — Уго-

(16.4.6)

для

данного случая имеет вид

Уравнение Веллмана

dS (у, t) _

 

 

 

dt

 

 

 

= ШІН [V {уи у2, t) -f

-

(tty1 + у i) + ■dS-Qy'2 ^ “2] • (16.4.8)

Выражение в квадратных скобках принимает минимальное значение при и, равном

 

Уі

dS (у,

t) I öS (у, t)

U~~

2

дуі

I

ây2

Подставляя это выражение

в

правую

часть

уравнения Веллмана (16.4.8)

и опуская символ min, получим уравнение в частных производных для опре­

деления

функции S

(у, t):

 

 

 

 

 

 

 

 

 

 

dS

Ft

л

, 9S

1

2

( — \ 2 lËä.

 

 

— W = F{y" Уг' t ) + d i i U2~ т

у' \9 у і )

I dy2

 

Это уравнение

надо

решить

при

граничном

 

условии S

(гд, у2, tк) = 0.

П р и м е р

16.4.2. Определим

оптимальное

управление

для условий

примера

16.4.1

при

ограничении

на

управление

| и \ <! 1. В

этом случае

оптимальное управление и, минимизирующее выражение в квадратных

скобках в (16.4.8), имеет

вид

 

 

 

 

 

 

и =

и (t)

при

I V (г)

I <

1,

и =

sgn V (t)

при

I

V (t)

I >

1,

где

 

 

 

 

 

 

 

 

Ѵи )==-

^ ^

І Ё

І

 

 

 

( }

2

d y j dy2 ■

 


$ 16.4. П Р И М Е Н Е Н И Е ДИ Н А М И Ч ЕС К О ГО П РО ГРА М М И РО ВА Н И Я

663

Подставляя полученное выражение для управления в правую часть урав­ нения (16.4.8), получаем уравнение в частных производных для функции S с тем же граничным условием. Решение этого уравнения, как и в предыдущем

примере, может

быть получено только численно.

П р и м е р

16.4.3. Пусть поведение объекта управления описывается

линейными уравнениями

 

 

п

 

 

 

Уі 2

аі]У) + тіи*

УіѴо) = Уіо

(і= 1 , ...,ге),

1=1

где atj, ті — заданные постоянные *). Требуется найти управление и, кото­ рое за бесконечное время переводит объект из начального состояния уі0 Ф О при <о = 0 в нулевое положение уік = 0 , минимизируя функционал

ооП

/ = j 2 ( ci№V} + \ “2)

0 1 , 1 = 1

где су, k — заданные постоянные. На управление дополнительных ограни­ чений не наложено. Принимая во внимание, что система стационарна, соста­ вим уравнение Веллмана, которое в данном случае имеет вид

 

п

п

п

 

muin [

2

cvyiyj + - j - u2+ 2

( 2 а«1 У1 + т 1“ ) ] = ° -

(16.4.9)

u

i, 1=1

t=l

1=1

 

Для определения и, доставляющего минимум выражению в квадратных скоб­ ках, служит уравнение

2 9S (у) 0

кдуі

Отсюда пвлучаем оптимальное управление в форме

п

и =

9S (у)

T fc2 m‘ дУі t=i

Подставляя это выражение в (16.4.9), получаем уравнение для определе­ ния S (у):

2 «u».w+ t ( S ” ' S !+

i , 1=1 1=1

+ 2

Wt ( 2 “MW- т

mt 2

=°-

<16-4-10>

t= i

i= i

i=i

 

 

Решение этого нелинейного уравнения можно искать в виде квадратичной

формы

п

5 = 2 ЬГругур.

г, р = і

Подставляя это выражение в (16.4.10) и приравнивая нулю коэффициенты при одинаковых произведениях переменных угур, получаем для неизвестных

*) Этот пример заимствован из книги А. М. Летова [92].


664 гл. 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

коэффициентов brp следующие нелинейные уравнения:

 

п

 

 

п

 

 

 

— к

2 mimjbipbjq+'^

aiqbip= cpq

(р, q = i,

. . п). (16.4.11)

 

i, j ' = 1

 

 

i = l

 

 

 

Решая эти уравнения,

определяем искомые коэффициенты bpq (р, q = 1, . . .

. . п).

После

их

определения окончательно

находим

 

 

 

 

п

 

п

 

 

 

“ =

2

d P y P '

d P = k 2 т і Ь іР

(Р==

••••»»).

 

 

P = 1

 

i = l

 

 

Таким образом, в данном случае управление может быть определено анали­ тически. Однако уравнения (16.4.11) приходится решать численными методами.

Г л а в а 17

САМОНАСТРАИВАЮЩИЕСЯ СИСТЕМЫ

§ 17.1. Управление при неполной информации

Проектируя автоматическую систему, конструктор всегда ста­ рается сделать ее возможно проще, обойтись по возможности простыми корректирующими цепями с постоянными параметрами. При этом расчет системы управления ведется в предположении, что динамические характеристики объекта управления известны. Однако в действительности динамические характеристики объектов управления бывают известны лишь приближенно. Кроме того, характеристики объектов управления обычно изменяются с изме­ нением внешних условий. Так, например, динамические харак­ теристики самолета или крылатой ракеты зависят от скорости полета и плотности воздуха (т. е. от высоты полета) вследствие зависимости от этих факторов аэродинамических сил и моментов. Кроме того, динамические характеристики самолета или крылатой ракеты могут измениться вследствие повреждений, полученных в результате действий противника. Благодаря запасам устойчиво­ сти система управления, спроектированная для определенных расчетных характеристик объекта управления, будет успешно осуществлять управление объектом и в том случае, когда его характеристики несколько отличаются от расчетных. Методы, изложенные в предыдущих главах, дают возможность опреде­ лять допустимые пределы изменений характеристик объекта уп­ равления, не приводящих к нарушению работы системы управ­ ления.

В некоторых случаях диапазон изменения характеристик объекта управления вследствие изменения внешних условий бывает настолько большим, что управление объектом при помощи простейшей системы управления, имеющей постоянные параметры, становится невозможным. Например, для современных самолетов и крылатых ракет часто оказывается невозможным спроектировать систему управления с постоянными параметрами, которая могла бы осуществлять управление полетом на всех высотах и при всех скоростях полета. В таких случаях можно применить систему управления с изменяемыми параметрами (чаще всего оказывается достаточным изменять коэффициенты усиления корректирующих


6 6 6 ГЛ . 17. САМ ОНАСТРАИВАЮ Щ ИЕСЯ СИСТЕМ Ы

цепей) и ввести в нее дополнительные цепи настройки изменяемых параметров в зависимости от внешних условий.

Вместо цепей настройки параметров системы управления можно также применить методы стабилизации динамических характеристик объекта управления с помощью дополнительных обратных связей. Это позволяет уменьшить диапазон изменения характеристик объекта при изменении внешних условий и, следо­ вательно, расширить диапазон изменения внешних условий, при которых возможно применение системы управления с постоянными параметрами.

Однако и системы управления с изменяемыми в зависимости от внешних условий параметрами не могут обеспечить управление объектом при значительном изменении характеристик объекта вследствие не предусмотренных в конструкции системы управления причин. Так, например, динамические характеристики самолета или крылатой ракеты могут значительно измениться вследствие обледенения или значительных повреждений в результате действий противника, не приводящих, однако, к невозможности продолже­ ния управляемого полета. Кроме того, в промышленности часто встречаются объекты управления, динамические характеристики которых совершенно неизвестны и не могут быть достаточно просто

•определены. Примерами таких объектов могут служить доменная печь и различные агрегаты химической промышленности. В таких случаях обычно приходится применять систему управления со

•сложными цепями настройки параметров, осуществляющими автоматический поиск подходящих значений параметров на -основе анализа результатов управления и поведения объекта уп­ равления.

Такие системы управления принято называть самонастраи­ вающимися.

Оператор самонастраивающейся системы, обеспечивающий удо­ влетворительное качество ее работы, устанавливается не сразу после начала ее работы, а лишь после некоторого периода времени, необходимого на поиск подходящих значений ее параметров. В течение времени поиска такая система может работать совер­ шенно неудовлетворительно. Это обстоятельство вообще характер­ но для задач управления при отсутствии достаточно полной информации.

На практике часто встречаются случаи, когда не только характеристики объектов управления, но и статистические характеристики полезных сигналов и помех оказываются неиз­ вестными. В таких случаях развитые в предыдущих главах методы расчета автоматических систем оказываются бессильными. Мы не можем тогда спроектировать не только оптимальную систему, но и вообще систему, которая могла бы обеспечить удовлетворительное решение задачи. Для решения задач управ­