Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 87

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Моделирование уравнений будем проводить с начальными условиями х10, х2о, которые изображаются точками; расположенными на прямых, параллель­

ных оси Xj = 0. Этим определим сечения функции Т (xj, х2) COnst в районе

линии переключения. Если минимум Т будет достигаться над линией переклю­ чения, то наш алгоритм управления оптимален, в противном случае координаты точек перегиба можно принять за новое приближение к линии переключения сто­ хастической задачи оптимального быстродействия. Кривые, показывающие те­

чение процессов в системе, приведены

на рис. 44 и 45.

 

В момент t = 6 с выполняется равенство М {х*Ах} = 1,

и решение .задачи

на этом заканчивается.

 

На рис. 46 показано сечение функции Т (xlt х2) при х2 =

-—2. Здесь видна

разница между координатой принятой

линии переключения

при хг = —2, и

координатой перегиба функции Т0, где теоретически должно происходить пере­ ключение согласно виду управления, получаемого из уравнения Веллмана.

 

 

г

 

 

1

 

 

о

Рис. 46. Сдвиг координаты ми­

Рис. 47. Первое приближение

нимального значения

функции

к линии переключения стохасти­

по сравнению с положением де­

ческой задачи. При | хх | -> оо

терминированной линии пере­

сливается с линией переключе­

ключения (х2 =

1,8)

ния детерминированной задачи

192


Координаты минимума функции Т , получаемой с помощью детерминиропанного алгоритма оптимального быстродействия, в первом приближении можно расположить на кривой

І і (х і> Х'г) = х г + к ( х г) = О,

показанной на рис. 47. Кривую, задаваемую этим выражением, можно считать первым приближением к оптимальной линии переключения стохастической за­

дачи

оптимального

быстродействия. Она значительно

отличается

от линии

So (x i>

x z)

0 в

окрестности начала координат и приближается

к ней при

I х { \ -> оо.

Моделирование системы уравнений с новой

линией переключения

показывает, что в пределах точности применяемых вычислительных методов кри­ вую Іх = 0 можно принять за линию переключения стохастической задачи опти­ мального быстродействия. Результаты моделирования сведены в таблицу.

 

 

Значения

первых двух итераций решения

примера

 

 

*2

X t = _2

 

Хі

= —3

 

*1= —4

То

Ті

х г

То

г.

X 2

То

Ті

 

 

 

1,2

1,52

1,46

1,2

2,21

2,11

1,2

2,84

2,64

1,4

1,47

1,42

1,4

2,15

2,06

1,4

2,77

2,54

1,6

1,46

1,40

1,6

2,11

2,02

1,6

2,74

2,46

1,8

1,47

1,43

1,8

2,10

2,00

1,8

2,74

2,46

2,0

1,58

1,50

2,0

2,12

2,01

2,0

2,79

2,65

2,1

1,85

1,78

2,2

2,16

2,05

2,2

4,75

4,51

 

 

 

2,4

2,38

2,26

2,4

4,95

4,72

 

Хі

= -6

*2

Хі

==—8

 

х г =: —10

Хг

т 0

Т,

То

Ті

Хг

То

Ті

 

 

 

2,0

5,84

4,86

2,5

6,50

5,60

3,0

7,03

5,75

2,5

5,78

4,63

3,0 .

6,44

5,31

3,5

6,99

5,51

2,9

5,77

4,40

3,4

6,43

5,15

3,9

6,98

5,30

3,2

5,80

4,40

3,7

6,45

5,24

4,2 '

7,00

5,46

3,5

5,88

5,40

4,0

6,49

5,83

4,5

7,05

6,15

8. Оптимальное быстродействие при неточном измерении фазовых координат

Если принять, что координаты объекта, описываемого уравне­ нием (361), вычисляются на основе измерения вектора:

у = Сх + т],

(456)

то формулировки задач оптимального быстродействия следует несколько изменить, а в блок управления ввести блок обработки данных (см. рис. 38).

13 А. М. Батков

193


Рассмотрим несколько формулировок стохастических задач оптимального быстродействия при неточном измерении фазовых координат объекта.

Задачу оптимального быстродействия первого типа для объекта, задаваемого уравнением (361), сформулируем следующим образом: на основе измерения вектора у требуется выбрать управление и,

которое за

минимальное время

 

 

 

 

T =

tk —

t

 

переводит

объект из состояния

х,

соответствующего

моменту t

и характеризуемого неравенством

 

 

 

M t\x*Ax} >

Сф (і),

(457)

в состояние х (4) к моменту 4. которое характеризуется равен­ ством

M t {я* (4) Ах (4)( = Сх (4),

(458)

т. е. априорное математическое ожидание равно заданной функции. Задача оптимального быстродействия второго типа формули­ руется следующим образом: на основе измерения вектора у тре­ буется так выбрать управление и, чтобы априорное математиче­

ское ожидание

f = М (Л , Т = 4 — 4

времени перехода из состояния х в момент t, характеризуемого

неравенством

Сг (0,

(459)

М, \х*Ах\ >

в состояние х (4) к моменту 4.

характеризуемому

равенством

M tk {х? (4) Лх (4)} = Сх (4)

(460)

было минимально.

В условии (460) подразумевается апостериорное математиче­ ское ожидание.

При уравнениях объекта (361) и при условии, что априорное распределение начального состояния х 0 нормально, обработка измерений (см. п. 5 гл. IV) сводится к определению математи­ ческого ожидания и дисперсионной матрицы фазовых координат. Так как дисперсионная матрица вычисляется априорно и не зави­ сит от измерений, то воспользовавшись равенством

М |х*Лх| = х*Ах + М {е*Ле},

где X — апостериорное математическое ожидание, а е — ошибка измерений, поставленные задачи сведем к сформулированным ранее задачам (438)—(440) и (441)—(442) соответственно. Экви­ валентный объект, определяющий изменение апостериорных мате­ матических ожиданий задается уравнением (418):

X = Ах + Ви + г (t); X (0) = х 0,

(461)

194


где г (t) — «белый» шум с интенсивностью DC*R~1CD. Матрицы R и D вычисляются по формулам (337) и (419).

Вместо функции Сх (t), определенной в выражении (439), следует поставить функцию

С2 (t) = Сх (t) М {е*Ле},

которая известна априорно.

Вусловиях неточного измерения фазовых координат объекта управления можно поставить задачу определения минимума мате­ матического ожидания времени, за которое апостериорная вероят­ ность попадания объекта в некоторую область L достигает задан­ ной величины р х.

Вэтом случае равенство

J р (х, X , D) dx = р х,

(462)

L

 

где р (х, X, D) — апостериорная плотность распределения, опре-

деляет контур в пространстве оценок х, на котором вероятность попадания вектора фазовых координат объекта в область L равна р х. Задача сводится к определению управления, минимизирующего среднее время попадания фазовых координат объекта (461) в об­ ласть (462).

13

Г Л А В A V

ПРИМЕНЕНИЕ СТОХАСТИЧЕСКОГО ПРИНЦИПА МАКСИМУМА К ОПТИМИЗАЦИИ СИСТЕМ УПРАВЛЕНИЯ

1.Условия оптимальности управления

вформе стохастического принципа максимума

Как указывалось выше, общая задача оптимального управле­ ния сводится к определению вектора управления и размерности lq, 1] объектом

Xi ~fi(x,

и,

I, t), Хі (0) =

x°i, i = 1, 2, . .

n,

(463)

на интервале (0,

T),

где х = \хг,

х 2..........хп\ — n-мерный

век­

тор; I (/) — случайный процесс размерности п с известными ста­

тистическими характеристиками;

х° — вектор, подчиняющийся

известному закону распределения; Д — ограниченные,

непрерыв­

ные вектор-функции, дважды дифференцируемые по х и и. Управле­ ние и предполагается физически осуществимым оператором от

измеряемого вектора у размерности [г, 1

]:

 

и — и у (т)), т

t,

где у = у (х, г], t)\

ц — случайный процесс размерности г с из­

вестными статистическими

характеристиками.

Предполагается,

что

и принадлежит

множеству U (и £ U)

для каждой реализации вектора у (t) и является оптимальным,

если имеет место

минимум

функционала

I:

 

/ = М

і 7

t) dt + F IT,

1

(464)

J / 0 (х, и,

X (Т)) ,

 

Іо

 

J

 

где операция математического ожидания М берется по начальным условиям х° и случайным воздействиям г] (t) и | (і).

В этой главе мы применим к решению описанной задачи прин­ цип максимума Л. С. Понтрягина в стохастическом варианте [81, 141 ].

Введем [81] координату х 0

уравнением

 

 

х 0 = /о (х, и,

t),

х 0

(0) =

0

(465)

и обозначим через X

расширенный

вектор

фазовых

координат

{хв, х\ размерности

[п + 1 ,

1].

 

 

 

 

 

Тогда из выражения (464)

следует

 

 

 

I =

М \ х й (Т) + F(T,

х(Т)]}.

(466)

196