Файл: Методы оптимизации в статистических задачах управления..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 87
Скачиваний: 0
Моделирование уравнений будем проводить с начальными условиями х10, х2о, которые изображаются точками; расположенными на прямых, параллель
ных оси Xj = 0. Этим определим сечения функции Т (xj, х2) COnst в районе
линии переключения. Если минимум Т будет достигаться над линией переклю чения, то наш алгоритм управления оптимален, в противном случае координаты точек перегиба можно принять за новое приближение к линии переключения сто хастической задачи оптимального быстродействия. Кривые, показывающие те
чение процессов в системе, приведены |
на рис. 44 и 45. |
|
В момент t = 6 с выполняется равенство М {х*Ах} = 1, |
и решение .задачи |
|
на этом заканчивается. |
• |
|
На рис. 46 показано сечение функции Т (xlt х2) при х2 = |
-—2. Здесь видна |
|
разница между координатой принятой |
линии переключения |
при хг = —2, и |
координатой перегиба функции Т0, где теоретически должно происходить пере ключение согласно виду управления, получаемого из уравнения Веллмана.
|
|
г |
|
|
1 |
|
|
о |
Рис. 46. Сдвиг координаты ми |
Рис. 47. Первое приближение |
|
нимального значения |
функции |
к линии переключения стохасти |
по сравнению с положением де |
ческой задачи. При | хх | -> оо |
|
терминированной линии пере |
сливается с линией переключе |
|
ключения (х2 = |
1,8) |
ния детерминированной задачи |
192
Координаты минимума функции Т , получаемой с помощью детерминиропанного алгоритма оптимального быстродействия, в первом приближении можно расположить на кривой
І і (х і> Х'г) = х г + к ( х г) = О,
показанной на рис. 47. Кривую, задаваемую этим выражением, можно считать первым приближением к оптимальной линии переключения стохастической за
дачи |
оптимального |
быстродействия. Она значительно |
отличается |
от линии |
|
So (x i> |
x z) |
— 0 в |
окрестности начала координат и приближается |
к ней при |
|
I х { \ -> оо. |
Моделирование системы уравнений с новой |
линией переключения |
показывает, что в пределах точности применяемых вычислительных методов кри вую Іх = 0 можно принять за линию переключения стохастической задачи опти мального быстродействия. Результаты моделирования сведены в таблицу.
|
|
Значения |
первых двух итераций решения |
примера |
|
|
||
*2 |
X t = _2 |
|
Хі |
= —3 |
|
*1= —4 |
||
То |
Ті |
х г |
То |
г. |
X 2 |
То |
Ті |
|
|
|
|
||||||
1,2 |
1,52 |
1,46 |
1,2 |
2,21 |
2,11 |
1,2 |
2,84 |
2,64 |
1,4 |
1,47 |
1,42 |
1,4 |
2,15 |
2,06 |
1,4 |
2,77 |
2,54 |
1,6 |
1,46 |
1,40 |
1,6 |
2,11 |
2,02 |
1,6 |
2,74 |
2,46 |
1,8 |
1,47 |
1,43 |
1,8 |
2,10 |
2,00 |
1,8 |
2,74 |
2,46 |
2,0 |
1,58 |
1,50 |
2,0 |
2,12 |
2,01 |
2,0 |
2,79 |
2,65 |
2,1 |
1,85 |
1,78 |
2,2 |
2,16 |
2,05 |
2,2 |
4,75 |
4,51 |
|
|
|
2,4 |
2,38 |
2,26 |
2,4 |
4,95 |
4,72 |
|
Хі |
= -6 |
*2 |
Хі |
==—8 |
|
х г =: —10 |
|
Хг |
т 0 |
Т, |
То |
Ті |
Хг |
То |
Ті |
|
|
|
|
||||||
2,0 |
5,84 |
4,86 |
2,5 |
6,50 |
5,60 |
3,0 |
7,03 |
5,75 |
2,5 |
5,78 |
4,63 |
3,0 . |
6,44 |
5,31 |
3,5 |
6,99 |
5,51 |
2,9 |
5,77 |
4,40 |
3,4 |
6,43 |
5,15 |
3,9 |
6,98 |
5,30 |
3,2 |
5,80 |
4,40 |
3,7 |
6,45 |
5,24 |
4,2 ' |
7,00 |
5,46 |
3,5 |
5,88 |
5,40 |
4,0 |
6,49 |
5,83 |
4,5 |
7,05 |
6,15 |
8. Оптимальное быстродействие при неточном измерении фазовых координат
Если принять, что координаты объекта, описываемого уравне нием (361), вычисляются на основе измерения вектора:
у = Сх + т], |
(456) |
то формулировки задач оптимального быстродействия следует несколько изменить, а в блок управления ввести блок обработки данных (см. рис. 38).
13 А. М. Батков |
193 |
Рассмотрим несколько формулировок стохастических задач оптимального быстродействия при неточном измерении фазовых координат объекта.
Задачу оптимального быстродействия первого типа для объекта, задаваемого уравнением (361), сформулируем следующим образом: на основе измерения вектора у требуется выбрать управление и,
которое за |
минимальное время |
|
|
|
|
T = |
tk — |
t |
|
переводит |
объект из состояния |
х, |
соответствующего |
моменту t |
и характеризуемого неравенством |
|
|
||
|
M t\x*Ax} > |
Сф (і), |
(457) |
в состояние х (4) к моменту 4. которое характеризуется равен ством
M t {я* (4) Ах (4)( = Сх (4), |
(458) |
т. е. априорное математическое ожидание равно заданной функции. Задача оптимального быстродействия второго типа формули руется следующим образом: на основе измерения вектора у тре буется так выбрать управление и, чтобы априорное математиче
ское ожидание
f = М (Л , Т = 4 — 4
времени перехода из состояния х в момент t, характеризуемого
неравенством |
Сг (0, |
(459) |
М, \х*Ах\ > |
||
в состояние х (4) к моменту 4. |
характеризуемому |
равенством |
M tk {х? (4) Лх (4)} = Сх (4) |
(460) |
было минимально.
В условии (460) подразумевается апостериорное математиче ское ожидание.
При уравнениях объекта (361) и при условии, что априорное распределение начального состояния х 0 нормально, обработка измерений (см. п. 5 гл. IV) сводится к определению математи ческого ожидания и дисперсионной матрицы фазовых координат. Так как дисперсионная матрица вычисляется априорно и не зави сит от измерений, то воспользовавшись равенством
М |х*Лх| = х*Ах + М {е*Ле},
где X — апостериорное математическое ожидание, а е — ошибка измерений, поставленные задачи сведем к сформулированным ранее задачам (438)—(440) и (441)—(442) соответственно. Экви валентный объект, определяющий изменение апостериорных мате матических ожиданий задается уравнением (418):
X = Ах + Ви + г (t); X (0) = х 0, |
(461) |
194
где г (t) — «белый» шум с интенсивностью DC*R~1CD. Матрицы R и D вычисляются по формулам (337) и (419).
Вместо функции Сх (t), определенной в выражении (439), следует поставить функцию
С2 (t) = Сх (t) — М {е*Ле},
которая известна априорно.
Вусловиях неточного измерения фазовых координат объекта управления можно поставить задачу определения минимума мате матического ожидания времени, за которое апостериорная вероят ность попадания объекта в некоторую область L достигает задан ной величины р х.
Вэтом случае равенство
J р (х, X , D) dx = р х, |
(462) |
L |
|
где р (х, X, D) — апостериорная плотность распределения, опре-
деляет контур в пространстве оценок х, на котором вероятность попадания вектора фазовых координат объекта в область L равна р х. Задача сводится к определению управления, минимизирующего среднее время попадания фазовых координат объекта (461) в об ласть (462).
13
Г Л А В A V
ПРИМЕНЕНИЕ СТОХАСТИЧЕСКОГО ПРИНЦИПА МАКСИМУМА К ОПТИМИЗАЦИИ СИСТЕМ УПРАВЛЕНИЯ
1.Условия оптимальности управления
вформе стохастического принципа максимума
Как указывалось выше, общая задача оптимального управле ния сводится к определению вектора управления и размерности lq, 1] объектом
Xi ~fi(x, |
и, |
I, t), Хі (0) = |
x°i, i = 1, 2, . . |
n, |
(463) |
на интервале (0, |
T), |
где х = \хг, |
х 2..........хп\ — n-мерный |
век |
|
тор; I (/) — случайный процесс размерности п с известными ста |
|||||
тистическими характеристиками; |
х° — вектор, подчиняющийся |
||||
известному закону распределения; Д — ограниченные, |
непрерыв |
ные вектор-функции, дважды дифференцируемые по х и и. Управле ние и предполагается физически осуществимым оператором от
измеряемого вектора у размерности [г, 1 |
]: |
||
|
и — и (Д у (т)), т |
t, |
|
где у = у (х, г], t)\ |
ц — случайный процесс размерности г с из |
||
вестными статистическими |
характеристиками. |
||
Предполагается, |
что |
и принадлежит |
множеству U (и £ U) |
для каждой реализации вектора у (t) и является оптимальным,
если имеет место |
минимум |
функционала |
I: |
|
/ = М |
і 7 |
t) dt + F IT, |
1 |
(464) |
J / 0 (х, и, |
X (Т)) , |
|||
|
Іо |
|
J |
|
где операция математического ожидания М берется по начальным условиям х° и случайным воздействиям г] (t) и | (і).
В этой главе мы применим к решению описанной задачи прин цип максимума Л. С. Понтрягина в стохастическом варианте [81, 141 ].
Введем [81] координату х 0 |
уравнением |
|
|
||||
х 0 = /о (х, и, |
t), |
х 0 |
(0) = |
0 |
(465) |
||
и обозначим через X |
расширенный |
вектор |
фазовых |
координат |
|||
{хв, х\ размерности |
[п + 1 , |
1]. |
|
|
|
|
|
Тогда из выражения (464) |
следует |
|
|
|
|||
I = |
М \ х й (Т) + F(T, |
х(Т)]}. |
(466) |
196