Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 315

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

станции (РЛС) траекторных измерений (значения даль­ ности, радиальной скорости, азимута и угла места) об­ рабатываются для оценки состояния аппарата. Эта оцен­ ка поступает на вход ЭВМ, вырабатывающей команды

управления

(сигналы

для изменения направления

поле­

та и выключения двигателей), которые в свою очередь

передаются

на борт

космического аппарата, где

они и

исполняются. Из схемы понятны как характер обратной связи, так и необходимость проведения довольно слож­ ных расчетов.

Основными задачами здесь являются:

1) оценка «состояния» аппарата таким образом, что­ бы минимизировать воздействие ошибок, присутствую­ щих в данных телеметрии и траекторных измерений;

2) настройка алгоритма управления на минимизацию

некоторой функции

от ошибок по положению и скорости

в точке вывода на

орбиту.

1-3. КРАТКОЕ С О Д Е Р Ж А Н И Е КНИГИ

В гл. 2—4 приведены основные результаты теории линейных систем, теория вероятностей и теории случай­ ных процессов. Основным итогом этих глав является по­ строение двух типов моделей систем (см. § 4-2 и 4-3), для которых в остальной части книги формулируются и решаются задачи оценки и управления. Как отмечалось

впредисловии, читатель, знакомый с теорией, описанной

вэтих трех главах, может сразу начать с последних двух параграфов после того, как бегло просмотрит материал первых глав для ознакомления с терминологией и обо­ значениями.

В начале гл. 5 формулируется задача

оптимальной

оценки систем с дискретным временем и для

этой зада­

чи доказываются три основные теоремы

и

следствие.

В предлагаемой формулировке задачи оценки разделя­ ются на три категории в зависимости от момента вре­ мени оценки относительно моментов времени известных измерений (табл. 1-1).

В остальной части гл. 5 внимание сосредоточено на получении алгоритмов оптимального предсказания и фильтрации (фильтр Калмана) для первой из двух рас­ сматриваемых моделей систем, так называемой гауссовской марковской последовательности (с дискретным вре­ менем) .

16


Т а б л и ц а 1-1

Классификация оценок

Класс задач оценки

Интервал измерений

Время

оценки

Предсказание

 

 

 

 

Любое t >

tx

Фильтрация

 

 

 

 

 

t =

tx

Сглаживание (интерполя­

 

 

 

Любое или все t, для

ция)

 

 

 

 

которых t„ <

t ^ ti

П р и м е ч а н и е .

t0— фиксированный момент

времени; t,

_ і переменное время;

t, может быть как фиксированным, так и переменным.

,

, .-, .

Вопрос об оптимальном сглаживании

для того же

класса моделей систем

исследуется в гл. 6. Оказывается,

что удобно разделить

задачу

сглаживания на три за­

дачи и разрабатывать

алгоритмы

оптимального сглажи­

вания для каждой задачи в отдельности.

 

 

В гл. 7 исследуется

задача

оценки для второй из рас­

сматриваемых

моделей

систем, для гауссовского марков­

ского процесса

(с непрерывным

временем). Алгоритмы

оптимального предсказания, фильтрации и сглаживания

получаются с помощью формальной процедуры

предель­

ного перехода из алгоритмов гл. 5 и 6.

 

 

 

Другой метод

решения задачи оценки для гауссов­

ского марковского

процесса приведен

в гл. 8.

Этот ме­

тод дополняет

подход, приведенный

в гл. 7,

так

как

в гл. 8 задача

полностью решается в непрерывном

вре­

мени. Центральным результатом главы является интег­

ральное уравнение

Винера—Хопфа,

которое

выводится

с использованием

методов классического

вариационного

исчисления.

Поскольку

алгоритмы

оптимального

пред­

сказания,

фильтрации

и сглаживания

уже

получены

в гл. 7, интегральное

уравнение Винера—Хопфа

решает­

ся только для задачи

оптимальной

фильтрации

(фильтр

Калмана—Бьюси)

и для одного из случаев оптимально­

го сглаживания с целью иллюстрации процедуры

реше­

ния уравнения.

 

 

 

 

 

 

 

В гл. 9 и 10 представлены формулировка

и решение

так называемых задач

дискретного

и непрерывного ли­

нейного стохастического регулятора. С использованием

динамического программирования

доказывается принцип

2—85

17

 

^ Г О С . П У Б Л И Ч Н А Я

 

Н Л У Ч ! : 0 - Т Е Х г - і И Ч Е С К А Я


разделений, утверждающий, что систему управлений в целом можно рассматривать как последовательно сое­ диненные оптимальный фильтр и нестационарную цепь обратной связи, причем оба устройства можно оптими­ зировать независимо друг от друга.

Литература к гл. 1 представляет некоторые основные работы в области оценок и управления в стохастических системах.

Г л а в а в т о р а я ЭЛЕМЕНТЫ ТЕОРИИ ЛИНЕЙНЫХ СИСТЕМ

Настоящая глава преследует две цели: во-первых, в ней дается общее введение в теорию двух моделей си­ стем, используемых в дальнейшем, и, во-вторых, иссле­ дуются и иллюстрируются некоторые фундаментальные свойства этих моделей 1 .

Для достижен-ия первой цели в § 2-1 рассмотрены не­ которые результаты матричного анализа. В этом пара­ графе также вводятся многие обозначения, используе­ мые во всей книге. В § 2-2 представлена первая из двух моделей систем и с помощью нескольких примеров ил­ люстрируется ее важность. В этом параграфе также ис­ следуются некоторые свойства модели с использованием ряда понятий из теории обыкновенных линейных диффе­ ренциальных уравнений.

Вторая

модель вводится и исследуется в § 2-3.

В § 2-4

приводится качественное обсуждение поня­

тий наблюдаемости и управляемости, возникающих со­ ответственно в задачах оценки и управления.

Эти два понятия более подробно исследуются в § 2-5 и 2-6 для двух частных моделей систем. Выводятся не­ обходимые и достаточные условия наблюдаемости и уп­ равляемости, чтобы дать читателю некоторое представ­ ление о характере задач оценки и управления, а также об условиях, при которых рассматриваемые здесь алго­ ритмы оценки и управления имеет смысл применять.

В заключение главы в § 2-7 исследуются возможно­ сти использования линейных моделей § 2-2 и 2-3 для

1 Более подробное описание моделей отложено до гл. 4, по­ скольку оно требует ряда сведений из теории вероятностей и случай­ ных процессов, приведенных в гл. 3 и в первой части гл. 4.

18

моделирования поведения нелинейных систем, линеари­ зованных относительно заданных номинальных условий.

Материал настоящей главы представляет собой часть теории линейных систем. Более подробное исследование этого предмета имеется, например, в книге Деруссо и др. ІЛ. 2-1]. В книге Заде и Дезоера [Л. 2-2] представлено математически более строгое изложение материала.

Читателю, нуждающемуся в дополнительном мате­ риале по матричному анализу и теории обыкновенных линейных дифференциальных уравнений, могут оказать­ ся полезными приложение к гл. 6 книги Каплана [Л. 2-3], гл. 2, 3, 4, 6 и 10 книги Беллмана [Л. 2-4] и гл. 1 книги Хильдебранда [Л. 2-5]. Строгое изложение теории обык­

новенных

дифференциальных

уравнений

приводится

в гл. 1—3

книги Коддингтона

и Левинсона

[Л. 2-6].

2-1. ОБОЗНАЧЕНИЯ И ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

Все переменные, рассматриваемые в дальнейшем, являются действительными, если это специально не ого­ варивается. Соответственно все функции являются функ­ циями действительного переменного, кроме специально оговоренных случаев.

Матрицы

и

векторы

В общем случае прописные латинские и греческие

буквы, такие

как

Л, В, Г, Ѳ и т. д., будут использовать­

ся для обозначения матриц, а соответствующие им строчные буквы с индексами — для обозначения элемен­ тов матриц. При индексации элементов матриц обычно

первым индексом является номер строки,

а

вторым —-

номер

столбца.

Например,

под

матрицей

А

размера

пгХп

подразумевается

 

 

 

 

 

 

 

 

 

# 2 l a 2 2 • • • a 2 n

 

 

 

 

 

 

 

"ml"»iS •

• Я»,-

 

 

 

 

Это обозначение иногда записывают в виде

А — ||а,-3-||.

Индексы і

и /

относятся

соответственно

 

к

строке

и

столбцу, в которых расположен элемент.

 

 

 

 

Матрица

называется прямоугольной,

если

тфп,

и

квадратной,

если пг = п.

 

 

 

 

 

 

2*

19



 

Две матрицы А и В называют равными тогда и толь­

ко тогда, когда они обе имеют

размер

тХп

и

aij = bi}

для всех і и /.

 

 

тХп,

 

 

 

 

 

 

Любая матрица

размера

 

все элементы

которой

равны

нулю,

называется

нулевой

 

матрицей

и

обозна­

чается

0.

 

 

 

 

 

 

 

 

 

 

 

Если все элементы квадратной матрицы, кроме рас­

положенных

на главной

диагонали,

равны нулю, т. е.

 

 

 

 

ап

0. .

.

0

 

 

 

 

 

 

 

 

0 <7 •

.

.

0

 

 

 

 

 

 

 

 

 

22

 

 

 

 

 

 

 

 

0

0 . .

 

а

 

 

 

то

матрица

называется

диагональной.

Если

при этом

ац

= \

для і=\,...,п,

то

матрица

 

называется

 

единичной

и обозначается /. Иногда эту матрицу записывают в ви­

де /=||оі,-||, где èij — символ

Кронекера,

 

 

 

 

 

 

0

при

іф/;

 

 

 

 

 

 

1

при

/ =

/.

 

 

 

Строчные латинские и

греческие

буквы х, у ,

z, Ç,

ç

и т. д. будут использоваться для

обозначения

матриц

размера

m X l

(матриц

с

одним

столбцом),

содер­

жащих элементы

х,, Уі и т. д. Такие матрицы называют

векторами.

Если

требуется

указать

число

элементов

в

векторе, используются термины

пг-вектор,

р-вектор

и т. д.

или m-мерный вектор, р-мерный зектор и т. д. Напри­ мер, р-вектор I имеет вид:

Для строчной матрицы,

т. е. для

матрицы

размера

\Хт, будет использоваться

термин

вектор-строка.

Под

n-мерным вектором-строкой

х подразумевается

матрица

вида

 

 

 

 

*= | | * і . . . * „ | | .

Вобоих случаях часто удобно считать, что элементы

вектора

(строки или столбца)

определяют точку

х%

я-мерного

евклидова пространства

и, следовательно,

от-

20