Файл: Брандин, В. Н. Основы экспериментальной космической баллистики.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 226

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

(5.6.1) это правило математически записывается в виде выра­ жений

а ( д ) = f W(q,g)p{q)L(z- , q)dQ(q),

(5.6.6)

2(9)

 

а (<7)= min а (<7).

(5.6.7)

f.(q)

 

Решение, получаемое в соответствии с формулами (5.6.6) — (5.6.7), называется бейесовским. Сам минимальный средний риск (бейесовский риск) является характеристикой оптимальности вычислительного устройства.

Теперь нетрудно заметить, что описанные выше методы оце­ нивания являются частными случаями метода минимального среднего риска. Действительно, использование простой функции потерь

W { q , q ) = \ - b { q - q )

в формуле (5.6.6)

а {Я) = J p { q ) L { z \ q ) d Q { q ) - p ( q ) L { z \ q )

Q (q)

означает, что условию (5.6.7) соответствует условие

p(q)L{z; q)= max p(q)L{z\ q),

{*}

которое совпадает с условием (5.3.6), означающим оценивание параметров по методу максимальной апостериорной вероят­ ности.

Использование квадратичной функции потерь

w { q , q ) = { q - q Y { q ~ q )

в формуле (5.6.6), как показано в § 5.4, означает оценивание па­ раметров по методу условного математического ожидания.

Наконец, минимаксный метод, рассмотренный в § 5.5, на язы­ ке теории статистических решений означает получение оценок не­ известных параметров из условия

r ( q , Г) = ш1п т а xr( q, Г).

I?} {г}

По существу .оба решения (бейесовское и минимаксное) на­ ходят из условия минимума среднего риска, только в последнем случае используется наименее предпочтительное априорное рас­ пределение для оцениваемых параметров.

154

Вообще оказывается, что каждая оценка, порождаемая вы­ бором той или иной функции потерь, является наилучшей по от­ ношению к какому-то определенному виду функции плотности вероятностей, по которой определяется оценка. Например, для функции правдоподобия нормального вида эффективные оценки получаются по методу наименьших квадратов; для функции правдоподобия Лапласа эффективные оценки получаются по ме­ тоду наименьших модулей. Если в случае лапласовской функции правдоподобия применить метод наименьших квадратов, то эф­ фективность оценок ухудшается почти в два раза [45].

Функции потерь (5.6.4) являются симметрическими, так как они не меняются ни при какой перестановке неизвестных.

Другим важным свойством функций потерь (5.6.4) является

их выпуклость. Функция потерь W{q, а) является выпуклой, если она удовлетворяет неравенству Иенсена

 

 

 

(5-6.8)

для любого действительного л (0 ^ Х ^ 1 ) и любых q b q2-

Выпуклые функции обладают таким свойством, что матрица

вторых частных производных

 

 

 

П =

a m

[I

(5.6.9)

dqdq

]|

 

 

является положительно полуопределенной.

Для линейной функ­

ции потерь справедливо неравенство

 

 

; q —

(1— \)q%I

= I Ь?+(1 — ^)q — 4 i ~ (1— ЦЧч I <

 

<*• 1Ч ~ Ч 1 I + ( l - x) I Ч -"ч2 I

,

следовательно, она является выпуклой.

легко

показать, что

Для

квадратичной

функции потерь

П = 2£', где Е — единичная матрица. Следовательно, квадратич­ ная функция потерь по свойству матрицы (5.6.9) является вы­

пуклой.

• -

Другие функции потерь, рассмотренные в (5.6.4), не являют­

ся выпуклыми.

 

Если W(q,

q) — выпуклая функция потерь,jro средний риск

является выпуклым в пространстве решений %{q). Действитель­ но, так как функция p(q)L [г; Я) является всюду неотрицатель­ ной, то смысл неравенства (5.6.8) не изменится при умножении на эту функцию

W(q,K~qx+ ( l - \ ) q 2)p(q)L(z; q ) < W ( q , qx) p(q)L(z;q) +

(grf q2)p(q) L(z; q).

155


Полагаем, что pac(q) имеет только конечные моменты. В этом случае остается справедливым интегральное неравенство

J W{q, 'Kql^r { \ - l ) q ) p { q ) L { z \ q)d Q { q )^ ^(q)

<X j W{q, ql)p{q)L{z\q)dQ{q) + , , Q(q)

+(l-x) J W{q~q2)p(q)L{z\q)d9-{q).

Q(q)

Отсюда с использованием выражения (5.6.6) получаем

Это есть неравенство Иенсена для риска.

Выбор строго выпуклой функции потерь обеспечивает одно­ значное решение задачи оценивания параметров модели движе­ ния космического объекта.

Гла в а VI. ОЦЕНИВАНИЕ-ПАРАМЕТРОВ ЛИНЕЙНЫХ МОДЕЛЕЙ ДВИЖЕНИЯ КОСМИЧЕСКИХ ОБЪЕКТОВ

ПРИ АДДИТИВНЫХ ОШИБКАХ ИЗМЕРЕНИЙ

В предыдущей главе были рассмотрены статистические ме- -тоды обработки измерительной информации для случая аддитив­ ных ошибок измерений. Функциональная зависимость между из­ меряемыми и оцениваемыми параметрами определялась векторфункцией общего вида, а модель движения явно не входила в постановку задачи. Описание различных статистических методов не было доведено до конкретных вычислительных алгоритмов, так как уравнения оценок были записаны в очень общей форме. Была указана только та область математического программиро­ вания, в которой следует искать алгоритм решения того или ино­ го уравнения.

В данной главе основное внимание уделяется влиянию моде­ ли движения и априорной информации о ней на алгоритм реше­ ния задачи. С целью наглядного представления этого влияния здесь рассматриваются только линейные задачи. В этом случае уравнения оценок для различных моделей движения удается за­ писать в конечном виде. Отметим, что класс линейных задач с учетом возможной линеаризации нелинейных задач довольно об­ ширный, а излагаемые здесь подходы решения могут быть ис­ пользованы и в приложении к нелинейным задачам.

Измеряемая функция в данной главе является скалярной, что также сделано для упрощения записи конечных результатов. Пе­ реход к векторной функции измеряемых параметров осуществ­ ляется без особых затруднений. И все-таки уравнения оценок для некоторых классов моделей движения получаются настолько сложными, что требуют для своего решения специальных вычис­ лительных процедур. Эти вопросы нашли свое отражение в гл. IX и X. Напомним также, что конкретные примеры рассматривае­ мых здесь моделей движения и их классификация были изложе­ ны в гл. II.

157


\

§ 6.1. ОЦЕНИВАНИЕ ПАРАМЕТРОВ КОНЕЧНОЙ АНАЛИТИЧЕСКОЙ МОДЕЛИ

Примерами конечных аналитических моделей являются зави­ симости кеплерова движения, в частности, уравнение траектории центра масс космического объекта (2.1.17); регулярная прецес­ сия космического объекта относительно центра масс (2.2.26), (2.2.28), (2.2.30); некоторые зависимости системы управления. Линейная многомерная конечная аналитическая модель имеет вид

x{t) = Q{t)k,

(6.1.1)

где х является n-мерным вектором параметров движения; кр- мерным вектором постоянных характеристик модели движения; G является пХ р прямоугольной матрицей координатных функ­ ций, т. е.

•■0(041^)11-

Рассмотрим случай, когда измеряемая функция задается вы­ ражением

=

(6Л.2)

где % и х — известные вектор-функции времени, а ц — s-мерный вектор характеристик модели измерения.

Подставив выражение (6.1.1) в выражение (6.1.2), получим

 

^ ) = Г ( 0 О Д * + Х т«!*-

Введем

r-мерный совокупный вектор характеристик модели

<7 = {Х, ц},

где r = p + s, и r-мерную вектор функцию ф координат­

ных функций, с помощью которых измеряемая функция пред­ ставлена в виде

 

(6.1.3)

Пусть на интервале [0, 7] в дискретные моменты

времени

производятся измерения

 

*/ = 0(*/) + A,

(6.1.4)

где ошибки независимы, не смещены и распределены

по нор­

мальному закону, а именно,

 

k h N i O ^ j / p i ) .

(6.1.5)

Имеем следующую систему условных уравнений:

 

Г

Н i

158


или в матричной записи

z = W q - \ - h ,

(6.1.6)

где

W = IIМ

Оценим неизвестные параметры в данной задаче с помощью различных статистических методов.

6.1.1. Оценивание по методу максимального правдоподобия

Функция правдоподобия, записанная с учетом выражений (6.1.5) и (6.В6), в данном случае имеет вид

w

j_ .

 

L{z\ q ) = (2яао) 2

| Я | 2 exp j ----- — {z WqyP{z — 4q)

 

1

2o20

(6.1.7)

Для получения оценок максимального правдоподобия, как следует из § 5.2, необходимо минимизировать квадратичную форму

a {q)— {z ^ q )TP {z — W<у).

(6.1.8)

Запишем выражение (6.1.8) в развернутом виде:

та (q) = z rPz - 2q'WTP z -f q'W'PWq.

Приведение членов в формуле сделано на основании того, что выражениядтЧГтЯ,г и z TPWq являются подобными, так как это скалярные величины.

В § 5.1 было условлено производную от скаляра по вектору записывать в виде матрицы-столбца, элементами которой явля­ ются производные от скаляра по элементам вектора. На основа­ нии этого правила получим

= - 2Г'Pz 4- 2W'PWq .

dq

В результате решения уравнения

WTPWq — WTPz = 0

находим оценку

g = C~W!PZ,

(6.1.9)

где

С = ЧГТЯЧГ.

159


Из условия

д In L

О

 

да0

 

 

 

также легко получить оценку для эталонной дисперсии:

 

ао = - ^ ( г - ^

) тЯ (г-Ч '<7),

(6.1.10)

если последняя неизвестна по условиям опыта.

 

Найденные оценки являются

случайными величинами. Из­

вестно, что оценка (6.1.10) распределена по закону %2-

Так как

при оценивании его сглаживались результаты измерений полино­

мом r-й степени, то оценка

(6.1.10) является смещенной.

Несме­

щенная оценка эталонной дисперсии находится по формуле

Ч = — 1 г

(^ - а д Р ( г - Щ ) .

(6.1.11)

Вектор оценок q представляет собой r-мерный случайный век­ тор, распределенный по нормальному закону с математическим ожиданием q и корреляционной матрицей сто2С^1.

Это легко показать. Обозначив прямоугольную r x N

матри­

цу C-14jT/5 в формуле (6.1.9) через D, получим

 

q ~ C ~ l4 TP{WqA-h) = q-\-Dh.

 

В этом равенстве матрица D — неслучайная, а вектор

h по ус­

ловиям опыта имеет нормальное распределение

 

А*елг(о,о2/>-1).

 

Отсюда

 

M [ q ] = q - \ - D M [ h * \ = q

(6.1.12)

и

 

B ^ = M [ { q - q ) { q - q ) 1] = DM[h*h*r]D^ = 3lC-K

(6.1.13)

С использованием выражения (6.1.7) легко получить матрицу Фишера (5.2.7), а именно

F = h 2C.

Выражение для матрицы, обратной к информационной матри­ це Фишера, совпадает с корреляционной матрицей (6.1.13). От­ сюда следует, что в рассматриваемом случае оценки максималь­ ного правдоподобия являются совместно эффективными.

160