Файл: Брандин, В. Н. Основы экспериментальной космической баллистики.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.10.2024
Просмотров: 226
Скачиваний: 0
(5.6.1) это правило математически записывается в виде выра жений
а ( д ) = f W(q,g)p{q)L(z- , q)dQ(q), |
(5.6.6) |
2(9) |
|
а (<7)= min а (<7). |
(5.6.7) |
f.(q) |
|
Решение, получаемое в соответствии с формулами (5.6.6) — (5.6.7), называется бейесовским. Сам минимальный средний риск (бейесовский риск) является характеристикой оптимальности вычислительного устройства.
Теперь нетрудно заметить, что описанные выше методы оце нивания являются частными случаями метода минимального среднего риска. Действительно, использование простой функции потерь
W { q , q ) = \ - b { q - q )
в формуле (5.6.6)
а {Я) = J p { q ) L { z \ q ) d Q { q ) - p ( q ) L { z \ q )
Q (q)
означает, что условию (5.6.7) соответствует условие
p(q)L{z; q)= max p(q)L{z\ q),
{*}
которое совпадает с условием (5.3.6), означающим оценивание параметров по методу максимальной апостериорной вероят ности.
Использование квадратичной функции потерь
w { q , q ) = { q - q Y { q ~ q )
в формуле (5.6.6), как показано в § 5.4, означает оценивание па раметров по методу условного математического ожидания.
Наконец, минимаксный метод, рассмотренный в § 5.5, на язы ке теории статистических решений означает получение оценок не известных параметров из условия
r ( q , Г) = ш1п т а xr( q, Г).
I?} {г}
По существу .оба решения (бейесовское и минимаксное) на ходят из условия минимума среднего риска, только в последнем случае используется наименее предпочтительное априорное рас пределение для оцениваемых параметров.
154
Вообще оказывается, что каждая оценка, порождаемая вы бором той или иной функции потерь, является наилучшей по от ношению к какому-то определенному виду функции плотности вероятностей, по которой определяется оценка. Например, для функции правдоподобия нормального вида эффективные оценки получаются по методу наименьших квадратов; для функции правдоподобия Лапласа эффективные оценки получаются по ме тоду наименьших модулей. Если в случае лапласовской функции правдоподобия применить метод наименьших квадратов, то эф фективность оценок ухудшается почти в два раза [45].
Функции потерь (5.6.4) являются симметрическими, так как они не меняются ни при какой перестановке неизвестных.
Другим важным свойством функций потерь (5.6.4) является
их выпуклость. Функция потерь W{q, а) является выпуклой, если она удовлетворяет неравенству Иенсена
|
|
|
(5-6.8) |
|
для любого действительного л (0 ^ Х ^ 1 ) и любых q b q2- |
||||
Выпуклые функции обладают таким свойством, что матрица |
||||
вторых частных производных |
|
|
|
|
П = |
a m |
[I |
(5.6.9) |
|
dqdq |
]| |
|||
|
|
является положительно полуопределенной. |
Для линейной функ |
|||
ции потерь справедливо неравенство |
|
|
||
; q — |
— (1— \)q%I |
= I Ь?+(1 — ^)q — 4 i ~ (1— ЦЧч I < |
||
|
<*• 1Ч ~ Ч 1 I + ( l - x) I Ч -"ч2 I |
, |
||
следовательно, она является выпуклой. |
легко |
показать, что |
||
Для |
квадратичной |
функции потерь |
П = 2£', где Е — единичная матрица. Следовательно, квадратич ная функция потерь по свойству матрицы (5.6.9) является вы
пуклой. |
• - |
Другие функции потерь, рассмотренные в (5.6.4), не являют |
|
ся выпуклыми. |
|
Если W(q, |
q) — выпуклая функция потерь,jro средний риск |
является выпуклым в пространстве решений %{q). Действитель но, так как функция p(q)L [г; Я) является всюду неотрицатель ной, то смысл неравенства (5.6.8) не изменится при умножении на эту функцию
W(q,K~qx+ ( l - \ ) q 2)p(q)L(z; q ) < W ( q , qx) p(q)L(z;q) +
(grf q2)p(q) L(z; q).
155
Полагаем, что pac(q) имеет только конечные моменты. В этом случае остается справедливым интегральное неравенство
J W{q, 'Kql^r { \ - l ) q ) p { q ) L { z \ q)d Q { q )^ ^(q)
<X j W{q, ql)p{q)L{z\q)dQ{q) + , , Q(q)
+(l-x) J W{q~q2)p(q)L{z\q)d9-{q).
Q(q)
Отсюда с использованием выражения (5.6.6) получаем
Это есть неравенство Иенсена для риска.
Выбор строго выпуклой функции потерь обеспечивает одно значное решение задачи оценивания параметров модели движе ния космического объекта.
Гла в а VI. ОЦЕНИВАНИЕ-ПАРАМЕТРОВ ЛИНЕЙНЫХ МОДЕЛЕЙ ДВИЖЕНИЯ КОСМИЧЕСКИХ ОБЪЕКТОВ
ПРИ АДДИТИВНЫХ ОШИБКАХ ИЗМЕРЕНИЙ
В предыдущей главе были рассмотрены статистические ме- -тоды обработки измерительной информации для случая аддитив ных ошибок измерений. Функциональная зависимость между из меряемыми и оцениваемыми параметрами определялась векторфункцией общего вида, а модель движения явно не входила в постановку задачи. Описание различных статистических методов не было доведено до конкретных вычислительных алгоритмов, так как уравнения оценок были записаны в очень общей форме. Была указана только та область математического программиро вания, в которой следует искать алгоритм решения того или ино го уравнения.
В данной главе основное внимание уделяется влиянию моде ли движения и априорной информации о ней на алгоритм реше ния задачи. С целью наглядного представления этого влияния здесь рассматриваются только линейные задачи. В этом случае уравнения оценок для различных моделей движения удается за писать в конечном виде. Отметим, что класс линейных задач с учетом возможной линеаризации нелинейных задач довольно об ширный, а излагаемые здесь подходы решения могут быть ис пользованы и в приложении к нелинейным задачам.
Измеряемая функция в данной главе является скалярной, что также сделано для упрощения записи конечных результатов. Пе реход к векторной функции измеряемых параметров осуществ ляется без особых затруднений. И все-таки уравнения оценок для некоторых классов моделей движения получаются настолько сложными, что требуют для своего решения специальных вычис лительных процедур. Эти вопросы нашли свое отражение в гл. IX и X. Напомним также, что конкретные примеры рассматривае мых здесь моделей движения и их классификация были изложе ны в гл. II.
157
\
§ 6.1. ОЦЕНИВАНИЕ ПАРАМЕТРОВ КОНЕЧНОЙ АНАЛИТИЧЕСКОЙ МОДЕЛИ
Примерами конечных аналитических моделей являются зави симости кеплерова движения, в частности, уравнение траектории центра масс космического объекта (2.1.17); регулярная прецес сия космического объекта относительно центра масс (2.2.26), (2.2.28), (2.2.30); некоторые зависимости системы управления. Линейная многомерная конечная аналитическая модель имеет вид
x{t) = Q{t)k, |
(6.1.1) |
где х является n-мерным вектором параметров движения; к—р- мерным вектором постоянных характеристик модели движения; G является пХ р прямоугольной матрицей координатных функ ций, т. е.
•■0(041^)11-
Рассмотрим случай, когда измеряемая функция задается вы ражением
= |
(6Л.2) |
где % и х — известные вектор-функции времени, а ц — s-мерный вектор характеристик модели измерения.
Подставив выражение (6.1.1) в выражение (6.1.2), получим
|
^ ) = Г ( 0 О Д * + Х т«!*- |
Введем |
r-мерный совокупный вектор характеристик модели |
<7 = {Х, ц}, |
где r = p + s, и r-мерную вектор функцию ф координат |
ных функций, с помощью которых измеряемая функция пред ставлена в виде
|
(6.1.3) |
Пусть на интервале [0, 7] в дискретные моменты |
времени |
производятся измерения |
|
*/ = 0(*/) + A, |
(6.1.4) |
где ошибки независимы, не смещены и распределены |
по нор |
мальному закону, а именно, |
|
k h N i O ^ j / p i ) . |
(6.1.5) |
Имеем следующую систему условных уравнений: |
|
Г
Н i
158
или в матричной записи
z = W q - \ - h , |
(6.1.6) |
где
W = IIМ
Оценим неизвестные параметры в данной задаче с помощью различных статистических методов.
6.1.1. Оценивание по методу максимального правдоподобия
Функция правдоподобия, записанная с учетом выражений (6.1.5) и (6.В6), в данном случае имеет вид
w |
j_ . |
|
L{z\ q ) = (2яао) 2 |
| Я | 2 exp j ----- — {z — WqyP{z — 4q) |
|
|
1 |
2o20 |
(6.1.7)
Для получения оценок максимального правдоподобия, как следует из § 5.2, необходимо минимизировать квадратичную форму
a {q)— {z — ^ q )TP {z — W<у). |
(6.1.8) |
Запишем выражение (6.1.8) в развернутом виде:
та (q) = z rPz - 2q'WTP z -f q'W'PWq.
Приведение членов в формуле сделано на основании того, что выражениядтЧГтЯ,г и z TPWq являются подобными, так как это скалярные величины.
В § 5.1 было условлено производную от скаляра по вектору записывать в виде матрицы-столбца, элементами которой явля ются производные от скаляра по элементам вектора. На основа нии этого правила получим
= - 2Г'Pz 4- 2W'PWq .
dq
В результате решения уравнения
WTPWq — WTPz = 0
находим оценку
g = C~W!PZ, |
(6.1.9) |
где
С = ЧГТЯЧГ.
159
Из условия
д In L |
О |
|
да0 |
|
|
|
|
|
также легко получить оценку для эталонной дисперсии: |
|
|
ао = - ^ ( г - ^ |
) тЯ (г-Ч '<7), |
(6.1.10) |
если последняя неизвестна по условиям опыта. |
|
|
Найденные оценки являются |
случайными величинами. Из |
|
вестно, что оценка (6.1.10) распределена по закону %2- |
Так как |
при оценивании его сглаживались результаты измерений полино
мом r-й степени, то оценка |
(6.1.10) является смещенной. |
Несме |
щенная оценка эталонной дисперсии находится по формуле |
||
Ч = — 1 г |
(^ - а д Р ( г - Щ ) . |
(6.1.11) |
Вектор оценок q представляет собой r-мерный случайный век тор, распределенный по нормальному закону с математическим ожиданием q и корреляционной матрицей сто2С^1.
Это легко показать. Обозначив прямоугольную r x N |
матри |
цу C-14jT/5 в формуле (6.1.9) через D, получим |
|
q ~ C ~ l4 TP{WqA-h) = q-\-Dh. |
|
В этом равенстве матрица D — неслучайная, а вектор |
h по ус |
ловиям опыта имеет нормальное распределение |
|
А*елг(о,о2/>-1). |
|
Отсюда |
|
M [ q ] = q - \ - D M [ h * \ = q |
(6.1.12) |
и |
|
B ^ = M [ { q - q ) { q - q ) 1] = DM[h*h*r]D^ = 3lC-K |
(6.1.13) |
С использованием выражения (6.1.7) легко получить матрицу Фишера (5.2.7), а именно
F = h 2C.
Выражение для матрицы, обратной к информационной матри це Фишера, совпадает с корреляционной матрицей (6.1.13). От сюда следует, что в рассматриваемом случае оценки максималь ного правдоподобия являются совместно эффективными.
160