Файл: Брандин, В. Н. Основы экспериментальной космической баллистики.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 223

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тогда минимаксные оценки будут определяться

из условия

а (<7; р ) = min max a (q; р),

(5.5.4)

{?} {^(9)}

 

где через p(q) обозначена плотность вероятностей наименее бла­ гоприятного априорного распределения в смысле критерия

(5.5.3). Проблема отыскания p{q) с математической точки зре­ ния сводится к решению вариационной задачи на максимум ли­ нейного функционала

^ ( й \ Р )= J W{q,q)~p{q)L(z\q)d&{q)

Q ( g )

при следующих ограничениях на функцию р (q):

Р(Я)> 0, \ p{q)dQ{q)= 1, Q(q)

накладываемых по смыслу плотности вероятностей.

В общем случае минимаксные оценки не совпадают с оценка­ ми максимального правдоподобия. Такого совпадения, например,

не будет, если в качестве функции W(q, q) взять модуль ошибки:

W{q, q) = \ q - q \ = '2i \qj - q j\.

) = i

Интересно отметить, что если оптимальность оценок характе­ ризовать функцией

W{q, q) = (q~q)4<l - q)=- j?i \<]j~~qj I- i=i

уже использованной нами в § 5.3, то в результате решения ва­ риационной задачи при довольно общих предположениях о функ­ ции L(z, q) получается наименее благоприятное априорное рас­ пределение в виде дельта-функции [53]:

7=1

(5-5-5)

 

где точка q соответствует условию

 

L{z; q)= max L(z; q).

(5.5.6)

Q (9)

 

Решение (5.5.5) — (5.5.6) становится интуитивно понятным, если функцию p(q) интерпретировать как весовую. В этом слу­

149


чае для получения максимально возможного значения функцио­ нала необходимо, очевидно, максимуму функции L(z, q) приписать максимально возможный вес (5.5.5), а другие ее значения учитывать с нулевым весом.

Подставив функцию (5.5.5) в формулу (5.5.3), получим с уче­ том «фильтрующего» свойства дельта-функции квадратичную форму

а(<7; р) = ( я - Ч ) г(я-~Я)1 (г> Я)-

 

(5.5.7)

Из выражения (5.5.7) непосредственно видно,

что его мини­

мум достигается в точке

q-

 

 

 

а (я; p) = mina(q\

р).

'

(5.5.8)

 

\я).

 

 

 

Отсюда следует, что

минимаксная

оценка

по

критерию

(5.5.3) определяется из условия (5.5.6), т. е. в данном случае ми­ нимаксная оценка совпала с оценкой максимального правдопо­ добия. Уравнения для оценки, следовательно, имеют вид

- ^ - = 0. dq

В общем случае использование минимаксного критерия (5.5.4) в задачах обработки результатов измерений по существу означает, что эти задачи становятся вариационными, так как не­ обходимо определять наименее благоприятную плотность апри­ орного распределения параметров. Таким образом, минимаксный критерий с вычислительной точки зрения выдвигает более слож­ ные требования, чем критерии, рассмотренные до этого. И вместе с тем минимаксные оценки в ряде случаев могут оказаться слиш­ ком осторожными.

Минимаксный подход может применяться не только в описан­ ной здесь ситуации отсутствия априорной информации статисти­ ческого характера о векторе оцениваемых, параметров, но и в случае неполной информации об условиях измерений. В гл. XI как раз рассматривается задача планирования программы изме­ рений в условиях неполной информации о статистических свой­ ствах ошибок измерений.

§ 5.6. ОБЩИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШЕНИЙ

Все многообразие статистических методов, их взаимосвязь и оптимальные свойства рассматриваются в теории статистических решений, разработанной А. Вальдом в 40-х годах нашего столе­ тия. Эта общая теория объединила в себе все статистические методы теории оценивания, теории испытания гипотез и методы

последовательного анализа. Здесь мы кратко остановимся на

/

150


методе минимального среднего риска и покажем, что рассмот­ ренные методы оценивания являются его частными случаями.

Сформулируем задачу оценивания параметров в терминах

теории статистических решений.

дискретные моменты времени t :

Пусть

на интервале [О, Т\ в

(г — 1,

измеряется вектор-функция

u(q,t), зависящая от

времени t и r-мерного вектора

оцениваемых параметров q. По

принятой

выборке z = \ г \ \ ...

\ ^ | | т, являющейся смесью изме­

ряемой вектор-функции и \q, t)=\}UT(q,

... j uT(q, tN)\Tи век­

тора ошибок h

z = u{q, t)\ -h, необходимо

найти в каком-то смысле оптимальный вектор оценок q. Способ комбинации измеряемых параметров и ошибок измерений может быть любым.

Введенное уже /--мерное пространство П(#) векторов назовем пространством оцениваемых параметров. Если р (q) — плотность вероятностей вектора q в этом пространстве, то р (q)clQ (не­ вероятность попадания конца вектора q в бесконечно малый объем dQ(q), который можно себе представить в виде много­ мерного параллелепипеда.

Построенное таким же образом пространство векторов q назо­

вем пространством решений и обозначим y,{q\. Это есть прост­ ранство выходов решающего устройства.

Пространство входов, состоящее в данном случае из тЛ/’-мер- ных векторов z и обозначенное через 2 (z), назовем простран­ ством выборок. Роль решающего устройства или алгоритма ре­ шения сводится к тому, чтобы пространство входов оптимальным образом преобразовать в пространство решении.

Так как условия проведения измерений считаются известны­ ми, то можно построить плотность вероятности выборки или функцию правдоподобия L(z; q). Один из векторов в этой функ­ ции будет считаться неизвестным варьируемым или случайным вектором, другой предполагается равным своему действительно­ му значению. Когда и какой вектор выступает в той или иной роли, можно установить по смыслу операции, производимой с функцией L(z\ q). Там, где это затруднено, будем использовать уже введенный отличительный индекс.

Решающие функции (решающие правила). Для отыскания в

каком-то смысле оптимального вектора оценок q в вычислитель­ ное устройство должно быть заложено правило решения. Полное описание процесса решения достигается заданием плотности ве­

роятностей принятия в качестве решения вектора оценок q при условии появления фиксированной выборки г ■Эта условная

плотность вероятностей Y(q/z) и называется решающей функци­ ей (решающим правилом).

В рассмотренных выше методах оценивания процесс отыска­ ния решения является полностью детерминированным, т. е. пра­

151


вило принятия решения является не случайным. В теории реше­ ний при весьма общих условиях доказано, что в большинстве практических задач можно ограничиться только неслучайными решающими правилами. Такие правила устанавливают взаимно однозначное соответствие между пространством входов 2 (г) и

пространством решений х(^). Значит, каждой фиксированной

выборке z соответствует только одно решение q с вероятностью, равной единице. В этом случае решающее правило можно за­ писать в виде дельта-функции

 

 

Г1№ ) =

8( ^ - 5 ) ,

(5.6.1)

л

.

 

 

^

где q

— окончательное решение из всех возможных

q.

Дельта-функция обладает теми же свойствами:

 

 

О

при q ф q

£ 4 q - 4 ) d * { q ) = 1,

 

оо

цри q^=q

 

*(</)'

 

что и функции плотности вероятностей.

Решающее правило по существу определяет структуру или алгоритм вычислительного устройства, которое физически реали­ зует получение оценок. Например, в методе максимального прав­ доподобия решающее правило предписывает найти такой вектор

(/'.которому соответствует максимальное значение функции прав­ доподобия L(z, q). Для этого необходимо использовать какой-то алгоритм поиска глобального экстремума. В § 5.4 решающее пра­ вило предписывает в качестве оценок принять их условные мате­ матические ожидания, для чего необходимо использовать много­ мерные квадратурные формулы.

Из этих примеров видно, что, определяя алгоритм вычисли­ тельного устройства, решающее правило в свою очередь зависит от функции потерь.

Функция потерь (функция платы). Из-за влияния ошибок из­

мерений при любой решающей функции Г (q/z) неизбежны ошиб­ ки решения. Ошибки решения, которыми, в данном случае явля­ ются ошибки оценки вектора- q, приводят к дополнительным за­ тратам на испытание и совершенствование космического .объекта и всей измерительно-вычислительной системы.

Мерой затрат (потерь) при этом служит заранее выбранная

функция потерь W (q, q). Ее выбор до некоторой степени произ­ волен, однако она должйа удовлетворять тому условию, что если

решение q i ближе к действительному значению q, чем

решение

q 2) то

 

^ ( Q , ( h ) < W ( q , q . 2).

(5.6.2)

152


Если правильным решениям приписать нулевые потери, то в этом случае

W { q , q ) > 0.

(5.6.3)

В остальном выбор функции потерь будет определяться усло­ виями задачи. Наиболее часто используются функции потерь следующего вида:

W(q, q)— \ — 8 (q~ - q )~ простая,

W{q, q ) =

1q — q |

—линейная,

 

(5.6.4)

W[.q, q) = {q~q)'c(q — q ) ~ квадратичная,

 

W {q, q ) =

1 — exp | — ) ^ { q q f { q — q) | — экспоненциальная,

....

[ 0

при

I «у — q j

—прямоугольная.

 

w { q , q ) = !

при

j q q | > s

 

 

I 1

 

 

Заметим, что только простая функция потерь не удовлетворя­ ет условию (5.6.3). Правильным решениям при простой функции потерь соответствуют отрицательные потери.

Так как решение, а следовательно, и W(q,q), вообще говоря, являются случайными, то для сравнительной оценки решающих правил функция потерь не может быть критерием. В качестве критерия разумно взять некоторые средние потери. Мерой сред­ них потерь служит риск — математическое ожидание функции потерь.

Риск. Условным риском r(q, Г) называется математическое ожидание функции потерь W{q, q) при фиксированном q и не­ котором фиксированном решающем правиле T(qjz)

r { q , T )= J J W{q,q)T(qiz)L{z\q)d*(q)db(z) .

х(<?)2(г)

Средний риск определяется как математическое ожидание ус­ ловного риска по вектору q, т. е.

Я ( Г )= ? r(q,T)p(q)dQ(q).

(5.6.5)

9 - h )

Решающее устройство должно выдать на выходе решение q, при котором функция риска (5.6.5) будет иметь минимальное значение, т. е. смысл решающего правила заключается в следую­ щем предложении: «необходимо по принятой выборке z найти

вектор q , соответствующий минимуму функции риска Л!(Г), и принять его в качестве решения». Для решающей функции

153