Файл: Брандин, В. Н. Основы экспериментальной космической баллистики.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.10.2024
Просмотров: 223
Скачиваний: 0
Тогда минимаксные оценки будут определяться |
из условия |
а (<7; р ) = min max a (q; р), |
(5.5.4) |
{?} {^(9)} |
|
где через p(q) обозначена плотность вероятностей наименее бла гоприятного априорного распределения в смысле критерия
(5.5.3). Проблема отыскания p{q) с математической точки зре ния сводится к решению вариационной задачи на максимум ли нейного функционала
^ ( й \ Р )= J W{q,q)~p{q)L(z\q)d&{q)
Q ( g )
при следующих ограничениях на функцию р (q):
Р(Я)> 0, \ p{q)dQ{q)= 1, Q(q)
накладываемых по смыслу плотности вероятностей.
В общем случае минимаксные оценки не совпадают с оценка ми максимального правдоподобия. Такого совпадения, например,
не будет, если в качестве функции W(q, q) взять модуль ошибки:
W{q, q) = \ q - q \ = '2i \qj - q j\.
) = i
Интересно отметить, что если оптимальность оценок характе ризовать функцией
W{q, q) = (q~q)4<l - q)=- j?i \<]j~~qj I- i=i
уже использованной нами в § 5.3, то в результате решения ва риационной задачи при довольно общих предположениях о функ ции L(z, q) получается наименее благоприятное априорное рас пределение в виде дельта-функции [53]:
7=1 |
(5-5-5) |
|
|
где точка q соответствует условию |
|
L{z; q)= max L(z; q). |
(5.5.6) |
Q (9) |
|
Решение (5.5.5) — (5.5.6) становится интуитивно понятным, если функцию p(q) интерпретировать как весовую. В этом слу
149
чае для получения максимально возможного значения функцио нала необходимо, очевидно, максимуму функции L(z, q) приписать максимально возможный вес (5.5.5), а другие ее значения учитывать с нулевым весом.
Подставив функцию (5.5.5) в формулу (5.5.3), получим с уче том «фильтрующего» свойства дельта-функции квадратичную форму
а(<7; р) = ( я - Ч ) г(я-~Я)1 (г> Я)- |
|
(5.5.7) |
||
Из выражения (5.5.7) непосредственно видно, |
что его мини |
|||
мум достигается в точке |
q- |
|
|
|
а (я; p) = mina(q\ |
р). |
' |
(5.5.8) |
|
|
\я). |
|
|
|
Отсюда следует, что |
минимаксная |
оценка |
по |
критерию |
(5.5.3) определяется из условия (5.5.6), т. е. в данном случае ми нимаксная оценка совпала с оценкой максимального правдопо добия. Уравнения для оценки, следовательно, имеют вид
- ^ - = 0. dq
В общем случае использование минимаксного критерия (5.5.4) в задачах обработки результатов измерений по существу означает, что эти задачи становятся вариационными, так как не обходимо определять наименее благоприятную плотность апри орного распределения параметров. Таким образом, минимаксный критерий с вычислительной точки зрения выдвигает более слож ные требования, чем критерии, рассмотренные до этого. И вместе с тем минимаксные оценки в ряде случаев могут оказаться слиш ком осторожными.
Минимаксный подход может применяться не только в описан ной здесь ситуации отсутствия априорной информации статисти ческого характера о векторе оцениваемых, параметров, но и в случае неполной информации об условиях измерений. В гл. XI как раз рассматривается задача планирования программы изме рений в условиях неполной информации о статистических свой ствах ошибок измерений.
§ 5.6. ОБЩИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШЕНИЙ
Все многообразие статистических методов, их взаимосвязь и оптимальные свойства рассматриваются в теории статистических решений, разработанной А. Вальдом в 40-х годах нашего столе тия. Эта общая теория объединила в себе все статистические методы теории оценивания, теории испытания гипотез и методы
последовательного анализа. Здесь мы кратко остановимся на
/
150
методе минимального среднего риска и покажем, что рассмот ренные методы оценивания являются его частными случаями.
Сформулируем задачу оценивания параметров в терминах
теории статистических решений. |
дискретные моменты времени t : |
||
Пусть |
на интервале [О, Т\ в |
||
(г — 1, |
измеряется вектор-функция |
u(q,t), зависящая от |
|
времени t и r-мерного вектора |
оцениваемых параметров q. По |
||
принятой |
выборке z = \ г \ \ ... |
\ ^ | | т, являющейся смесью изме |
|
ряемой вектор-функции и \q, t)=\}UT(q, |
... j uT(q, tN)\Tи век |
||
тора ошибок h |
z = u{q, t)\ -h, необходимо |
найти в каком-то смысле оптимальный вектор оценок q. Способ комбинации измеряемых параметров и ошибок измерений может быть любым.
Введенное уже /--мерное пространство П(#) векторов назовем пространством оцениваемых параметров. Если р (q) — плотность вероятностей вектора q в этом пространстве, то р (q)clQ (не вероятность попадания конца вектора q в бесконечно малый объем dQ(q), который можно себе представить в виде много мерного параллелепипеда.
Построенное таким же образом пространство векторов q назо
вем пространством решений и обозначим y,{q\. Это есть прост ранство выходов решающего устройства.
Пространство входов, состоящее в данном случае из тЛ/’-мер- ных векторов z и обозначенное через 2 (z), назовем простран ством выборок. Роль решающего устройства или алгоритма ре шения сводится к тому, чтобы пространство входов оптимальным образом преобразовать в пространство решении.
Так как условия проведения измерений считаются известны ми, то можно построить плотность вероятности выборки или функцию правдоподобия L(z; q). Один из векторов в этой функ ции будет считаться неизвестным варьируемым или случайным вектором, другой предполагается равным своему действительно му значению. Когда и какой вектор выступает в той или иной роли, можно установить по смыслу операции, производимой с функцией L(z\ q). Там, где это затруднено, будем использовать уже введенный отличительный индекс.
Решающие функции (решающие правила). Для отыскания в
каком-то смысле оптимального вектора оценок q в вычислитель ное устройство должно быть заложено правило решения. Полное описание процесса решения достигается заданием плотности ве
роятностей принятия в качестве решения вектора оценок q при условии появления фиксированной выборки г ■Эта условная
плотность вероятностей Y(q/z) и называется решающей функци ей (решающим правилом).
В рассмотренных выше методах оценивания процесс отыска ния решения является полностью детерминированным, т. е. пра
151
вило принятия решения является не случайным. В теории реше ний при весьма общих условиях доказано, что в большинстве практических задач можно ограничиться только неслучайными решающими правилами. Такие правила устанавливают взаимно однозначное соответствие между пространством входов 2 (г) и
пространством решений х(^). Значит, каждой фиксированной
выборке z соответствует только одно решение q с вероятностью, равной единице. В этом случае решающее правило можно за писать в виде дельта-функции
|
|
Г1№ ) = |
8( ^ - 5 ) , |
(5.6.1) |
л |
. |
|
|
^ |
где q |
— окончательное решение из всех возможных |
q. |
||
Дельта-функция обладает теми же свойствами: |
|
|||
|
О |
при q ф q |
£ 4 q - 4 ) d * { q ) = 1, |
|
|
оо |
цри q^=q |
||
|
*(</)' |
|
что и функции плотности вероятностей.
Решающее правило по существу определяет структуру или алгоритм вычислительного устройства, которое физически реали зует получение оценок. Например, в методе максимального прав доподобия решающее правило предписывает найти такой вектор
(/'.которому соответствует максимальное значение функции прав доподобия L(z, q). Для этого необходимо использовать какой-то алгоритм поиска глобального экстремума. В § 5.4 решающее пра вило предписывает в качестве оценок принять их условные мате матические ожидания, для чего необходимо использовать много мерные квадратурные формулы.
Из этих примеров видно, что, определяя алгоритм вычисли тельного устройства, решающее правило в свою очередь зависит от функции потерь.
Функция потерь (функция платы). Из-за влияния ошибок из
мерений при любой решающей функции Г (q/z) неизбежны ошиб ки решения. Ошибки решения, которыми, в данном случае явля ются ошибки оценки вектора- q, приводят к дополнительным за тратам на испытание и совершенствование космического .объекта и всей измерительно-вычислительной системы.
Мерой затрат (потерь) при этом служит заранее выбранная
функция потерь W (q, q). Ее выбор до некоторой степени произ волен, однако она должйа удовлетворять тому условию, что если
решение q i ближе к действительному значению q, чем |
решение |
q 2) то |
|
^ ( Q , ( h ) < W ( q , q . 2). |
(5.6.2) |
152
Если правильным решениям приписать нулевые потери, то в этом случае
W { q , q ) > 0. |
(5.6.3) |
В остальном выбор функции потерь будет определяться усло виями задачи. Наиболее часто используются функции потерь следующего вида:
W(q, q)— \ — 8 (q~ - q )~ простая,
W{q, q ) = |
1q — q | |
—линейная, |
|
(5.6.4) |
|
W[.q, q) = {q~q)'c(q — q ) ~ квадратичная, |
|
||||
W {q, q ) = |
1 — exp | — ) ^ { q — q f { q — q) | — экспоненциальная, |
||||
.... |
[ 0 |
при |
I «у — q j |
—прямоугольная. |
|
w { q , q ) = ! |
при |
j q — q | > s |
|
||
|
I 1 |
|
|
Заметим, что только простая функция потерь не удовлетворя ет условию (5.6.3). Правильным решениям при простой функции потерь соответствуют отрицательные потери.
Так как решение, а следовательно, и W(q,q), вообще говоря, являются случайными, то для сравнительной оценки решающих правил функция потерь не может быть критерием. В качестве критерия разумно взять некоторые средние потери. Мерой сред них потерь служит риск — математическое ожидание функции потерь.
Риск. Условным риском r(q, Г) называется математическое ожидание функции потерь W{q, q) при фиксированном q и не котором фиксированном решающем правиле T(qjz)
r { q , T )= J J W{q,q)T(qiz)L{z\q)d*(q)db(z) .
х(<?)2(г)
Средний риск определяется как математическое ожидание ус ловного риска по вектору q, т. е.
Я ( Г )= ? r(q,T)p(q)dQ(q). |
(5.6.5) |
9 - h )
Решающее устройство должно выдать на выходе решение q, при котором функция риска (5.6.5) будет иметь минимальное значение, т. е. смысл решающего правила заключается в следую щем предложении: «необходимо по принятой выборке z найти
вектор q , соответствующий минимуму функции риска Л!(Г), и принять его в качестве решения». Для решающей функции
153