ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 30.10.2024
Просмотров: 58
Скачиваний: 0
2.1. Оценка случайных параметров |
19 |
Доказательство этой теоремы см. в работе Ван Триса [1, п. 2.4.1]. Отметим, что при выполнении условий тео ремы 2.1 все три величины — условное математическое ожидание, условная мода, условная медиана — равны между собой. В следующей теореме мы ослабим ограни чения на функцию потерь за счет дополнительного су жения класса функций f(a\z).
Т е о р е м а 2.2. Если функция |
f(a|z) |
унимодальна, |
симметрична и для любого z |
|
|
lim с (а)/(а |z) = |
0, |
(2.10) |
а - » о о |
|
|
то для любой симметричной функции потерь, монотонной в том смысле, что
с(е')^с(е) |
при е '^ е ^ О , |
(2.11) |
||
байесовский риск |
минимален приd(z) = |
d(z). |
|
|
Д о к а з а т е л ь с т в о |
(см. Витерби |
[2, стр. |
376]). |
Так как наши рассуждения применимы к условной плот ности f(a\z) при произвольном значении z, мы для
удобства опустим переменную z. Полагая а* = а — а, запишем условный риск при каком-либо значении оцен ки d в виде
оо оо
<8С(â) = J |
с (а — а) / (а) d a — |
J с (а' — d + а) f* (а*) da* = |
|
—ОО |
|
—ОО |
оо |
|
|
= |
I c(w)f*{w-{- а — d)dw, |
где через |
/*(а*) = f(a* + а) |
—ОО |
|
|
|
обозначена центрирован |
ная условная плотность. Используя симметрию функций с и /*, находим
|
|
|
оо |
Ше(d) — <§с (а) = |
— 2 J с (ш) f * (ш) dw + |
||
|
оо |
о |
|
|
0 |
||
+ |
J |
с (до) /’ (w + |
d—d) dw + J c (w) f * (w + d — d) dw = |
|
0 |
|
— oo |
|
oo |
c (w) [f* (ш + |
d—a) + f* (w—d + d)— 2f’ (w)\dw. (2.12) |
= |
J |
||
|
о |
|
|
20 Гл. 2. Оценка параметров
Обозначим
V = С (ДО),
du — [f* (до + й — ä) + f* (до — й + ö) — 2/* (до)] dw
и проинтегрируем выражение справа по частям. Счи тая, что d > ix, получаем при всех до ^ 0
|
|
|
|
|
0 |
|
|
w |
|
|
|
|
и (до) = |
— J f |
{у) dij — J f* (у) dy 4- |
|
|
||||||||
|
|
|
|
—to |
|
0 |
|
|
|
|
||
|
|
|
|
—(â—ct)+a> |
|
|
й —â-\'W |
|
|
|||
|
|
|
+ |
|
W |
|
(у) dy + |
|
(у) dy = |
|
||
|
|
|
|
|
|
|
й — й+иі |
|
|
|
||
|
|
|
|
—(й—й) |
|
|
й—й |
|
|
|
||
|
|
= |
— |
|
j |
dy + |
|
/* |
Of)Гdy |
= |
|
|
|
|
|
|
|
(У) Г |
|
|
J |
|
|
||
|
|
|
|
—аі+(й—й) |
|
|
ш+(й—â) |
|
|
|||
|
|
= — |
J ГJ |
f ' ( y ) d yJ+ |
J |
f {y ) d y = |
|
|||||
|
|
йJ- й |
|
—w |
|
|
|
w |
|
|
|
|
Смысл |
= |
|
(y + O') — (У — ®)] dy < 0. |
(2.13) |
||||||||
промежуточных |
выкладок в |
(2.13) проще |
всего |
|||||||||
уяснить, |
|
о |
|
|
|
графически |
промежутки интегриро |
|||||
изобразив |
||||||||||||
|
|
|
[Г |
|
|
Г |
|
|
|
|
|
вания; последнее неравенство следует из монотонности функции f.
Объединяя |
(2.10), (2.12) и |
(2.13), |
получаем |
<ВС(“ ) — <^с (ä) = |
lim с (до) и (до) |
— j dw |
и ^ ^ °> |
|
*->•00 |
||
|
|
|
(2.14) |
так как dc(w)/dw в силу монотонности функции с *).
Заметим, что из условия (2.10) и вида функции «(до)
‘ ) Если функция с( ) [«дифференцируема, то интеграл в (2.14) можно рассматривать как интеграл Стильтьеса. Тогда из монотон ности функции с(w) и неравенства u(w) tg: 0 следует, что этот инте грал неположителен. При этом формула интегрирования по частям по-прежнему верна.
2.2. Оценивание неслучайных параметров |
21 |
в (2.13) |
вытекает, |
что lim |
c{w)u{w) = |
0. |
В |
силу |
|
|
ЬУ - > со |
|
|
|
|
симметрии |
те же |
рассуждения применимы |
и |
при |
||
â — а < 0. |
|
|
|
|
|
|
З а д а ч а 2.2. Пусть а — скалярная случайная |
вели |
|||||
чина, а Z |
обозначает /г-мерный |
случайный |
вектор, |
при |
чем совместное распределение а и Z гауссовское. Пред положим, что а и Z имеют нулевое математическое ожи
дание и матрицу ковариаций
2, |
• • • z a |
а |
2, |
|
|
RaZ — ■ |
Rz |
г] |
|
|
|
Zn |
г |
|
а |
|
где Rz есть (/гХ'г)-матрица, г — вектор-строка, г] — век тор-столбец, оа2— скаляр.
Обозначим через Q матрицу, обратную к Raг-
2, . . . Z n |
а |
2, |
— |
|
|
Qz |
q] |
Q — • |
|
Zn |
|
а |
Яа _ |
где Qz есть (п X «) -матрица.
Показать, что E {a |Z } — линейная функция от Z. При умелом использовании матричных обозначений и вида матрицы Q эта задача не требует громоздких вычис
лений.
2.2. О Ц Е Н И В А Н И Е Н Е С Л У Ч А Й Н Ы Х П А РА М ЕТРО В
Существуют различные ситуации (такие, как измере ние радиолокатором скорости вращения планеты),' когда нет смысла предполагать, что параметр а выбирается
22 |
Гл. 2. Оценка параметров |
случайным образом из некоторого множества, на кото ром можно разумным способом задать плотность априор ного распределения /(а). Этот случай, который мы ис следуем в настоящем разделе, логически не столь прост, как предыдущий. Трудность состоит в том, что нелегко непосредственно определить, что мы будем понимать под наилучшей оценкой. Чтобы обойти эту трудность, изберем следующий путь. Сначала, опираясь на интуи тивные соображения, определим некоторую оценку спе циального вида — так называемую оценку максималь ного правдоподобия. Затем получим границу качества оценивания для произвольной оценки а. Наконец, рас
смотрим ряд «хороших» свойств, которыми могут обла дать те или иные оценки, и покажем, что если суще ствует оценка, обладающая этими свойствами, то она совпадает с оценкой максимального правдоподобия.
Оценка максимального правдоподобия
Чтобы объяснить, почему мы уделяем оценке макси мального правдоподобия особое внимание, заметим сле дующее.
i) Как мы видели, при некоторых слабых ограниче ниях на плотность /(ct|z) для широкого класса функ ций потерь оптимальной оценкой является оценка мак симума апостериорной вероятности (МАВ); другими словами, это оценка, принимающая то значение а, при котором величина
f ( a \ z ) = П г \ Щ іа) |
(2.15) |
|
максимальна. |
|
|
ii) Поскольку f{z) |
в последнем равенстве не |
зави |
сит от а, оценка МАВ |
максимизирует f(z\a)f(a). |
Если |
же предположить, что наблюдение Z заметно увеличи вает надежность оценивания а, то функция /(z|a)/(a)
должна иметь гораздо более выраженный пик вблизи своей моды, чем f[a). Следовательно, в этом случае
максимум (относительно а) функции f(z|a)f(cc) распо ложен вблизи максимума функции f(z|a ).
Таким образом, в качестве оценки разумно выбрать то значение а, которое максимизирует /(z|a); эту оценку