Файл: Шаракшанэ, А. С. Испытания сложных систем учеб. пособие.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 125
Скачиваний: 0
&7.6. БАЙЕСОВА ПРОЦЕДУРА ОЦЕНКИ
Байесов подход возможен ври наличии априорной информации о законах распределения оцениваемых показателей качества или эффективности. Методы определения стратегий оценки параметров для этого подхода хорошо изучены и сводятся к минимизации среднего риска:
P[^(y»)] = J® (tf)P * [/r(y j, R]dR, |
(7-6.1) |
где w(R) — априорное распределение оцениваемого |
показателя |
качества; уп — наблюдаемая выборка, полученная либо при статис
тическом моделировании, либо в процессе проведения натурных
—>
испытаний (временной вектор уп= {уи У2 , Уп))- |
значения |
|
Выражение для |
условного риска ря, как среднего |
|
функции потерь Яф?*(Ут>), R), можно определить соотношением |
||
Р*[/?*(Ул), |
^ ]= jV [tf* (y J . ЯШ зЫЯЫу*. |
(7.6.2) |
где l(yn\R) — функция правдоподобия или совместная функция плотности вероятности временного вектора у„.
Переоценку априорных распределений показателя R в апосте риорные осуществляют на основании формулы Байеса:
Р {R I Уя)— |
; |
(7..6.3) |
Р ( У п ) |
|
|
Р (Ул)= l w {R)l{Yn\R) dR. |
|
(7.6.4) |
Если ввести условный риск относительно наблюдаемой выбор- —►
ки уп
Ру Ю У л), Ул]= 1 ^ [/Г (У я),^ (^ |У „ ) а 1 у я, |
(7.6.5) |
то средний риск можно записать в виде:
• Р[^(У„)] = 1 Ру[Я*(У«), R]pGn)dyn-
Так как функция плотности вероятности р(уп) положительна во всей области определения уп, то минимизация среднего риска экви
валентна минимизации условного риска ру |
(Уп), Л] для каждой |
фиксированной выборки у„. С математической точки зрения реше ние возникающих функциональных уравнений для всевозможных
выпуклых положительных функций потерь W[R*(yn), -К] всегда су ществует' и может быть найдено, например, с помощью градиентно го метода поиска экстремумов [27].
164
Вычислительная реализуемость байесовой процедуры оценки в значительной степени зависит от сложности математического описа
ния выбираемой функции потерь. Если функция потерь |
равна |
|
—V |
—>- |
оценок |
W [R* (yn), |
R] = [R* (уп) — R]2, то уравнения оптимальности |
получают наиболее простыми, а при гауссовых распределениях их решение может быть найдено в аналитической форме. Однако в не которых случаях указать конкретный вид функции потерь очень трудно. Поэтому, когда функция потерь неизвестна, на практике в качестве оценок искомых параметров принимают такие, которые максимизируют значение апостериорной функции плотности веро
ятности p(R |уп).
При отсутствии априорных сведений, оставась в рамках байе сова подхода, можно рассматривать задачи, связанные с поисками таких наиху^ших априорных распределений w(R), которые гаран тируют определенную оптимальность получаемых оценок в самых неблагоприятных случаях. Если решение подобных задач удается найти, то говорят, что полученный алгоритм расчета оценок реали зует стратегию минимаксного типа в том смысле, что удовлетворяет уравнению
Р*[Я*(Ул)] = тахр[Я* (у„)], |
(7.6.6) |
|
|
w ( R ) |
|
где' р* — минимаксный риск. |
что в случае отсутствия |
априорных |
Постулат Байеса гласит, |
данных, чтобы сохранить замкнутость и логическую обоснованность байесова подхода, нужно принять гипотезу, что все значения истин ного показателя R равновероятны, т. е. w (R) =const.
При оценке характеристик реальных систем, когда все физиче ские переменные ограничены размерами области своего изменения, практическое использование постулата Байеса приводит порой к противоречивым заключениям. В этом нетрудно убедиться, если рассмотреть задачу оценки дисперсии нормально распределенной случайной величины двумя различными способами, которые по свое му смыслу должны привести к одному и тому же результату.
Первый способ заключается в том, что сначала рассчитывают оценку среднеквадратического отклонения а, а потом с помощью известных преобразований находят оценку дисперсии о2. Реализа ция второго способа оценивания состоит в непосредственном расче те величины дисперсии по наблюдаемой выборке.
Чтобы найти искомые оценки, используя постулат Байеса, запи сывают априорные плотности вероятности
для о
|
da |
если |
|
W (о) flfa= |
|
(7.6.7) |
|
a max |
9min |
||
|
О, |
в противном случае, |
|
165
ддя а2
^ //л2—— |
dc^ |
—, если а2 . <Га2 |
^ |
а 2 ; |
|
2 . |
2 ' j '-'-4 * mm^ |
max’ |
(7.6.8) |
||
w (о2)Ф |
°max |
?min |
|
|
|
|
О, |
в противном случае. |
|
|
Рассматривая одну и ту же выборку, например выборку еди ничного' объема, получают, что функции правдоподобия для оцени ваемых параметров должны быть равными и записываться в виде:
к СУI ° )= к (УI °2)= — ~ |
(7.6.9) |
У 2Яст |
|
Тогда на -основании формул (7.6.3), .(7.6.7) и (7.6.8) можно оп ределить распределение апостериорных вероятностен:
Pi ( а I У ) = —а е-У"12”*, |
omin < |
а < |
omax; |
|
Ръ(а2I у) |
_£2_ a—y*ft°z |
а2- < |
< |
■2 |
|
П1Ш ^ |
|
max’ |
где си с2— -некоторые константы.
Принимая во -внимание, что cfa=da2/2y о2, нетрудно получить распределение pi(a2[y), соответствующее распределению р \(ст| у ):
рх{ з Ч у )= { с ^ 2) е г - у ^\ ofnin< = 2< = 2iax.
Сравнивая Р\{о2\у) с p2 (oz\y), можно убедиться -в том, что по лученные апостериорные распределения отличны друг от друга, а следовательно, будут разными и оценки величины дисперсии, хотя, исходная выборка была -одной и той же. Этот факт обусловлен не однозначностью, -которую допускает постулат Байеса при выборе априорных распределений.
Пример. Пусть задана выборка результатов наблюдений у\, у 2, . . . . у п- Относительно выборки известно, что закон распределения гауссов с плотно
стью вероятности, равной
Р (Vi I Щ)- |
-IVi-rnyWl t = 1, 2 , |
п. |
|
У2яоу |
|
Требуется определить оценку математического ожидания при условии, что величина дисперсии сг„2 .известна, а априорное распределение оцениваемого па раметра
w(my) = |
( ту —т 0)2 |
■ехр |
|
У 2яа0 |
20п |
где do, яг0 — заданные параметры.
В качестве функции потерь выберем функцию
W { т*у, т о) = (т* —т у ) 2 .
J66
Далее находим совместную функцию плотности вероятности значений Ух, i =
= 1, 2, .. . . п
I (уп I ту ) = П /7(</i I тУ) = |
( V ^ ° у ) ~ Пехр | — 2 |
( У 1 ~ ту)212а1 J > |
||||||||||
|
|
Уп — (У\ I |
У.2, ■■■, Уп)- |
|
|
|
|
|
||||
Применяя формулу Байеса, получаем: |
|
|
|
|
|
|
|
|||||
Р (ту I |
1 |
• ехр |
[ т у ~а]п* Ч |
' Ч то!°+ Щ 2 |
|
|
||||||
Уд)-; |
|
|
|
2<Р * |
|
|
|
|
||||
|
У2я |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
т |
|
|
|
(7.6.10) |
||
|
|
|
|
|
|
|
|
|
|
|
||
|
4* |
|
« |
- |
i |
s - |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
I- 1 |
|
|
|
|
|
|
Для |
выбранной функции |
потерь |
на |
основании |
(7.6.10) |
нетрудно |
записать |
|||||
алгоритм построения искомых оценок: |
|
|
|
|
|
|
|
|
||||
|
т 1 = У * |
[] + |
а^/°оп]-1 + Ч 1+ лао/^]-1- |
|
|
|||||||
Оценки, найденные на основании этого алгоритма, получают смещенными; ве |
||||||||||||
личина этого смещения |
|
|
|
|
тй— ту |
|
|
|
|
|
||
|
Е (тУ |
|
- ту — |
|
|
|
|
|
||||
|
|
1 + °о”1°1 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||
Подставив выражения для ту*, w(my) в (7.6.2), а затем в (7.6.1) и преобра |
||||||||||||
зовав полученные выражения, |
находим |
зависимость |
среднего риска |
р [ту*] от |
||||||||
объема выборки и точности априорных сведений: |
|
|
( |
|
|
|||||||
|
|
- |
4 |
[1 + ^/°о«] \ |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|||
Если устремить Сто2-*- |
что |
соответствует |
полному |
отсутствию |
априорных |
|||||||
сведений, то можно убедиться |
в том, |
что в этом случае |
риск как функция сто2 |
|||||||||
достигает своего максимума. |
|
|
|
|
|
|
сводится к тому, |
что в |
||||
Стратегия оценки, соответствующая этой ситуации, |
||||||||||||
качестве оценки математического ожидания следует принять величину у*, |
т. е. |
|||||||||||
|
|
|
|
|
|
п |
|
|
|
|
|
|
Так как риск p[/ntf*] максимален |
при ту* = у *, то такая |
стратегия |
оценки |
|||||||||
является минимаксной и |
в рассматриваемом |
случае |
приводит к несмещенным |
|||||||||
оценкам. |
|
|
|
|
|
|
|
|
|
|
|
|
Рассмотрим более сложный случай байесовой оценки парамет ров, характеризующих качество управляемых систем, в которых процессы смены состояний описываются многомерными марковски ми цепями.
167
Пусть исследуемая система вместе с измерительными устройст вами описывается разностными уравнениями:
x(+1= F{(Xi, |
5i), |
/ = |
0 , 1 , 2 , . . . ; |
(7.6.11) |
Уi— Gi (х,-, т),), |
i= |
0, |
1, 2, ... , |
(7.6.12) |
где х, — «-мерный вектор состояния в i-й момент; и, — г-мерный вектор управления в i-й момент; у, — /n-мерный вектор наблюде ний в i-момент;’|г, гц— взаимно независимые случайные шумы из мерительных устройств и отклонения параметров в г'-й момент.
Чтобы проиллюстрировать байесову процедуру оценки вектора х,-, будем предполагать, что априорное распределение вектора х0 задано и закон распределения р (y»+i |x,-+i), определяющий точность измерений, известен.
Для нахождения искомого апостериорного распределения р(х,-+1|у0, уь ..., yi+i) рассмотрим равенство:
Р ( х /+1, Vi-i 11 V d — P i Y i + i I |
У/) P ( x /+i I У г + i ) , |
( 7 . 6 . 1 3 ) |
—ь |
|
|
У/-н=(Уо. Уп • • |
Y<+i)- |
|
Выражая р(Уг-н|Уг) и р(х{+1, Уг+^Уг) через известные распреде ления, получают:
Р (Уi+i I У,-)= J Р (X/1 У/)Р (xf+11x /tu,) р (уг+11х г+1)Д (х„ х /+1), (7.6.14)
р(х,-+1, у /+11у , ) = J р (х, | y j р (х ,+1 1х /+1, и,-) р (у,+11xi+1) dxt. (7.6.15)
Распределение р(х0|уо) может быть найдено |
на основании ис |
ходных распределений р (х0), р (уо| х0) : |
|
р(х01у0) = / (-Хо)^ (Уо|Хо) |
(7.6.16) |
J Р Ш Р (Уо ( x0)fifx0 |
|
Соотношение (7.6.13) позволяет записать рекуррентный алго ритм переоценки апостериорных распределений:
P (х/+11у |
^ |
) |
= |
(7.6. 17) |
|
р |
( у / + х 1 у Л . |
|
|
при условии, что |
|
|
|
|
P(*j 1У/) |
И р ( у г ч-il Уг) |
|
|
|
ранее уже получены. |
—>• |
|
|
|
|
удается получить компактные |
|||
В частных случаях для р ( X i + i |У г ) |
аналитические соотношения.
168