Файл: Шаракшанэ, А. С. Испытания сложных систем учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 125

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

&7.6. БАЙЕСОВА ПРОЦЕДУРА ОЦЕНКИ

Байесов подход возможен ври наличии априорной информации о законах распределения оцениваемых показателей качества или эффективности. Методы определения стратегий оценки параметров для этого подхода хорошо изучены и сводятся к минимизации среднего риска:

P[^(y»)] = J® (tf)P * [/r(y j, R]dR,

(7-6.1)

где w(R) — априорное распределение оцениваемого

показателя

качества; уп — наблюдаемая выборка, полученная либо при статис­

тическом моделировании, либо в процессе проведения натурных

—>

испытаний (временной вектор уп= {уи У2 , Уп))-

значения

Выражение для

условного риска ря, как среднего

функции потерь Яф?*(Ут>), R), можно определить соотношением

Р*[/?*(Ул),

^ ]= jV [tf* (y J . ЯШ зЫЯЫу*.

(7.6.2)

где l(yn\R) — функция правдоподобия или совместная функция плотности вероятности временного вектора у„.

Переоценку априорных распределений показателя R в апосте­ риорные осуществляют на основании формулы Байеса:

Р {R I Уя)—

;

(7..6.3)

Р ( У п )

 

 

Р (Ул)= l w {R)l{Yn\R) dR.

 

(7.6.4)

Если ввести условный риск относительно наблюдаемой выбор- —►

ки уп

Ру Ю У л), Ул]= 1 ^ [/Г (У я),^ (^ |У „ ) а 1 у я,

(7.6.5)

то средний риск можно записать в виде:

• Р[^(У„)] = 1 Ру[Я*(У«), R]pGn)dyn-

Так как функция плотности вероятности р(уп) положительна во всей области определения уп, то минимизация среднего риска экви­

валентна минимизации условного риска ру

(Уп), Л] для каждой

фиксированной выборки у„. С математической точки зрения реше­ ние возникающих функциональных уравнений для всевозможных

выпуклых положительных функций потерь W[R*(yn), -К] всегда су­ ществует' и может быть найдено, например, с помощью градиентно­ го метода поиска экстремумов [27].

164


Вычислительная реализуемость байесовой процедуры оценки в значительной степени зависит от сложности математического описа­

ния выбираемой функции потерь. Если функция потерь

равна

—V

—>-

оценок

W [R* (yn),

R] = [R* (уп) — R]2, то уравнения оптимальности

получают наиболее простыми, а при гауссовых распределениях их решение может быть найдено в аналитической форме. Однако в не­ которых случаях указать конкретный вид функции потерь очень трудно. Поэтому, когда функция потерь неизвестна, на практике в качестве оценок искомых параметров принимают такие, которые максимизируют значение апостериорной функции плотности веро­

ятности p(R |уп).

При отсутствии априорных сведений, оставась в рамках байе­ сова подхода, можно рассматривать задачи, связанные с поисками таких наиху^ших априорных распределений w(R), которые гаран­ тируют определенную оптимальность получаемых оценок в самых неблагоприятных случаях. Если решение подобных задач удается найти, то говорят, что полученный алгоритм расчета оценок реали­ зует стратегию минимаксного типа в том смысле, что удовлетворяет уравнению

Р*[Я*(Ул)] = тахр[Я* (у„)],

(7.6.6)

 

w ( R )

 

где' р* — минимаксный риск.

что в случае отсутствия

априорных

Постулат Байеса гласит,

данных, чтобы сохранить замкнутость и логическую обоснованность байесова подхода, нужно принять гипотезу, что все значения истин­ ного показателя R равновероятны, т. е. w (R) =const.

При оценке характеристик реальных систем, когда все физиче­ ские переменные ограничены размерами области своего изменения, практическое использование постулата Байеса приводит порой к противоречивым заключениям. В этом нетрудно убедиться, если рассмотреть задачу оценки дисперсии нормально распределенной случайной величины двумя различными способами, которые по свое­ му смыслу должны привести к одному и тому же результату.

Первый способ заключается в том, что сначала рассчитывают оценку среднеквадратического отклонения а, а потом с помощью известных преобразований находят оценку дисперсии о2. Реализа­ ция второго способа оценивания состоит в непосредственном расче­ те величины дисперсии по наблюдаемой выборке.

Чтобы найти искомые оценки, используя постулат Байеса, запи­ сывают априорные плотности вероятности

для о

 

da

если

 

W (о) flfa=

 

(7.6.7)

a max

9min

 

О,

в противном случае,

 

165


ддя а2

^ //л2——

dc^

—, если а2 . <Га2

^

а 2 ;

 

2 .

2 ' j '-'-4 * mm^

max’

(7.6.8)

w (о2)Ф

°max

?min

 

 

 

О,

в противном случае.

 

 

Рассматривая одну и ту же выборку, например выборку еди­ ничного' объема, получают, что функции правдоподобия для оцени­ ваемых параметров должны быть равными и записываться в виде:

к СУI ° )= к (УI °2)= — ~

(7.6.9)

У 2Яст

 

Тогда на -основании формул (7.6.3), .(7.6.7) и (7.6.8) можно оп­ ределить распределение апостериорных вероятностен:

Pi ( а I У ) = —а е-У"12”*,

omin <

а <

omax;

Ръ(а2I у)

_£2_ a—y*ft°z

а2- <

<

■2

 

П1Ш ^

 

max’

где си с2— -некоторые константы.

Принимая во -внимание, что cfa=da2/2y о2, нетрудно получить распределение pi(a2[y), соответствующее распределению р \(ст| у ):

рх{ з Ч у )= { с ^ 2) е г - у ^\ ofnin< = 2< = 2iax.

Сравнивая Р\{о2\у) с p2 (oz\y), можно убедиться -в том, что по­ лученные апостериорные распределения отличны друг от друга, а следовательно, будут разными и оценки величины дисперсии, хотя, исходная выборка была -одной и той же. Этот факт обусловлен не­ однозначностью, -которую допускает постулат Байеса при выборе априорных распределений.

Пример. Пусть задана выборка результатов наблюдений у\, у 2, . . . . у п- Относительно выборки известно, что закон распределения гауссов с плотно­

стью вероятности, равной

Р (Vi I Щ)-

-IVi-rnyWl t = 1, 2 ,

п.

 

У2яоу

 

Требуется определить оценку математического ожидания при условии, что величина дисперсии сг„2 .известна, а априорное распределение оцениваемого па­ раметра

w(my) =

( ту —т 0)2

■ехр

У 2яа0

20п

где do, яг0 — заданные параметры.

В качестве функции потерь выберем функцию

W { т*у, т о) = (т* т у ) 2 .

J66


Далее находим совместную функцию плотности вероятности значений Ух, i =

= 1, 2, .. . . п

I (уп I ту ) = П /7(</i I тУ) =

( V ^ ° у ) ~ Пехр | — 2

( У 1 ~ ту)212а1 J >

 

 

Уп — (У\ I

У.2, ■■■, Уп)-

 

 

 

 

 

Применяя формулу Байеса, получаем:

 

 

 

 

 

 

 

Р (ту I

1

• ехр

[ т у ~а]п* Ч

' Ч то!°+ Щ 2

 

 

Уд)-;

 

 

 

2<Р *

 

 

 

 

 

У2я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

(7.6.10)

 

 

 

 

 

 

 

 

 

 

 

 

4*

 

«

-

i

s -

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I- 1

 

 

 

 

 

 

Для

выбранной функции

потерь

на

основании

(7.6.10)

нетрудно

записать

алгоритм построения искомых оценок:

 

 

 

 

 

 

 

 

 

т 1 = У *

[] +

а^/°оп]-1 + Ч 1+ лао/^]-1-

 

 

Оценки, найденные на основании этого алгоритма, получают смещенными; ве­

личина этого смещения

 

 

 

 

тй— ту

 

 

 

 

 

 

Е (тУ

 

- ту —

 

 

 

 

 

 

 

1 + °о”1°1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставив выражения для ту*, w(my) в (7.6.2), а затем в (7.6.1) и преобра­

зовав полученные выражения,

находим

зависимость

среднего риска

р [ту*] от

объема выборки и точности априорных сведений:

 

 

(

 

 

 

 

-

4

[1 + ^/°о«] \

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если устремить Сто2-*-

что

соответствует

полному

отсутствию

априорных

сведений, то можно убедиться

в том,

что в этом случае

риск как функция сто2

достигает своего максимума.

 

 

 

 

 

 

сводится к тому,

что в

Стратегия оценки, соответствующая этой ситуации,

качестве оценки математического ожидания следует принять величину у*,

т. е.

 

 

 

 

 

 

п

 

 

 

 

 

 

Так как риск p[/ntf*] максимален

при ту* = у *, то такая

стратегия

оценки

является минимаксной и

в рассматриваемом

случае

приводит к несмещенным

оценкам.

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим более сложный случай байесовой оценки парамет­ ров, характеризующих качество управляемых систем, в которых процессы смены состояний описываются многомерными марковски­ ми цепями.

167


Пусть исследуемая система вместе с измерительными устройст­ вами описывается разностными уравнениями:

x(+1= F{(Xi,

5i),

/ =

0 , 1 , 2 , . . . ;

(7.6.11)

Уi— Gi (х,-, т),),

i=

0,

1, 2, ... ,

(7.6.12)

где х, — «-мерный вектор состояния в i-й момент; и, — г-мерный вектор управления в i-й момент; у, — /n-мерный вектор наблюде­ ний в i-момент;’|г, гц— взаимно независимые случайные шумы из­ мерительных устройств и отклонения параметров в г'-й момент.

Чтобы проиллюстрировать байесову процедуру оценки вектора х,-, будем предполагать, что априорное распределение вектора х0 задано и закон распределения р (y»+i |x,-+i), определяющий точность измерений, известен.

Для нахождения искомого апостериорного распределения р(х,-+1|у0, уь ..., yi+i) рассмотрим равенство:

Р ( х /+1, Vi-i 11 V d — P i Y i + i I

У/) P ( x /+i I У г + i ) ,

( 7 . 6 . 1 3 )

—ь

 

 

У/-н=(Уо. Уп • •

Y<+i)-

 

Выражая р(Уг-н|Уг) и р(х{+1, Уг+^Уг) через известные распреде­ ления, получают:

Р (Уi+i I У,-)= J Р (X/1 У/)Р (xf+11x /tu,) р (уг+11х г+1)Д (х„ х /+1), (7.6.14)

р(х,-+1, у /+11у , ) = J р (х, | y j р (х ,+1 1х /+1, и,-) р (у,+11xi+1) dxt. (7.6.15)

Распределение р(х0|уо) может быть найдено

на основании ис­

ходных распределений р (х0), р (уо| х0) :

 

р(х01у0) = / (-Хо)^ (Уо|Хо)

(7.6.16)

J Р Ш Р (Уо ( x0)fifx0

 

Соотношение (7.6.13) позволяет записать рекуррентный алго­ ритм переоценки апостериорных распределений:

P (х/+11у

^

)

=

(7.6. 17)

 

р

( у / + х 1 у Л .

 

 

при условии, что

 

 

 

 

P(*j 1У/)

И р ( у г ч-il Уг)

 

 

ранее уже получены.

—>•

 

 

 

 

удается получить компактные

В частных случаях для р ( X i + i |У г )

аналитические соотношения.

168