Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 739

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

570 Глава 8

собой нормировочный множитель. Предполагается, что апостери­ орная плотность распределения вероятности является функцией независимых переменных x, а также и Y, хотя эта зависимость опущена в аргументах плотностей распределения вероятности в равенстве (8.4.2). Основной интерес при построении плана экспе­ римента представляет установление будущих значений xt. Соглас­ но Байесу, апостериорная плотность распределения вероятности содержит всю доступную информацию о параметрах ßj. В качестве естественного критерия выбора фиксированных значений xt при составлении плана нового эксперимента можно использовать сле­ дующее правило: значения xt выбираются так, чтобы получилось в некотором смысле наиболее желательное апостериорное распре­ деление, в частности чтобы имело место наибольшее желаемое изменение распределения, которое существовало в конце п-го

эксперимента.

После

проведения

первых п наблюдений

можно

построить

некоторую

функцию

правдоподобия,

аналогичную

выражению

(5.1.11а) с тем исключением,

что здесь модель

может

быть нелинейной:

 

 

 

 

 

 

 

 

 

 

n

 

 

L ( ß | y n ,

x,

а\)=

/ п _ ч П / 2 д » ехр

I

2 [ У | - т ц ф , х і ) ] а

 

 

 

 

( 2 я ) п / 2 an ^

Щ

 

 

 

 

 

 

 

 

 

(8.4.3)

Чтобы получить плотность распределения рп (ß), которая

используется

в теореме Байеса, необходимо иметь

начальную

априорную плотность распределения вероятности ß до проведения

п наблюдений, например р0

(ß), и L (ß | у„). Тогда применение

равенства

(8.4.2) даст желаемую апостериорную плотность

Рп (ß I Утг),

которую в свою очередь можно использовать в качестве

априорной

плотности для

последующих наблюдений. Вместо

предположения о равномерной плотности распределения р0 (ß) допустим, следуя Дрейперу и Хантеру [26], что из некоторого

источника получена

априорная информация

о

параметрах ß;-,

так что начальную

плотность распределения

ß

можно

записать

в виде

 

 

 

 

 

 

Р о ( ß ) = ( 2 ^ / 2 % /2

« Р [ -4-( ß - b < V И " 1 ( ß - b < 0 )

) ] .

(8.4.4)

где Ь< 0 > —вектор начальных оценок

параметров ßy,

а

 

 

"(оц . . .

щт

 

 

 

 

 

I

 

 

 

 

 

Q =

L<j)m i . . . тт

J


Стратегия

эффективного

экспериментирования

571

— ковариационная матрица для ß;-, каждый элемент которой известен.

Подставляя выражения (8.4.4) и (8.4.3) в формулу Байеса, полу­ чаем искомую плотность распределения вероятности после про­ ведения п наблюдений:

n

 

I Уп) =

К ехр

2

[У*-тц(Р, *г)12

 

 

 

Рп

 

2сту

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X ехр [ - і - ( ß - b ( 0

, ) r Q-i ( ß - b ( 0

) ) ] ,

(8.4.5)

где kn

— подходящий нормировочный

множитель,

который

пока

не

было необходимости

вычислять.

 

 

 

 

 

Теперь обсудим, что следует предпринять для определения

зна­

чений

хп+і,

хп+2і • • • матрицы плана

для п* дополнительных

наблюдений величины У. Выражение (8.4.5) теперь становится априорным распределением в теореме Байеса (8.4.2), а функция

правдоподобия

L (ß | уп+п*)

аналогична

выражению

(8.4.3),

исключая

тот факт, что она содержит

п*

произведений.

Таким

образом,

 

суммирование в

экспоненте

 

проводится

от

i = n -f- 1

до

i =

n

 

-f- п*,

т. е. по всем новым наблюдениям,

 

 

 

 

 

 

 

 

 

 

п+п*

 

 

 

 

 

 

 

 

 

 

 

2

 

 

[ У І - Т ) * ( М І ) ] Я

 

 

L

I Уп+n*) =

( 2 я ) т а ; / 2 <

ехр [ - і = т а

+

1

щ

 

[ -

 

(8.4.6)

 

Подстановка выражений (8.4.5) и (8.4.6) в равенство (8.4.2) дает

искомую

апостериорную

плотность

распределения вероятности

 

 

 

 

 

 

 

п+п*

 

 

 

 

 

 

 

Рп+п*

I Уп+n*) = fcn+n* ехр I

 

 

-щ^

j X

 

 

 

 

 

 

 

X ехр [ _ i - ( ß _ b (

0

> ) T Q - 4 ß - b < 0

> ) ]

,

(8.4.7)

где kn+n*

 

— новый нормировочный множитель.

 

 

 

 

Как можно использовать выражение (8.4.7) при выборе зна­

чений х в матрице плана? В

работах,

 

указанных в

списке лите­

ратуры к этой главе, разъясняется смысл термина «наилучшая» применительно к плотности вероятности (8.4.7) в зависимости от целей, которые ставит перед собой экспериментатор. Дрейпер, Хантер и др. максимизировали апостериорную плотность

(8.4.7) как

по

параметрам

ß^, так и

относительно

новых значе­

ний Xi (ХП+І,

. . ., хп+п*).

Так как

величина

о\

и матрица Q

заданы,

в

принципе

можно было бы

максимизировать


572

Глава 8

рп+п*

(ß I Уп+n*) с помощью какого-либо из итерационных мето­

дов оптимизации, описанных в гл. 6. Однако, если принять несколь­ ко разумных предположений, можно существенно упростить необ­ ходимые вычисления.

В гл. 6 модель разлагалась [см. выражение (6.2.12)] в ряд Тей­ лора относительно предполагаемой оценки Ь ( 0 ) . Здесь будет пред­ полагаться, что подобное разложение в пространстве ß справед­ ливо в любой локальной ограниченной области относительно неко­ торого выбранного вектора Ь*:

m

tj(ß, х,)«т|<(Ь*, x i ) + S

(b-bJ)Xtj.

(8.4.8)

3=1

 

 

Выражение (8.4.8) вводит предположение о локальной

линейности,

что не означает, что модель линейна при всех значениях ß.

Сумма в выражении (8.4.7) равна

(Y — т|)т (Y — т|); после

подстановки вместо т]г- выражения (8.4.8) эта сумма принимает вид

тЧ-п*

2 ( r , - 4 i ) a = [ Y - t i ( b * , x ) - X ( ß - b * ) ] T x i =l

X [ Y - î i ( b * , x ) - X ( ß - b * ) ] = [ Y - r , ( b * , x ) ] T [ Y - r | ( b * , x ) ] - _ [ Y - r , ( b * , x ) ] T [ X ( ß - b * ) ] - [ X ( ß - b * ) ] r [ Y ~ r | ( b * , x)] +

+ (ß b * ) T X T X b*).

Если в качестве b* используется максимально правдоподобная оценка b параметров ß, то в соответствии с формулой (5.1.8) два смешанных произведения в этой сумме исчезают. Следовательно, апостериорная плотность, определяемая выражением (8.4.7), ста­ новится равной

Рп+п*

(PI Уп+п*) = k*n+n* ехр { -

( Ь ' Х)І¥~ЧІЬ'

} X

Хехр

| - ^ i г [ ( ß - b ) т X г X ( ß - b ) - ( ß - b ( 0 > ) т a y Q - l ( ß - b < 0 , ) ] ] .

 

 

 

(8.4.9)

Теперь следует уделить некоторое внимание нормировочному множителю к п + п * . Выражение (8.4.9) представляет собой комбина­ цию из двух многомерных нормальных плотностей распределения

вероятности; следовательно,

по аналогии с выражением (2.3.7)

величина п+п*) 2 пропорциональна определителю

 

Ап+п* =

ТХ-то№-'\.

(8.4.10)

Если апостериорная плотность распределения вероятности (8.4.9) максимизируется как по ß, так и по вектору новых наблюдений


 

Стратегия эффективного

экспериментирования

573

п+і, . . .,

хп+п*), то параметры ß зависят от Ь/™4-*1** и Ь( 0 ) и не

могут быть(

определены до проведения наблюдений. Однако,

како­

вы бы ни были наблюдения и параметры ß, в точке экстремума показатель последней экспоненты выражения (8.4.9) становится равным нулю; таким образом, можно заключить, что множитель

kn+n*i

и тем самым определитель

А, вычисляемый по формуле

(8.4.10), является той величиной,

которая

определяет

значение

рп+п*.

Следовательно,

условие максимума

А служит

критерием

выбора значений п+і,

. . ., хп+п*).

Одна из трудностей при этом

заключается в том, что элементы матрицы

Т Х) содержат неиз­

вестный вектор параметров ß. Поэтому вместо ß в элементах мат­ рицы X подставим самые новые оценки параметров ß, например Ь ( П ) ; в этом случае во избежание путаницы матрицу X можно обо­ значить как Х < П ) .

Матрица X (для п проведенных наблюдений и п* наблюдений, которые будут проведены) в определителе (8.4.10) имеет вид

Хі2 Хіт

Хм Х2т

Х =

Хщ

Хп2

X,

Хп-\-п*,

1

Хп+п*, 2

• • • Xn-j-n*,

а отдельные элементы

этой

матрицы

равны

хи=-

Элементы

матрицы Х Т Х будут обозначаться как

и, например

в случае

трех

параметров после четырех экспериментов и перед

одним новым

экспериментом,

выражаются

следующим

образом:

Г

4

 

4

 

4

 

 

 

 

і = 1

 

 

 

 

 

 

 

 

2с. X f j + X a

S ХцХі2

+ ХЬІХ&2

2

ХЦХІЗ

- j -

Х 5 І Х Ь З

 

 

 

і = 1

 

і= 1

 

 

 

 

 

 

4

 

4

 

 

 

 

* м м

и„

2 Х \ 2 - \ - Х \ г

2

ХІ2ХІЗ

+ Х Ь 2

Х Ь З

 

М е т

г=1

 

г=1

4

 

 

 

 

 

 

 

 

 

 

переменныыВэтойс индексомматрицехдля5поопределяютспятогзнакоэкспериментаx0 суммыяпстоятновым.известнызначенияг2= і хіз+х^звеличины,мнезависимычлех­