Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 166

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

4, БАЙЕСОВ ПРИНЦИП ВОССТАНОВЛЕНИЯ

55

рассматривать функцию

 

I

 

ln L (хъ ..., x t I а) = 2 Ій Р to» а)>

(3.4')

г— 1

Максимум функций (3.4) и (3.4') совпадают и, следова-

•гельно, оценки максимума правдоподобия могут быть найдены как корни урав­ нения

ÖL (хі,

I а) _

 

да?

 

 

{j = 1, 2,

 

 

или уравнения

 

3ln L (*1, s c , ia)

n

da?

~~ VI

 

Теория метода призвана оценить, насколько «хорош» пред­ лагаемый способ оценивания параметров. Эта теория до­ статочно полно разработана. Подробное исследование свойств оценки максимума правдоподобия можно найти в работах [2, 621.

Основное содержание теории заключается в том, что для определенных функций Р (х, а) (которым заведомо принадлежат оба класса рассматриваемых распределе­ ний вероятностей) метод максимума правдоподобия! обеспечивает асимптотическую несмещенность и асимп-І тотическую эффективность оценки.

§ 4. Байесов принцип восстановления

Байесов принцип восстановления плотности распреде­ ления основан на использовании формулы Байеса:

P (ajx ) =

Р (х I а) Р (а)

Р{х)

 

Пусть известна априорная плотность распределения вероятностей Р (а) вектора параметров а, которая харак­ теризует предполагаемую возможность осуществления различных значений а до того как проведен эксперимент


56 ГЛ. III. МЕТОДЫ ВОССТАНОВЛЕНИЯ РАСПРЕДЕЛЕНИЙ

(дана выборка). Апостериорная вероятность Р (а | хх, . . .

. . хі) характеризует возможность осуществления раз­ личных значений а после того, как к априорному знанию добавлено знание, извлеченное из экспериментальных данных хх, . . ., х х. В этом случае формула Байеса ут­ верждает, что апостериорная вероятность параметра а получается умножением априорной вероятности на функ­

цию правдоподобия

I

Ь(хх, ..., ж,Iа) = П * ( * И І—1

и делением на вероятность

данного эксперимента

 

Р (хх, . . ., Хі ) .

Иначе говоря, справедлива формула

Р (а I хх, ..., Хі)

L (ал,..., Xj I <х) .Р (а)

.....

где

 

 

Р ( х ъ ...,

х-і) =

•••’ x t Iа ) P (а ) d a ,

если параметры а

непрерывны, и

Р(хъ ..., хі) = '21Ь(хі, ..., хі I ак) Р (afc),

если значения параметра а дискретны.

Таким образом, с помощью формулы Байеса по апри­ орному распределению вероятностей параметров а и ре­ зультатам эксперимента может быть вычислена плотность апостериорного распределения вероятностей Р (а \ хх, . . .

• • •» ®і)*

Теперь задача заключается в том, чтобы, зная плот­ ность Р (a I хх, . . ., Ж(), определить искомый параметр.

Здесь может быть несколько идей оценивания.

1. В качестве искомого значения вектора параметро выбирается такое а, которое доставляет максимум функ­ ции Р (а \ х1, . . ., хі).

É2. В качестве искомого значения вектора параметров выбирается математическое ожидание значения а, т. е.

a = § aP(ajxl t ..., xt) da.


§ 4. БАЙЕСОВ ПРИНЦИП ВОССТАНОВЛЕНИЯ

57

3. Принята и такая идея восстановления, когда с по­ мощью плотности распределения Р (а | хх, . . ., хі) кон­ струируется плотность Р (X) по правилу

Р (х) = § Р (х I а) Р (а I хъ ..., xt)da =

 

I Р (х I а) р (Х1' ••■>хі I

5

J Р (хі, ..., х{I а) Р (а) da

 

т. е. в качестве оценки выбирается математическое ожи­ дание плотности Р (х I а). Вообще говоря, полученная

в результате восстановления (3.5) плотность Р (х) вовсе не должна принадлежать рассматриваемому параметри­ ческому семейству Р (х , а). Поэтому, строго говоря,

рассматриваемый метод конструирования плотности Р (х) нельзя называть восстановлением функции в классе Р (X, а), тем не менее он получил название байесовой стра­

тегии восстановления функции Р (х).

Байесова оценка плотности распределения вероят­ ностей обладает замечательной особенностью, делающей получение ее крайне желательной. Она реализует опти­ мальную стратегию в следующей игре с «природой». Игра состоит в том, чтобы «угадать» ход, сделанный при­ родой. Функция Р (а) задает вероятность того, что при­ рода назначит вектор а = а0 в качестве параметра плот­ ности распределения Р (х, а). Пусть теперь дана выборка

длины I

из генеральной

совокупности

с

плотностью

Р (х, а 0).

Стратегия игрока

заключается

в

том, чтобы

задать такую функцию я (х; х^, . . ., хі), которая была бы как можно «ближе» к Р (х, а 0). «Партия» в такой игре определяется стратегией природы а = а0, стратегией

игрока я (х; хІ7 . . ., хі) и случайной выборкой хх, . .

.,

Величина проигрыша в этой игре

 

D(a\ Хі, ..., Хі) = §(Р(ж|а) — я(х; хъ ..., x,)fdx.

(3.6)

Средний проигрыш игрока в игре определяется выраже­ нием

\ I = §D (а; хъ ..., х,) Р (а) Р (хъ ..., Хі\а)йхъ ..., dxt da, (3.7)


58 ГЛ. III. МЕТОДЫ ВОССТАНОВЛЕНИЯ РАСПРЕДЕЛЕНИЙ

т. е. (3.7) получается усреднением (3.6) по стратегиям природы и всевозможным реализациям выборки.

Замечательное свойство байесовой оценки заключается в том, что она минимизирует средний проигрыш игрока, который знает смешанную стратегию природы Р (а). Иначе говоря, оптимальная стратегия игрока определя­ ется как

ГР (х I а) Р(жі,.... X

I а) Р (а) da

Л ( я ; Х и . . . , X, ) = ■-— : -------------------------------------------------

.

£ Р (х!, .... xt I а) Р (а) da

Докажем это важное для понимания значения байесо­ вых оценок утверждение.

Итак, требуется найти такое я (х ; хг, . . ., хі), которое минимизирует функционал

I = § ... \(Р(х\а) — л (x' хъ ..., Х[))2Р (хх,..., х,]а)Р (а) х

X dadxdxx... dxt. (3.8)

Обозначим

Ф(ж; Жц..., хі) = 5(Р(ж|о) — я(х; хх, ..., xt) f Р{хъ ..., ж ,[а)х

X P(a)da

и изменим порядок интегрирования, после чего (3.8) примет вид

/ = У. . . УФ (х; хг, . . ., Xi) dx dx1 dx2 . . . dxt.

Преобразуем теперь функцию Ф (х\ х1, . . ., жг)Г

Ф (x', хі) = УР2 (ж| <х)Р (жІ5 . . ., хі \ а)Р(а) da

—2я (х; х1г . . ., хі) УР (х\ а)Р (хг, . . ., х г | а)Р (а) da + + я 2 (х; % , . . . , хі) УР(хи . . ., Xi I а)Р (а) da.

Обозначим

с (тх, . . ., хі) =s УР {хх, . . ., х г\ а)Р (а) da,

г (*) = т г *г,т .; xt) 5

'Iа) р %Х і' •••’ I а) Р (а) йа-


§ 5. СРАВНЕНИЕ МЕТОДОВ ОЦЕНИВАНИЯ

 

59

Справедливо

равенство

 

 

 

 

 

Ф (ж; хи . .

Xi)

= I Р2 (ж] а)Р (х1, . . ., жг | а) Р (а) da

—Р2 (х)с (ж1( . .

хі) + [Р {х) — я (ж; жх, . .

хі)]2 х

 

 

 

 

 

X с (жх, . .

хі).

Таким образом, функционал I распадается на

два

сла­

гаемых

 

/ = / і

+

/ „

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

/ х = J [J Р2 (ж I а)Р (жх, . .

Хі I а)Р (а) da —

 

 

 

 

— с (ж1?

. .

жг)Р2

(ж)] dx dxx . . . dxi,

/ 2 і [Р (ж)

— я (ж; жІ5 . .

ж,)12 с (ж15

. . хі)

dx dxx ...

 

 

 

 

 

 

. . . dxh

Первое слагаемое не зависит от функции я (ж; ж1( . .

x t).

Поэтому минимизация I эквивалентна минимизации вто­

рого слагаемого

/ 2.

 

 

 

 

 

Минимум этого слагаемого равен нулю и достигается тогда, когда

я (ж; жх, . . ., хі) = Р (ж).

§5. Сравнение байесова метода оценивания

иоценивания методом максимума правдоподобия

Рассмотренные методы оценивания не являются рав­ нозначными ни по сложности их реализации, ни по эф­ фекту, который может быть с их помощью получен. Наи­ большую трудность в реализации метода максимума прав­ доподобия представляет отыскание решения системы уравнений

dL (хі,.... X, I a)

da*

V

'

Хотя система уравнений, вообще говоря, не является линейной, численное решение ее не составляет принци­ пиальной трудности, тем более что для широкого класса функций существует лишь единственное решение (3.9).

Реализация байесовой стратегии — задача значитель- „ но более трудная. Как правило, эта стратегия может быть реализована лишь тогда, когда удается провести