Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 87

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Если fi(X) и fz(X) подчинены нормальным законам распределения с математическими ожиданиями ßi и az

соответственно и среднеквадратическими отклонениями ві — ö‘i= o , т. е. имеют вид

іС-{Х-аЩ!Ъ\1

а Ѵ2Х

 

М *) =

-

( X - a \ ) ß 0 f

 

 

 

 

 

 

то вероятность ложной тревоги равна

 

 

00

 

со

 

Q ,= Q * t = S

 

ft (X)dX-^=

\ f 1( X ) d X ~

 

 

Хо

 

oo

 

-

]° f, ( X ) d X - ^ l - F

( X 0 -[ a t)/a,

(2.22)

—oo

 

 

 

 

 

где F(t) — функция Лапласа.

 

 

 

Вероятность пропуска цели равна

 

Qz =

Qnp=

^ f A X ) d X =

F (X lt- a t)lo.

(2.23)

Условные вероятности правильных решений при спра­

ведливости гипотез Н1

и Hz соответственно равны

 

 

0 1= l - Q nT= /7№ -ai)/(T ,

(2.24)

 

Ö2= l —Qnp= l —F(Xo-az)/o,

(2.25)

В теории статистических решений Qnr называется раз­

мером испытаний, Dz— 1—Qnp— мощностью

испытаний.

В приведенных выражениях для Qi и Qz при инте­

грировании функций fі(Х) и fz(X) в пределах от — оо до

Х 0 произведена замена Х0a/a — t, которая

приводит

к интегралам вида

 

 

 

(Хо-а,)/о

 

 

(Х0-с,)/ч

J

е - *

1X2:*

—/*/2dt.

 

 

1

Для вычисления этих интегралов ввиду того, что они не выражаются через элементарные функции, пользуют-

3-452

33


ся таблицами специальных функций

(Х-а)/о

V2Ü

которые приведены в работах ряда авторов (например,

И ) .

При многомерных нормальных распределениях могу г быть получены функции Fn (%2), которые являются п- мерными аналогами интеграла вероятностей F(t). Для

этих функций при 2 < п < 1 9 разработаны таблицы (7]. При выборе значения Х0, т. е. при разделении про­

странства признака А' на два полупространства R\ и R2,

необходимо учитывать, с чем сопряжено совершениеошибок первого и второго рода. Можно полагать, что эти ошибки связаны с нанесением стороне, включающей в се­ бя систему распознавания, определенного ущерба, что распознающая сторона несет определенные потери. Ве­ личина этих потерь определяет собой плату за ошибки, иначе стоимости принятия ошибочных решений. В об­ щем виде мы имеем дело со следующими стоимостями (рисками): Сі2— стоимость ошибки первого рода, С21— стоимость ошибки второго рода, Си, С22 — стоимости

правильных решений.

Указанные стоимости можно записать в виде матри­ цы цен

|с„ ^12 1^*21 С2%

Средняя стоимость, которую приходится платить при многократном распознавании неизвестных объектов, рав­ на сумме стоимостей неправильных и правильных реше­ ний с учетом вероятностей их появления и априорных вероятностей поступления на вход системы распознана ния объектов I и II классов, т. е.

C = -P (I)C n (l- Q „ T) + P ( I) C i2QnT+

+ P(II)C22( l - Q Dp)+P (II)C 21Qnp.

(2.26)

34

Подставив в (2.26) выражения для вероятностей Qaт и

Qnp, получим

 

Хо

со

1

С = Р ( I)

Сп jM X )rfX +

C12 J h ( X ) d X

+

 

оо

Хо

Т

+ Р(ІІ)

C22J / 2(X)dX +

C21 j /2 (X)dX I . (2.27)

 

Xo

—oo

J

Произведение вида CkQk называется риском, соответст­ вующим k гипотезе. Системы распознавания, как пра­ вило, являются системами многократного действия.

Именно поэтому необходимо, чтобы выбору Х0 был осу­ ществлен с учетом того, чтобы величина С была мини­

мальна.

Для определения величины Х0, при_которой средний риск минимален, продифференцируем С по X и прирав­ няем производную нулю, положив X= Х0

I Рѵ W^ =

(

Сх 12Л (*Хо)) +

о= )

+ Р (И) [C J* (Хо) -

c

j 2(X,)] = 0.

(2.28)

Откуда

/2(Хо)//1 (Хо) = Р (I) (С12- С „ )/Р (II) (С2і - С 22) . (2.29)

Отношение плотностей вероятности f2(X)/fl (X) назы­ вают отношением или коэффициентом правдоподобия.

При Х = Х0 коэффициент правдоподобия приобретает кри­ тическое значение и обозначается либо Хо, либо Х(Х0).

Положим для примера, что Сц = С22= 0 , Сі2= С і и

€ 2і = С2. Тогда

h (Хо) /fi (Хо) =

Р (I) Сі/Р (11) С2= Х0.

(2.30)

Откуда при Оі= (Т2= сг

 

 

 

 

Хо = ехр—[(Хо—аі)2— (Хо—а2)2]/2о2.

(2.31)

Решая это уравнение относительно Х0, получаем

 

Ді + Й2

I

°2

1п Р(І) Cl

(2.32)

2

а2- а ,

Р(П)Са

 

при Сі = С2 и Р(І )=Р( ІІ )

Хо= (йі + а2)/2.

3:

35


Знание Х0> при котором осуществляется оптимальное

в смысле минимума риска разделение пространства на две области Ri и R%, позволяет минимизировать ошибку

классификации. Если Х <Х 0, то следует принять реше­ ние о принадлежности объекта к классу I, а если Х> >2Г0— то к классу II. Область R і состоит из значений X

для

которых Я (X) <К0,

а R2 — из

значений X, для кото­

рых

А(Х)>Яо. Поэтому

решение

об отнесении объекта

к классу I следует принимать, если значение коэффи­ циента правдоподобия меньше его критического значе­ ния, и к классу II — при противоположной ситуации..

2.3. КРИТЕРИИ БАЙЕСА

Правило, по которому стратегия решений выбирается так, чтобы минимизировать средний риск, называется критерием Байеса. Применение подобного критерия осо­

бенно целесообразно в том случае, когда необходимо принимать многократно решения в одинаковых усло­ виях.

Минимизация среднего риска будет иметь место в том случае, если гипотеза # і принимается тогда, когда изме­ ренное значение X лежит в области Ri, а если в обла­ сти Rz, то принимается гипотеза Я2. Докажем, что байе­

совская стратегия обеспечивает минимальный средний риск, который называется байесовским риском. Для это­

го вычислим средний риск, когда используется стратегия,

отличная от байесовской

(рис. 2.2).

Пусть,

 

например*

используется

стратегия А, т. е. принимается

решение

о принадлежности объекта к классу

I, если

Х < Х А, и

к классу II,

если Х > Х А.

 

 

 

_

Разность среднего риска при подобной стратегии СА

и байесовского риска С будет равна

 

 

 

с А - Ѵ =

Р (И) С21 h (X) d X ~ P (I) Cl j h (X) d X =

 

r2

 

r2

 

 

=

[ J h (X )d x -

Я0 J /, (X)dX]p(\\)C2.

(2.33)

 

r2

r2

 

 

 

В_области rz^ R 2 f2(X)>Xofi(X),

значит

CA—C > 0,

T. e. CA>C.

 

 

 

 

 

При выборе стратегии В, т. е. когда принимается ре­

шение о принадлежности

объекта к классу

I,

если Х <

36


< Х В, и к классу II,

если Х > Х В, разность средних ри­

сков этой и байесовской стратегии будет равна

 

св - Г - = Р (I) С, j

и (X) dX -

Р (II) С2 j>2(X) d X ^

 

Гі

 

гI

 

= [я* J h (X) d X - I f ,

(X) dX] P(U)C2.

(2.34)

 

n

rt

 

 

В_области

r i^ R i

X0fi(X)>f2(X), значит CBC>0,

T. e. CB>C.

 

 

 

 

Байесовская

стратегия может быть описана

также

с помощью других соостношений. Пусть в результате опы-

Рис. 2.2.

та установлено, что признак распознаваемого объекта составляет величину У0. Тогда условная вероятность при­ надлежности этого объекта к первому классу или, ина­ че, условная вероятность первой гипотезы равна

р(Ну\ Х °)=Р ( І ) П(Х°)If (X«),

' (2.35)

а условная вероятность второй гипотезы

Р(Н2\Х°) = P ( l l ) f 2(X°)lf(X°),

(2.36)

где f (У0) =P(l)fi(X°) +P(II)f2(X°)— полная плотность вероятности результатов X при всех опытах. Величины Р( Ні|Х°) и Р(Н2\Х°) называются также апостериорными

вероятностями.

Условный риск, связанный с выбором гипотезы Ну,

будет равен

С(Ну\Х°)=С2Р(Н2\Х°), (2.37)

а условный риск при выборе гипотезы Н2 будет равен

С (Н21Х°) — СуР (Ну I У0) .

(2.38)

37


Система распознавания, основанная на байесовой стратегии, должна решать задачу с минимумом услов­ ного риска. Это значит, что предпочтение первой гипо­ тезе следует отдавать тогда, когда

с (Hi\x °)!с ( н 2\х°) < і.

(2.39)

Следовательно, первая гипотеза должна приниматься тогда, когда

С1Р( НІ \Х°)>С2Р(Н2\Х°)

(2.40)

или

(2.41)

Р (Н 1\Х0)/Р(Н2\Х°)>С2ІСі.

Таким образом, байесов подход к решению задачи распознавания состоит в вычислении условных апосте­ риорных вероятностей и принятия решения на основа­ нии сравнения их величин. Если число классов больше двух и равно т, то апостериорная вероятность отнесе­

ния распознаваемого объекта к t-му классу равна

 

Р Щ Х ° ) = Р № ) Ь ( Х ° )

2

т ) №

° ) .

(2.42)

В том случае,

когда

объекты характеризуются N приз­

наками

X j . ’ j =

1,...,

N, и признаки

распознаваемого

объекта

приняли

значения

Х, = Х°; Х 2 =

Х°, ...,

2^ =

_ \/о

то вероятность

того,

что при осуществлении со­

= Лд,,

бытий aN = (X°,

Х ° ,...,

Х^.)

объект

будет

относиться к

t-му классу, будет

равна

 

 

 

 

 

 

 

P m a N)

Р ( ^ ) к ( х 1

х 2,°

...,

(2.43)

 

т

 

 

 

 

 

 

 

 

2 т )

ы

а-?,

х°2.......x°N)

 

 

 

 

і=1

 

 

 

 

 

 

Существует и другая форма записи байесового кри­

терия статистического различения гипотез

(в нашем слу­

чае отнесения объекта к тому или другому классу). Пусть, как и раньше, имеется два класса Qt и Q2, ап­ риорные вероятности появления объектов этих классов

соответственно Р(І)

и б*(II)

и

заданы

веса или

цены

ошибок первого

Сі2=С і

и

второго

С2і = С 2

рода,

а Си = С22, = 0. Пусть известны также условные плотно­

сти распределения вероятностей значений признаков по классам, т. е. fi(Xu ..., XN) и f2(Xit ..., XN).

38