Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 88

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тогда вероятность ошибки первого рода, то есть ве­ роятность ложной тревоги, равна

 

Q ,=

J -

J

 

 

X J d X , , . . . ,

dXN,

(2.44)

а вероятность

ошибки

второго рода, то

есть пропуска

цели

 

 

 

 

 

 

 

 

 

 

 

Qa=

f

... fM X ,, .. . , X j d X ^ . S , dXN.

(2.45)

 

 

 

 

«S2, ^

 

 

 

 

 

Здесь

Rs

и R9 — области

признакового

пространства,

в пределах которых

принимаются решения о принадлеж­

ности объектов к классам I и II соответственно.

 

Средняя стоимость принятия решения

 

 

 

 

 

 

ü=CiP(l)Ql+ CiP(U)Q2.

 

(2.46)

Так

как

интеграл от плотности вероятности

по об­

ластям RQi

и R

равен

единице, то

 

 

 

Ql =

 

1 — ?

... Jft(X,.......x N)dX„...,

dXN.

 

Откуда

 

 

 

 

^я,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с =

CtP (I) +

f

...

f [C2P (II) f2 (X„ ..., XN ) -

 

 

 

~ C XP(\)U {Xu ...,XN)\dX%...,dXN.

(2.47)

Задача

состоит в том,

чтобы минимизировать

вели­

чину среднего риска. Для этого необходимо так выбрать RSi и R чтобы интеграл 'принял наибольшее отрица­

тельное значение. Это достигается тогда, когда подын­

тегральное выражение принимает

наибольшее отрица­

тельное значение и вне области RSi

не существует та­

кой области, где подынтегральное выражение отрица­ тельно, т. е.

С2Р (ІІ)/2(ХЬ ..., XN) - C i P ( l ) h ( X b ...,XN)<0. (2.48)

Решающее правило, обеспечивающее в среднем наимень­ ший риск, состоит в следующем. Распознаваемый объ­ ект со, признаки которого, как установлено в результате

проведения экспериментов,

равны

у _ уО

_ уО

у

-у0

1—'

t Л 2—' -^2 >•••>

*

39


относятся к классу Qi, если

h W

 

 

_СІР(ІІ)_

(2.49)

h ( K

.... Х%)

^

С ,Я (І) ’

 

 

 

 

в противном случае — к классу Пг-

2.4. МИНИМАКСНЫЙ КРИТЕРИЙ

При построении систем распознавания возможны такие ситуации, когда априорные вероятности появления объектов соответствующих классов неизвестны. Миними­ зировать средний риск принятия решений на основе бай­ есовой стратегии в этом случае нельзя. Применительно к этой ситуации рационально использовать такой крите­

рий, который обеспечивает минимум максимального среднего риска. Этот крите­ рий получил название мини­ максного критерия.

Суть минимакса состоит в том, что решение о принад­ лежности неизвестного объ­ екта к соответствующему Классу принимается на осно­ ве байесовой стратегии, со­ ответствующей такому зна­ чению Р(І), при котором средний риск максимален.

Покажем преимущество минимаксной стратегии по сравнению с другими возможными стратегиями, когда

неизвестны значения Я(Й,), i — I, ..., m. При наличии

двух классов величина среднего риска, как известно, равна

С = Р(І)С,

оо

Хо

 

J (X)rfx + [1 — /> (I)] С3 j“f2(X)dX.

(2.50)

 

Хв

—оо

 

Построим график функции С =/[Я (І)]і помня при

этом,

что при Р (1)=0 и при Р ( І)=1

величина среднего риска

равна нулю

(рис. 2.3). Пусть

С достигает своего

наи­

большего значения при Р ( I) = Р '( І ) . Этот риск представ­

ляет собой максимальную величину минимального байесового риска. Обозначим его через С™*. Применение

40


критерия минимакса означает, что при отсутствии дан­ ных об априорных вероятностях появления объектов следует ориентироваться на величину Р ( І ) = Р ' ( І ) .

Положим, что выбрано другое значение Р(І), напри­

мер Р ( І )= Р "( І ) . В этом

случае

средние

потери будут

описываться

уравнением

прямой

линии,

касательной

к кривой с =

С[Р(І)] в точке А, соответствующей Р(І) =

= Р"(І). Уравнение касательной имеет вид

 

 

C= P (l)C iQ'l+ [l-P (l)]C 2Q'2,

(2.51)

где Q,i = Qi[P/'(I)] и Q \=Q .2[P"{Щ представляют собой

ошибки первого и второго рода при априорной вероят­ ности Р( I) = Р "\ I).

Так как байесова стратегия обеспечивает минималь­ ный средний риск, кривая С лежит ниже прямой для всех значений Р{\)ФР"{\). Стратегия «касательной»

приводит к следующему. Положим, что априорная веро­ ятность равна Р "(I). Тогда, если в действительности априорная вероятность на интервале от 0 до Р "'(I) от­ лична от Р "(I), то средний риск будет меньше, чем при

минимаксной стратегии. Но если Р(І)>Р"'(І), то потери будут резко возрастать, достигая чрезмерных значений. Выбор минимаксной стратегии гарантирует нас от подоб­ ных потерь. Продифференцировав средний риск по Р(I), получим трансцендентное уравнение

CiQi (Xo) = C 2Q2(Xo) >

(2.52)

которое непосредственно решается относительно точки Хо. Алгоритм принятия решения имеет следующий вид:

ахгПі, если Х<.Х%

соеПг, если Х > Х 0.

(2.53)

Кроме того, так как по величине Р ( І ) = Р / (І) определя­ ется и Р'(ІІ) = 1—Р'(І), то это дает возможность опре­ делить критическое значение коэффициента правдоподо­ бия

X'0= P '( l ) C l/P/(U)C2

(2.54)

и строить алгоритм классификации так:

cü&Qi,

если к<Х'о,

 

ш е 0 2,

если ХЖ'о-

(2.55)

 

 

41


В заключение отметим, что минимаксная стратегия есть байесова стратегия для наихудших значений апри­ орных вероятностей, дающая хотя и осторожную, но га­ рантированную величину среднего риска.

2.5.КРИТЕРИЙ НЕЙМАНА — ПИРСОНА

Внекоторых системах распознавания могут быть не­ известны не только априорные вероятности появления объектов соответствующих классов, но и цены ошибок.

Вподобных системах це­ лесообразно воспользо­ ваться критерием Нейма­ на — Пирсона. Суть это­ го критерия состоит в

следующем. Определяет­ ся допустимое значение вероятности ошибки пер­ вого рода Qi (ложная тре­ вога), а затем находятся такие решения, при кото­ рых вероятность ошибки

о,2 о,ь '0,8 0,8

>,оалт второго рода Qz (пропуск

Рис 2 4

цели) минимальна.

 

Применительно к воен­

 

ной терминологии — мак­

симизируется вероятность обнаружения цели при задан­ ной вероятности ложной тревоги. Итак, пусть из какихлибо соображений принято, что Q ^ H .

Требуется определить решение Х0 задачи

X

minQ2=m in Г f2(X)dX

X X J

ФО

при ограничении вида

со

Qі = f f i ( X ) d X ^ A .

X

Очевидно, что решение Х0 удовлетворяет уравнению

00

J h ( X) dX=A,

Хо

так как при выборе

42

любого другого значения Х'о>Ха ошибка Q2 растет. Выбрать же Х'0-<Х0 нельзя по условию задачи.

В заключение рассмотрим геометрическую интерпре­ тацию названных критериев. Для этого в координатах £>2= 1 —Qnp и <2лт изобразим так называемую рабочую

характеристику (рис. 2.4). При построении рабочей ха­

рактеристики заметим, что когда

Qлт= 0,

то Qnp = l и

£>2= 0, а при (Злт= 1> QnP= 0

и £>2=

1.

 

Вспомним, что

 

 

 

ОО

 

00

 

Qa?= J fr (X) dx,

а Da= $ f a(X)dX.

Х0

 

Хо

 

Продифференцировав D2 по Qлт, получим

 

 

 

 

(2.5в>

Но dDildQxj, есть тангенс

угла

наклона

касательной

к рабочей характеристике при Я = Я0Поэтому для крите­ рия Байеса на рабочей характеристике найдем такую

точку, касательная в

которой имеет наклон, равный

£0 = £‘(і і/£,(П)С2, т . е.

tg« = Xo.

Теперь ордината этой точки определяет вероятность правильного решения, а абсцисса — вероятность ложной тревоги. Для минимаксного критерия необходимо учесть, что производная от среднего риска по априорной веро­ ятности в точке максимума равна нулю.

Напомним, что

 

 

 

 

С-- СцР (I) ( 1--- ^Лт) + С12Р (I) <2лт+

 

+ С22[1 ■- Р (I)}DZ+ С21[1 - Р (I)] (1■-D2) .

 

Откуда

 

 

 

 

= С» (1 - <?лт) +

CltQ„ -

C22D2- Сп (1 - D2) = 0.

 

 

 

 

(2.57)

В координатах £>2

и

<3ЛТ это

уравнение прямой.

При

этом, если С ц = С 22,

т о

 

 

 

£>2=|<Злт(С’и—С12)/(С21—С22) + 1

(2.58)

с угловым коэффициентом

 

 

ß =

(Сц—Сі2)/(С 2і—£22)-

(2.59)

43