Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 88
Скачиваний: 1
Тогда вероятность ошибки первого рода, то есть ве роятность ложной тревоги, равна
|
Q ,= |
J - |
J |
|
|
X J d X , , . . . , |
dXN, |
(2.44) |
||
а вероятность |
ошибки |
второго рода, то |
есть пропуска |
|||||||
цели |
|
|
|
|
|
|
|
|
|
|
|
Qa= |
f |
... fM X ,, .. . , X j d X ^ . S , dXN. |
(2.45) |
||||||
|
|
|
|
«S2, ^ |
|
|
|
|
|
|
Здесь |
Rs |
и R9 — области |
признакового |
пространства, |
||||||
в пределах которых |
принимаются решения о принадлеж |
|||||||||
ности объектов к классам I и II соответственно. |
|
|||||||||
Средняя стоимость принятия решения |
|
|
||||||||
|
|
|
|
ü=CiP(l)Ql+ CiP(U)Q2. |
|
(2.46) |
||||
Так |
как |
интеграл от плотности вероятности |
по об |
|||||||
ластям RQi |
и R |
равен |
единице, то |
|
|
|||||
|
Ql = |
|
1 — ? |
... Jft(X,.......x N)dX„..., |
dXN. |
|
||||
Откуда |
|
|
|
|
^я, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
с = |
CtP (I) + |
f |
... |
f [C2P (II) f2 (X„ ..., XN ) - |
|
||||
|
|
~ C XP(\)U {Xu ...,XN)\dX%...,dXN. |
(2.47) |
|||||||
Задача |
состоит в том, |
чтобы минимизировать |
вели |
чину среднего риска. Для этого необходимо так выбрать RSi и R чтобы интеграл 'принял наибольшее отрица
тельное значение. Это достигается тогда, когда подын
тегральное выражение принимает |
наибольшее отрица |
тельное значение и вне области RSi |
не существует та |
кой области, где подынтегральное выражение отрица тельно, т. е.
С2Р (ІІ)/2(ХЬ ..., XN) - C i P ( l ) h ( X b ...,XN)<0. (2.48)
Решающее правило, обеспечивающее в среднем наимень ший риск, состоит в следующем. Распознаваемый объ ект со, признаки которого, как установлено в результате
проведения экспериментов, |
равны |
у _ уО |
|
_ уО |
у |
-у0 |
|
1—' |
t Л 2—' -^2 >•••> |
* |
39
относятся к классу Qi, если
h W |
|
|
_СІР(ІІ)_ |
(2.49) |
|
h ( K |
.... Х%) |
^ |
С ,Я (І) ’ |
||
|
|||||
|
|
|
в противном случае — к классу Пг-
2.4. МИНИМАКСНЫЙ КРИТЕРИЙ
При построении систем распознавания возможны такие ситуации, когда априорные вероятности появления объектов соответствующих классов неизвестны. Миними зировать средний риск принятия решений на основе бай есовой стратегии в этом случае нельзя. Применительно к этой ситуации рационально использовать такой крите
рий, который обеспечивает минимум максимального среднего риска. Этот крите рий получил название мини максного критерия.
Суть минимакса состоит в том, что решение о принад лежности неизвестного объ екта к соответствующему Классу принимается на осно ве байесовой стратегии, со ответствующей такому зна чению Р(І), при котором средний риск максимален.
Покажем преимущество минимаксной стратегии по сравнению с другими возможными стратегиями, когда
неизвестны значения Я(Й,), i — I, ..., m. При наличии
двух классов величина среднего риска, как известно, равна
С = Р(І)С, |
оо |
Хо |
|
J (X)rfx + [1 — /> (I)] С3 j“f2(X)dX. |
(2.50) |
||
|
Хв |
—оо |
|
Построим график функции С =/[Я (І)]і помня при |
этом, |
||
что при Р (1)=0 и при Р ( І)=1 |
величина среднего риска |
||
равна нулю |
(рис. 2.3). Пусть |
С достигает своего |
наи |
большего значения при Р ( I) = Р '( І ) . Этот риск представ
ляет собой максимальную величину минимального байесового риска. Обозначим его через С™*. Применение
40
критерия минимакса означает, что при отсутствии дан ных об априорных вероятностях появления объектов следует ориентироваться на величину Р ( І ) = Р ' ( І ) .
Положим, что выбрано другое значение Р(І), напри
мер Р ( І )= Р "( І ) . В этом |
случае |
средние |
потери будут |
|
описываться |
уравнением |
прямой |
линии, |
касательной |
к кривой с = |
С[Р(І)] в точке А, соответствующей Р(І) = |
|||
= Р"(І). Уравнение касательной имеет вид |
|
|||
|
C= P (l)C iQ'l+ [l-P (l)]C 2Q'2, |
(2.51) |
где Q,i = Qi[P/'(I)] и Q \=Q .2[P"{Щ представляют собой
ошибки первого и второго рода при априорной вероят ности Р( I) = Р "\ I).
Так как байесова стратегия обеспечивает минималь ный средний риск, кривая С лежит ниже прямой для всех значений Р{\)ФР"{\). Стратегия «касательной»
приводит к следующему. Положим, что априорная веро ятность равна Р "(I). Тогда, если в действительности априорная вероятность на интервале от 0 до Р "'(I) от лична от Р "(I), то средний риск будет меньше, чем при
минимаксной стратегии. Но если Р(І)>Р"'(І), то потери будут резко возрастать, достигая чрезмерных значений. Выбор минимаксной стратегии гарантирует нас от подоб ных потерь. Продифференцировав средний риск по Р(I), получим трансцендентное уравнение
CiQi (Xo) = C 2Q2(Xo) > |
(2.52) |
которое непосредственно решается относительно точки Хо. Алгоритм принятия решения имеет следующий вид:
ахгПі, если Х<.Х%
соеПг, если Х > Х 0. |
(2.53) |
Кроме того, так как по величине Р ( І ) = Р / (І) определя ется и Р'(ІІ) = 1—Р'(І), то это дает возможность опре делить критическое значение коэффициента правдоподо бия
X'0= P '( l ) C l/P/(U)C2 |
(2.54) |
и строить алгоритм классификации так:
cü&Qi, |
если к<Х'о, |
|
ш е 0 2, |
если ХЖ'о- |
(2.55) |
|
|
41 |
В заключение отметим, что минимаксная стратегия есть байесова стратегия для наихудших значений апри орных вероятностей, дающая хотя и осторожную, но га рантированную величину среднего риска.
2.5.КРИТЕРИЙ НЕЙМАНА — ПИРСОНА
Внекоторых системах распознавания могут быть не известны не только априорные вероятности появления объектов соответствующих классов, но и цены ошибок.
Вподобных системах це лесообразно воспользо ваться критерием Нейма на — Пирсона. Суть это го критерия состоит в
следующем. Определяет ся допустимое значение вероятности ошибки пер вого рода Qi (ложная тре вога), а затем находятся такие решения, при кото рых вероятность ошибки
о,2 о,ь '0,8 0,8 |
>,оалт второго рода Qz (пропуск |
Рис 2 4 |
цели) минимальна. |
|
Применительно к воен |
|
ной терминологии — мак |
симизируется вероятность обнаружения цели при задан ной вероятности ложной тревоги. Итак, пусть из какихлибо соображений принято, что Q ^ H .
Требуется определить решение Х0 задачи
X
minQ2=m in Г f2(X)dX
X X J
ФО
при ограничении вида
со
Qі = f f i ( X ) d X ^ A .
X
Очевидно, что решение Х0 удовлетворяет уравнению
00
J h ( X) dX=A,
Хо
так как при выборе
42
любого другого значения Х'о>Ха ошибка Q2 растет. Выбрать же Х'0-<Х0 нельзя по условию задачи.
В заключение рассмотрим геометрическую интерпре тацию названных критериев. Для этого в координатах £>2= 1 —Qnp и <2лт изобразим так называемую рабочую
характеристику (рис. 2.4). При построении рабочей ха
рактеристики заметим, что когда |
Qлт= 0, |
то Qnp = l и |
|
£>2= 0, а при (Злт= 1> QnP= 0 |
и £>2= |
1. |
|
Вспомним, что |
|
|
|
ОО |
|
00 |
|
Qa?= J fr (X) dx, |
а Da= $ f a(X)dX. |
||
Х0 |
|
Хо |
|
Продифференцировав D2 по Qлт, получим |
|
||
|
|
|
(2.5в> |
Но dDildQxj, есть тангенс |
угла |
наклона |
касательной |
к рабочей характеристике при Я = Я0Поэтому для крите рия Байеса на рабочей характеристике найдем такую
точку, касательная в |
которой имеет наклон, равный |
£0 = £‘(і )Сі/£,(П)С2, т . е. |
tg« = Xo. |
Теперь ордината этой точки определяет вероятность правильного решения, а абсцисса — вероятность ложной тревоги. Для минимаксного критерия необходимо учесть, что производная от среднего риска по априорной веро ятности в точке максимума равна нулю.
Напомним, что |
|
|
|
|
С-- СцР (I) ( 1--- ^Лт) + С12Р (I) <2лт+ |
|
|||
+ С22[1 ■- Р (I)}DZ+ С21[1 - Р (I)] (1■-D2) . |
|
|||
Откуда |
|
|
|
|
= С» (1 - <?лт) + |
CltQ„ - |
C22D2- Сп (1 - D2) = 0. |
||
|
|
|
|
(2.57) |
В координатах £>2 |
и |
<3ЛТ это |
уравнение прямой. |
При |
этом, если С ц = С 22, |
т о |
|
|
|
£>2=|<Злт(С’и—С12)/(С21—С22) + 1 |
(2.58) |
|||
с угловым коэффициентом |
|
|
||
ß = |
(Сц—Сі2)/(С 2і—£22)- |
(2.59) |
43