Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 107

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

Определение 3. Риском после цепочки исходов

1

« называется

 

(4.12)

Необходимо заметить, что величина риска прекращения дальнейших экспериментов определяется расходами на проведение всех предыдущих экспериментов и наимень­ шими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта к соответствующему классу.

Величина риска продолжения экспериментов после проведения опытов с исходами ХЯі, Ха определяется

расходами на дальнейшее проведение экспериментов (k+l)-H стадии, спланированных на основе оптималь­

ного последовательного правила R. В связи с этим спра­

ведливо следующее рекуррентное уравнение.

(4.13)

(4.14)

представляет вероятность исхода Ха .

При планировании процесса распознавания количе­ ство стадий экспериментирования, можно ограничить некоторым числом N. Тогда для любой цепочки экспери­ ментов х аі, ..., x aN

=

(4.15)

Рекуррентное уравнение (4.13) с учетом

последнего ра­

венства позволяет на основе использования рекурсии от N к N — 1, N — 2 и т. д. и данных о значениях р° после каждой стадии проведения экспериментов от 1- до N-й,

восстановить значения функций риска р(Х^.......X ) и

85

—т

функции риска продолжения экспериментов р ( Х а1, ..., Х аft)

при

всех значениях

k — N — 1,

N — 2,

1.

Порядок

расчета таков.

После

установления

количества

стадий

экспериментов определяются значения р°,

р°(Ха),

р° (X

,

х а)

.......Р° (Xch........

XaJ-

По

величине

р(Хаі.........

XaJ = -

= р° (Ха , ...,

XaJ

в соответствии

с уравнением (4.13) оп

ределяется

величина

р(Х^

...... Ха

).

На

основе

сопо­

ставления величин р°(Х . ..., X,

)

и р(Х

. ...,Х„

)

в

соответствии с (4.12) определяется значение p(Xaj, ..;

■•■>XaN ,)• Это, в свою очередь, на основе уравнения

(4.13) позволяет определить р (Хаі, ..., Ха^ 2). 7Ѵ-кратное

повторение описанной процедуры расчетов позволяет оп­

ределить значения р (Х^, ..., Х ^ _ з), ?{Хаі, Xa#_J, и

т. д. вплоть до риска проведения экспериментов первой стадии.

Определение значений функций риска продолжения и прекращения экспериментов после каждой стадии по­ зволяет осуществлять оптимальное последовательное планирование проведения экспериментов, а именно:

эксперименты последовательно проводятся до тех пор,

—>

 

 

 

 

 

 

 

 

пока р<р°.

 

 

 

 

 

 

 

 

Как только (после исходов Ха1, ..., Хаft) величина

ри-

ска продолжения

 

эксперимента

р(Х%, ..., X )

становит­

ся больше или равна величине риска

прекращения

экс­

периментов р°(Х

1,

..., Хаft ), проведение экспериментов еле-

дует прекратить и принять

решение

z(XQi, .... Ха ),

при

котором достигается

 

 

 

 

 

 

P(x ai. - . X

)

= min S C e X

 

 

 

 

 

h

 

я.

 

 

 

X ( X a,, .... Ха \

z ) P ( Q t

|X ^ ,...,X ak).

(4.16)

86


Порядок управления экспериментами (до тех пор, по­ ка их выгодно продолжать) определяется с помощью

функции риска продолжения экспериментов р(Ха*, ..., Х ак),

а именно в качестве ah+i (Х а,

..., Х а ) в байесовом прави-

 

 

1

к

 

ле следует выбрать такой эксперимент (ай+1£:Лй+] а, ...,

Xaft), на

котором достигается

inf в правой части ре­

куррентного уравнения для риска (4.13).

 

Таким образом, реализация оптимального управле­

ния процессом распознавания

связана

с выполнением

следующих расчетных работ.

 

 

1.

На основе карты

штрафов, априорных вероятно­

стей появления объектов соответствующих классов и

условных законов распределения значений признаков по

классам

в соответствии с

уравнением

(4.10) определя­

ются значения рисков прекращения экспериментов после

2.Из физических соображений определяется предель­ ное количество стадий экспериментирования, т. е. вели­ чина N.

3.На основе рекуррентного уравнения (4.13) рассчи­ тываются значения рисков продолжения экспериментов

для всех стадий от (N— 1)-й до 1-й.

4. На основе сравнения величин р° и р для всевоз­ можных исходов экспериментов определяется оптималь­ ное количество стадий экспериментальных работ.

Рассмотрим на конкретном примере порядок опти­ мального планирования процесса распознавания.

4.5. ПРИМЕР

Положим, что в системе распознавания, предназначенной для распознавания объектов ш, принадлежащих одному из двух классов ßi или й 2, следует реализовать оптимальное планирование экспери­ ментов. Пусть априорные вероятности появления объектов соответ­ ственно равны: Р (йі)= 0,6 и Р (й 2)=0,4. Будем исходить из того, что признаки объектов тр и гр дискретны и могут принимать значения:

87


При этом положим, что вероятности отнесения со к Qi, і= 1, 2, в за­ висимости от значений признаков X j , / = 1, 2, равны

^ Bl(* i =

°) =

°.з;

РвЛ а', =

і ) = о,7,

=

0)

=

0.6.

PBt{ X t =

1) = 0,4.

^ ffil( ^ 2 =

0)

=

0,2,

P Bi( X t =

1) =

0,8.

=

0) =

0,7,

Р ^ ( Х г =

1) =

0,3.

Определение

признаков

АП и Х 2 связано с проведением экспери­

ментов

я,

и я 2-

Ограничим

 

число стадий экспериментов N — 2. При

этом на первой

стадии

возможно

проведение либо эксперимента

а и

связанного с определением

признака Х ,

с исходами

Х йі = 0 и Х а

= 1, либо

эксперимента

я 2,

связанного с определением

признака

X і

с исходами Х а = 0 и АГ0а =

 

1.

 

 

 

 

 

 

а2 ( Ха = 0 );

На

второй

стадии

 

возможны

эксперименты

 

я 2 ( Хйі =

1);

либо эксперименты

а , (26

=

0);

а х (Х а

= 1) также

с исходами

Х п = 0 ;

А',,

= 1

и

Х п = 0 ;

Х„

=

1

соответственно*

Общая

схема

экспериментов

приведена на рис. 4.2. Наша задача

состоит в том, чтобы определить риск прекращения и продолжения

экспериментов, т. е. величины р°

и р после

всех

исходов каждого

эксперимента первой и второй стадий, и на основе их сравнения

определить оптимальную процедуру распознавания.

 

 

 

 

Последовательность расчетов такова.

 

 

 

 

 

 

1.

 

Определяем по формуле Байеса значения апостериорной веро­

ятности отнесения со к Qi классу после проведения экспериментов

первой стадии. В данном случае

 

 

 

 

 

 

 

 

Р (S, I Х щ =

0) =

0,43

 

 

 

P (Q ,| A'Ci =

l)= 0 ,7 2

 

P (S 21Х щ = 0 ) =

0,57

 

 

 

Р (S2 I X Ü1 =

1) = 0,28

 

Я ( ^ 1 ^ = 0 ) = 0 ,3

 

 

р (2і1^йа=

1*) =

0,8

Р (S, I 26Ua = 0) =

0,7

 

 

P(Q2\Xai = 1) =

0,2

2. Будем полагать, что условные вероятности вида Р 0

( X

/А" ),

^ = 1,2, равны

 

 

 

 

 

 

 

 

 

Л». (* са 0 I Х 0і = 0) =

0,2

 

 

( X at =

0 1Х ^

=

0) =

0,7

Л ,а ( * 0а = 1 1 ^ = 0 )

=

0,8

f/Bi (А'0а =

1 1 ^ = 0 )

=

0,3

P ai( X 0t = °\Х а, = I) =

°.2

Яй,

=

0 I *«, =

>) =

°-7

Рыі (Х а, = 1 I * 01 = 1) =

0,8

P s, ( Xß, =

1 I

=

1) =

0,3

При этом апостериорные вероятности отнесения объекта со к Qi классу после проведения экспериментов второй стадии в соответ-

88



Рис. 4.2.

ствии С

ф о р м ) 'лой Б а й е с а

;равны

 

Р ( 2 , | * * , = =о; х Ві = 0)

!і о

СО

Р{ 2 , 1

= і ;

* йі — 0)

II О

-*4

 

 

р ( 2 , 1

= о;

a '0j = і)

= 0 ,4 3 ,

я (2 ,1 * а 2 = 1; * „ == і) == 0 ,8 8 ,

Ю

 

 

 

м

І * а , =

0;

 

ю

1 А'в,

= : I;

Р ( 2 2

І ^ а

, =

°;

Р ( 2 а 1 ^ =

1

•*«, -= 0) = 0 ,8 2 ,

=0,3 3 ,

*flI == 0) =

х^ --= 1) = 0 ,57,

: 1 ) == 0 ,1 2 .

3.Составим карту штрафов. Будем полагать, что стоимости

проведения экспериментов равны

С(аі) = С (а2) = 100, а

риски приня­

тия окончательных решений составляют:

 

 

а) без проведения экспериментов

 

 

 

— риски правильных решений

 

 

 

с в,

(z„ -> 2 0

= С йа (z 0 -> Qa) = 100.

 

Выражение вида Cs

(г0 -» 2t)

означает риск принять

окончательное

решение г0 о том, что объект

cog5 2 j

тогда, когда

он в действитель­

ности относится к классу 24, і =

1, ...

, т.

700; Сй (г0 -* 2 0 =

— риски ошибочных решений

Cffi

(z0 -►S2) =

= 600.

Выражение вида Са (г0 -* 2К) означает риск принять окончатель­

ное решение г0 о том, что ш £ 2 г тогда, когда в действительности to относится к классу 2g, q, g = 1, ... , т, q ф g-

б) после проведения экспериментов первой стадии

— риски правильных решений

СВі [*, ( * ft) - 2,1 ==

[г, ( XaJ - 22] = 100;

— риски ошибочных решений

80