Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 103
Скачиваний: 1
4. ОПТИМАЛЬНОЕ ПЛАНИРОВАНИЕ ПРОЦЕССА РАСПОЗНАВАНИЯ
4.1. ОБЩИЕ СООБРАЖЕНИЯ
При определенных ограничениях, накладываемых на
признаки, можно показать, что |
когда |
ѵ= А,+ р — число |
используемых признаков (Ц,. . . , |
5х; |
гі1, . .. rf) — воз |
растает, то увеличивается вероятность однозначного ре шения и при V— *оо стремится к единице. Покажем это
[4]. Вероятность получить однозначное решение по одно му признаку?* или rf равна вероятности попадания со
ответствующей случайной величины на такие интервалы
Д(Цу, у = а, ß, |
где отлична от нуля только одна из функ |
||
ций fi, і= 1,2........ m. |
|
|
|
IА Обозначим это событие через а , а соответствующую |
|||
вероятность |
через Р (aj |
и будем |
предполагать, что |
Р (a.f) > е > 0 |
при любом '{. |
|
|
Допустим для простоты, |
что все |
параметры Ц и тр |
независимы между собой. Тогда события Св а%. . . так
же будут независимы. Вероятность получить однознач
ное решение при |
использовании ѵ = А.+ ц признаков бу |
||
дет равна |
|
|
|
р ( І |
= S |
^(aT) - S Р<Рлаѵ) + |
|
+ 2 P(aTapat) + . . . |
+ ( - l ) ,- 'P (a 1,..., а,). |
(4.1) |
т.р.1
Это уравнение получено в соответствии с общей форму лой для вероятности суммы любого числа совместных событий. При использовании (ѵ+1)-го признака будем иметь
р 2 « , |
= 2 |
р (ат)— 2 (а7аР) + . . . + ( — 1)ѵР(а1 ( а +1)- |
чТ=1 |
t = i |
т. Р |
|
|
(4.2) |
При любом V, вычитая из второго уравнения первое, по лучаем
/ѵ + 1 |
1 — Р 2 |
|
Р І 2 — р |
(4.3) |
\ Т = 1
74
Предположим, |
что Р |
a ^ j ^ l, так |
как сущест |
||
вование равенства |
доказывало бы |
сделанное утвержде |
|||
ние. Значит, Р |
|
aT j |
> 0 при любом V, а |
||
следовательно, ограниченная |
последовательность чисел |
||||
= |
aTj j |
является |
монотонно |
возрастающей |
|
и потому сходится. |
Так как для сходящейся последова |
||||
тельности чисел 1іт(Рѵ+1 — PJ — 0, то в силу равенства |
|||||
|
Ѵ->00 |
|
|
|
|
(4.3) lira | р |
[ 2 |
= 1. |
|
|
|
|
7=1 |
|
|
|
|
Однако в физически реализуемых системах распозна вания число используемых признаков далеко не безгра нично. Выше уже шла речь об ограничениях, наклады ваемых на разработку рабочего словаря признаков системы. Более того, при распознавании конкретных объ ектов или явлений подчас нецелесообразно использовать весь набор признаков рабочего словаря. Связано это
стем, что определение каждого признака требует про ведения соответствующего эксперимента и, следователь но, сопряжено с некоторыми расходами. Именно в связи
сэтим и возникает уже упоминавшаяся задача оптими зации процесса распознавания, цель которой — миними зировать расходы, связанные с реализацией процессов распознавания.
Ниже мы рассмотрим один из возможных методов построения оптимального управления процессом распо знавания, основанного на теории оптимального последо вательного планирования экспериментов для различения гипотез, являющейся обобщением теории последователь ных статистических решений.
4.2. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПОСТАНОВКА ЗАДАЧИ
Введем следующие понятия и определения.
1. Пусть £2 = {со}— множество, каждый элемент кото рого со является объектом. Пусть произведена класси-
75
фикация объектов, в результате которой множество Q подразделено на сумму непересекающихся подмно
жеств — классов |
t = l , . . . , т. |
2. Каждый объект обладает определенной совокупно |
|
стью признаков, |
непрерывных Г и дискретных тД а = \ , |
. . ., Я; ß = 1, . . ., ц.
3. Признаки объектов могут быть определены путем обработки информации, получаемой с помощью техни ческих средств наблюдения Ту у = 1,. . ., г.
4. Для определения признаков распознаваемого объ екта необходимо с помощью технических средств наблю дений провести множество экспериментов. Обозначим это множество через А={а}. Оно фактически распадает
ся на сумму непересекающихся подмножеств вида
|
|
л = 2 £ V и л = £ s - V |
|
|||
|
|
|
1=1 а=1 |
1=1ß=l |
|
|
где а ^ |
и |
означают, что |
в эксперименте а |
|||
используется |
техническое средство 7' |
для определения |
||||
либо |
непрерывного признака |
Г, либо |
дискретного |
при |
||
знака |
соответственно. |
имеет определенный |
исход. |
|||
5. |
Каждый |
эксперимент |
Введем в рассмотрение множество возможных исходов экспериментов К„ = {Ха}. Здесь Ха — общее обозначение исхода эксперимента а. Под исходом эксперимента бу
дем подразумевать либо наличие соответствующего при знака у объекта, либо его отсутствие, определение чис ленного значения признака и т. д. Когда а есть экспери
мент по проверке логического признака, тоХа принимает одно из трех возможных значений: — 0,1 или X, озна
чающих соответственно либо отсутствие данного призна ка, либо его наличие, либо, наконец, что в результате проведения эксперимента не удалось установить, при сущ ли данный признак распознаваемому объекту или нет. Если в результате эксперимента а определяется ве роятностный признак, то Ха принимает численное зна
чение.
6. На проведение экспериментов, естественно, накла дываются определенные ограничения. Они обусловли ваются рядом обстоятельств. Например, оптические
76
средства могут быть использованы только при наличии определенной освещенности объектов. Выход из строя того или другого технического средства либо ограниченность его ресурсов также, очевидно, накладывает ограничения на проведение последовательного эксперимента. И, наконец, ограничения могут носить временной характер. Они мо гут, например, состоять в том, что время проведения оче редного эксперимента или группы экспериментов не должно превышать заданной величины.
Таким образом, на множество А={а} накладывается система последовательных ограничений Г, которая, бу
дем считать, задана, если определены следующие под множества из А:
а) задано множество Лг еЛ , элементы которого
можно назвать Т-допустимыми экспериментами первой стадии;
б) для каждого исхода X любого эксперимента а,
G /lf задано множество экспериментов Аг2 (Ха) — допус
тимых после экспериментов первой стадии, и т. д., т. е. для любого а = 1, 2,... имеет место;
в) для каждой /"-допустимой цепочки исходов X
Ха,..., Ха , |
т. е. |
цепочки ах^ _ А \, а2G Аг2 ( X J , ..., |
|||
0Л ^ (X , |
Ха |
), определено множество эксперимен |
|||
тов (Ä -}- 1)-й стадии ЛЙ+1(Х |
1, |
Хак), допустимых после |
|||
цепочки исходов |
X , |
Ха |
экспериментов а,,..., ак. Со |
||
вокупность |
опытов Л с заданной системой ограничений Г |
обозначим Аг .
7. Информация, полученная в результате проведения очередного эксперимента, используется в алгоритме рас познавания для решения вопроса о принадлежности объ екта к одному из подмножеств Q;. Обозначим через z = = {z} множество окончательных решений. Оно распадает ся на подмножества г,, г = 1,... т, при этом zez* озна
чает, что в результате проведения процедуры распозна
вания |
принято |
окончательное |
решение о том, что озе |
8. |
Принятие |
окончательных |
решений Zi сопряжено |
с уплатой «штрафов» Qu за ошибки решения задачи
распознавания, состоящие в том, что объект, принадле жащий к классу k, ошибочно отнесен к классу I (k, 1 =
= 1, 2 ,... т).
77
Введенные в рассмотрение определения позволяют сформулировать задачу построения оптимального плана проведения процесса распознавания.
Пусть система распознавания располагает совокуп ностью технических средств наблюдения Т у=1
каждое из которых предназначено для получения инфор мации о распознаваемых объектах ю.
На основе этой информации с помощью |
специальных |
алгоритмов определены признаки объектов |
и if, необ |
ходимые для их распознавания. Получение информации об объектах связано с проведением экспериментов а,
каждый из которых считается заданным в том случае, если указано техническое средство Т и признак или if,
которые должны быть выявлены с помощью этого сред ства. Проведение экспериментов и принятие окончатель ного решения о принадлежности данного объекта к ка кому-либо классу по информации, полученной в резуль тате этих экспериментов, сопряжено с определенными расходами— Ua. Величина этих расходов Uw, усреднен
ная по всем возможным цепочкам развития эксперимен тов, определяется последовательным правилом R, в со
ответствии с которым осуществляется планирование экспериментов, т. е.
Dm= ü uW .
Каждое из последовательных правил R может
строиться лишь с учетом тех ограничений'Г, которые на кладываются на возможность проведения эксперимен тов. Ввиду того, что заранее неизвестно, какой объект
подвергается распознаванию, величина Uw должна быть
усреднена с помощью априорной вероятности появления объектов соответствующих классов Р(П,).
Качеством каждого алгоритма, определяющего по следовательное правило R, в соответствии с которым ре
ализуется процесс распознавания, может быть охарак теризовано следующим функционалом:
|
|
m |
|
Uv (R) = |
Мр [0 . m = |
£ Da(R) Р (Qi). |
(4.4) |
|
|
г=і |
|
Требуется определить такое |
оптимальное |
правило |
|
R£=Rr, которое |
обеспечивает |
минимум функционала |
78