Файл: Журавлёв, Ю. И. Алгоритмы вычисления оценок и их применение [монография].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 30.10.2024
Просмотров: 99
Скачиваний: 0
щих математических приемов, позволяющих методически единооб разно формулировать все многообразие (или достаточно большую его часть) задач распознавания и решать их с заданной точностью. К теоретическим аспектам проблемы также относятся вопросы вы работки научно обоснованного подхода к оптимальному кодирова нию и представлению внешней информации об объектах, подлежа щих распознаванию. При этом внешняя информация понимается в весьма широком смысле — она может представляться, например, непрерывными сигналами различной длительности и амплитуды, задаваться наборами чисел или иных символов.
В смысле техническом проблема распознавания образов заклю чается в разработке и усовершенствовании технических средств для эффективного решения задач классификации. Такими средст вами являются или специально создаваемые устройства, структура которых зависит от особенностей классифицируемых объектов (например, звуковых, зрительных и т. д.), или универсальные ЭВМ. При использовании последних необходимо иметь машинные про граммы или программные комплексы, составленные на основе соответствующих алгоритмов распознавания.
Практика распознавания образов интересна тем, что разраба тываемые в этой проблеме методы позволяют решать большое количество задач классификации (и прогнозирования) не только в традиционных областях знаний, но даже в гуманитарных науках. Особенно полезным при рассмотрении вопросов в таких областях представляется то, что возникает необходимость в новых математи ческих постановках или математических формулировках задач, которые, как оказывается, не могут быть решены методами «обыч ной» математики непрерывных процессов [21]. Это является стиму лом к разработке новых разделов самой математической науки.
И, наконец, социально-философская значимость проблемы рас познавания образов вытекает из того, что впервые в рамках этой проблемы предпринимается попытка искусственно создать устрой ство, наделенное чертами разумй.
Как отмечает А. А. Дородницын [21],Гобщей чертой задач рас познавания объектов весьма различной физической природы явля ется то, что по совокупности признаков (внешняя информация), которые проявляет неизвестный объект из определенного класса, необходимо установить (достоверно или с достаточной степенью вероятности), какому именно объекту из этого класса соответствует данная конкретная совокупность признаков]''.
Наиболее просто приведенная задача могла бы быть решена при наличии полной информации о классе, т. е. генеральной сово купности объектов, образующих класс. Тогда поочередно сравни вая новый, неизвестный объект с представителями класса (по признаковым множествам), можно однозначно установить принад лежность объекта классу. Однако на практике такая ситуация, когда имеется исчерпывающая совокупность признаков (объектов) класса, почти не встречается.
8
Поэтому в проблеме распознавания образов описанный триви альный случай не рассматривается и при построении алгоритмов и теории распознавания (обычно называемой теорией обучения ма шин распознаванию образов) используются иные пути.
Первый путь связан с привлечением к обучению машины «учи теля», который сам умеет классифицировать наблюдаемые объек ты. Учитель может передавать ученику (машине) свой опыт или сообщая ему четкие правила классификации (обучение передачей правил), пли показывая определенное количество характеристик представителей классов (обучение демонстрацией примеров). Пер вый способ обучения более трудный, так как учителю не всегда сдается четко выработать и формализовать правила обучения (за частую он сам не знает этих правил). Поэтому большее распрост ранение получил второй подход к обучению, почерпнутый, как было сказано во введении, из живой природы.
Методы обучения машин распознаванию образов с учителем в литературе называются обучением с учителем п им посвящено уже достаточно большое, число научных работ [2, 11, 56—57]. В. С. Пу гачев предложил общую модель байесовских обучающихся систем с учителем, позволяющую объединить различные схемы обучения в одну формулировку и учитывающую даже случай реального учи теля, когда он не знает точно правильного ответа [59]. Обучение демонстрацией примеров в некоторых работах именуется также обучением с эталонами. Это определение мы используем далее в данной работе.
Второй путь в решении задач распознавания связан с отсут ствием обучающего учителя и при классификации объектов исполь зуется только информация, заложенная в описании самих объектов, подлежащих классификации. Такой подход к классификации на зывается методом распознавания без учителя, пли классификацией без эталонов, или самопроизвольным разбиением множества объ ектов. Большой цикл работ, связанных с разработкой алгоритмов для этих разбиений, проведен Н. Г. Загоруйко и его ученика ми [23, 34].
§2. Классификация и характеристика основных
задач распознавания образов
При более детальном рассмотрении и анализе проблемы распо знавания образов возникает большое количество важных, отчасти самостоятельных задач, таких как получение эффективных описа ний объектов, выбор наилучших решающих правил, расчет затрат на систему распознавания, вычисление меры важности признаков и т. д. От их решения зависит в определенной мере и успех самой проблемы.
К настоящему времени не выработана единая, достаточно пол ная классификация таких задач, однако уже имеется несколько интересных попыток, заслуживающих внимания как в теоретиче-
9
еком, так и в прикладном смысле. Особенно полезным представля ется принцип, предложенный в [34], позволяющий свести все мно гообразие задач распознавания к нескольким типам и указать ал горитмы, пригодные для их решения. Ввиду того, что в данном па раграфе (да и во всей работе) не ставилась цель разработать новую классификацию, мы в дальнейшем будем использовать ре комендации, данные в работе [34] с той лишь разницей, что к переч ню описанных там вопросов добавим еще один — вычисление меры важности признаков или наборов признаков, участвующих в опи сании объектов распознавания. Необходимость и полезность от дельного изучения такой задачи подтверждаются соображениями, приводимыми в третьей главе.
Для удобства последующего изложения введем некоторые обо
значения (более полно они даны в следующей главе). |
через S. , а |
|||||||
|
Объект распознавания под номером j |
обозначим |
||||||
г'-ый признак |
этого объекта —через я... |
Если признаки |
а,7 , i = 1, |
|||||
2 |
, п |
принимаютсвои значения из некоторых заданных множеств |
||||||
2Д, |
г = |
1, |
2 |
то набор а0) = (а |
<* |
,.,я } |
назовем до |
|
пустимым, |
а множество объектов Sj , |
у = |
1, 2, ... |
, т, |
представ |
ляемых такими наборами, отметим буквой D. Непересекающнеся подмножества — классы, получаемые при разбиении множества D (если они существуют), обозначим через ЛГ, , /С2 , ...,КЦ, ... ,КГ
В некоторых случаях отдельный |
объект (например, контроль |
||
ный, вновь предъявленный для распознавания) |
удобно |
обозна |
|
чать через S и сопоставлять с ним набор признаков а ( |
■ |
||
Перейдем к описанию задач |
распознавания |
и краткому рас |
смотрению некоторых алгоритмов. При этом будем подразумевать, что заданы ограничения на общую сумму затрат Q, складываю щихся из стоимости процедуры (объем памяти, количество опера ций на ЭВМ, вес, габариты, стоимость оборудования и т. д., необходимые для реализации, т>е. для построения и использования данного распознающего устройства или имитирующего его машин ного алгоритма) и стоимости потерь (стоимость ошибок распозна вания, зависящая от их вероятности).
1. Задача классификации объектов с эталонами. Эта задача яв ляется основной в теории обучения машин распознаванию образов и содержательно формулируется следующим образом.
Задано некоторое множество M R c:D эталонных объектов и
известно разбиение этого множества на I непересекающихся под множеств— классов /<] , ЛГ2, ... , Ки, ... , Kt . Совокупность объек тов, составляющих определенное подмножество, представляет
собой |
образ соответствующего класса. Заданы также множества |
M v т. |
е. определено пространство признаков М а , где образы |
следует отличать друг от. друга. Требуется найти решающее правило (алгоритм), обеспечивающее распознавание (отнесение к
К)
одному из классов) объекта S e D с затратами, не превышающи ми заданной величины Q0.';
Ввиду того, что поиск""решающего правила неразрывно связан с построением некоторого алгоритма А, в рамках которого рабо тает решающее правило, то рассматриваемую задачу в дальней шем будем называть Л-задачей.
В решении Л-задачи различают детерминистскую и вероятност ную постановки. Детерминистская постановка подразумевает, что измерения признаков дают детерминированные величины aj, a2, ап, а суждения учителя об объектах, используемых в процессе обучения, с точки зрения их отнесения к тому или иному классу
вполне однозначны.
В таком случае Л-задача связана о) построением так называе
мых разделяющих функций |
[34, 57, 69]. |
Пусть S = (a j, |
а2, ... |
|
..., ап), тогда |
разделяющая |
функция RU(S), относящаяся к клас |
||
су Ки, и = 1, |
2, ... , /, выбирается таким образом, что если S&KU , |
|||
величина |
Ru( S ) > R q (S), и, q = \ , |
2, ... , I. |
(1.1) |
|
|
и Ф Я-
Уравнение
R u( S ) - R q(S) = О
определяет в пространстве признаков границу разбиений (ре шающую границу) между областями, принадлежащими соответ ственно классу Ки и классу Kq.
Можно подобрать много различных форм для Ru (S), удов
летворяющих условию (1.1). Широко распространены линейные разделяющие функции с использованием линейной комбинации
’ признаков";^ , а2 , ... , ап :
П
|
К (■->) = |
И=1 ?Ац ak “Ь Рд. л +1’ и = |
^ > 2, ... , /. |
|
|||
Решающая граница |
между классами Ки и Kq имеет вид |
||||||
|
|
|
|
П |
|
|
|
|
* „ < S ) - / ? , ( S ) = 2 P 1 «, + P.-m =0. |
О-2) |
|||||
|
|
|
|
fc=l |
|
|
|
где |
|
|
|
|
|
|
|
|
Pft = |
$ик |
$qk И |
P« + l = Hi. л + 1 |
P?. л+1 ■ |
|
|
Уравнение (I. 2) есть уравнение гиперплоскости |
в простран |
||||||
стве |
признаков. |
|
|
|
|
ряд интересных форм |
|
В литературе [57, 69] можно найти еще |
|||||||
для Ru (S) в виде кусочно-линейных |
или полиномиальных функ |
||||||
ций. |
Применение |
эталонов |
классов |
при |
обучении |
сводится к |
и