Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 79

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

бе обрабатывать, как производить разбиение па класСьі и т. д.

Однако рассмотренные примеры позволяют составить представление о задаче распознавания объектов или явлений в следующей трактовке. Имеется некоторая со­ вокупность объектов или явлений. Априорная информа­ ция об этих объектах позволяет подразделить их па ряд непересекающихся (с точки зрения выбранного принци­ па классификации) классов, составить алфавит классоз. Выбран словарь признаков, на языке которого произво­ дится описание каждого класса объектов. Созданы тех­ нические средства, с помощью которых определяются признаки объектов или явлений, а на вычислительных средствах системы распознавания реализованы алгорит­ мы распознавания, обеспечивающие сопоставление апо­ стериорных данных о неизвестном объекте с априорной информацией. Когда на вход системы распознавания поступает неизвестный объект, то с помощью техниче­ ских средств наблюдений проводятся опыты и определя­ ются признаки этого объекта.

Данные о признаках неизвестного объекта, представ­ ляющие собой апостериорную информацию, поступают на вход алгоритмов распознавания, которые, используя априорные описания классов, и определяют, к какому классу может быть отнесен данный объект.

Рассмотренные примеры, кроме того, позволяют уяснить, что распознавание объектов и явлений требует создания специальных систем распознавания.

1.2.ОСНОВНЫЕ ЗАДАЧИ ПОСТРОЕНИЯ СИСТЕМ РАСПОЗНАВАНИЯ

Под системой распознавания или распознающей си­ стемой будем подразумевать сложную динамическую си­

стему, состоящую в общем случае из группы подготов­ ленных специалистов и совокупности технических средств получения и переработки информации и предназначенную для решения на основе специально сконструированных алгоритмов задач распознавания соответствующих объ­ ектов или явлений. Слово «соответствующих» означает, что, как правило, каждая система распознавания при­ способлена для распознавания только данного вида объектов или явлений (система для диагностики заболе­ ваний не «умеет» диагностировать отказы аппаратуры,

9

â система, предназначенная для чтения букв русского алфавита, не «умеет» читать китайские иероглифы или ноты и т. д.).

Разработка систем распознавания связана с решени­ ем целого ряда задач. Обсудим основные задачи, воз­ никающие в процессе проектирования и построения си­ стем распознавания.

Первая задача состоит в максимально подробном и тщательном изучении распознаваемых объектов. Цель этой работы состоит в том, чтобы уяснить, каковы осо­ бенности изучаемых объектов или явлений, что родни г и отличает их друг от друга. Именно подобная работа лежала в основе классификации растительного и живот­ ного мира, проведенной Карлом Линнеем и Чарльзом Дарвиным, в составлении Д. И. Менделеевым периодиче­ ской таблицы элементов. Глубокое проникновение в суть распознаваемых объектов или явлений является серьез­ ной предпосылкой для успешного решения второй зада­ чи— проведения их классификации. Основное в этой за­ даче— выбор надлежащего принципа классификации.

Выбор принципа классификации, как правило, опре­ деляется требованиями, предъявляемыми к системе рас­ познавания, которые, в свою очередь, зависят от того, какие решения могут в принципе приниматься па основе результатов распознавания системой неизвестных объек­ тов и явлений.

Так, нумизмат при классификации может отнести к одному классу рублевые монеты, выпущенные в честь ХХ-летия победы над фашистской Германией, монеты того же достоинства, но отчеканен­ ные в связи с пятидесятой годовщиной Советской власти, — к дру­ гому, а монеты достоинством также в один рубль, но посвященные 100-летию со дня рождения В. И. Ленина, — к третьему. В то же время кассир или кассовый автомат, безусловно, отнесет все три мо­ неты к одному классу.

Другой пример. Пусть сторона А создает систему распознавания самолетов стороны В. Если в распоряжении стороны А нет выбора мер противодействия самолетами стороны В, то стороне А при по­ строении системы распознавания достаточно предусмотреть лишь два класса: один класс — самолеты стороны В, второй класс — свои са­ молеты. Однако если сторона А располагает некоторым набором мер противодействия, то создаваемая ею система распознавания должна, по-видимому, не только различать принадлежность самолетов той или другой стороне, но и классифицировать самолеты стороны В, к при­ меру, «а истребители, бомбардировщики и т, и.

Следующая задача — составление словаря признаков, используемого как для априорного описания классов, так и для апостериорного описания каждого неизвест-

Ю


ного объекта или явления, поступающего на вход систе­ мы и подлежащего распознаванию.

Признаки объектов могут быть подразделены на де­ терминированные (логические) и стохастические (веро­ ятностные) .

Логические признаки распознаваемых объектов мож­ но рассматривать как элементарные высказывания, при­ нимающие два значения истинности вида «да», «нет» или «истина» и «ложь» с полной определенностью.

К числу логических признаков объектов относятся прежде всего признаки, которые не имеют количествен

ного выражения. Эти признаки

представляют

собой

суждения качественного характера

типа наличия

или

отсутствия некоторых свойств или некоторых элементов у распознаваемых объектов или явлений. В качестве логических признаков можно рассматривать, к примеру, следующие симптомы, используемые при медицинской диагностике: боль в горле, кашель, насморк и т. д. Тип двигателя у распознаваемого самолета: реактивный, тур­ бовинтовой или поршневой — также можно рассматри­ вать в качестве примера логических признаков. В каче­ стве логических признаков подлежащих распознаванию объектов геологической разведки могут рассматриваться такие их свойства, как растворимость или нераствори­ мость в определенных кислотах или в некоторых смесях кислот, наличие или отсутствие запаха, цвета и т. д.

К числу логических можно отнести также такие при­ знаки, которые хотя и имеют количественное выраже­

ние, однако при этом важна

(и учитывается) не сама

по себе величина признака у

распознаваемого объекта,

а лишь факт попадания или непопадания ее в заданный интервал. На практике логические признаки подобного рода имеют место в таких ситуациях, когда-либо ошиб­ ками измерений можно пренебречь, либо интервалы зна­ чений признаков выбраны таким образом, что ошибки измерений практически не оказывают влияния на досто­ верность принимаемых решений относительно попадания измеряемой величины в заданный интервал.

Примеры подобного рода логических признаков весь­ ма многочисленны. В области медицинской диагностики в качестве таких признаков (симптомов) можно пола­ гать, например, частоту пульса, величину артериального давления, некоторые показатели анализа крови и т. д. Частота пульса может быть подразделена, к примеру, на

П


следующие интервалы и соответствующие им логические признаки: до 60 ударов/мин — замедленный пульс; от 60 до 80 ударов/мин — нормальный пульс; свыше 80 уда­ ров/мин — частый пульс.

Попадание частоты пульса у пациента в данный ин­ тервал означает, что соответствующий этому интервалу признак принимает значение истинности «да», а осталь­ ные признаки — значение истинности «нет».

В области технической диагностики, как правило, ре шение о выходе из строя технических устройств прини­ мается лишь тогда, когда фактические значения некото­ рых признаков (параметров) превышают заданные диа­ пазоны. Отклонение же значений параметров от номина­ ла, не сопровождающееся выходом за пределы соответ­ ствующих интервалов, является информацией о том, что устройство функционирует нормально.

К числу вероятностных относятся такие признаки, случайные значения которых распределены (безотноси­ тельно к тому, известно или неизвестно это распределе­ ние) по всем классам объектов или явлений и при этом решение о принадлежности распознаваемого объекта

ктому или другому классу может приниматься только на основании конкретных значений признаков данного объекта, определенных в результате проведения соответ­ ствующих опытов.

Признаки распознаваемых объектов следует рассма­ тривать в качестве вероятностных и в том случае, когда измерение их численных значений производится с таки­ ми ошибками, что по результатам измерений невозмож­ но точно сказать, какое численное значение данная ве­ личина приняла.

При разработке словаря признаков, безотносительно

ктому, являются ли они случайными или логическими, приходится сталкиваться с рядом ограничений. Одно из них состоит в том, что в словарь могут быть включены только те признаки, относительно которых может быть получена априорная информация, достаточная для опи­ сания классов на языке этих признаков.

Второе ограничение связано с нецелесообразностью включать в словарь все признаки, на которые не рас­ пространяется указанное ограничение. В самом деле, не­ которые признаки, хотя о них и имеется достаточный объем априорных данных, включать в словарь призна­ ков нет смысла ввиду того, что они либо совсем беспо­

12

лезны, либо весьма мало полезны. О таких признаках говорят, что они малоинформативны, что они не облада­ ют достаточными разделительными свойствами, что каче­ ство их неудовлетворительно.

Рассмотрим следующий пример. Положим, что необходимо со­ здать автомат для размена десятикопеечных монет на два пятака. Одной из основных частей подобного автомата является система рас­ познавания этих монет. Известно, что по размерам монета достоин­ ством в 10 коп. весьма сходна с двухкопеечной и значительно отли­ чается от всех других монет. Поэтому будем полагать, что в данном случае система распознавания должна давать ответ на вопрос о том, к какому классу: десятиили двухкопеечных монет относится брошен­ ная в автомат монета. После проведения классификации возникает вопрос: какие признаки следует использовать при построении систе­ мы распознавания. Круглая монета может быть охарактеризована следующими признаками: диаметр, толщина, вес, материал, и, нако­ нец, рисунки (в том числе цифра), изображенные на одной и другой стороне монеты. Поскольку распознающий автомат должен быть как

можно

проще и дешевле, то последние два признака использовать

в нем

нецелесообразно.

Итак, в распоряжении разработчиков остаются три признака: Х і — диаметр, Х2— толщина, Х3— вес. Соста­

вим таблицу значений признаков Хіл

Х2 и Х3 для I и И

классов.

 

 

 

 

 

 

 

Таблица 1.1

Признаки X j

I класс (десятикопееч­

II класс (двухкопееч­

ные монеты)

ные монеты)

 

Хг

17,5

мм

17,8

мм

X 2

1,2

мм

1,2

мм

Х 3

1800 мг

2000

мг

Из таблицы видно, что признак Х2 не обладает раз­

делительными свойствами и его использовать бесполез­ но. Легко также заметить, что признак Х3 качественнее, чем признак Х\. В самом деле, значения признака

для I и II классов отличаются всего примерно на 2%, признака же Х3— свыше, чем на 11%. Таким образом,

при построении системы распознавания в данном случае целесообразно использовать признак Х3. В разменных

автоматах именно вес монеты и используется в качестве разделительного признака,

13


И, наконец, третье ограничение связано с фактиче­ ским наличием (или возможностью создания) техниче­ ских средств наблюдения, обеспечивающих па основе проведенных экспериментов определение предварительно' отобранных признаков. Названные ограничения зача­ стую превращают разработку словаря признаков в до­ статочно сложную задачу.

К этой задаче вплотную примыкает вопрос о проек­ тировании и создании специальных технических средств наблюдения для определения признаков распознаваемых объектов. В каждом конкретном случае этот вопрос име­ ет свое решение. Общее состоит лишь в том, что эффек­ тивность практически любых систем распознавания в значительной мере определяется объемом и качеством информации о распознаваемых объектах. Это обусловли­ вает необходимость создавать такие средства наблюде­ ния, которые позволяют с максимально возможной точ­ ностью определять наиболее информативные признаки объектов или явлений.

Очередная задача состоит в описании классов на языке словаря признаков, разработанного с учетом указанных ограничений. Признаки объектов можно вы­ разить в виде упорядоченного набора параметров

*і, • ■ XN.

Взависимости от конкретных свойств объектов эти

параметры при переходе от одного объекта к другому изменяются либо непрерывно, либо дискретно.

Будем обозначать непрерывно изменяющиеся признаки

через S“,

ос = 1,...,

Я, а дискретные — через tp, ß =

= 1,..., р.

Множество

упорядоченных чисел вида

т)1, ..., Vх образуют пространство признаков размер­ ности Я + р = М, а конкретные точки этого пространства представляют собой распознаваемые объекты.

Априорное разбиение объектов на т классов Q1;...,

Qm эквивалентно выделению в пространстве признаков областей г = 1,..., т и установлению следующей не­

обходимой зависимости: если объект, имеющий признаки

^ , ..., Eq;

относится к классу £2г-, то пред­

ставляющая его в признаковом пространстве точка при­ надлежит области Di. Если признаки распознаваемых

объектов носят детерминированный характер, то для описания классов объектов Q* на языке признаков необ­

ходимо составить зависимости вида (£“,

опреде­

14


ляющие диапазоны изменений значений признаков

и if

по классам Уг-, і — 1,..., т.

 

Если распределение объектов по областям Д і про­ странства А, + р для всех значений і = 1, . . т носит сто­ хастический характер, то необходимо определить веро­ ятностные характеристики этих распределений.

Такими характеристиками

являются

функции

плот­

ности вероятности /г- (S1,...,

ij1, ..., тр)

значений

па­

раметров Г, т/ при условии, что объекты принадлежат классу Уі , и априорные вероятности Р (Пг) того, что объект, случайным образом выбранный из общей сово­ купности, окажется принадлежащим к классу Пг-. Заме­

тим, что если все параметры Г и

независимы

между

собой, ТО функции /г- (?*,

... ,

У]',...,

Т)1*) МОгуТ

бЫТЬ

представлены

в виде произведений

 

 

k V .......

V, ... ,

/ ) = І 1 Ш { [ Р ( М

 

 

 

 

а=1

р=1

 

где Р {tfji)

условные вероятности

события

*о 2

 

 

 

 

 

Выработка сведений о распознаваемых объектах и априорное описание классов являются весьма трудоем­ кой частью в решении классификационных задач и тре­ буют глубокого изучения свойств этих объектов.

Практическое построение зависимостей. (I“;

либо функций fi (Г), Р (yf\i), Р (Qj) основывается, как пра­

вило, на обработке достаточного количества статистиче­ ского материала. При этом применительно к задачам, в которых указанные зависимости и функции могут из­ меняться во времени, возникает необходимость постоян­ но накапливать статистику по классифицируемым объ­ ектам, исключать из нее не встречающиеся на данное время случаи и корректировать описание классов.

Следующая задача состоит в разработке алгоритмов распознавания, обеспечивающих отнесение распознавае­ мого объекта или явления к тому или другому классу или их некоторой совокупности. Алгоритмы распознава­ ния основываются на сравнении той или другой меры близости или меры сходства распознаваемого объекта с каждым классом. При этом, если выбранная мера бли­ зости данного объекта со с каким-либо классом ßg, g —

15