Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 79
Скачиваний: 1
бе обрабатывать, как производить разбиение па класСьі и т. д.
Однако рассмотренные примеры позволяют составить представление о задаче распознавания объектов или явлений в следующей трактовке. Имеется некоторая со вокупность объектов или явлений. Априорная информа ция об этих объектах позволяет подразделить их па ряд непересекающихся (с точки зрения выбранного принци па классификации) классов, составить алфавит классоз. Выбран словарь признаков, на языке которого произво дится описание каждого класса объектов. Созданы тех нические средства, с помощью которых определяются признаки объектов или явлений, а на вычислительных средствах системы распознавания реализованы алгорит мы распознавания, обеспечивающие сопоставление апо стериорных данных о неизвестном объекте с априорной информацией. Когда на вход системы распознавания поступает неизвестный объект, то с помощью техниче ских средств наблюдений проводятся опыты и определя ются признаки этого объекта.
Данные о признаках неизвестного объекта, представ ляющие собой апостериорную информацию, поступают на вход алгоритмов распознавания, которые, используя априорные описания классов, и определяют, к какому классу может быть отнесен данный объект.
Рассмотренные примеры, кроме того, позволяют уяснить, что распознавание объектов и явлений требует создания специальных систем распознавания.
1.2.ОСНОВНЫЕ ЗАДАЧИ ПОСТРОЕНИЯ СИСТЕМ РАСПОЗНАВАНИЯ
Под системой распознавания или распознающей си стемой будем подразумевать сложную динамическую си
стему, состоящую в общем случае из группы подготов ленных специалистов и совокупности технических средств получения и переработки информации и предназначенную для решения на основе специально сконструированных алгоритмов задач распознавания соответствующих объ ектов или явлений. Слово «соответствующих» означает, что, как правило, каждая система распознавания при способлена для распознавания только данного вида объектов или явлений (система для диагностики заболе ваний не «умеет» диагностировать отказы аппаратуры,
9
â система, предназначенная для чтения букв русского алфавита, не «умеет» читать китайские иероглифы или ноты и т. д.).
Разработка систем распознавания связана с решени ем целого ряда задач. Обсудим основные задачи, воз никающие в процессе проектирования и построения си стем распознавания.
Первая задача состоит в максимально подробном и тщательном изучении распознаваемых объектов. Цель этой работы состоит в том, чтобы уяснить, каковы осо бенности изучаемых объектов или явлений, что родни г и отличает их друг от друга. Именно подобная работа лежала в основе классификации растительного и живот ного мира, проведенной Карлом Линнеем и Чарльзом Дарвиным, в составлении Д. И. Менделеевым периодиче ской таблицы элементов. Глубокое проникновение в суть распознаваемых объектов или явлений является серьез ной предпосылкой для успешного решения второй зада чи— проведения их классификации. Основное в этой за даче— выбор надлежащего принципа классификации.
Выбор принципа классификации, как правило, опре деляется требованиями, предъявляемыми к системе рас познавания, которые, в свою очередь, зависят от того, какие решения могут в принципе приниматься па основе результатов распознавания системой неизвестных объек тов и явлений.
Так, нумизмат при классификации может отнести к одному классу рублевые монеты, выпущенные в честь ХХ-летия победы над фашистской Германией, монеты того же достоинства, но отчеканен ные в связи с пятидесятой годовщиной Советской власти, — к дру гому, а монеты достоинством также в один рубль, но посвященные 100-летию со дня рождения В. И. Ленина, — к третьему. В то же время кассир или кассовый автомат, безусловно, отнесет все три мо неты к одному классу.
Другой пример. Пусть сторона А создает систему распознавания самолетов стороны В. Если в распоряжении стороны А нет выбора мер противодействия самолетами стороны В, то стороне А при по строении системы распознавания достаточно предусмотреть лишь два класса: один класс — самолеты стороны В, второй класс — свои са молеты. Однако если сторона А располагает некоторым набором мер противодействия, то создаваемая ею система распознавания должна, по-видимому, не только различать принадлежность самолетов той или другой стороне, но и классифицировать самолеты стороны В, к при меру, «а истребители, бомбардировщики и т, и.
Следующая задача — составление словаря признаков, используемого как для априорного описания классов, так и для апостериорного описания каждого неизвест-
Ю
ного объекта или явления, поступающего на вход систе мы и подлежащего распознаванию.
Признаки объектов могут быть подразделены на де терминированные (логические) и стохастические (веро ятностные) .
Логические признаки распознаваемых объектов мож но рассматривать как элементарные высказывания, при нимающие два значения истинности вида «да», «нет» или «истина» и «ложь» с полной определенностью.
К числу логических признаков объектов относятся прежде всего признаки, которые не имеют количествен
ного выражения. Эти признаки |
представляют |
собой |
суждения качественного характера |
типа наличия |
или |
отсутствия некоторых свойств или некоторых элементов у распознаваемых объектов или явлений. В качестве логических признаков можно рассматривать, к примеру, следующие симптомы, используемые при медицинской диагностике: боль в горле, кашель, насморк и т. д. Тип двигателя у распознаваемого самолета: реактивный, тур бовинтовой или поршневой — также можно рассматри вать в качестве примера логических признаков. В каче стве логических признаков подлежащих распознаванию объектов геологической разведки могут рассматриваться такие их свойства, как растворимость или нераствори мость в определенных кислотах или в некоторых смесях кислот, наличие или отсутствие запаха, цвета и т. д.
К числу логических можно отнести также такие при знаки, которые хотя и имеют количественное выраже
ние, однако при этом важна |
(и учитывается) не сама |
по себе величина признака у |
распознаваемого объекта, |
а лишь факт попадания или непопадания ее в заданный интервал. На практике логические признаки подобного рода имеют место в таких ситуациях, когда-либо ошиб ками измерений можно пренебречь, либо интервалы зна чений признаков выбраны таким образом, что ошибки измерений практически не оказывают влияния на досто верность принимаемых решений относительно попадания измеряемой величины в заданный интервал.
Примеры подобного рода логических признаков весь ма многочисленны. В области медицинской диагностики в качестве таких признаков (симптомов) можно пола гать, например, частоту пульса, величину артериального давления, некоторые показатели анализа крови и т. д. Частота пульса может быть подразделена, к примеру, на
П
следующие интервалы и соответствующие им логические признаки: до 60 ударов/мин — замедленный пульс; от 60 до 80 ударов/мин — нормальный пульс; свыше 80 уда ров/мин — частый пульс.
Попадание частоты пульса у пациента в данный ин тервал означает, что соответствующий этому интервалу признак принимает значение истинности «да», а осталь ные признаки — значение истинности «нет».
В области технической диагностики, как правило, ре шение о выходе из строя технических устройств прини мается лишь тогда, когда фактические значения некото рых признаков (параметров) превышают заданные диа пазоны. Отклонение же значений параметров от номина ла, не сопровождающееся выходом за пределы соответ ствующих интервалов, является информацией о том, что устройство функционирует нормально.
К числу вероятностных относятся такие признаки, случайные значения которых распределены (безотноси тельно к тому, известно или неизвестно это распределе ние) по всем классам объектов или явлений и при этом решение о принадлежности распознаваемого объекта
ктому или другому классу может приниматься только на основании конкретных значений признаков данного объекта, определенных в результате проведения соответ ствующих опытов.
Признаки распознаваемых объектов следует рассма тривать в качестве вероятностных и в том случае, когда измерение их численных значений производится с таки ми ошибками, что по результатам измерений невозмож но точно сказать, какое численное значение данная ве личина приняла.
При разработке словаря признаков, безотносительно
ктому, являются ли они случайными или логическими, приходится сталкиваться с рядом ограничений. Одно из них состоит в том, что в словарь могут быть включены только те признаки, относительно которых может быть получена априорная информация, достаточная для опи сания классов на языке этих признаков.
Второе ограничение связано с нецелесообразностью включать в словарь все признаки, на которые не рас пространяется указанное ограничение. В самом деле, не которые признаки, хотя о них и имеется достаточный объем априорных данных, включать в словарь призна ков нет смысла ввиду того, что они либо совсем беспо
12
лезны, либо весьма мало полезны. О таких признаках говорят, что они малоинформативны, что они не облада ют достаточными разделительными свойствами, что каче ство их неудовлетворительно.
Рассмотрим следующий пример. Положим, что необходимо со здать автомат для размена десятикопеечных монет на два пятака. Одной из основных частей подобного автомата является система рас познавания этих монет. Известно, что по размерам монета достоин ством в 10 коп. весьма сходна с двухкопеечной и значительно отли чается от всех других монет. Поэтому будем полагать, что в данном случае система распознавания должна давать ответ на вопрос о том, к какому классу: десятиили двухкопеечных монет относится брошен ная в автомат монета. После проведения классификации возникает вопрос: какие признаки следует использовать при построении систе мы распознавания. Круглая монета может быть охарактеризована следующими признаками: диаметр, толщина, вес, материал, и, нако нец, рисунки (в том числе цифра), изображенные на одной и другой стороне монеты. Поскольку распознающий автомат должен быть как
можно |
проще и дешевле, то последние два признака использовать |
в нем |
нецелесообразно. |
Итак, в распоряжении разработчиков остаются три признака: Х і — диаметр, Х2— толщина, Х3— вес. Соста
вим таблицу значений признаков Хіл |
Х2 и Х3 для I и И |
||||
классов. |
|
|
|
|
|
|
|
|
Таблица 1.1 |
||
Признаки X j |
I класс (десятикопееч |
II класс (двухкопееч |
|||
ные монеты) |
ные монеты) |
||||
|
|||||
Хг |
17,5 |
мм |
17,8 |
мм |
|
X 2 |
1,2 |
мм |
1,2 |
мм |
|
Х 3 |
1800 мг |
2000 |
мг |
Из таблицы видно, что признак Х2 не обладает раз
делительными свойствами и его использовать бесполез но. Легко также заметить, что признак Х3 качественнее, чем признак Х\. В самом деле, значения признака
для I и II классов отличаются всего примерно на 2%, признака же Х3— свыше, чем на 11%. Таким образом,
при построении системы распознавания в данном случае целесообразно использовать признак Х3. В разменных
автоматах именно вес монеты и используется в качестве разделительного признака,
13
И, наконец, третье ограничение связано с фактиче ским наличием (или возможностью создания) техниче ских средств наблюдения, обеспечивающих па основе проведенных экспериментов определение предварительно' отобранных признаков. Названные ограничения зача стую превращают разработку словаря признаков в до статочно сложную задачу.
К этой задаче вплотную примыкает вопрос о проек тировании и создании специальных технических средств наблюдения для определения признаков распознаваемых объектов. В каждом конкретном случае этот вопрос име ет свое решение. Общее состоит лишь в том, что эффек тивность практически любых систем распознавания в значительной мере определяется объемом и качеством информации о распознаваемых объектах. Это обусловли вает необходимость создавать такие средства наблюде ния, которые позволяют с максимально возможной точ ностью определять наиболее информативные признаки объектов или явлений.
Очередная задача состоит в описании классов на языке словаря признаков, разработанного с учетом указанных ограничений. Признаки объектов можно вы разить в виде упорядоченного набора параметров
*і, • ■ XN.
Взависимости от конкретных свойств объектов эти
параметры при переходе от одного объекта к другому изменяются либо непрерывно, либо дискретно.
Будем обозначать непрерывно изменяющиеся признаки
через S“, |
ос = 1,..., |
Я, а дискретные — через tp, ß = |
= 1,..., р. |
Множество |
упорядоченных чисел вида |
т)1, ..., Vх образуют пространство признаков размер ности Я + р = М, а конкретные точки этого пространства представляют собой распознаваемые объекты.
Априорное разбиение объектов на т классов Q1;...,
Qm эквивалентно выделению в пространстве признаков областей г = 1,..., т и установлению следующей не
обходимой зависимости: если объект, имеющий признаки
^ , ..., Eq; |
относится к классу £2г-, то пред |
ставляющая его в признаковом пространстве точка при надлежит области Di. Если признаки распознаваемых
объектов носят детерминированный характер, то для описания классов объектов Q* на языке признаков необ
ходимо составить зависимости вида (£“, |
опреде |
14
ляющие диапазоны изменений значений признаков |
и if |
по классам Уг-, і — 1,..., т. |
|
Если распределение объектов по областям Д і про странства А, + р для всех значений і = 1, . . т носит сто хастический характер, то необходимо определить веро ятностные характеристики этих распределений.
Такими характеристиками |
являются |
функции |
плот |
ности вероятности /г- (S1,..., |
ij1, ..., тр) |
значений |
па |
раметров Г, т/ при условии, что объекты принадлежат классу Уі , и априорные вероятности Р (Пг) того, что объект, случайным образом выбранный из общей сово купности, окажется принадлежащим к классу Пг-. Заме
тим, что если все параметры Г и |
независимы |
между |
|||
собой, ТО функции /г- (?*, |
... , |
У]',..., |
Т)1*) МОгуТ |
бЫТЬ |
|
представлены |
в виде произведений |
|
|
||
k V ....... |
V, ... , |
/ ) = І 1 Ш { [ Р ( М |
|
||
|
|
|
а=1 |
р=1 |
|
где Р {tfji) |
условные вероятности |
события |
*о 2 |
||
|
|
|
|
|
Выработка сведений о распознаваемых объектах и априорное описание классов являются весьма трудоем кой частью в решении классификационных задач и тре буют глубокого изучения свойств этих объектов.
Практическое построение зависимостей. (I“;
либо функций fi (Г), Р (yf\i), Р (Qj) основывается, как пра
вило, на обработке достаточного количества статистиче ского материала. При этом применительно к задачам, в которых указанные зависимости и функции могут из меняться во времени, возникает необходимость постоян но накапливать статистику по классифицируемым объ ектам, исключать из нее не встречающиеся на данное время случаи и корректировать описание классов.
Следующая задача состоит в разработке алгоритмов распознавания, обеспечивающих отнесение распознавае мого объекта или явления к тому или другому классу или их некоторой совокупности. Алгоритмы распознава ния основываются на сравнении той или другой меры близости или меры сходства распознаваемого объекта с каждым классом. При этом, если выбранная мера бли зости данного объекта со с каким-либо классом ßg, g —
15