Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 76

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

" 0 P F Т И К , Н Л ( К Р И П К И Н

ПОСТРОЕНИЕ

СИСТЕМ

РАСПОЗНАВАНИЯ

А Ш

ФИ З'М 'А Т Е М А Тм

ЛИ Т Е Р А Т У Р Ы± J

А. Л. ГОРЕЛИК, В. А. СКРИПКИН

НЕКОТОРЫЕ ВОПРОСЫ ПОСТРОЕНИЯ СИСТЕМ РАСПОЗНАВАНИЯ

А 1

1

ФИЗ>М АТЕМAT.

I

Л И Т Е Р А Т У Р Ы

1

--

'• I --

Москва «Советское радио» 1974

Г67 6Ф0.1

УДК 62—5:007:621.391:5192

Г о р е л и к А.

Л„ С к р и п к и н

В. А. Некоторые вопросы

построения систем

распознавания.

М., «Сов. радио», 1974,

В книге изложены некоторые основные разделы теории построения систем распознавания объектов и явлений. Особое внимание уделено обсуждению таких вопросов, как выбор словаря признаков, применение методов алгебры логики для конструирования алгоритмов распознавания, оптимизации про­ цесса распознавания, оценка эффективности систем распозна­

вания. Изложение сопровождается значительным количеством примеров.

Книга рассчитана на студентов старших курсов, аспиран­ тов и научных работников, специализирующихся в области исследования и построения систем распознавания.

4 табл., 30 рис., библ. 22 назв.

Редакция кибернетической литературы

ІI ГМ. пувличк»*

научи* « теки * ,е на»

і

б и в л и в т * * * r CCS*

i

Э * а** Я Л Я :-4

j

Ц И Т А Л Ч И С О З А Л А

30501-020

 

1

046(01).74

65-74

© Издательство «Советское радио», 1974.

2


Пре д и с л о в и е

Приблизительно 10—15 лет назад возникло и стало бурно развиваться новое научное направление, связан­ ное с разработкой и технической реализацией устройств, предназначенных для распознавания образов. Первые работы в этой области были посвящены теории читаю­ щих автоматов и само слово «образ» использовалось в основном для обозначения напечатанного или написан­ ного от руки знака, изображающего букву или цифру.

Методы теории статистических решений, использован­ ные в задачах распознавания образов, в скором време­ ни были распространены на более широкие классы за­ дач, в которых требовалось определить тип объекта или явления, основываясь на экспериментальных измерениях некоторого набора параметров, относящихся к конкрет­ ному объекту (явлению), и определенных статистических

данных,

характеризующих

рассматриваемое множество

объектов

(явлений).

••

_

Несмотря на то, что количество публикации,«-поевя-

щенных

теории распознавания образов,

весьма' фелико,

в них не нашла должного отражения та .то,чка''зрения, что технические средства, а в некоторых случаях и коллективы специалистов, предназначенные для выявле­ ния признаков объектов и измерения описывающих их параметров, совокупность алгоритмов, преобразующих входную информацию об объектах в определенные вы­ воды, наконец, вычислительная техника, привлекаемая для реализации этих алгоритмов, образуют единую си­ стему распознавания.

В качестве примера подобных систем распознавания можно привести разрабатываемую в настоящее время в США единую централизованную систему медицинской диагностики с общим вычислительным центром. В памя­ ти многомашинного цифрового вычислительного комп­ лекса центра размещена априорная информация о свя­ зях между симптомами и заболеваниями и алгоритмы

3

распознавания, обеспечивающие постановку диагноза. Информация о симптомах заболеваний пациентов, нахо­ дящихся порой за сотни или тысячи километров от'цен­ тра, передается туда по каналам связи. В центре не только определяется характер заболевания, но и выра­ батываются рекомендации о порядке лечения, которые и используются на местах для проведения соответствую­ щих лечебных мероприятий.

Впредлагаемой читателю книге сделана попытка

показать, какие задачи возникают

при

проектировании

и разработке систем распознавания,

и

предложить воз­

можные методы решения некоторых задач. При этом основной упор сделан на применение алгебры логики для построения собственно алгоритмической части си­ стемы распознавания, на методах построения рабочего словаря признаков системы распознавания, на методах оптимизации процесса распознавания и, наконец, на ме­ тодах математического моделирования системы распо­ знавания для оценки ее эффективности.

Из шести глав книги четыре первые главы написаны А. Л. Гореликом, главы 5 и 6 В. А. Скрипкиным.

Достаточно ясное представление о содержании от­ дельных глав можно получить из оглавления, в связи с чем кажется излишним дополнительно характеризо­ вать распределение материала в книге. Некоторые под­

робности, относящиеся к этому

вопросу, можно найги

в гл. 1, а также во введении к гл.

5.

Авторы считают своим приятным долгом выразить признательность член-корр. АН СССР Н. П. Бусленко, действительному члену АН УССР В. С. Михалевичу, проф. Ю. И. Журавлеву и к. т. н. В. Н. Вапнику, взявшим на себя труд прочитать настоящую книгу в ру­ кописи. Их полезные советы и рекомендации во многом способствовали улучшению книги.


І. ВЕРОЯТНОСТНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ

1.ВВЕДЕНИЕ В ПРОБЛЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ

1.1.КАЧЕСТВЕННОЕ ОПИСАНИЕ ЗАДАЧИ РАСПОЗНАВАНИЯ

Исторически интерес к проблеме распознавания объ­ ектов и явлений, к проблеме распознавания образов, впервые возник в связи с исследованиями процессов интеллектуальной деятельности человека, в том числа процессов распознавания человеком неизвестных объ­ ектов, ситуаций, явлений и попытками промоделировать эти процессы на цифровых вычислительных машинах. Однако вскоре стало ясно, что практическое значений проблемы распознавания чрезвычайно велико и далеко выходит за рамки ее значимости в первоначальной, так сказать, «физиологической», трактовке. Дело в том, что многие задачи современной техники и естествознания, экономики и политики сводятся к распознаванию объектов и явлений. К их числу можно отнести задачи техни­ ческой и медицинской диагностики, метеорологического прогноза, объективной оценки общественных, экономи­ ческих, социологических явлений и процессов, опреде­ ление наиболее вероятных направлений их трансформа­ ции и т. д. При этом важно отметить, что вне зависимо­ сти от того, в какой области науки или техники возникает задача распознавания, — ее постановка и ме­ тоды решения практически аналогичны, что, как извест­ но, свойственно задачам кибернетики.

Прежде чем приступить к формальному математиче­ скому описанию различных аспектов задачи распозна­ вания, представляется полезным на конкретных приме­ рах рассмотреть ее качественное описание. В качестве первого примера рассмотрим задачу постановки меди­ цинского диагноза. Последовательность операций в дан­ ном случае практически такова. Прежде всего определя­ ется (селектируется) область заболевания пациента. При этом под областью заболевания мы подразумеваем то,

5

Что в медицине определяется специальностями: кардио­ логией, отоларингологией, урологией, общей хирургией и т. д. В результате анализа врач устанавливает, явля­ ется ли заболевание кардиологическим урологическим, ларингологическим и т. д. Сузив таким образом свою задачу, врач определяет симптомы или признаки заболе­ вания пациента, которые характеризуют классы заболе­ вания в данной области. Здесь под классами подразуме­

вается собственно вид заболевания. В кардиологии это

могут быть, например, класс

I — миокардит,

класс

II--

эндокардит, класс III — инфаркт миокарда и т. д.,

а под

признаками — температура,

пульс, кровяное

давление,

состав крови, характеристики кардиограммы и т. д. На­ копив достаточное количество информации о характере заболевания, о его симптомах, врач начинает их сопо­ ставлять со значениями этих же симптомов, присущими заболеваниям соответствующих классов. В результате подобного сопоставления врач последовательно исклю­ чает те или другие классы заболеваний и останавлива­ ется на конкретном диагнозе, т. е. констатирует, что, например, заболевание относится к классу I.

Из рассмотренного примера легко заметить, что по­ становка диагноза, или распознавание заболевания, со­ стоит, условно говоря, из ряда этапов. Первый этап (подготовительный) заключается в формировании систе­ мы распознавания и подготовке ее к эффективному функционированию. Задачи этого этапа состоят в сле­ дующем. Во-первых, необходимо по возможности наибо­ лее детально классифицировать заболевания. Во-вторых, следует определить симптомы, которыми характеризует­ ся или не характеризуется каждый класс заболеваний, и установить применительно к каждому классу, значения или диапазоны изменений измеряемых величин, связан­ ных с симптомами. В-третьих, необходимо создать меди­ цинскую аппаратуру, позволяющую определять симпто­ мы. Другими словами, на первом этапе на основе априор­ ных данных устанавливается классификация заболева­ ний, составляется по возможности максимально полное описание каждого класса на языке симптомов, выбира­ ются или разрабатываются технические средства, пред­ назначенные для определения этих симптомов.

Цель второго этапа — проведение селекции, т. е. опре­ деление того, к какой из выделенных областей относит­ ся изучаемое заболевание. В нашем примере достаточно

6


определить немногие симптомы для решения задачи селекции, однако в общем случае может потребоваться привлечение значительного количества признаков.

Третий этап состоит в детальном обследовании па­ циента, в определении симптомов, которыми характери­ зуется его заболевание. Иначе говоря, этот этап состоит в накоплении апостериорной информации о распозна­ ваемом явлении.

И, наконец, на заключительном этапе врач произво­ дит сопоставление апостериорной информации с апри­ орными данными и принимает решение о характере заболевания пациента или, как говорят врачи, ставит диагноз.

В качестве второго примера в зарубежной литературе рассматривается задача распознавания каких-либо об­ разцов военной техники противника. Для определенно­ сти представим себе, что речь идет о распознавании его самолетов..

С чего следовало бы начать решение подобной зада­ чи? По-видимому, прежде всего следовало бы на основе изучения авиации противника, определить, какими типа­ ми или классами самолетов он располагает. В качестве принципа, используемого для классификации (разбиения на классы), в данном случае можно было бы избрать, например, характер основной задачи, для решения кото­ рой предназначен данный тип самолета. Использовав подобный принцип, можно выделить класс бомбардиров­ щиков, класс истребителей, класс штурмовиков и т. д. Затем следовало бы определить, с помощью каких пара­ метров или признаков могли бы быть описаны выделен­ ные классы самолетов. После этого в соответствии с тех­ ническими возможностями средств наблюдения за само­ летами (радиолокаторов, акустических средств, лазеров, оптических устройств и т. д.) следовало бы из общего перечня признаков выделить те из них, которые могут быть реально определены. К числу таких признаков в данном случае можно отнести, например, крейсерскую и максимальную скорость, предельную высоту полета, число и тип двигателей, длину фюзеляжа самолета, раз­ мах крыльев и др. И, наконец, следовало бы на основе априорных данных произвести описание на языке вы­ бранных признаков каждого класса самолетов. В дан­ ном случае некоторые из признаков носят качественный характер (например, тип двигателей), другие — количе-

7

ствешіый

(скорость, высота полета и т. д.). Поэтому

в описании

классов должны содержаться сведения как

о том, присущи или неприсущи каждому классу те или другие признаки качественного характера, так и о воз­ можных диапазонах либо законах распределений значе­ ний признаков, имеющих количественные выражения, для каждого класса (рис. 1.1 и 1.2).

а

с ь

d

х

Рис. 1.1.

На этом подготовительную работу можно считать завершенной, так как накоплена и проанализирована априорная информация о самолетах, произведено их разбиение на классы, выбрана система признаков и опи­ саны все классы самолетов на языке этих признаков.

Теперь положим, что с помощью каких-либо средств наблюдения определены некоторые признаки неизвест­ ного самолета. Сопоставление апостериорных данных об этом самолете с данными, заключенными в априорном описании всех классов самолетов па языке признаков, позволяет в принципе определить, к какому классу от­ носится неизвестный самолет, распознать его.

Легко заметить, что рассмотренные примеры содер­ жат лишь качественное описание задачи распознавания, они не позволяют уяснить ряд моментов. Например, как, на основе каких алгоритмов осуществляется сопостав­ ление апостериорной и априорной информации, из каких соображений выбираются признаки, используемые для распознавания в тех случаях, когда обеспечена свобода выбора, как накапливать априорную информацию, как

Я