Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 76
Скачиваний: 1
" 0 P F Т И К , Н Л ( К Р И П К И Н
ПОСТРОЕНИЕ
СИСТЕМ
РАСПОЗНАВАНИЯ
А Ш
ФИ З'М 'А Т Е М А Тм
ЛИ Т Е Р А Т У Р Ы± J
А. Л. ГОРЕЛИК, В. А. СКРИПКИН
НЕКОТОРЫЕ ВОПРОСЫ ПОСТРОЕНИЯ СИСТЕМ РАСПОЗНАВАНИЯ
• |
А 1 |
1 |
ФИЗ>М АТЕМAT. |
I |
|
Л И Т Е Р А Т У Р Ы |
1 |
|
-- |
'• I -- |
Москва «Советское радио» 1974
Г67 6Ф0.1
УДК 62—5:007:621.391:5192
Г о р е л и к А. |
Л„ С к р и п к и н |
В. А. Некоторые вопросы |
построения систем |
распознавания. |
М., «Сов. радио», 1974, |
В книге изложены некоторые основные разделы теории построения систем распознавания объектов и явлений. Особое внимание уделено обсуждению таких вопросов, как выбор словаря признаков, применение методов алгебры логики для конструирования алгоритмов распознавания, оптимизации про цесса распознавания, оценка эффективности систем распозна
вания. Изложение сопровождается значительным количеством примеров.
Книга рассчитана на студентов старших курсов, аспиран тов и научных работников, специализирующихся в области исследования и построения систем распознавания.
4 табл., 30 рис., библ. 22 назв.
Редакция кибернетической литературы
ІI ГМ. пувличк»*
научи* « теки * ,е на»
і |
б и в л и в т * * * r CCS* |
i |
Э * а** Я Л Я :-4 |
j |
Ц И Т А Л Ч И С О З А Л А |
„ |
30501-020 |
|
1 |
046(01).74 |
65-74 |
© Издательство «Советское радио», 1974.
2
Пре д и с л о в и е
Приблизительно 10—15 лет назад возникло и стало бурно развиваться новое научное направление, связан ное с разработкой и технической реализацией устройств, предназначенных для распознавания образов. Первые работы в этой области были посвящены теории читаю щих автоматов и само слово «образ» использовалось в основном для обозначения напечатанного или написан ного от руки знака, изображающего букву или цифру.
Методы теории статистических решений, использован ные в задачах распознавания образов, в скором време ни были распространены на более широкие классы за дач, в которых требовалось определить тип объекта или явления, основываясь на экспериментальных измерениях некоторого набора параметров, относящихся к конкрет ному объекту (явлению), и определенных статистических
данных, |
характеризующих |
рассматриваемое множество |
|
объектов |
(явлений). |
•• |
_ |
Несмотря на то, что количество публикации,«-поевя- |
|||
щенных |
теории распознавания образов, |
весьма' фелико, |
в них не нашла должного отражения та .то,чка''зрения, что технические средства, а в некоторых случаях и коллективы специалистов, предназначенные для выявле ния признаков объектов и измерения описывающих их параметров, совокупность алгоритмов, преобразующих входную информацию об объектах в определенные вы воды, наконец, вычислительная техника, привлекаемая для реализации этих алгоритмов, образуют единую си стему распознавания.
В качестве примера подобных систем распознавания можно привести разрабатываемую в настоящее время в США единую централизованную систему медицинской диагностики с общим вычислительным центром. В памя ти многомашинного цифрового вычислительного комп лекса центра размещена априорная информация о свя зях между симптомами и заболеваниями и алгоритмы
3
распознавания, обеспечивающие постановку диагноза. Информация о симптомах заболеваний пациентов, нахо дящихся порой за сотни или тысячи километров от'цен тра, передается туда по каналам связи. В центре не только определяется характер заболевания, но и выра батываются рекомендации о порядке лечения, которые и используются на местах для проведения соответствую щих лечебных мероприятий.
Впредлагаемой читателю книге сделана попытка
показать, какие задачи возникают |
при |
проектировании |
и разработке систем распознавания, |
и |
предложить воз |
можные методы решения некоторых задач. При этом основной упор сделан на применение алгебры логики для построения собственно алгоритмической части си стемы распознавания, на методах построения рабочего словаря признаков системы распознавания, на методах оптимизации процесса распознавания и, наконец, на ме тодах математического моделирования системы распо знавания для оценки ее эффективности.
Из шести глав книги четыре первые главы написаны А. Л. Гореликом, главы 5 и 6 В. А. Скрипкиным.
Достаточно ясное представление о содержании от дельных глав можно получить из оглавления, в связи с чем кажется излишним дополнительно характеризо вать распределение материала в книге. Некоторые под
робности, относящиеся к этому |
вопросу, можно найги |
в гл. 1, а также во введении к гл. |
5. |
Авторы считают своим приятным долгом выразить признательность член-корр. АН СССР Н. П. Бусленко, действительному члену АН УССР В. С. Михалевичу, проф. Ю. И. Журавлеву и к. т. н. В. Н. Вапнику, взявшим на себя труд прочитать настоящую книгу в ру кописи. Их полезные советы и рекомендации во многом способствовали улучшению книги.
І. ВЕРОЯТНОСТНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ
1.ВВЕДЕНИЕ В ПРОБЛЕМЫ РАСПОЗНАВАНИЯ ОБЪЕКТОВ И ЯВЛЕНИЙ
1.1.КАЧЕСТВЕННОЕ ОПИСАНИЕ ЗАДАЧИ РАСПОЗНАВАНИЯ
Исторически интерес к проблеме распознавания объ ектов и явлений, к проблеме распознавания образов, впервые возник в связи с исследованиями процессов интеллектуальной деятельности человека, в том числа процессов распознавания человеком неизвестных объ ектов, ситуаций, явлений и попытками промоделировать эти процессы на цифровых вычислительных машинах. Однако вскоре стало ясно, что практическое значений проблемы распознавания чрезвычайно велико и далеко выходит за рамки ее значимости в первоначальной, так сказать, «физиологической», трактовке. Дело в том, что многие задачи современной техники и естествознания, экономики и политики сводятся к распознаванию объектов и явлений. К их числу можно отнести задачи техни ческой и медицинской диагностики, метеорологического прогноза, объективной оценки общественных, экономи ческих, социологических явлений и процессов, опреде ление наиболее вероятных направлений их трансформа ции и т. д. При этом важно отметить, что вне зависимо сти от того, в какой области науки или техники возникает задача распознавания, — ее постановка и ме тоды решения практически аналогичны, что, как извест но, свойственно задачам кибернетики.
Прежде чем приступить к формальному математиче скому описанию различных аспектов задачи распозна вания, представляется полезным на конкретных приме рах рассмотреть ее качественное описание. В качестве первого примера рассмотрим задачу постановки меди цинского диагноза. Последовательность операций в дан ном случае практически такова. Прежде всего определя ется (селектируется) область заболевания пациента. При этом под областью заболевания мы подразумеваем то,
5
Что в медицине определяется специальностями: кардио логией, отоларингологией, урологией, общей хирургией и т. д. В результате анализа врач устанавливает, явля ется ли заболевание кардиологическим урологическим, ларингологическим и т. д. Сузив таким образом свою задачу, врач определяет симптомы или признаки заболе вания пациента, которые характеризуют классы заболе вания в данной области. Здесь под классами подразуме
вается собственно вид заболевания. В кардиологии это
могут быть, например, класс |
I — миокардит, |
класс |
II-- |
эндокардит, класс III — инфаркт миокарда и т. д., |
а под |
||
признаками — температура, |
пульс, кровяное |
давление, |
состав крови, характеристики кардиограммы и т. д. На копив достаточное количество информации о характере заболевания, о его симптомах, врач начинает их сопо ставлять со значениями этих же симптомов, присущими заболеваниям соответствующих классов. В результате подобного сопоставления врач последовательно исклю чает те или другие классы заболеваний и останавлива ется на конкретном диагнозе, т. е. констатирует, что, например, заболевание относится к классу I.
Из рассмотренного примера легко заметить, что по становка диагноза, или распознавание заболевания, со стоит, условно говоря, из ряда этапов. Первый этап (подготовительный) заключается в формировании систе мы распознавания и подготовке ее к эффективному функционированию. Задачи этого этапа состоят в сле дующем. Во-первых, необходимо по возможности наибо лее детально классифицировать заболевания. Во-вторых, следует определить симптомы, которыми характеризует ся или не характеризуется каждый класс заболеваний, и установить применительно к каждому классу, значения или диапазоны изменений измеряемых величин, связан ных с симптомами. В-третьих, необходимо создать меди цинскую аппаратуру, позволяющую определять симпто мы. Другими словами, на первом этапе на основе априор ных данных устанавливается классификация заболева ний, составляется по возможности максимально полное описание каждого класса на языке симптомов, выбира ются или разрабатываются технические средства, пред назначенные для определения этих симптомов.
Цель второго этапа — проведение селекции, т. е. опре деление того, к какой из выделенных областей относит ся изучаемое заболевание. В нашем примере достаточно
6
определить немногие симптомы для решения задачи селекции, однако в общем случае может потребоваться привлечение значительного количества признаков.
Третий этап состоит в детальном обследовании па циента, в определении симптомов, которыми характери зуется его заболевание. Иначе говоря, этот этап состоит в накоплении апостериорной информации о распозна ваемом явлении.
И, наконец, на заключительном этапе врач произво дит сопоставление апостериорной информации с апри орными данными и принимает решение о характере заболевания пациента или, как говорят врачи, ставит диагноз.
В качестве второго примера в зарубежной литературе рассматривается задача распознавания каких-либо об разцов военной техники противника. Для определенно сти представим себе, что речь идет о распознавании его самолетов..
С чего следовало бы начать решение подобной зада чи? По-видимому, прежде всего следовало бы на основе изучения авиации противника, определить, какими типа ми или классами самолетов он располагает. В качестве принципа, используемого для классификации (разбиения на классы), в данном случае можно было бы избрать, например, характер основной задачи, для решения кото рой предназначен данный тип самолета. Использовав подобный принцип, можно выделить класс бомбардиров щиков, класс истребителей, класс штурмовиков и т. д. Затем следовало бы определить, с помощью каких пара метров или признаков могли бы быть описаны выделен ные классы самолетов. После этого в соответствии с тех ническими возможностями средств наблюдения за само летами (радиолокаторов, акустических средств, лазеров, оптических устройств и т. д.) следовало бы из общего перечня признаков выделить те из них, которые могут быть реально определены. К числу таких признаков в данном случае можно отнести, например, крейсерскую и максимальную скорость, предельную высоту полета, число и тип двигателей, длину фюзеляжа самолета, раз мах крыльев и др. И, наконец, следовало бы на основе априорных данных произвести описание на языке вы бранных признаков каждого класса самолетов. В дан ном случае некоторые из признаков носят качественный характер (например, тип двигателей), другие — количе-
7
ствешіый |
(скорость, высота полета и т. д.). Поэтому |
в описании |
классов должны содержаться сведения как |
о том, присущи или неприсущи каждому классу те или другие признаки качественного характера, так и о воз можных диапазонах либо законах распределений значе ний признаков, имеющих количественные выражения, для каждого класса (рис. 1.1 и 1.2).
а |
с ь |
d |
х |
Рис. 1.1.
На этом подготовительную работу можно считать завершенной, так как накоплена и проанализирована априорная информация о самолетах, произведено их разбиение на классы, выбрана система признаков и опи саны все классы самолетов на языке этих признаков.
Теперь положим, что с помощью каких-либо средств наблюдения определены некоторые признаки неизвест ного самолета. Сопоставление апостериорных данных об этом самолете с данными, заключенными в априорном описании всех классов самолетов па языке признаков, позволяет в принципе определить, к какому классу от носится неизвестный самолет, распознать его.
Легко заметить, что рассмотренные примеры содер жат лишь качественное описание задачи распознавания, они не позволяют уяснить ряд моментов. Например, как, на основе каких алгоритмов осуществляется сопостав ление апостериорной и априорной информации, из каких соображений выбираются признаки, используемые для распознавания в тех случаях, когда обеспечена свобода выбора, как накапливать априорную информацию, как
Я