Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 204

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 5. МЕТОДЫ РАСПОЗНАВАНИЯ В МЕДИЦИНЕ

173

Для примера в таблице 3 приведена часть вопросника, составленного в связи с диагностикой заболеваний желудка.

го Наименование признака

1Пол

2Возраст

3Наличие болей

4Боли ноющие

5Боли приступообразные

6Боли голодные

7Боли возникают сразу после еды

8Возникают через 30 мин после еды

9Возникают через 2—3 часа после еды

hi На сколько кг похудел больной за последние 0 ,5 года

к% Гемоглобин в крови

къ Наличие молочной кислоты и т. д.

 

Т а б л и ц а 3

Характер ответа

мужской (1)

женский (0)

целое число

Да (1)

нет (0)

Да (1)

нет (0)

Да (1)

нет (0)

Да (1)

нет (0)

Да (1)

нот (0)

да (1)

нет (0)

Да (1)

нет (0)

ответ в виде числа

ответ в виде числа

есть (1)

нет (0)

Обучающая последовательность составляется из век­ торов, соответствующих больным с установленным диаг­ нозом; полученное с помощью этой последовательности решающее правило и используется в дальнейшем для установления характера заболевания.

Такие решающие правила получены для дифферен­ циальной диагностики болезней желудка (язва желудка, рак желудка, полипы, гастриты), для дифференциальной диагностики болезней пищевода (кардиоспазм, рак пи­ щевода, рубцовые сужения и т. п.), заболеваний легких и других заболеваний. Как уже указывалось, точность правильной классификации с помощью этих правил выше, чем точность врачебной диагностики.

Б. З а д а ч и п р о г н о з и р о в а н и я о с л о ж ­

н е н и й . Умение

прогнозировать осложнения

очень

важно при выборе

схемы лечения. При хирургических

вмешательствах

существует опасность, связанная с та­

ким, например,

осложнением, как тромбофлебит,

и было


174 ГЛ. ѴІІ. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ

бы очень заманчиво для каждого больного уметь прогно­ зировать эту опасность. При других заболеваниях какието схемы лечения могут у некоторых больных вызвать аллергию, а ее тоже надо уметь предсказывать.

Подобные задачи решаются по той же схеме, что и задачи дифференциальной диагностики. Для каждой такой задачи составляется свой перечень вопросов, со­ держание которых должно отражать причины, вызыва­ ющие осложнение. Затем формируется обучающая после­ довательность: к одному классу этой последовательности относят тех больных, которые прошли данный курс лечения, не имея осложнений; к другому — больных, пе­ ренесших осложнения. По этой последовательности стро­ ится правило, которое, учитывая индивидуальные осо­ бенности больного, должно прогнозировать возможности

осложнения при

заданной методике

лечения.

В . П р о г н о з и р о в а н и е о т д а л е н н ы х р е ­

з у л ь т а т о в

л е ч е н и я . Прогнозирование отдален­

ных результатов лечения является

определяющим фак­

тором при выборе методов лечения. По существу, реша­ ется вопрос об эффективности для данного больного некоторой схемы лечения. Обычно принятие решения о применении определенного метода лечения связано с вы­ бором одного из «конкурирующих» методов. Например, для многих заболеваний существуют радикальные (опе­ ративные) и консервативные способы лечения, при этом каждый вариант может иметь различные отдаленные ре­ зультаты. Для простоты будем считать, что лечение при­ водит к одному из трех исходов: 1) полное выздоровление, 2) инвалидность, 3) смерть (в действительности сущест­ вуют различные степени инвалидности).

Предположим, что для каждого метода лечения у нас есть правило, с помощью которого с большой точностью может быть осуществлено отдаленное прогнозирование результатов лечения. Естественно тогда выбирать такую методику лечения, которая дает для данного больного прогностически наиболее благоприятный результат.

Такое прогностическое правило может быть получено средствами обучения распознаванию образов.

Для этого также составляется вопросник, учитывающий индивидуальные особенности больного и особенности те­ чения его заболевания. По такому вопроснику состав­


§ 5. МЕТОДЫ РАСПОЗНАВАНИЯ В МЕДИЦИНЕ

175

ляется обучающая последовательность, т. е. для каждого метода лечения отбирается группа людей, для которых известен результат лечения. Такая группа людей распа­ дается на несколько классов, соответствующих результа­ ту лечения. По этой обучающей последовательности стро­ ится решающее правило, прогнозирующее попадание каждого больного после лечения в соответствующую категорию.

Такие решающие правила строятся для каждого ме­ тода лечения. А затем метод лечения для данного больного выбирается исходя из наиболее благоприятного прогноза результатов лечения.

Подобные методы принятия^решения чрезвычайно эффективны. Обычно, чем большее число параметров не­ обходимо обработать для принятия решения, тем сильнее сказываются преимущества машин в сравнении с челове­ ком. Уже задача о дифференциальной диагностике забо­ левания выявляет значительное преимущество вычисли­ тельных методов в точности и надежности классификации. Задача о выборе методов лечения исходя из наибольшей прогностической эффективности по структуре значитель­ но сложней задач дифференциальной диагностики. Имен­ но поэтому здесь должны сказаться преимущества точного расчета.

Г. Э п и д е м и о л о г и ч е с к и е з а д а ч и . По­ явление методов обучения распознаванию образов позво­ лило поставить в медицинской практике принципиально новые и чрезвычайно важные задачи эпидемиологического плана. Вот примеры таких задач.

Известно, что бывают так называемые вредные произ­ водства. Вредными их называют потому, что, несмотря на принятые меры предосторожности, часть рабочих, занятых на этом производстве, заболевает определенным заболеванием (они называются профессиональными). Между тем рядом с этими заболевшими рабочими работают их товарищи, для которых то же самое производство не опасно. Спрашивается, можно ли при приеме на работу по различным особенностям организма рабочего, его пре­ дыдущей жизни, особенностям, связанным с привычками, и т. п. прогнозировать, заболеет ли он профессиональной болезнью. Естественно, что людям, для которых ответ прогностически неблагоприятен, следует рекомендовать

І76 г л . ѴІІ. ПРИМЕРЫ ПРЙМЕЙЕНИЯ МЕТОДОЙ РАСПОЗНАВАНИЯ

не поступать на эту работу. Такая задача решается так же, как и обычная задача прогноза.

Чрезвычайно важна задача по выделению среди насе­ ления так называемых групп риска. Известно, например, что различные психофизиологические особенности чело­ века, его образ жизни как-то связаны с вероятностью заболеть той или иной болезнью. Так, например, среди заболевших инфарктом миокарда чаще отмечаются люди с такими психофизиологическими особенностями: это. люди сангвистического темперамента, с преобладающими* отрицательными эмоциями, предрасположенными к цолноте, чаще — занятые умственным трудом и т. д.

Возникает вопрос, нельзя ли средствами обучения рас-- познаванию образов построить такое правило,, которое« по данным о психофизиологических особенностях чело­ века, об особенностях его жизненных условий и его нас­ ледственности прогнозировало бы для него вероятность, заболевания той или иной болезнью.

Людей с неблагоприятным прогнозом можно было бы объединить в «группы риска» и для каждой из них пы­ таться выработать некоторые профилактические меро­ приятия.

В настоящее время уже существуют решаюшие пра­ вила, с помощью которых можно выделять группы риска по поводу некоторых онкологических и кардиологических заболеваний.

§ 6. Замечания о применениях методов обучения распознаванию образов

В приведенных выше примерах можно проследить одну и ту же схему: для каждой конкретной проблемы спе­ циалисты указывают формальный способ описания ситуа­ ций, в соответствии с которым образуются векторы, под лежащие классификации. Составляется соответствующая обучающая последовательность, а затем с помощью од­ ного из универсальных алгоритмов обучения распозна­ ванию образов строится нужное решающее правило. Часто оказывается, что полученное правило классификации позволяет разделять ситуации точнее, чем это делают специалисты. Может возникнуть иллюзия, что уже одноприменение алгоритмов обучения распознаванию образов


§ e. Ö ПРИМЕНЕНИЯХ МЕТОДОЙ РАСПОЗНАВАНИЯ

177

само но себе гарантирует успех в решении задач класси­ фикации. Это далеко не так.

Прежде всего, заметим, что из пяти приведенных при­ меров четыре относятся к классификации так называемых абстрактных ситуаций. Как уже отмечалось, структура человеческого распознающего устройства, видимо, не приспособлена к распознаванию абстрактных образов.

Кажущаяся легкость выбора системы формальных описаний ситуаций в приведенных примерах объясняется отнюдь не безразличием к способам формализации инфор­ мации, а тем, что в рассмотренных примерах существует единственная возможность «разумной» формализации.. Так, в задаче о классификации нефтеносных пластов ком­ плекс геофизических измерений был уже определен, в за­ даче прогнозирования срока службы ламп определены эксплуатационные параметры приборов, в задаче о про­ гнозе погоды определены синоптические параметры, при составлении программированной истории болезни широко использовались разработки реальных историй болезни. Итак, оказалось, что во всех приведенных задачах уже задолго до появления методов обучения распознаванию образов было ясно, какая информация нужна для клас­ сификации и как данная информация может быть фор­ мально представлена. Именно этим во многом и объяс­ няется успех применения методов распознавания.

Однако не везде методы распознавания позволили достигнуть успеха в решении конкретных задач. Оказа­ лось, что наиболее трудны для решения такие задачи, как создание буквочитающего автомата и автомата, распо­ знающего речь (акустические сигналы). В различении рукописных знаков ни один из существующих буквочита­ ющих автоматов не может сравниться с искусством раз­ личения рукописных знаков человеком.

Чем это можно объяснить? Вероятно тем, что руко­ писные знаки придумывали сами люди и, естественно, ■создавали их максимально удобными для своего распо­ знающего аппарата. Теперь, для того чтобы состязаться с человеком в различении рукописных знаков, надо по­ вторить в программе «человеческую распознающую структуру».

Г л а в а VIII

Н Е С К О Л Ь К О О Б Щ И Х З А М Е Ч А Н И Й

§ 1. Еще раз о постановке задачи

Почему же задача обучения распознаванию обра­ зов вот уже более пятнадцати лет вызывает такой боль­ шой интерес у ученых различных' специальностей? Ко­ нечно, отвечая на вопрос, можно было бы сослаться на ту пользу, которая может быть достигнута при использова­ нии идей и методов распознавания.

Однако основная притягательная сила задачи обу­ чения распознаванию образов не в этом. Вот уже более пятнадцати лет ученые пытаются понять, какую же за­ дачу они решают. Иногда удается нарисовать общую, а потому поверхностную схему, в которую укладывается постановка задачи распознавания образов, например такую, какая проводится в данной книге. При несколько прямолинейном взгляде на мир можно утверждать, что задача обучения распознаванию образов является примитивной задачей о минимизации среднего риска. Примитивной потому, что решающие правила, среди которых отыскивается нужное,— просто характе­ ристические функции. Более того, это, возможно, просто линейные дискриминантные функции.

Если стать на традиционную в математике точку зре­ ния о том, что задание класса функций, в котором ищется нужная функция, является внешним моментом в поста­ новке задачи, то задача обучения распознаванию обра­ зов есть частный случай задачи о минимизации среднего риска. Правда, оказалось, что для решения такой част­ ной задачи соответствующая математическая теория была недостаточно развита. Поэтому в связи с задачей обучения распознаванию образов были проведены исследования