Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 201

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 2. ЗАДАЧА О РА ЗЛИЧЕНИ И СХОДНЫХ ПОЧЕРКОВ

167

Специфика понятия качества применительно к

элек­

тронным лампам состоит в том, что они должны удовлет­ ворять двум требованиям:

параметры ламп должны находиться в заданных пре­ делах;

параметры прибора должны не выходить из заданных пределов на протяжении заданного промежутка време­ ни АТ.

Контроль над выполнением первого требования обыч­ но не вызывает принципиальных затруднений: всегда можно предусмотреть пост технического контроля в конце технологической линии производства, который проверяет все без исключения приборы, отбраковывая не удовлетво­

ряющие стандарту.

зна­

Гарантировать выполнение второго требования

чительно сложнее. Для этого принят статистический

кон­

троль качества выпущенной продукции. Статистический кон­ троль качества обосновывается так: поскольку приборы выпускаются партиями, считается, что внутри партии отклонение от некоторого фиксированного значения ка­ чества есть явление случайное. Поэтому в каждой партии может быть определено событие, которое выражается в том, что долговечность прибора окажется менее тре­ буемых АТ часов. Оценить вероятность такого события можно следующим образом: из партии извлекаются I приборов, которые ставятся на испытания, имитирую­ щие реальные условия. Испытания проводятся в течение АТ часов. Вероятность встретить нестандартный прибор в партии оценивается как

_ п

ѵ — Т ’

где п — число нестандартных приборов, выявленных во время испытания.

Партия принимается или отклоняется в зависимости от величины ѵ.

Конечно, хорошо, если партия принята, но как быть, если по результатам статистических испытаний партия должна быть забракована/Досадно’бывает, когда партия, большая часть приборов которой доброкачественная, бракуется целиком. Обычным бывает, например, такой случай, когда заказчик, согласный принять партию с 5%

168 гл. V II. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ

недоброкачественных изделий, бракует партию с 10% недоброкачественных изделий.

Использование методов обучения распознаванию об­ разов для контроля качества продукции позволяет «спа­ сать» забракованные партии, «очищая» их от недоброка­ чественных приборов. Для этого требуется уметь пред­ сказывать по испытаниям приборов в начальный момент времени, выйдут ли параметры приборов за установлен­ ные границы в течение гарантируемого срока АТ, т. е. требуется уметь относить каждую лампу к одному из двух классов — к классу доброкачественных или недоброка­ чественных ламп. Задача сводится, таким образом, к по­ строению решающего правила.

С помощью найденного решающего правила можно перебрать все приборы партии, отделив те, которые клас­ сифицируются как «недоброкачественные». Ясно, что если для данного правила вероятность совершить ошибку первого рода (принять плохой прибор за хороший) равна

рѵ а

всего партия содержит р% плохих

приборов, то

после

«очистки» гв партии останется только ргр % плохих

 

 

 

 

 

 

 

Т а б л и ц а 2

 

 

Прогнози­

 

9

Длина обуча­

Длина эк­

Число

Тип при-

критерий

Рі

ющей

замена­

ошибок

руемый

а

последова­

ционной

прог-

[бора

 

срок

срока

ой

тельности

последо-

нози-

 

 

службы

службы

о»

 

 

ватель-

рова-

 

 

 

 

3* га

1 кл.

2 кл.

ности

ния

1. Лампа

Г

Крутизна

9

10

10

29

1

1000 ча­

6Ж1П

сов

анодно-се­

 

 

 

 

 

 

 

 

точной ха­

 

 

 

 

 

 

 

 

рактеристи­

 

 

 

 

 

2. Лампа

 

ки

 

 

 

 

 

5000 ча­

Группа экс­

7

19

16

15

1

6Ж9П-Е

сов

плуатаци­

 

 

 

 

 

 

 

 

онных пара­

эа

 

 

 

 

3. Лампа

 

метров

 

 

 

 

 

2U0Ü ча­

Выходная

6

9

18

19

0

бегу щей

сов

мощность

 

 

 

 

 

волны

 

 

 

 

 

 

 

ЛЕВ

 

1 год

Выходная

5

14

9

33

3

4. Магне­

трон

 

хране­

мощность

 

 

 

 

 

 

 

ния

 

 

 

 

 

 



§ 3. ЗАДАЧА О КОНТРОЛЕ КАЧЕСТВА ПРОДУКЦИИ 169

приборов. Конечно, из партии будет изъято и (100—р)Х ХРг% хороших приборов (р2—вероятность ошибок вто­ рого рода), но с этим ничего не поделаешь — такова плата за отбраковку приборов партии. Такой метод от­ браковки в настоящее время успешно применяется для многих типов электронных ламп.

Результаты отбраковки для некоторых типов элек­ тронных ламп проведены в таблице 2.

После исключения из партии ламп прогностически недоброкачественных приборов снова может быть про­ изведен статистический контроль партии. Партия опять либо принимается, либо не принимается. В последнем случае может быть снова построено решающее правило по расширенной обучающей последовательности, про­ ведена новая очистка партии и т. д.

Комбинация методов обучения распознаванию обра­ зов с методами статистического контроля открывает возможность построения интереснейших схем отбора и оценки партий доброкачественных приборов.

§ 4. Задача о прогнозе погоды

Эта традиционная задача прогнозирования всегда решалась специалистами-синоптиками с использованием чисто синоптических качественных методов прогноза.

Относительно недавно для прогноза погоды стали при­ меняться точные методы, где развитие синоптической ситуации представлено в виде модели, которая может быть описана уравнениями. Полученное на ЭВМ решение такого уравнения, где начальные условия — метеоро­ логическая ситуация в момент времени t определяет про­ гноз для различных моментов времени t + Аt. Однако качество прогнозов, даваемых по расчетным моделям, пока уступает качеству прогнозов, полученных тради­ ционными методами. И сейчас прогнозы, по существу, даются синоптиками, использующими сведения о машин­ ном прогнозе лишь как консультативный материал.

Для получения прогноза в настоящее время на земном шаре существует широко разветвленная сеть метеостанций, которые фиксируют значения различных метеорологиче­ ских параметров. Эти данные поступают в центральные метеорологические учреждения, где составляются карты

170 ГЛ. VII. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ

метеорологических ситуаций. Синоптики, исследуя эти карты, и дают прогноз погоды. Прогноз погоды состоит из нескольких элементов, таких как прогноз осадков, тем­ пературы, ветра и т. д. Особенно важно уметь прогно­ зировать опасные явления погоды, такие как заморозки, шквал, гололед, грозы.

Для всех этих опасных явлений погоды в настоящее время средствами обучения распознаванию образов по­ лучены решающие правила. Вероятно, первое такое реша­ ющее правило было получено в Западно-Сибирском региональ­ ном гидрометцентре для реше­ ния чрезвычайно важной для сельского хозяйства задачи — прогноза заморозков для лет­ них месяцев (июль — август).

Прогноз минимальной тем­ пературы (заморозков) давался по данным Новосибирска и ше­ сти станций, расположенных в радиусе 1000 км. Данные состо­

яли из сведении о значениях следующих шести пара­ метров:

1) температуры воздуха у поверхности Земли,

2)температуры воздуха на изобарической поверх­ ности 850 миллибар,

3)давления у поверхности Земли,

4)высоты изобарической поверхности 850 миллибар,

5)скорости ветра на уровне 850 миллибар.

6) направления ветра на уровне 880 миллибар.

В отличие от предыдущих задач решалась задача раз­ деления не на 2, а на 18 классов. Результаты испытания полученных решающих правил приведены на рис. 19. На этом рисунке сравниваются распределения вероят­ ностей ошибок прогноза ЭВМ (кривая 1) и синоптика (кривая 2).

По оси абсцисс графика отложена величина ошибки, по оси ординат вероятность этой ошибки. Согласно этому графику малые ошибки при получении прогноза сред­ ствами обучения распознаванию образов менее вероят­ ны, чем при прогнозе синоптика. Наоборот, машина несколько чаще делает грубые ошибки, которых синоп­


5. МЕТОДЫ РАСПОЗНАВАНИЯ В МЕДИЦИНЕ

171

тик избегает. Это объясняется тем, что информация о метеорологических ситуациях собиралась только от шести станций, расположенных на расстоянии 1000 км. А на таком сравнительно небольшом расстоянии нельзя учесть быстрых и резких изменений в развитии атмосферных процессов; они могут быть учтены лишь при наблюдении за большим участком земной поверхности. Тем не менее показательно то, что уже по данным шести станций про­ гнозы ЭВМ оказались в среднем не хуже прогнозов синоп­

тиков.

Схема прогноза гололеда средствами обучения рас­ познаванию образов была построена в Гидрометцентре

СССР.

Прогностическая схема была построена по шести пара­

метрам:

1) температура воздуха у поверхности Земли,

2)

температура воздуха на изобарической поверхности

850 миллибар,

3)

суммарный дефицит точки росы у поверхности земли

и на уровне 850 миллибар,

4)

лапласиан температуры на уровне 850 миллибар,

5)

скорость ветра у поверхности земли,

6)

разность между скоростями ветра у поверхности

земли и на уровне 850 миллибар.

Надежность прогноза гололеда с помощью построен­ ной схемы составила 90 %. Это намного выше, чем синоп­

тический прогноз.

Аналогичные схемы прогноза были построены в Гид­ рометцентре СССР для предсказания гроз и шквалов. Эти явления прогнозировались по большому числу парамет­ ров (26 для шквалов и 80 для гроз). И здесь оправдываемость прогнозов, полученных с помощью решающих правил, оказалась выше, чем оправдываемость прогно­ зов, даваемых синоптиками.

§ 5. Применение метода обучения распознаванию образов в медицине

Вероятно, наибольший интерес у специалистов в об­ ласти построения обучающихся программ вызывают при­ ложения, связанные с внедрением методов распознавания в медицину. Оказалось, что почти на всех участках своей


172 ГЛ. VII. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ

деятельности врач так или иначе связан с необходимостью классифицировать различные ситуации. Внедрение мето­ дов распознавания в медицину началось уже в первой половине 60-х годов. В настоящее время существуют десятки задач, решенных методами обучения распозна­ ванию образов. При этом оказалось, что в сопоставимых условиях, как правило, классификации с помощью ма­ шин значительно точнее классификаций, которые про­ водит врач.

Методы обучения распознаванию образов использу­ ются для решения следующих задач.

A. Дифференциальная диагностика.

Б. Прогнозирование осложнений при лечении.

B. Прогнозирование отдаленных результатов лечения. Г. Выявление людей, «предрасположенных» к забо­

леванию (эпидемиологические задачи).

д и а ­

А. З а д а ч и д и ф ф е р е н ц и а л ь н о й

г н о с т и к и . Дифференциальная диагностика — одна из наиболее трудных задач медицины. Она состоит в том, чтобы поставить больному диагноз тогда, когда имеюща­ яся симптоматика может проявляться при различных болезнях. Часто при этом окончательный диагноз корен­ ным образом меняет тактику лечения. Например, чрезвы­ чайно трудно различать такие сходно текущие заболе­ вания, как рак легкого и центральное воспаление легкого. А между тем в первом случае желательно срочное опера­

тивное вмешательство, тогда как

во втором

необхо­

димо консервативное

лечение. Для различных

трудно

дифференцируемых

заболеваний

строятся решающие

правила.

В качестве исходной информации о больном берется анамнез, данные обследования: лабораторных анализов, рентгенограммы, кардиограммы и т. д.

Все эти данные определенным образом кодируются. Для этого составляется стандартный перечень вопросов, который для каждого больного заполняется ответами. Часть вопросов требует ответов в виде утверждения «да» (отрицания «нет»), на другие вопросы ответ дается в виде числа. Уславливаются, что ответ «да» — наличие при­ знака — обозначется 1, а ’«нет» — 0. Таким образом, набор ответов для такого вопросника — вектор, і-я координата которого есть ответ на і-й вопрос перечня.