Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 201
Скачиваний: 4
§ 2. ЗАДАЧА О РА ЗЛИЧЕНИ И СХОДНЫХ ПОЧЕРКОВ |
167 |
Специфика понятия качества применительно к |
элек |
тронным лампам состоит в том, что они должны удовлет ворять двум требованиям:
параметры ламп должны находиться в заданных пре делах;
параметры прибора должны не выходить из заданных пределов на протяжении заданного промежутка време ни АТ.
Контроль над выполнением первого требования обыч но не вызывает принципиальных затруднений: всегда можно предусмотреть пост технического контроля в конце технологической линии производства, который проверяет все без исключения приборы, отбраковывая не удовлетво
ряющие стандарту. |
зна |
Гарантировать выполнение второго требования |
|
чительно сложнее. Для этого принят статистический |
кон |
троль качества выпущенной продукции. Статистический кон троль качества обосновывается так: поскольку приборы выпускаются партиями, считается, что внутри партии отклонение от некоторого фиксированного значения ка чества есть явление случайное. Поэтому в каждой партии может быть определено событие, которое выражается в том, что долговечность прибора окажется менее тре буемых АТ часов. Оценить вероятность такого события можно следующим образом: из партии извлекаются I приборов, которые ставятся на испытания, имитирую щие реальные условия. Испытания проводятся в течение АТ часов. Вероятность встретить нестандартный прибор в партии оценивается как
_ п
ѵ — Т ’
где п — число нестандартных приборов, выявленных во время испытания.
Партия принимается или отклоняется в зависимости от величины ѵ.
Конечно, хорошо, если партия принята, но как быть, если по результатам статистических испытаний партия должна быть забракована/Досадно’бывает, когда партия, большая часть приборов которой доброкачественная, бракуется целиком. Обычным бывает, например, такой случай, когда заказчик, согласный принять партию с 5%
168 гл. V II. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ
недоброкачественных изделий, бракует партию с 10% недоброкачественных изделий.
Использование методов обучения распознаванию об разов для контроля качества продукции позволяет «спа сать» забракованные партии, «очищая» их от недоброка чественных приборов. Для этого требуется уметь пред сказывать по испытаниям приборов в начальный момент времени, выйдут ли параметры приборов за установлен ные границы в течение гарантируемого срока АТ, т. е. требуется уметь относить каждую лампу к одному из двух классов — к классу доброкачественных или недоброка чественных ламп. Задача сводится, таким образом, к по строению решающего правила.
С помощью найденного решающего правила можно перебрать все приборы партии, отделив те, которые клас сифицируются как «недоброкачественные». Ясно, что если для данного правила вероятность совершить ошибку первого рода (принять плохой прибор за хороший) равна
рѵ а |
всего партия содержит р% плохих |
приборов, то |
||||||
после |
«очистки» гв партии останется только ргр % плохих |
|||||||
|
|
|
|
|
|
|
Т а б л и ц а 2 |
|
|
|
Прогнози |
|
9 |
Длина обуча |
Длина эк |
Число |
|
Тип при- |
критерий |
Рі |
ющей |
замена |
ошибок |
|||
руемый |
а |
последова |
ционной |
прог- |
||||
[бора |
|
срок |
срока |
ой |
тельности |
последо- |
нози- |
|
|
|
службы |
службы |
о» |
|
|
ватель- |
рова- |
|
|
|
|
3* га |
1 кл. |
2 кл. |
ности |
ния |
1. Лампа |
Г |
Крутизна |
9 |
10 |
10 |
29 |
1 |
|
1000 ча |
||||||||
6Ж1П |
сов |
анодно-се |
|
|
|
|
|
|
|
|
|
точной ха |
|
|
|
|
|
|
|
|
рактеристи |
|
|
|
|
|
2. Лампа |
|
ки |
|
|
|
|
|
|
5000 ча |
Группа экс |
7 |
19 |
16 |
15 |
1 |
||
6Ж9П-Е |
сов |
плуатаци |
|
|
|
|
|
|
|
|
|
онных пара |
эа |
|
|
|
|
3. Лампа |
|
метров |
|
|
|
|
|
|
2U0Ü ча |
Выходная |
6 |
9 |
18 |
19 |
0 |
||
бегу щей |
сов |
мощность |
|
|
|
|
|
|
волны |
|
|
|
|
|
|
|
|
ЛЕВ |
|
1 год |
Выходная |
5 |
14 |
9 |
33 |
3 |
4. Магне |
||||||||
трон |
|
хране |
мощность |
|
|
|
|
|
|
|
ния |
|
|
|
|
|
|
§ 3. ЗАДАЧА О КОНТРОЛЕ КАЧЕСТВА ПРОДУКЦИИ 169
приборов. Конечно, из партии будет изъято и (100—р)Х ХРг% хороших приборов (р2—вероятность ошибок вто рого рода), но с этим ничего не поделаешь — такова плата за отбраковку приборов партии. Такой метод от браковки в настоящее время успешно применяется для многих типов электронных ламп.
Результаты отбраковки для некоторых типов элек тронных ламп проведены в таблице 2.
После исключения из партии ламп прогностически недоброкачественных приборов снова может быть про изведен статистический контроль партии. Партия опять либо принимается, либо не принимается. В последнем случае может быть снова построено решающее правило по расширенной обучающей последовательности, про ведена новая очистка партии и т. д.
Комбинация методов обучения распознаванию обра зов с методами статистического контроля открывает возможность построения интереснейших схем отбора и оценки партий доброкачественных приборов.
§ 4. Задача о прогнозе погоды
Эта традиционная задача прогнозирования всегда решалась специалистами-синоптиками с использованием чисто синоптических качественных методов прогноза.
Относительно недавно для прогноза погоды стали при меняться точные методы, где развитие синоптической ситуации представлено в виде модели, которая может быть описана уравнениями. Полученное на ЭВМ решение такого уравнения, где начальные условия — метеоро логическая ситуация в момент времени t определяет про гноз для различных моментов времени t + Аt. Однако качество прогнозов, даваемых по расчетным моделям, пока уступает качеству прогнозов, полученных тради ционными методами. И сейчас прогнозы, по существу, даются синоптиками, использующими сведения о машин ном прогнозе лишь как консультативный материал.
Для получения прогноза в настоящее время на земном шаре существует широко разветвленная сеть метеостанций, которые фиксируют значения различных метеорологиче ских параметров. Эти данные поступают в центральные метеорологические учреждения, где составляются карты
170 ГЛ. VII. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ
метеорологических ситуаций. Синоптики, исследуя эти карты, и дают прогноз погоды. Прогноз погоды состоит из нескольких элементов, таких как прогноз осадков, тем пературы, ветра и т. д. Особенно важно уметь прогно зировать опасные явления погоды, такие как заморозки, шквал, гололед, грозы.
Для всех этих опасных явлений погоды в настоящее время средствами обучения распознаванию образов по лучены решающие правила. Вероятно, первое такое реша ющее правило было получено в Западно-Сибирском региональ ном гидрометцентре для реше ния чрезвычайно важной для сельского хозяйства задачи — прогноза заморозков для лет них месяцев (июль — август).
Прогноз минимальной тем пературы (заморозков) давался по данным Новосибирска и ше сти станций, расположенных в радиусе 1000 км. Данные состо
яли из сведении о значениях следующих шести пара метров:
1) температуры воздуха у поверхности Земли,
2)температуры воздуха на изобарической поверх ности 850 миллибар,
3)давления у поверхности Земли,
4)высоты изобарической поверхности 850 миллибар,
5)скорости ветра на уровне 850 миллибар.
6) направления ветра на уровне 880 миллибар.
В отличие от предыдущих задач решалась задача раз деления не на 2, а на 18 классов. Результаты испытания полученных решающих правил приведены на рис. 19. На этом рисунке сравниваются распределения вероят ностей ошибок прогноза ЭВМ (кривая 1) и синоптика (кривая 2).
По оси абсцисс графика отложена величина ошибки, по оси ординат вероятность этой ошибки. Согласно этому графику малые ошибки при получении прогноза сред ствами обучения распознаванию образов менее вероят ны, чем при прогнозе синоптика. Наоборот, машина несколько чаще делает грубые ошибки, которых синоп
5. МЕТОДЫ РАСПОЗНАВАНИЯ В МЕДИЦИНЕ |
171 |
тик избегает. Это объясняется тем, что информация о метеорологических ситуациях собиралась только от шести станций, расположенных на расстоянии 1000 км. А на таком сравнительно небольшом расстоянии нельзя учесть быстрых и резких изменений в развитии атмосферных процессов; они могут быть учтены лишь при наблюдении за большим участком земной поверхности. Тем не менее показательно то, что уже по данным шести станций про гнозы ЭВМ оказались в среднем не хуже прогнозов синоп
тиков.
Схема прогноза гололеда средствами обучения рас познаванию образов была построена в Гидрометцентре
СССР.
Прогностическая схема была построена по шести пара
метрам:
1) температура воздуха у поверхности Земли,
2) |
температура воздуха на изобарической поверхности |
850 миллибар, |
|
3) |
суммарный дефицит точки росы у поверхности земли |
и на уровне 850 миллибар, |
|
4) |
лапласиан температуры на уровне 850 миллибар, |
5) |
скорость ветра у поверхности земли, |
6) |
разность между скоростями ветра у поверхности |
земли и на уровне 850 миллибар.
Надежность прогноза гололеда с помощью построен ной схемы составила 90 %. Это намного выше, чем синоп
тический прогноз.
Аналогичные схемы прогноза были построены в Гид рометцентре СССР для предсказания гроз и шквалов. Эти явления прогнозировались по большому числу парамет ров (26 для шквалов и 80 для гроз). И здесь оправдываемость прогнозов, полученных с помощью решающих правил, оказалась выше, чем оправдываемость прогно зов, даваемых синоптиками.
§ 5. Применение метода обучения распознаванию образов в медицине
Вероятно, наибольший интерес у специалистов в об ласти построения обучающихся программ вызывают при ложения, связанные с внедрением методов распознавания в медицину. Оказалось, что почти на всех участках своей
172 ГЛ. VII. ПРИМЕРЫ ПРИМЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ
деятельности врач так или иначе связан с необходимостью классифицировать различные ситуации. Внедрение мето дов распознавания в медицину началось уже в первой половине 60-х годов. В настоящее время существуют десятки задач, решенных методами обучения распозна ванию образов. При этом оказалось, что в сопоставимых условиях, как правило, классификации с помощью ма шин значительно точнее классификаций, которые про водит врач.
Методы обучения распознаванию образов использу ются для решения следующих задач.
A. Дифференциальная диагностика.
Б. Прогнозирование осложнений при лечении.
B. Прогнозирование отдаленных результатов лечения. Г. Выявление людей, «предрасположенных» к забо
леванию (эпидемиологические задачи). |
д и а |
А. З а д а ч и д и ф ф е р е н ц и а л ь н о й |
г н о с т и к и . Дифференциальная диагностика — одна из наиболее трудных задач медицины. Она состоит в том, чтобы поставить больному диагноз тогда, когда имеюща яся симптоматика может проявляться при различных болезнях. Часто при этом окончательный диагноз корен ным образом меняет тактику лечения. Например, чрезвы чайно трудно различать такие сходно текущие заболе вания, как рак легкого и центральное воспаление легкого. А между тем в первом случае желательно срочное опера
тивное вмешательство, тогда как |
во втором |
необхо |
|
димо консервативное |
лечение. Для различных |
трудно |
|
дифференцируемых |
заболеваний |
строятся решающие |
правила.
В качестве исходной информации о больном берется анамнез, данные обследования: лабораторных анализов, рентгенограммы, кардиограммы и т. д.
Все эти данные определенным образом кодируются. Для этого составляется стандартный перечень вопросов, который для каждого больного заполняется ответами. Часть вопросов требует ответов в виде утверждения «да» (отрицания «нет»), на другие вопросы ответ дается в виде числа. Уславливаются, что ответ «да» — наличие при знака — обозначется 1, а ’«нет» — 0. Таким образом, набор ответов для такого вопросника — вектор, і-я координата которого есть ответ на і-й вопрос перечня.