Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 200

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

160 ГЛ. ѴІМЕТОДЫ УП ОРЯДОЧЕННОЙ МИНИМИЗАЦИИ РИСКА

При

га <

I О 2ге положим

Д = 0,25. В этом случае учтем только

первые члены суммы (II.5) и (П.6)

(в первой сумме га2

= 1, во вто­

рой

щ =

п2 = 0):

 

 

 

 

 

 

 

 

 

М о >

f0,25 -f-

gre j e n .

 

(П.8)

При

I )> 2га положим

 

i_

ra

 

 

 

 

 

Д

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

ll\ n%

 

и аппроксимируем

распределение

величины

 

-----j-----=

Ѳнормаль­

 

 

2

 

ным законом (для определенности считаем, что Р (1 | х) )> 0,5). Эта величина имеет математическое ожидание и дисперсию

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

1

Л(/(Ѳ)= —

1

 

 

 

 

 

D

 

1

 

4Д2

 

 

 

 

 

 

 

 

 

га/

Таким

образом,

нормальное

распределение

имеет вид

 

(Ѳ) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(0~ )

2

 

 

 

 

 

 

РФ):

V

 

2{ ѵлі)

 

 

 

 

 

 

 

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pi-= P (Q < 0 ) = 1 - e r f ( г д ] / - ^ - ) •

При д

 

1

1 Г п

 

 

 

 

 

 

 

 

=

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рі =

1 -

erf (1).

 

 

Таким

образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Мо> Y

(1 ~

orf (!))•

(П.9)

Итак из

(П.7),

(П.8),

(П.9)

следует, что

 

 

 

 

 

 

 

 

 

 

0,5«

п

при /^ га ,

 

 

 

М0>

 

 

 

 

I

\ - —

га <

/ <; 2ге,

 

 

 

 

 

0,25 -fg^ -je

"

при

j / " - у - (1 — erf (1)) при 1 ^ 2 п .


Г л а в а V II

П Р И М Е Р Ы П Р И М Е Н Е Н И Я М Е Т О Д О В

ОБ У Ч Е Н И Я Р А С П О З Н А В А Н И Ю

ОБ Р А ЗО В *)

§1. Задача о различении нефтеносных и водоносных

пластов в скважине

Одной из первых задач,

где применялся метод обуче­

ния распознаванию, была

решенная в 1963

году задача

о различении нефтеносных и водоносных

пластов в

скважине.

Залегающая в недрах нефть пропитывает пористые слои земной породы. Такие, подобные смоченной губке, пласты называются коллекторными. Они могут быть на­ полнены не только нефтью, но и водой и обычно череду­ ются с неколлекторными пластами. Жидкость, пропиты­ вающая породу, испытывает значительное давление, по­ этому при бурении в'скважину нагнетается глинистый буровой раствор. Каждый пройденный участок одевается трубами, которые цементируются. В результате много­ километровая скважина надежно изолирована.

Теперь относительно тех пород, через которые про­ ходит скважина; эксплуатационникам предстоит решить: во-первых, какие из пластов коллекторные и, во-вторых, какие из коллекторных пластов наполнены нефтью (неф­ теносные пласты подлежат,’ вскрытию; в определенном месте скважина пробивается специальным снарядом, и

*) В этой главе рассказано о примерах применения метода обоб­ щенного портрета, наиболее знакомых авторам. Некоторые резуль­ таты практического применения других методов к этим же задачам упомянуты в комментариях к главе.

£р. Ң, Ваппик, А. Я. Червонеищіс

162 ГЛ. V II. ПРИМ ЕРЫ ПРИМ ЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЯ

нефть по трубам поступает в нофтеприемник). Число кол­ лекторных пластов в скважине может достичь нескольких десятков и среди них возможны самые различные отно­ шения нефтеносных и водоносных.

При классификации коллекторных пластов на нефте­ носные и водоносные существует опасность ошибок двух

родов.

Ошибка первого рода приводит к тому, что вскрытый пласт оказывается не нефтеносным (и в нефтеприемник поступает вода). В этом случае скважина требует ремонта: заделывание вскрытого пласта — дорогая и трудоемкая операция.

При ошибках второго рода вскрыты бывают не все нефтеносные пласты скважины и эксплуатационный эф­ фект скважины снижается. Чтобы избежать таких оши­ бок, с самого начала разработки скважины производится геофизическое исследование пластов, идея которого до­

вольно

проста.

земные породы обладают

сравни­

Известно, что

тельно

большим

электрическим сопротивлением

и по­

этому в скважину накачивается раствор с заведомо малым электрическим сопротивлением. Непористые слои породы, не впитав в себя бурового раствора, не изменят свое электрическое сопротивление, в то время как кол­ лекторные пласты, впитав буровой раствор, покажут малое электрическое сопротивление. Кроме того, нефть обладает более высоким электрическим сопротивлением, нежели вода, и поэтому коллекторный пласт, насыщенный нефтью, в свою очередь покажет более высокое сопротивление, чем коллекторный пласт, содержащий воду.

В общем, такие соображения как-то оправдываются. Действительно, на коллекторных пластах отмечается резкое падение сопротивления. Среди самих же коллек­ торных пластов электрическое сопротивление нефтеносных пластов бывает в среднем несколько выше, чем водо­ носных .

На практике же оказалось, что геофизические методы позволяют сравнительно надежно различать коллектор­ ные пласты от неколлекторных, в то время как ни один из геофизических методов не позволяет достаточно надеж­ но классифицировать коллекторные пласты на нефтенос­ ные и водоносные,


§ 1. ЗАДАЧА О РА ЗЛИЧЕНИ И ПЛАСТОВ Ё СКВАЖИНЕ 1вЗ

Почему же это не удается сделать? Во-первых, сами коллекторные пласты бывают разных толщин (от одного до десятков метров) и, чем меньше толщина пласта, тем труднее его классифицировать — сильнее сказываются случайные влияния, вкрапления других пород и т. п.; во-вторых, пористость породы может быть различная, поэтому степень заполнения породы раствором разная и, следовательно, возможно различное сопротивление по­ роды. Классифицировать коллекторные пласты можно было бы, учитывая косвенные влияния на сопротивление породы, т. е., по существу, используя не один параметр, а набор их. Такой набор геофизических параметров со­ ставляет стандартный комплекс обследования скважин. Он включает в себя измерения:

1)кажущихся электричёских сопротивлений пород при измерениях зондами различной длины (4 зонда);

2)потенциалов собственной поляризации,

3)интенсивности естественного гамма-излучения пород,

4)интенсивности гамма-лучей захвата при облучении нейтронами,

5)диаметра скважины,

6)сопротивления бурового раствора.

По этим измерениям эксперты принимали решения принадлежности пласта к числу нефтеносных. Однако надежность получения таким образом классификации не превосходила 75—85%.

Поэтому и возникла задача классификации средствами распознавания образов.

Эксперимент ставился на нефтеносных месторожде­ ниях Башкирии и Татарии (основной материал относился к девонским песчаникам Татарии). Были собраны све­ дения о геофизических комплексах 300 вскрытых пластов и 100 примеров пластов (50 водоносных и 50 нефтеносных) были выделены для выработки решающего правила, а 200 — для оценки его качества.

Такое правило было получено, и качество его было оценено как три ошибки на 200 случаев. Так примерно это правило и работало в условиях промышленной экс­ плуатации.

Надо сказать, что методы обучения распознаванию образов нашли очень широкое применение во многих раз­ делах геологии.

6*

І64 гл. VII. ПРИМ ЕРЫ ПРИМ ЕНЕНИ Я МЕТОДОЙ РАСПОЗНАВАНИЯ

§2. Задача о различении сходных почерков

Вкриминалистике существует задача о дифференциа­ ции сходных почерков, когда известно, что запись вы­ полнена одним из нескольких лиц, и необходимо выяснить,

каким именно лицом она была сделана.

Рис. 17.

Такую задачу решает эксперт, которому предъявля­ ются исследуемый текст и образцы почерка, выполнен­ ные подозреваемыми лицами. Эксперт, исследуя эти документы, высказывает свое мнение о том, кому при­ надлежит исследуемая запись.

Интересно было бы выяснить, в состоянии ли обуча­ ющаяся программа конкурировать с экспертами-почерко- ведами в задаче о различении сходных почерков.

Для эксперимента были отобраны два^лица со сход­ ными почерками и было сфотографировано по 155 букв «б», написанных в связных текстах каждым из них. Фото­ снимки букв были выполнены одинаковыми по размеру *).

*) Криминалисты указали две характерные точки в начертании букв, по которым проводились масштабирование, центрирование и ориентация изображений.


S 2. ЗАДАЧА О РА ЗЛИ ЧЕН И И СХОДНЫ Х ЙОЧЕРКОЙ

165

На рис. 17 в первой строке приведены образцы почерка лица А, а во второй строке — лица Б. На рис. 18 по­ казан растр для кодировки. Кодировка каждой буквы заключалась в том, что каждая зачерненная на растре

СТОЛБЦЫ _ 10 11 ft 1Б 18 20

* т Р '--------------

 

 

J16

10

г*

w

 

 

e

 

 

TS

 

 

ft

 

■7-S

 

 

T

 

18

p

 

 

го

8

 

 

’l l

X

ZEQ3..

 

И

 

 

 

Рис.

18.

 

 

клетка означала 1 в соответствующей координате 326-мер­ ного вектора.

Из 155 букв, написанных каждым лицом, было слу чайно отобрано по 30 букв для обучения. Таким образом, обучение проводилось по 60 буквам, а для проверки полученного решающего правила оставалось 250 пись­ менных знаков. Решающее правило, которое при этом было получено, дало следующий результат: из 250 пись­ менных знаков было правильно опознано 208 и допу­ щено 42 ошибки.

Одновременно с машинным опознанием проводились контрольные экспертизы семью экспертами. Экспертам

вкачестве образцов почерка давались те же 60 букв, ко­ торые брались для обучения машины. Буквы выдавались

ввиде фотографии (не растрированные). После ознаком­ ления с образцами эксперты должны были определить, кем из двух лиц написана каждая из 250 букв, предъяв­ ленных для опознания. Результаты этого эксперимента приведены в таблице 1.


166 ГЛ. У И . ПРИМ ЕРЫ ПРИМ ЕНЕНИЯ МЕТОДОВ РАСПОЗНАВАНИЙ

 

 

 

Таблица 1

Эксперт

Верных отве­

Ошибок

% опознания

тов на 250

на 25U

1

226

24

90,4

2

229

21

91,4

3

200

50

80

4

223

22

91,2

5

220

30

88

6

237

13

94,6

7

217

33

8 6 ,8

Средний процент опознания семью экспертами соста­ вил 88%; процент же правильных ответов, полученных с помощью ЭВМ, составил 83%.

Таким образом, надежность экспертизы с помощью машины и традиционным способом имеет один и тот же порядок. При этом надо иметь в виду, что машина и экс­ перты пользовались, по существу, различной информа­ цией. Эксперты проводили опознание по фотографиям букв, в то время как машина опознавала рукописные знаки по растру, никак не отражающему все многообра­ зие графического очертания знака.

Несомненно, что кодирование растрированием не яв­ ляется лучшим для целей экспертизы. Существуют спо­ собы кодирования, приспособленные для того, чтобы со­ хранять индивидуальность в начертании знаков. Поэтому возможности вычислительных машин в применении их к задачам почерковой экспертизы далеко не исчерпаны.

Проведенный эксперимент показал, что уже при уни­ версальном (а потому плохом) способе кодирования ка­ чество экспертизы, полученной с помощью машины и традиционным способом, соизмеримы. Специализиро­ ванный способ кодирования буквенных знаков безуслов­ но повысит надежность успешной экспертизы. Создание такого специализированного способа кодирования состав­ ляет предмет исследования криминалистов-почерковедов.

§3. Задача о контроле качества продукции

Внастоящее время одной из важнейших проблем

впромышленности является контроль качества продукции.

Вчастности, такая проблема возникает при проверке качества электронных ламп.