Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 84

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

где

значение Х*} признака для /!-го

класса

заключено

в пределах

(X*j)

 

 

 

 

 

Как правило, ошибки измерения подчиняются нор­

мальному закону. Пусть

 

 

 

 

f

) = : - ѵ =

exp - (AXj - m tf!2з2 (2.13)

 

 

о

г 2п

 

 

J

где

т j — математическое

ожидание

ошибки

измерения:

Xj

признака, а а,- — ее

среднеквадратическое

значение.

 

Теперь перед

нами

стоит задача: найти

совместный

закон распределения суммы двух независимых случай­ ных величин или, иначе, композицию законов распреде­ лений, т. е.

 

 

 

 

 

 

 

(2.14)

где знак

>(< — символ композиции

[3]. Напомним,

что если

Z ^ X +

У, то

 

 

 

 

 

 

 

 

 

 

 

00

 

 

ff(Z)= f ( В Д

(У) = j f, (X) ft (Z - X ) dX =

 

 

 

 

oo

—oo

 

 

 

 

 

 

 

 

 

 

 

 

=

$ l A Z - Y ) f s{Y)dY.

(2.15)

Пусть

 

 

 

 

 

 

 

Ь

(X ):

 

\ _

-

(X- n)W t

ш = =

 

V2тс

 

 

b— a

 

тогда

 

 

 

 

 

 

 

 

 

 

 

 

g(Z):

 

 

 

 

[Z—Г—m]»/2oJ

 

 

 

b

a

\ я V'2n

'гіУ:

 

 

 

 

 

 

 

 

1

Г

1

 

dY.

(2.16)

 

b a

J я У2n

 

 

 

Подынтегральная функция есть нормальный закон рас­ пределения с центром рассеивания (Z—т ) и среднеквадратическим отклонением о, а интеграл есть вероят­ ность попадания случайной величины, подчиненной это-

28



Му закону, iiâ участок от а до Ь. СледойательНО,

■(Z -

а У 2‘

і

 

(2.17)

где Ф(/) — функция Лапласа.

 

В нашем случае Z — X j, b = bij, а = ац, т = О,

так как

систематическая ошибка в измерении признаков Xj от­

сутствует и n='<Tj. Поэтому

/< № ) =

1

Гф 7

-ѵ*

(2.18)

^ і ' ^г;) L V а, Р 3

<чѴ*~

Рассмотрим вопрос о возможных методах построения функций Р(Уг), і=1, ..., т, т. е. априорных вероятно­ стей появления объектов і-х классов. В том случае, ког­

да априорная вероятность не зависит от времени, значе­ ния Р (Qi) могут быть определены на основании частот

событий:

Р* (Qi) =Ni(N,

где N — общее количество доступных изучению объектов

во

всех

классах, а Ni — количество объектов в і

классе.

 

 

в частности

В

некоторых системах распознавания,

в системах

медицинской

диагностики, P(Qi)

может за­

висеть от времени. Это

может быть связано, например,

с распространением эпидемии какого-либо заболевания, составляющего или входящего в какой-либо класс си­ стемы. В этом случае следует изучить поведение функ­ ций P(Qj) во времени до текущего момента, а затем на основе тщательного изучения явления произвести их

экстраполяцию на

определенный

промежуток

времени.

В том случае, когда непосредственно изучить априор­

ную информацию

невозможно,

приходится

прибегать

к эвристическому конструированию законов распределе­ ния значений признаков по классам fi(Xj), і= 1, ..., т; j = 1, ..., N, и функций P(Qi).

Задача определения функций fi(Xj) может быть ре­

шена следующим образом. Положим, что группа квали­ фицированных специалистов согласилась дать эксперт­ ные оценки возможных значений признаков объектов всех классов. Пусть применительно к і-му классу оценки возможных значений признаков Xj, по мнению экспер­ тов, Ah, k — \, .... S, составляют Cjg, g= 1, ..., tij. Для

29


Наглядности сведем суждений эксйерТов в таблицу вида

 

 

 

Т а б л и ц а 2.1

Наименование ре-

 

Признаки

X j

 

 

х р

шений альтернатив

X,

Х 1

 

 

 

 

с !

с \

C f

С 1

 

4

 

 

 

 

 

С'Пі

( J

Г-Ѵ

 

п і

nN

 

 

В таблице верхний индекс у решений С1 относится

к номеру признака, а нижний — определяет его возмож­ ное значение. Наличие нескольких решений по каждому признаку есть следствие того, что эксперты могут ука­ зывать не на одну, а на несколько альтернатив. Поло­ жим, что при определении значения признака Хі объек­ тов і'-го класса эксперты подразделились на р групп.

При этом 1-я группа, состоящая из а экспертов, ука­

зала,

что значение признака равно С1, 2-я экспертов)—

С1

Р-я группа (k

экспертов) — С1(г,

ц, <7= 1 ,...,

ііі). Обозначим „веса“

мнений

экспертов

каждой группы

через

ßj1’, Y = 1, ...,

а; ß '2), <р=

1, ... , b;

ф = 1,... , k.

„веса“ мнений групп равны:

 

 

а

 

 

 

 

 

 

ь

 

i x

* )

=

1

ß

(

;= 2 4

=>■ .

у

- В

( 12 ).

 

 

 

D I )<

 

у

 

а и 1

 

1

 

Ь

9

2

d

 

7

 

= 1

 

1

 

 

 

=

(2.19)

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Я<р>=

т

в [ р ) .

 

 

 

 

 

 

 

 

 

Ф

і

 

 

 

 

 

 

 

 

Ф

-

і

 

 

 

Будем полагать, что статистическая вероятность каждого из названных группами экспертов значений признака

30


п л о т ­

пропорциональна «весам» их авторитетов. Тогда

Р*(С') =D <1>/D;

P*(Cjj = D (2>/D;...; Р* (C') = DWfD,

где Z?= £ ) ( » +

. . . +Z)(p).

Наличие значений признаков Xj в i-x классах и соот­

ветствующих им статистических вероятностей позволяет построить статистические ряды, а затем произвести вы­ равнивание (сглаживание) и, следовательно, определить искомые функции распределения fi(Xj) [3].

Метод определения функций P(Q;) аналогичен при­ веденному. Таким образом, эвристический подход к фор­ мированию априорных сведений основывается на обра­ ботке результатов опроса группы экспертов с учетом их авторитета. При этом предполагается, что научно-техни­ ческий уровень экспертов достаточно высок, а их ре­ шения обусловлены только физическими или обществен­ ными законами и техническими возможностями.

2.2.АЛГОРИТМЫ РАСПОЗНАВАНИЯ, ОСНОВАННЫЕ НА ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШЕНИИ

Мы рассмотрели вопросы, связанные с анализом априорной информации и построением функций плотно­ сти вероятности значений признаков объектов по клас­ сам. Наличие этих функций, наряду с функциями апри­ орных вероятностей появления объектов соответствую­ щих классов, позволяет приступить к конструированию собственно алгоритмов распознавания.

Анализ характера задачи распознавания в условиях неполной информации, т. е. при наличии вероятностной связи между признаками объектов и классами, показал, что для построения алгоритмов распознавания с успе­ хом может быть использована теория статистических решений или, иначе, статистическая теория проверки ги­ потез, созданная Нейманом и Пирсоном.

Рассмотрим, в чем состоит суть теории проверки ги­ потез па простом примере. Положим: перед нами постав­ лена задача распознавать объекты, когда число классов равно двум, а объекты описываются одним признаком

X [5].

Пусть класс I описывается функцией условной ности вероятности fi(X), а класс П — функцией

взаимное расположение которых представлено на рис. 2.1. (И

X

Пусть, кроме того, заданы априорные вероятности появ­ ления объектов I и II и классов Р(І) и Р(ІІ) = 1—Р (І). В результате эксперимента определено значение призна­ ка распознаваемого объекта, равное X. Спрашивается,

к какому классу отнести объект?

Обозначим через Х0 некоторое, пока неопределенное

число и условимся о следующем правиле принятия ре­

шений:

 

если Х > Х 0,

то объект будем относить ко II классу;

если Х^ Х о ,

— к I классу.

Если объект относится к классу I, а его считают объектом клас­ са II, то совершена ошибка, которая называется ошибкой первого рода. По терминологии теории статистических решений, ошибочно выбрана гипотеза Нг, в то время как справедлива гипотеза Ни

Вероятность ошибки первого рода, т. е. вероятность отнести объект к классу II, когда он относится к классу I,

оо

Q1= \ h ( X ) d X .

(2.20)

Х0

Наоборот, если справедлива гипотеза Нг. а отдано предпочтение гипотезе # і, то совершена ошибка второго рода, вероятность кото­ рой равна

х„

Q .= ] h ( X ) d X ,

(2.21)

С?2 есть вероятность выбрать гипотезу Ни когда справедлива гипо­ теза Нг.

В некоторых приложениях теории статистических ре­ шений вероятность ошибки первого рода подчас называ­ ют вероятностью ложной тревоги, в то время как вероят­ ность ошибки второго рода — вероятностью пропуска

цели.

■ , ■ *і

32