Файл: Галушкин, А. И. Синтез многослойных систем распознавания образов.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 104

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Рассмотрим критерий минимума средней функции риска. Иллюстрация видоизменения функции ошибок при пере­ ходе от двух к Кр и континууму решений системы распоз­ навания двух классов образов представлена на рис. 2-5. Следовательно, в данном случае вводится в рассмотрение вместо матрицы (2 -12) коэффициентов ошибок для случая

Рис. 2-5. Иллюстрация видоизменения функции ошибок при переходе от двух к К р и континууму решений СР двух классов образов.

а — два решения; б — три решения; в — /Ср решений; г — конти­ нуум решений.

двух классов образов и Кр решений вектор функции оши­ бок

L = h (xk)

J i ( X k ) .

возникающих при приписывании различным образам пер­ вого и второго класса решения %.

В случае Кр решений СР двух классов образов выраже­ ние для условной функции риска для образов первого класса имеет следующий вид:

к г

N

Г1 = У IIk, j .

. - J* Л (x) rfx.

 

(x)>0

42

Здесь U S р(х) = Х ,где X — полное многомерное про-

странство признаков. Введем дополнительные обозначе­ ния:

G (х, kp) =

1 при х £ S kp ( х )> 0 ,

 

 

О при

x £ S * p (x )> 0 .

Тогда выражение для условной функции риска гх при­

мет следующий

вид:

 

 

 

к р

N

• J G (х, kp) /1 (х) dx.

О =

Ъ hkv Г■ •

*p= 1

х

 

В этом случае, как и в предыдущих, рассмотренных ра­ нее, функция G (х, kp) является предметом синтеза. Она определяет оптимальную модель СР, т. е. оптимальную связь (с точки зрения принятого критерия первичной оп­ тимизации) выходного и входного сигналов СР.

При переходе к континууму решений выражения для функций риска принимают следующий вид:

N

Гх=

I U ( ^ ) j - •

JG(x,

xk)fi(x)dxdxk]

 

Хь

X

 

 

 

 

 

 

N

R = РхГх+ РгО =

.f j' ■•~j' G (x, xk) X

 

 

 

xk

x,

X [pill (xk) /1 (x) -f p2/2 (xk) /я (x)] dx dxk.

Обозначая

 

 

 

 

g (x,

xk) =

[рЛ (xk) fx(x) + p2/2 (xk) /2 (x)],

получаем окончательное выражение для средней функции

риска:

N

R = I

Г- •

• fG (х, xk)g(x, xk)dxdxk.

(2-15)

V

х

J

 

Здесь функция g (х, xk) задана в общем виде. Функция G (х, xk), являющаяся предметом синтеза, должна быть выражена через функцию g (х, xk) таким образом, чтобы достигался минимум R. На рис. 2-6 представлена иллюстра­ ция данной функции для случая одномерного пространства признаков и конечного числа Кр решений СР. При переходе

43


к континууму решений СР данная функция вырождается

вфункцию G (х, xk), общий вид которой представлен на рис. 2-7. Это полоса с высотой, равной единице. Предметом

синтеза является форма данной полосы.

Рис. 2-6. Вид функции

G (х, хк)

Рис. 2-7. Вид функции G (х,

для дискретного множества ре-

для континуума решений и двух

шений и двух классов

образов.

классов образов.

Рис. 2-8. Вид функции G (х, х^ для континуума решений и двух классов образов.

На рис. 2-8 представлена геометрическая иллюстрация функции g (х, xk) в простейшем случае. Таким образом, задача минимизации средней функции риска сводится к за­ даче минимизации площади полосы G (х, хк) g (х, хк), по­ лученной модуляцией (профилированием) полосы G (х, xk), показанной на рис. 2-7, функцией g (х, xk).

44

В выражении для средней функции риска (2-15)

G(x. х*) = 1 1 при

1 0 при хк ф р (\),

где функция р (х) есть предмет синтеза — преобразование, осуществляемое СР над входным сигналом в режиме рас­ познавания. Отсюда выражение для R (х, хк) можно за­ писать в следующем виде:

N

R = j - •

[х. P ( x ) ] d x ,

(2-16)

х

где функция g [х, р (х) ] в данном случае имеет вид:

g [х, р (х)] = Pi/x (х) 1Х\р (х)] + р2/2 (х) /2 [р (х)].

Минимизация R является задачей вариационного ис­ числения. При этом минимум достигается при условии

dg[x,p(x)] _ q

dp (х)

или с учетом конкретного вида функции g [х, р (х)]:

р Л (*)

+ PJ. (X)

= о.

dp (х)

 

dp (х)

Иначе можно записать:

 

 

Pifi (х) dli (Ч)

+

Рг/2(х) d li (хк)

= 0. (2-17)

 

dxk

хк=р(х)

dxk хк=Р(х)

 

Это уравнение определяет оптимальную модель СР двух

классов образов с континуумом решений.

 

Рассмотрим частные случаи.

второго класса

1.

Функции

ошибок

для образов первого и

имеют вид, изображенный на рис. 2-9. Этот случай соответствует одинаковому значению функции ошибок на некотором интервале изменения хк. При этом

dli {Хк) dxk

dli {Хк)

=

= 2 Л/«а6 (**-*«*)1р(*) =

*ь=р(х)

сс=1

 

2 ^ « 1^ IP (х) %ак\>

а= 1

dxk

хк=РМ

2 А/а2б (хк~ хак) L x) =

 

а = 1

 

А

 

 

= 2 -

Л/а2б (х) — хак].

 

0=1

 

45


Уравнение для оптимальной модели СР будет иметь следующий

вид:

А

Plfl (X) а =1 A/“l6

_ Xak1 _

А

 

—P2/ 2 W 2

(х) — Xak) = 0.

а = 1

 

Здесь б (л-*) — б — функция с известными свойствами.

2.Функции ошибок для образов первого и второго класса

функции второго порядка /] (х*) = (1 + х*)2/, /2 (*ft) = (1—х*)2/.

'

11<х к }

{<

f n

{ .

J______ 1

0

- 1

1

j

| -Я/A-

,1 г (Х к)

j

<-

-

 

l -

1

L —

g -

 

1

 

X k

 

Хяк .1

I

*

r

j

 

^

I

1

 

1

1

 

 

1----

!

 

Х/к

Хяк

Хк

Рис. 2-9. Зависимости функции ошибок для СР с континуумом решений.

При этом

^ * l = 2/(l + *ft),

^ M = 2/(* ft-l).

dxk

dxk

Подставляя данные выражения в (2-17), получаем уравнение для оптимальной модели р (х) СР с континуумом решений в следую­ щем виде:

Plfl (X)2/[ 1+ р (х)] + p2f2(х) 21 [р (X) - 1] = 0.

Отсюда следует выражение для оптимальной модели СР с кон­ тинуумом решений в случае квадратичных функций потерь:

р (х) = Рг/g (х) — p j i (х)

Р2 / 2 (х) + Р1 / 1 (х)

Иллюстрация функции xk = р (х), реализуемой СР, представ­ лена на рис. 2-10.

3.Функции ошибок для образов первого и второго класса ес

функции первого порядка 1г (xk) = 1 ( 1 + xk), l2 (xk) =-■ l ( \ —xk).

46


В данном случае dl1 (x^/dx^ /; dl2 (x^/dx^ = l. Отсюда сле­ дует, что при линейных функциях ошибок возникают определен­ ные трудности в формировании оптимальной модели СР. Для ис­ следования данного вопроса рассмотрим функцию ошибки в сле­ дующем виде:

к (Ч) = / (1 + xk)e+l, к (Ч) = / (1 - * * ) е+1,

из которого при с — 1 следует случай 2, а при с = 0 — линейный случай. Тогда

■f- к {ч) =

ахь

[/(1 + ч ) с+'] = — J— I (1 + ч ) с\

ахь

с + 1

-?-к (**)=—

[/( 1 - ^ ) с+,] =

_1_ l ( \ - x kf.

dxk

dxk

 

с +

1

 

 

Общее выражение для опти­

 

 

 

 

 

мальной модели СР имеет следую­

 

 

 

 

 

щий вид:

 

 

 

 

 

 

 

Pifi (х) (1 +

xk)c — p j 2(х) (1 —

 

 

 

 

 

 

Ч ) с = о

 

 

 

 

 

или, иначе,

 

 

 

 

 

 

 

[Р2/ 3 (x)]'/g— [Pl/l (Х)]'/С ^

Рис. 2-10.

Иллюстрация к оп­

[p2M x)]’/C+[Pl/l(x)]1/C '

тимальной модели СР в случае

континуума

решений

и квад­

При с — 1 получаем уже из­

 

ратичных функций

потерь.

 

 

 

 

 

вестное

выражение

оптимальной

 

порядка.

Исследуем случай

модели

для

функций

потерь второго

с -* 0.

Тогда х^ ----- — 1 при любом

значении

х,

удовлетворяющем

неравенству p j x (х))> р 2/ 2 (х), х*=

1 при любом значении

х, удов­

летворяющем неравенству р2/г (х)

 

(х)-

 

 

 

Таким образом,

в случае линейных функций ошибок и конти­

нуума решений пространство решений вырождается в пространство двух решений.

При сравнении критериев первичной оптимизации СР по ве­ личине апостериорной вероятности (2-14а) и минимума средней функции риска (2-17) видно, что оптимальные модели СР совпадают,

если

 

 

1

~ d ( x k)

dk (Xk) .

dxk

 

 

1

-f- d (х^)

dk [Ч)

 

dxk

Эти выражения позволяют ввести дополнительную физическую интерпретацию функции d (х«)

47


Рассмотрим критерий минимума средней функции риска при ограничениях (2-7) и (2-8). Минимизация средней функ­ ции риска (2-15) при условии

N

J J-

■-jG (x, хк) gi (х, xk)dxdxk =

 

xk

x

 

 

N

 

 

= 1 ' ' ■|gri[xp(x)]dx = 0 ,

(2-18)

 

x

 

где

gi (x, xk) = p1f1(x) h {xk)— p2f2(x) l2 (xk),

приводит к уравнению для оптимальной модели СР следую­ щего вида:

(1 +A,)Pi/1 ( x ) - ^ M

+

dxk

xk =P(x)

+ ( 1 - Ц рМ * ) АЬг *1

=

0.

(2-19)

 

 

ахk

хк=Р(х)

 

 

Множитель

Лагранжа к определяется

подстановкой

(2-19) в (2-18).

 

 

 

 

Ограничение в виде заданного значения составляющей

средней функции риска имеет вид:

 

 

 

N

 

 

 

 

I J •

'

• I G (х, xk) [Pi/i (х)

\хк)\ dx dxk= а.

(2-20)

Х к

X

 

 

 

 

Обозначая

 

 

 

 

 

§2 (х, хк, к) g (х, хк) +

(х) li (хк) —

 

=

0

+ Pifi (х) h (хк) +

р2/2 (х) 12 (хк),

 

получаем выражение для оптимальной модели СР в сле­ дующем виде:

Ф?2 (х, xk, k)\Xk=PW

др (х)

или, иначе,

dxk

+

хк=р (х)

dlj (хк)

(2-21)

+ Р2/2 (х)

dxk

 

Множитель А, определяется подстановкой (2-15) в (2-20).

48