Файл: Галушкин, А. И. Синтез многослойных систем распознавания образов.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.10.2024
Просмотров: 104
Скачиваний: 1
Рассмотрим критерий минимума средней функции риска. Иллюстрация видоизменения функции ошибок при пере ходе от двух к Кр и континууму решений системы распоз навания двух классов образов представлена на рис. 2-5. Следовательно, в данном случае вводится в рассмотрение вместо матрицы (2 -12) коэффициентов ошибок для случая
Рис. 2-5. Иллюстрация видоизменения функции ошибок при переходе от двух к К р и континууму решений СР двух классов образов.
а — два решения; б — три решения; в — /Ср решений; г — конти нуум решений.
двух классов образов и Кр решений вектор функции оши бок
L = h (xk)
J i ( X k ) .
возникающих при приписывании различным образам пер вого и второго класса решения %.
В случае Кр решений СР двух классов образов выраже ние для условной функции риска для образов первого класса имеет следующий вид:
к г |
N |
Г1 = У IIk, j . |
. - J* Л (x) rfx. |
|
(x)>0 |
42
Здесь U S р(х) = Х ,где X — полное многомерное про-
странство признаков. Введем дополнительные обозначе ния:
G (х, kp) = |
1 при х £ S kp ( х )> 0 , |
||
|
|
О при |
x £ S * p (x )> 0 . |
Тогда выражение для условной функции риска гх при |
|||
мет следующий |
вид: |
|
|
|
к р |
N |
• J G (х, kp) /1 (х) dx. |
О = |
Ъ hkv Г■ • |
||
*p= 1 |
х |
|
В этом случае, как и в предыдущих, рассмотренных ра нее, функция G (х, kp) является предметом синтеза. Она определяет оптимальную модель СР, т. е. оптимальную связь (с точки зрения принятого критерия первичной оп тимизации) выходного и входного сигналов СР.
При переходе к континууму решений выражения для функций риска принимают следующий вид:
N
Гх= |
I U ( ^ ) j - • |
JG(x, |
xk)fi(x)dxdxk] |
|
|
Хь |
X |
|
|
|
|
|
|
N |
R = РхГх+ РгО = |
.f j' ■•~j' G (x, xk) X |
|||
|
|
|
xk |
x, |
X [pill (xk) /1 (x) -f p2/2 (xk) /я (x)] dx dxk. |
||||
Обозначая |
|
|
|
|
g (x, |
xk) = |
[рЛ (xk) fx(x) + p2/2 (xk) /2 (x)], |
получаем окончательное выражение для средней функции
риска:
N
R = I |
Г- • |
• fG (х, xk)g(x, xk)dxdxk. |
(2-15) |
V |
х |
J |
|
Здесь функция g (х, xk) задана в общем виде. Функция G (х, xk), являющаяся предметом синтеза, должна быть выражена через функцию g (х, xk) таким образом, чтобы достигался минимум R. На рис. 2-6 представлена иллюстра ция данной функции для случая одномерного пространства признаков и конечного числа Кр решений СР. При переходе
43
к континууму решений СР данная функция вырождается
вфункцию G (х, xk), общий вид которой представлен на рис. 2-7. Это полоса с высотой, равной единице. Предметом
синтеза является форма данной полосы.
Рис. 2-6. Вид функции |
G (х, хк) |
Рис. 2-7. Вид функции G (х, |
для дискретного множества ре- |
для континуума решений и двух |
|
шений и двух классов |
образов. |
классов образов. |
Рис. 2-8. Вид функции G (х, х^ для континуума решений и двух классов образов.
На рис. 2-8 представлена геометрическая иллюстрация функции g (х, xk) в простейшем случае. Таким образом, задача минимизации средней функции риска сводится к за даче минимизации площади полосы G (х, хк) g (х, хк), по лученной модуляцией (профилированием) полосы G (х, xk), показанной на рис. 2-7, функцией g (х, xk).
44
В выражении для средней функции риска (2-15)
G(x. х*) = 1 1 при
1 0 при хк ф р (\),
где функция р (х) есть предмет синтеза — преобразование, осуществляемое СР над входным сигналом в режиме рас познавания. Отсюда выражение для R (х, хк) можно за писать в следующем виде:
N
R = j - • |
[х. P ( x ) ] d x , |
(2-16) |
х
где функция g [х, р (х) ] в данном случае имеет вид:
g [х, р (х)] = Pi/x (х) 1Х\р (х)] + р2/2 (х) /2 [р (х)].
Минимизация R является задачей вариационного ис числения. При этом минимум достигается при условии
dg[x,p(x)] _ q
dp (х)
или с учетом конкретного вида функции g [х, р (х)]:
р Л (*) |
+ PJ. (X) |
= о. |
dp (х) |
|
dp (х) |
Иначе можно записать: |
|
|
||
Pifi (х) dli (Ч) |
+ |
Рг/2(х) d li (хк) |
= 0. (2-17) |
|
|
dxk |
хк=р(х) |
dxk хк=Р(х) |
|
Это уравнение определяет оптимальную модель СР двух |
||||
классов образов с континуумом решений. |
|
|||
Рассмотрим частные случаи. |
второго класса |
|||
1. |
Функции |
ошибок |
для образов первого и |
имеют вид, изображенный на рис. 2-9. Этот случай соответствует одинаковому значению функции ошибок на некотором интервале изменения хк. При этом
dli {Хк) dxk
dli {Хк)
= |
= 2 Л/«а6 (**-*«*)1р(*) = |
*ь=р(х) |
сс=1 |
|
2 ^ « 1^ IP (х) %ак\>
а= 1
dxk |
хк=РМ |
2 А/а2б (хк~ хак) L x) = |
|
а = 1 |
|
|
А |
|
|
= 2 - |
Л/а2б [р (х) — хак]. |
|
0=1 |
|
45
Уравнение для оптимальной модели СР будет иметь следующий
вид:
А
Plfl (X) а =1 A/“l6 |
_ Xak1 _ |
А |
|
—P2/ 2 W 2 |
[Р (х) — Xak) = 0. |
а = 1 |
|
Здесь б (л-*) — б — функция с известными свойствами.
2.Функции ошибок для образов первого и второго класса
функции второго порядка /] (х*) = (1 + х*)2/, /2 (*ft) = (1—х*)2/.
' |
11<х к } |
{< |
f n |
{ . |
J______ 1 |
|
0 |
- 1 |
1 |
j |
| -Я/A- |
|
,1 г (Х к) |
j |
|
<- |
- |
|
l - |
1 |
L — |
g - |
|
1 |
|
X k |
|
Хяк .1 |
I |
* |
r |
j |
|
^ |
I |
1 |
||
|
1 |
1 |
|
|
1---- |
! |
|
Х/к |
Хяк |
Хк
Рис. 2-9. Зависимости функции ошибок для СР с континуумом решений.
При этом
^ * l = 2/(l + *ft), |
^ M = 2/(* ft-l). |
dxk |
dxk |
Подставляя данные выражения в (2-17), получаем уравнение для оптимальной модели р (х) СР с континуумом решений в следую щем виде:
Plfl (X)2/[ 1+ р (х)] + p2f2(х) 21 [р (X) - 1] = 0.
Отсюда следует выражение для оптимальной модели СР с кон тинуумом решений в случае квадратичных функций потерь:
р (х) = Рг/g (х) — p j i (х)
Р2 / 2 (х) + Р1 / 1 (х)
Иллюстрация функции xk = р (х), реализуемой СР, представ лена на рис. 2-10.
3.Функции ошибок для образов первого и второго класса ес
функции первого порядка 1г (xk) = 1 ( 1 + xk), l2 (xk) =-■ l ( \ —xk).
46
В данном случае dl1 (x^/dx^ — /; dl2 (x^/dx^ = — l. Отсюда сле дует, что при линейных функциях ошибок возникают определен ные трудности в формировании оптимальной модели СР. Для ис следования данного вопроса рассмотрим функцию ошибки в сле дующем виде:
к (Ч) = / (1 + xk)e+l, к (Ч) = / (1 - * * ) е+1,
из которого при с — 1 следует случай 2, а при с = 0 — линейный случай. Тогда
■f- к {ч) = |
ахь |
[/(1 + ч ) с+'] = — J— I (1 + ч ) с\ |
ахь |
с + 1 |
-?-к (**)=— |
[/( 1 - ^ ) с+,] = |
_1_ l ( \ - x kf. |
||||||
dxk |
dxk |
|
с + |
1 |
|
|
||
Общее выражение для опти |
|
|
|
|
|
|||
мальной модели СР имеет следую |
|
|
|
|
|
|||
щий вид: |
|
|
|
|
|
|
|
|
Pifi (х) (1 + |
xk)c — p j 2(х) (1 — |
|
|
|
|
|
||
|
— Ч ) с = о |
|
|
|
|
|
||
или, иначе, |
|
|
|
|
|
|
|
|
[Р2/ 3 (x)]'/g— [Pl/l (Х)]'/С ^ |
Рис. 2-10. |
Иллюстрация к оп |
||||||
[p2M x)]’/C+[Pl/l(x)]1/C ' |
тимальной модели СР в случае |
|||||||
континуума |
решений |
и квад |
||||||
При с — 1 получаем уже из |
|
ратичных функций |
потерь. |
|||||
|
|
|
|
|
||||
вестное |
выражение |
оптимальной |
|
порядка. |
Исследуем случай |
|||
модели |
для |
функций |
потерь второго |
|||||
с -* 0. |
Тогда х^ ----- — 1 при любом |
значении |
х, |
удовлетворяющем |
||||
неравенству p j x (х))> р 2/ 2 (х), х*= |
1 при любом значении |
х, удов |
||||||
летворяющем неравенству р2/г (х) |
|
(х)- |
|
|
|
|||
Таким образом, |
в случае линейных функций ошибок и конти |
нуума решений пространство решений вырождается в пространство двух решений.
При сравнении критериев первичной оптимизации СР по ве личине апостериорной вероятности (2-14а) и минимума средней функции риска (2-17) видно, что оптимальные модели СР совпадают,
если |
|
|
|
1 |
~ d ( x k) |
dk (Xk) . |
|
dxk |
|||
|
|
||
1 |
-f- d (х^) |
dk [Ч) |
|
|
dxk
Эти выражения позволяют ввести дополнительную физическую интерпретацию функции d (х«)
47
Рассмотрим критерий минимума средней функции риска при ограничениях (2-7) и (2-8). Минимизация средней функ ции риска (2-15) при условии
N
J J- |
■-jG (x, хк) gi (х, xk)dxdxk = |
|
xk |
x |
|
|
N |
|
|
= 1 ' ' ■|gri[xp(x)]dx = 0 , |
(2-18) |
|
x |
|
где
gi (x, xk) = p1f1(x) h {xk)— p2f2(x) l2 (xk),
приводит к уравнению для оптимальной модели СР следую щего вида:
(1 +A,)Pi/1 ( x ) - ^ M |
+ |
dxk |
xk =P(x) |
+ ( 1 - Ц рМ * ) АЬг *1 |
= |
0. |
(2-19) |
||
|
|
ахk |
хк=Р(х) |
|
|
Множитель |
Лагранжа к определяется |
подстановкой |
|||
(2-19) в (2-18). |
|
|
|
|
|
Ограничение в виде заданного значения составляющей |
|||||
средней функции риска имеет вид: |
|
|
|||
|
N |
|
|
|
|
I J • |
' |
• I G (х, xk) [Pi/i (х) |
\хк)\ dx dxk= а. |
(2-20) |
|
Х к |
X |
|
|
|
|
Обозначая |
|
|
|
|
|
§2 (х, хк, к) — g (х, хк) + |
(х) li (хк) — |
|
|||
= |
0 |
+ Pifi (х) h (хк) + |
р2/2 (х) 12 (хк), |
|
получаем выражение для оптимальной модели СР в сле дующем виде:
Ф?2 (х, xk, k)\Xk=PW
др (х)
или, иначе,
dxk |
+ |
хк=р (х) |
|
dlj (хк) |
(2-21) |
+ Р2/2 (х) |
|
dxk |
|
Множитель А, определяется подстановкой (2-15) в (2-20).
48