ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.06.2024
Просмотров: 218
Скачиваний: 1
ГЛАВА II
184 |
|
|
|
|
|
4к%2Ы |
4к2 |
2к2Лк,1 |
2к<2 |
|
|
|
|
|
О |
fO |
ч |
|
|
|
|
5 |
|
|
|
|
|
5 |
|
4к*ЗМ |
4к2*к |
2кЪ \2k*t |
Зк+2 |
к*1 |
|
|
|
<Ь— |
о |
о— |
"1 |
|
|
|
о |
о |
|
|
О |
|
|
|
|
№<1)г |
4кг+2к |
2кг+Зк+1 |
4к*2 |
2к<1 |
|
Рис. 2.2,4. Плоскость обучения 16
Пусть вектор градиента функции качества оптимизи руемой системы удовлетворяет условию
(2.2.38)
где oci — направляющий косинус вектора градиента.
В этом случае |
имеем автомат с (2&+1)2 |
состояниями |
и 4 выходами |
AX<J>. Функционирование |
такого ав |
томата (переходы вектора W из одного состояния в другое) описывается цепью Маркова с блочной матри цей (2.1.67) из предыдущего параграфа. Блоки Pu,v этой матрицы равны матрицам (2.1.73) и (2.1.74), элементы которых определяются формулой (2.1.59). Так как на функцию Q(X) не накладывается помеха (о = 0), то имеют место равенства (2.2.12) и из формул (2.1.59) и (2.1.68) получаем, что в матрице А блоки Pu,u+i и P2k+i,2k+\ равны нулю, т. е.
ПОИСК С САМООБУЧЕНИЕМ
185-
Ри,и+\ = 0
(2.2.39)
(u=\,2,...,2k);
P2k+\,2k+l = 0.
Следовательно, матрица А принимает вид
Рп |
0 |
0 •• • |
0 |
0 |
0 |
|
Рц |
0 |
0 ••• |
0 |
0 |
0 |
|
0 |
Р32 |
0 ••• |
0 |
0 |
0 |
|
A (Wj/WO = |
|
|
|
|
|
|
0 |
0 |
0 • |
• Pzhfih-l |
0 |
0 |
|
0 |
0 |
0 • |
• |
0 |
Р2h+\,2h |
0 |
(2.2.40)
В этой матрице нулями обозначены блоки, элементы
которых равны нулю, Pu,v являются квадратными мат |
|||||||||
рицами |
Якоби [49] — частными |
случаями |
матриц (2.1.73) |
||||||
и (2.1.74). Так, например, для i = j = l |
имеем |
матрицу |
|||||||
Рп |
Р12 |
0 |
0 |
0 • |
0 |
0 |
|
0 |
0 |
Р21 |
0 |
Р23 |
0 |
0 • |
0 |
0 |
|
0 |
0 |
0 |
Р32 |
0 |
Р34 0 • |
0 |
0 |
|
0 |
0 |
|
0 |
0 |
0 |
0 |
0 • "P2h-\,2k- -2 |
0 |
P2h-\,2k |
0 |
||
0 |
0 |
0 |
0 |
0 |
0 |
P2k,2k-i |
|
о |
p2h, |
0 |
0 |
0 |
0 |
0 • |
0 |
0 |
p2h+l,2k P2h+l |
||
|
|
|
|
|
|
|
|
|
(2.2.41) |
Элементы рц последней матрицы с учетом формулы (2.1.59) определяются из таблицы 2.2.2 условных вероят ностей выбора направлений движения оптимизируемой системы в плоскости параметров. Элементы таблицы вычислены по формулам (2.2.7). При помощи таблицы можно показать, что элементы матрицы (2.2.41) удов летворяют соотношениям
ГЛАВА II
186
|
дхш |
|
ДХ(1) |
|
|
|
|
W, |
1 — |
(1+66) (1+66) |
|
|
i |
4 |
|
W2 |
| |
1 |
(1+ £ 6)(1 + ( й - 1 ) 6 ) |
|
| |
4 |
|
w* |
|
4-(1+*б)(1+в) |
4
1 ( I + W )
1 ( 1 + А 6 ) ( 1 - 6 )
w2 * |
1 ( l - A 6 ) ( l - ( f t - l ) 6 ) |
w 2 A + 1 |
-1 (1+&6) (1 - Аб) |
ДХ(2)
i
А- (1+66) ( 1 - й б ) 4
j i - ( 1 + £ 6 ) ( 1 - ( & - 1 ) 6 ) 1 4
i - ( l + f t 6 ) ( l - 6 ) 4
-4L(i-t-fte)
4-(1+*в)(1+«)
4
1 ( 1 + £ 6 ) ( 1 + (/г-1)6)
J4- (l+k6)(l+kd)
Pll =P2fc+l ,2fc+b |
P\2 = P2h+\,2h', P23 = p2fc,2fc-b |
P34 |
= |
|
|
|||||
|
= P2ft-l,2ft-2J |
Pft,ft+1 =Pft+2,fe+b |
Pft+I,ft+2 = |
Pft+l,ftJ |
||||||
|
Pft+2,ft+3 = P M - f > |
P2ft-l,2fe = P32; p2k,2k+\ = |
P21- |
|||||||
|
|
|
|
|
|
|
|
(2.2.42) |
||
Построенные по матрицам (2.2.40) и (2.2.41) |
переходы |
|||||||||
вектора W |
из |
одного |
состояния |
в другое |
показаны |
на |
||||
рис. |
2.2.5. |
Из |
рисунка |
видно, |
что вектор |
памяти |
W |
|||
за |
(2& + 1) шагов, независимо от того, в каком |
состоянии |
он находился в начале поиска, достигает правого ребра сетки. Потом происходит блуждание по состояниям
ПОИСК С САМООБУЧЕНИЕМ
187
|
|
|
|
|
|
|
Т а б л и ц а 2.2.2 |
|
АХ(3) |
; |
1 |
|
ДХ(4) |
|
|
|
|
|
|
|
|||
1 ( 1 - й 6 ) ( 1 + й 6 ) |
1 |
4 |
1 ( 1 - £ 6 ) ( 1 - 6 6 ) |
||||
4 |
|
|
|
|
|
||
1 ( 1 - А в ) ( 1 + (А - 1)в) |
|
|
_ 1 . ( 1 _ Л б ) ( 1 - ( А - 1 ) в ) |
||||
|
|
|
1 |
|
|
|
|
}4 ( 1 - А в ) ( 1 + 6 ) |
|
|
1 ( 1 - И ) (1-6) |
||||
1 |
(1-66) |
|
|
1(1 - 66 ) |
|
|
|
4 |
|
|
|
4 |
|
|
|
1 ( 1 - И ) ( 1 - в ) |
I |
|
l(i-*e)(i+e) |
|
|
||
4 |
|
, |
4 |
|
|
|
|
J4- ( l - W ) ( l - ( * - l ) 6 ) |
|
|
1 ( 1 - А в ) ( 1 + ( * - 1 ) в ) |
||||
--- (1 — Jfe6) (I — A6) |
|
|
1 ( 1 - А 6 ) ( 1 + * 6 ) |
||||
4 |
|
|
|
4 |
|
|
|
этого |
ребра. Поэтому |
основной |
интерес |
|
представляет |
||
анализ |
переходных вероятностей |
за такое |
число шагов |
||||
N, которое превосходит |
2k+l |
|
(N^2k+l). |
Для таких N |
из матрицы (2.2.40) получаем следующую блочную мат
рицу переходных вероятностей |
за N шагов для вектора |
||||
памяти W: |
|
|
|
|
|
|
P U ( J V ) |
0 |
.. . |
0 |
|
|
Рп |
РЦ"-1 |
0 |
.. . |
0 |
A"{WjfW{)= |
\\ Раг |
P2l PUN~2 |
0 |
.. . |
0 | | (2.2.43) |
2fe+l,2fe P2i Ри 0 .. . 0
ГЛАВА II
где нулями обозначены блоки, элементы которых равны
нулю; Pi+i,i... |
P2\P\\N~i |
(i = 0,..., 2k) |
— произведение |
матриц; Рц^ - » |
— (N — i)-n степень |
матрицы Ри; эту |
степень можно определить, используя формулу Перрона.
Из матрицы (2.2.43) видно, что состояния |
от 2k + 2 до |
||
(2/г-Ы)2 являются несущественными. Поэтому |
|||
p2k+2= |
••• =P(2fe+i)J =0. |
|
(2.2.44) |
Теперь |
находим предельные |
вероятности |
pi. Из мат |
рицы (2.2.40), учитывая (2.2.44), получаем |
|
||
Р = Р'пР, |
|
(2.2.45) |
|
где Р'и |
— транспонированная |
матрица (2.2.41); |
|
Р |
— вектор предельных |
вероятностей. |
|
Решая систему (2.2.45), получаем:
Р2к+\=Р\;
ПОИСК С САМООБУЧЕНИЕМ
189
P2h = P2= |
Pl2 Рй |
|
|
Рг\ |
|
|
Р2Ъ |
Р\2 |
Р 2 Й - 1 = Р З = Р32 |
Р21 Р\\ |
|
|
|
(2.2.46) |
|
h |
|
Pk+2=Pk= |
. . |
Р3—1,3 |
11 |
Pi; |
|
|
3п= 2 |
Р 3,3-1 |
|
3 = 2 |
|
k + l |
|
|
P h + 1 = 11л |
. " t ^ P |
l > |
j - 2 Рз-Э-1
где
h |
ш |
k +1 |
) |
(•-••£ IГ, |
II: |
||
m = 2 |
j = 2 ^J'J—1 |
j = 2 |
rj,]—l |
Эти предельные вероятности определяют дискретное распределение блуждания системы в процессе поиска вдоль правого ребра квадрата на рис. 2.2.5. В качестве
Рис: 2.2.6. Предельное распределение вектора W по существенным состояниям для k—l; 2; 4; 8; 16.