Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 218

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ГЛАВА II

184

 

 

 

 

 

4к%2Ы

2

2Лк,1

2к<2

 

 

 

 

 

О

fO

ч

 

 

 

 

5

 

 

 

 

 

5

 

4к*ЗМ

2

2кЪ \2k*t

Зк+2

к*1

 

 

 

<Ь—

о

о—

"1

 

 

 

о

о

 

 

О

 

 

 

 

№<1)г

г+2к

г+Зк+1

4к*2

2к<1

 

Рис. 2.2,4. Плоскость обучения 16

Пусть вектор градиента функции качества оптимизи­ руемой системы удовлетворяет условию

(2.2.38)

где oci — направляющий косинус вектора градиента.

В этом случае

имеем автомат с (2&+1)2

состояниями

и 4 выходами

AX<J>. Функционирование

такого ав­

томата (переходы вектора W из одного состояния в другое) описывается цепью Маркова с блочной матри­ цей (2.1.67) из предыдущего параграфа. Блоки Pu,v этой матрицы равны матрицам (2.1.73) и (2.1.74), элементы которых определяются формулой (2.1.59). Так как на функцию Q(X) не накладывается помеха (о = 0), то имеют место равенства (2.2.12) и из формул (2.1.59) и (2.1.68) получаем, что в матрице А блоки Pu,u+i и P2k+i,2k+\ равны нулю, т. е.


ПОИСК С САМООБУЧЕНИЕМ

185-

Ри,и+\ = 0

(2.2.39)

(u=\,2,...,2k);

P2k+\,2k+l = 0.

Следовательно, матрица А принимает вид

Рп

0

0 •• •

0

0

0

Рц

0

0 •••

0

0

0

0

Р32

0 •••

0

0

0

A (Wj/WO =

 

 

 

 

 

 

0

0

0 •

• Pzhfih-l

0

0

0

0

0 •

0

Р2h+\,2h

0

(2.2.40)

В этой матрице нулями обозначены блоки, элементы

которых равны нулю, Pu,v являются квадратными мат­

рицами

Якоби [49] частными

случаями

матриц (2.1.73)

и (2.1.74). Так, например, для i = j = l

имеем

матрицу

Рп

Р12

0

0

0 •

0

0

 

0

0

Р21

0

Р23

0

0 •

0

0

 

0

0

0

Р32

0

Р34 0 •

0

0

 

0

0

0

0

0

0

0 • "P2h-\,2k- -2

0

P2h-\,2k

0

0

0

0

0

0

0

P2k,2k-i

 

о

p2h,

0

0

0

0

0 •

0

0

p2h+l,2k P2h+l

 

 

 

 

 

 

 

 

 

(2.2.41)

Элементы рц последней матрицы с учетом формулы (2.1.59) определяются из таблицы 2.2.2 условных вероят­ ностей выбора направлений движения оптимизируемой системы в плоскости параметров. Элементы таблицы вычислены по формулам (2.2.7). При помощи таблицы можно показать, что элементы матрицы (2.2.41) удов­ летворяют соотношениям


ГЛАВА II

186

 

дхш

 

ДХ(1)

 

 

 

W,

1

(1+66) (1+66)

 

i

4

 

W2

|

1

(1+ £ 6)(1 + ( й - 1 ) 6 )

 

|

4

 

w*

 

4-(1+*б)(1+в)

4

1 ( I + W )

1 ( 1 + А 6 ) ( 1 - 6 )

w2 *

1 ( l - A 6 ) ( l - ( f t - l ) 6 )

w 2 A + 1

-1 (1+&6) (1 - Аб)

ДХ(2)

i

А- (1+66) ( 1 - й б ) 4

j i - ( 1 + £ 6 ) ( 1 - ( & - 1 ) 6 ) 1 4

i - ( l + f t 6 ) ( l - 6 ) 4

-4L(i-t-fte)

4-(1+*в)(1+«)

4

1 ( 1 + £ 6 ) ( 1 + (/г-1)6)

J4- (l+k6)(l+kd)

Pll =P2fc+l ,2fc+b

P\2 = P2h+\,2h', P23 = p2fc,2fc-b

P34

=

 

 

 

= P2ft-l,2ft-2J

Pft,ft+1 =Pft+2,fe+b

Pft+I,ft+2 =

Pft+l,ftJ

 

Pft+2,ft+3 = P M - f >

P2ft-l,2fe = P32; p2k,2k+\ =

P21-

 

 

 

 

 

 

 

 

(2.2.42)

Построенные по матрицам (2.2.40) и (2.2.41)

переходы

вектора W

из

одного

состояния

в другое

показаны

на

рис.

2.2.5.

Из

рисунка

видно,

что вектор

памяти

W

за

(2& + 1) шагов, независимо от того, в каком

состоянии

он находился в начале поиска, достигает правого ребра сетки. Потом происходит блуждание по состояниям


ПОИСК С САМООБУЧЕНИЕМ

187

 

 

 

 

 

 

 

Т а б л и ц а 2.2.2

 

АХ(3)

;

1

 

ДХ(4)

 

 

 

 

 

 

 

1 ( 1 - й 6 ) ( 1 + й 6 )

1

4

1 ( 1 - £ 6 ) ( 1 - 6 6 )

4

 

 

 

 

 

1 ( 1 - А в ) ( 1 + (А - 1)в)

 

 

_ 1 . ( 1 _ Л б ) ( 1 - ( А - 1 ) в )

 

 

 

1

 

 

 

 

}4 ( 1 - А в ) ( 1 + 6 )

 

 

1 ( 1 - И ) (1-6)

1

(1-66)

 

 

1(1 - 66 )

 

 

4

 

 

 

4

 

 

 

1 ( 1 - И ) ( 1 - в )

I

 

l(i-*e)(i+e)

 

 

4

 

,

4

 

 

 

 

J4- ( l - W ) ( l - ( * - l ) 6 )

 

 

1 ( 1 - А в ) ( 1 + ( * - 1 ) в )

--- (1 — Jfe6) (I — A6)

 

 

1 ( 1 - А 6 ) ( 1 + * 6 )

4

 

 

 

4

 

 

 

этого

ребра. Поэтому

основной

интерес

 

представляет

анализ

переходных вероятностей

за такое

число шагов

N, которое превосходит

2k+l

 

(N^2k+l).

Для таких N

из матрицы (2.2.40) получаем следующую блочную мат­

рицу переходных вероятностей

за N шагов для вектора

памяти W:

 

 

 

 

 

 

P U ( J V )

0

.. .

0

 

Рп

РЦ"-1

0

.. .

0

A"{WjfW{)=

\\ Раг

P2l PUN~2

0

.. .

0 | | (2.2.43)

2fe+l,2fe P2i Ри 0 .. . 0


ГЛАВА II

где нулями обозначены блоки, элементы которых равны

нулю; Pi+i,i...

P2\P\\N~i

(i = 0,..., 2k)

— произведение

матриц; Рц^ - »

(N — i)-n степень

матрицы Ри; эту

степень можно определить, используя формулу Перрона.

Из матрицы (2.2.43) видно, что состояния

от 2k + 2 до

(2/г-Ы)2 являются несущественными. Поэтому

p2k+2=

••• =P(2fe+i)J =0.

 

(2.2.44)

Теперь

находим предельные

вероятности

pi. Из мат­

рицы (2.2.40), учитывая (2.2.44), получаем

 

Р = Р'пР,

 

(2.2.45)

где Р'и

— транспонированная

матрица (2.2.41);

Р

вектор предельных

вероятностей.

 

Решая систему (2.2.45), получаем:

Р2к+\=Р\;

ПОИСК С САМООБУЧЕНИЕМ

189

P2h = P2=

Pl2 Рй

 

 

Рг\

 

 

Р2Ъ

Р\2

Р 2 Й - 1 = Р З = Р32

Р21 Р\\

 

 

(2.2.46)

 

h

 

Pk+2=Pk=

. .

Р3—1,3

11

Pi;

 

3п= 2

Р 3,3-1

 

3 = 2

 

k + l

 

P h + 1 = 11л

. " t ^ P

l >

j - 2 Рз-Э-1

где

h

ш

k +1

)

(•-••£ IГ,

II:

m = 2

j = 2 ^J'J—1

j = 2

rj,]—l

Эти предельные вероятности определяют дискретное распределение блуждания системы в процессе поиска вдоль правого ребра квадрата на рис. 2.2.5. В качестве

Рис: 2.2.6. Предельное распределение вектора W по существенным состояниям для k—l; 2; 4; 8; 16.