Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 223

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ПОИСК С САМООБУЧЕНИЕМ

211

12М(Ш)

1

0,75-

0,50 -

0,25 -

6

О

0,5

1

1,5

2

2,5

3

3,5

4

 

Рис. 2.4.3.. Сравнительная характеристика изменения среднего приращения функции качества за один шаг поиска в зависимости от помехи а при обучении для случаев b = d и 6=s2rf (d=l).

На рис. 2.4.3 сравнивается изменение

У2.М[Д(2],_вычис-

ленное

по формуле (2.4.30),

с изменением y2M[AQ],

вычисленным для ai = l ; аг = 0

при d=l,

в случае, когда

6^2d.

Видно, что для случая

8 = d среднее приращение

функции качества на один шаг поиска примерно на 1/3 больше, чем для случая 8^2d. Это показывает, что в об­ становке помех для оптимизации системы целесообразно применять самообучение с меньшей интенсивностью. Этот вывод согласуется с экспериментально полученным результатом, приведенным в работе [6]: уменьшение ско­ рости обучения улучшает свойства поиска.

§2.5. С В О Й С Т В А П О К О О Р Д И Н А Т Н О Г О

СА М О О Б У Ч Е Н И Я

СД Е Т Е Р М И Н И Р О В А Н Н О Й

П Е Р Е Х О Д Н О Й Ф У Н К Ц И Е Й , Н Е З А В И С Я Щ Е Й О Т В Ы Х О Д А А В Т О М А Т А

Такое самообучение задается формулой (2.1.76) параграфа 2.1 и представляет собой автомат с детерминированными переходами и случайными выхо­ дами.

14*

ГЛАВА II

212

1. Случай m = 2 n = 4 (b^2d). Матрицы переходов для этого случая задаются формулами (2.1.84). Полное функционирование автомата в случайной среде описыва­ ется цепью Маркова с матрицей переходных вероятнос­ тей (2.1.25). Элементы матрицы штрафов (2.1.26) опре­ деляются по формуле (2.1.27). По матрице (2.1.25) на­ ходим

 

 

l-s*1 )

0

0

sw

 

 

 

А =

О

1 -S<2 >

S<2>

О

 

 

(2.5.1)

О .

s<3>

l-s<3>

О

 

 

 

 

 

 

 

 

 

s<4>

0

0

l-s<4 >

 

 

 

 

 

 

Множество

состояний

и

переходы

 

 

 

из

одного

состояния

в другое для

 

 

 

этой цепи показаны на рис. 2.5.1.

 

 

 

Видно, что состояния 1 и 4 образуют

 

 

 

одно замкнутое множество, а состо­

 

 

 

яния 2 и 3 — второе замкнутое мно­

 

 

 

жество. Исходя из матрицы

(2.5.1)

 

 

 

имеем систему уравнений для опре­

 

 

 

деления предельных

вероятностей

Рис.

2.5.1. Перехо­

 

S ( 1 ) P i = p 4 S < 4 > ;

 

 

(2.5.2)

ды

вектора W для

 

SWp2 = sWp3.

 

 

случая

т — А; п — 2.

 

 

 

 

 

 

 

Поскольку

состояния

цепи

Мар­

кова

распадаются на два замкнутых класса,

то

можно

рассматривать две цепи Маркова, отдельно для каждого замкнутого множества состояний. Из системы уравнений

(2.5.2),

 

используя

начальные

вероятности

состояний

Pi ( 0 ) , Р 2 (

0

) , Рз( 0 ) , Р 4 ( 0 )

и учитывая

условия нормировки

Pi + p 4

= l ;

р 2

+ Р з = 1 ,

 

 

(2.5.3)

находим

 

предельные

вероятности

 

р,

= S (4)

( р , (0) + р4(0)) ;

p2 =

s(3) 2(0)+ рз (0)) .

(2.5.4)

p3

= s ( 3 ) ( p 2

( 0 ) + p 3 ( 0 ) ) ;

 

=

sw{piW+Pi(0)).

P i

 

Теперь

 

по

формуле

(2.1.27)

определим

вероятности

штрафов

s( i )

(i— 1 , . . . , 4). Вероятности

цц (/, t' =


ПОИСК С САМООБУЧЕНИЕМ

213

= 1,...,4), содержащиеся в этой формуле, даны в таб­ лице 2.2.1. Вероятности штрафов Sj действий АХ<^ опре­ деляются по формуле (2.2.11):

(2.5.5)

Следовательно,

для вероятностей

штрафов

s^' (t' =

= 1,2,3,4) имеем:

 

 

 

 

sW=±[l+d(Sl-s2)];

 

 

s ( 2 ) = l [

l + d ( S 2 -

S 3

) ] ;

 

 

 

 

 

 

(2.5.6)

s t 3 ) = - i [ l - d ( s 2 - s 3 ) ] ;

s » ) = ^ - [ l - d ( s 1 - s 4 ) ] .

Отсюда видно, что

 

 

 

 

S (i) + S(4) = i ;

S (2)+ S (3) = i .

 

 

(2.5.7)

Среднее приращение функции качества Q(X) определя­

ется по формуле

 

 

 

 

 

т

 

 

 

 

 

 

M[AQ]= ^

pfM[AQ/W<*>].

 

 

(2.5.8)

Если функция

Q(X) линейная, то в формуле

(2.5.8)

 

 

4

 

 

 

 

Af[AQ/W<*>]= ^

qijAQU)

= d&QW,

 

 

 

 

3=1

 

 

 

 

где AQW — приращение функции Q(X) (на одном шаге) по направлению АХ( г ) . Следовательно, среднее прираще­ ние функции качества

M[AQ] = d[(sW-s^) (р,(°) + /74(0)) (а! + сс2) + (s<3>-s<2)) х

X (Р2<°) + Рз( 0 ) ) ( с с 1 - а 2 ) ] = б ? 2 [ Ф ( ^ 2 ? ) ^ ' ( ° ) +



ГЛАВА II

214

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ р4<°>) (а, + а 2 ) + Ф ( ^

~

)

(Р2( 0 ) +Рз ( 0 >) X

 

 

 

X ( с ц - а 2 )

] •

 

 

 

 

 

 

 

 

(2.5.9)

 

Рассмотрим случай, когда а-*-0,

т. е. когда

отсутствует

 

помеха. Тогда

Si->0,

s2 -»-0, s 3 - > l ,

s 4

- ^ l .

Следовательно,

S ( l ) _ ^ l ( l _ d ) ;

S ( 2 ) ^ i . ( 1 _ d ) ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.5.10)

 

Из формулы

(2.5.9)

имеем

 

 

 

 

 

 

 

 

 

 

УИ[А Q] = d2[ai + (Pi( 0 )

+ p 4

( 0 ) - p 2 ( 0 )

- Рз( 0 ) ) a2 ].

 

 

(2.5.11)

 

2. Случай

m = 4 2 = 16

(6 = 2c?/3). В этом

случае

по

 

матрице (2.1.25)

находим

матрицу (2.5.12).

 

 

 

 

 

 

 

 

 

 

1_S<1)

0 0

 

0

0

 

0

 

0

0

 

 

 

 

1_S (2)

0

0

 

0

0

0

S(2)

0

0

 

 

 

 

 

0

0

0

1-S(3)

0

s<3>

0

 

0 0

 

 

 

 

 

0

0 0

1 _ S (4)

0

0

s<4>

0 0

 

 

 

 

1-s<5> 0 0

 

0

0

0

0 0 0

 

 

 

 

1_s (6)

0

0

 

0

0

0

0

 

0 0

 

 

 

 

 

0

0 0 l - s < 7 >

0

0

0

0 0

 

 

А =

 

0

0 0

1_S(8)

0

0

0

 

0 0

 

 

 

0

0 0

 

0

0 S<9> 0 0 0

 

 

 

 

 

 

 

 

 

 

 

0

0

0

 

0

0

0

S(10)

0

0

 

 

 

 

 

0

0 0

 

0

0

s<u>

0

 

0 0

 

 

 

 

 

0

0 0

 

0

0 0 s<12>

0 0

 

 

 

 

 

0

0

0

0

0

0

0

 

0

0

 

 

 

 

 

0

0

0

 

0

0

0

0

 

0

0

 

 

 

 

 

0

0

0

0

0

0

0

 

0

0

 

 

 

 

 

0

0

0

0

0

0

0

 

0

0

ПОИСК С САМООБУЧЕНИЕМ

215

 

 

 

 

 

в

 

9

 

 

1гР

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

\

б

/

/

I

 

 

 

 

ПС

 

 

 

 

 

 

hz

 

 

 

 

 

 

 

 

 

 

/

к

 

 

 

 

 

 

 

 

 

 

\

 

 

 

 

 

 

 

 

 

 

 

 

9 *

 

 

 

 

'6

 

12

8

 

 

 

 

 

 

 

Рис.

2.5.2. Переходы

вектора W для

 

 

 

 

случая т= 16; п = 2.

 

 

 

 

 

Переходы

этой

цепи

Маркова

показаны на рис. 2.5.2.

Из рисунка

видно,

что состояния

цепи Маркова обра­

зуют два замкнутых

множества. В первое множество

0

0

0

 

0

0

0

0

 

 

 

 

0

0

0

 

0

0

0

0

 

 

 

 

0

0

0

 

0

0

0

0

 

 

 

 

0

0

0

 

0

0

0

0

 

 

 

 

sC5)

0

0

 

0

0

0

0

 

 

 

 

0

S<6>

0

 

0

0 0

0

 

 

 

 

5(7)

0

0

 

0

0

0

0

 

 

 

 

0

s<8>

0

 

0

0 0

0

 

 

 

(2.5.12)

0

0

0

l-s<9 >

0

0

0

 

 

 

0

0 0

l-s<1 0 > 0 0

0

 

 

 

 

0

0 0

 

0

0 0 1- s < n >

 

 

 

 

0

0

0

 

0

0 0

1-S02)

 

 

 

 

S(I3)

0

0

1_S<13) 0 0

0

 

 

 

 

0

S (14)

0

1_S04> 0 0

0

 

 

 

 

S(15)

0

•0

 

0

0

0

1-5(15)

 

 

 

 

0

S(15)

0

 

0

0

0

1_S(16)

 

 

 

 


ГЛАВА II

216

входят состояния 1, 6, 11, 16, во второе — состояния 4, 7, 10, 13. Другие состояния являются невозвратными. Предельные вероятности невозвратных состояний равны нулю, т. е.

P2 = P3 = P5 = P& = P9 = Pl2=Pl4 = P\S = 0.

(2.5.13)

Из матрицы (2.5.12) получаем уравнения для нахожде­ ния предельных вероятностей состояний 1, 6, 11, 16, при­ надлежащих первому замкнутому множеству:

S(')p1 = =(l-S (6))p6 ;

 

s<6>p6 = 5<'»p u ;

(2.5.14)

( l - s < n > ) p „ = s<16>pi6,

 

и для состояний 4, 7, 10, 13, принадлежащих второму замкнутому множеству:

S<4)p4 =(l-S <7))p7 ;

 

 

 

sWP7

=s m P l o ;

 

 

 

(2.5.15)

( l - S U O ) ) p ) 0 =

s(13)p]3.

 

 

Решая

систему уравнений

(2.5.14), с учетом условий нор­

мировки и начальных вероятностей получаем:

 

 

S (18)s(n)( 1 _s(6))

 

 

Pi=

^

 

* V ' .

 

 

5<16)S(11)S(1)

 

 

 

Рб

S ( 1 )

г i

,

 

 

 

 

 

 

 

(2.5.16)

P n =

S<n

Л < ° ) ;

 

 

 

(1-S(">)5<6>SP>

 

 

P16

S ( 1

)

^1

,

 

где

 

 

 

 

 

S<n = s (i6) s (U)( s (i) + s (n))

+ S (i )S (6)(S (6)+ S(i6))_

(2.5.17)