Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 224

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ПОИСК С САМООБУЧЕНИЕМ

217

Здесь Pi<°) — начальная вероятность пребывания сис­ темы в первом замкнутом множестве;

Р,т = P l <o) + р б ( 0 ) +

pu(0)+pi6(0)

+p2Q)p3l

+ р з т р з б

+

+

Psi0)Psi+

Pai0)Pa,U+

Р9(0)Р9,6

+ Pl2WPl2,U

+

+

Pl4(0)Pl4,ll+Pl5<°>Pl5,16.

 

(2.5.18)

Решая систему уравнений (2.5.15), получаем анало­

гичные

формулы

для предельных

вероятностей

р^

рт,

Рю,

Pl3-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5 ( . 3 » 5 0 0 ) ( 1 - 5 ( 7 ) )

 

 

 

 

 

 

 

 

/ 4

 

S (

2 )

 

2 -

 

 

 

 

 

 

 

 

Н7

с(13)с(10)с(4)

 

 

 

 

 

 

 

 

 

 

5

( 2 )

^2

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.5.19)

I h 0 = — s e T ~

2

*

 

 

 

 

 

 

 

 

Pl3 =

( 1-S (10)) S (7)S (1)

 

 

 

 

 

 

 

 

 

 

^

 

* V ' ,

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5(2)=S (13)S (10)(S (4)+S (10)) + S ( 4 ) 5 ( 7 ) ( S ( 1 3) +

S(7)),

 

 

(2.5.20)

Здесь

/ V 0

) начальная

вероятность

пребывания

сис­

темы во втором замкнутом

множестве;

 

 

 

 

 

/>2<о)= р 4 ( 0 ) + рт(0) +

р ш (0) + р 1 3 ( о ) + р 2 ( 0 ) ; 7 2

7 + р

з ( о ) ; 3 з 4

+

 

 

 

 

 

+

P5(0)P5,10 + P8( 0 ) P8,4 + P9( 0 ) P9,13 +

Pl2(0)Pl2,7

+

 

 

 

 

+

Р14(0)Р14ЛЗ + Р15(0)Р15,20.

 

 

 

 

(2.5.21)

В

формулах

(2.5.12) — (2.5.21)

входящие

вероятности

штрафов

si

(/=1, ... ,16)

определяются по

формуле

(2.1.27) с учетом

формул (2.1.41) и (2.2.11).

q^

 

 

По формуле 2.1.41 определяем вероятности

появле­

ния на выходе АХ^^ при условии, что вектор памяти W

находится

в

состоянии

W<J'>.

Эти

вероятности

для


ГЛАВА II

213

различных состояний приведены в таблице 2.2.1. Опре­ деленные по формуле (2.1.27) вероятности s( j ) штрафов состояний следующие:

S ( l ) =

i . [ l +

d (

S l _ S 4 )

] ;

S ( 6 ) =

! _ d ( S l _ S 4 ) ] ;

s < n ) = у [ 1 - - | d ( s , - s 4 ) ] ;

s 0 « = l [ i - d ( s , - s 4 ) ] ;

 

 

 

 

 

 

 

(2.5.22)

S ( 4 ) =

_ ^ [ 1

+ d

( S

2 _ S 3 ) ] ;

S (7)=

| _ d ( s 2 _ S 3 ) ] ;

S d 0 ) =

1 [ i -

A

d (s 2 - s 3 )] ;

s«3) = ~

[1 _ d ( s 2 - s 3 ) ] .

Из этих формул находим

равенства

 

S (i) + S (1 6 > = l ;

S ( 6 ) + S ( i i ) = i ;

 

 

S ( 4 ) + S ( 1 3 ) =

l ;

S (7)+ S (10)=

l .

 

(2.5.23)

 

 

Следовательно,

 

 

 

 

5<l)=

[s (16) +

(S <6))2]S (1);

S<2)=rs(13)+ (S<7>)2]s<4);

 

c(16)/s (ll))2

 

 

S (16)S (11)S (1)

 

 

 

 

 

 

 

50)

 

 

s (i6)s (6) s ( i)

Л<°>;

P l l =

50)

 

 

 

S (13)(S (10))2

P2 (0);

P4 =

 

 

S (13)S (7)S (4)

 

Pio =

S<2)

P 2 ( 0 ) ;

 

 

Pi6=

(s(6))2sO) Л ( 0 ) ;

(2.5.24)

 

SO)

 

S O 3 ) s ( 1 0 ) s ( 4)

p7 =

P2 (0);

 

5(2)

(s<7>)2sO>

P i 3 =

5<2)

Среднее приращение функции Q(X) при нахождении вектора W в состоянии W<2'' равно


ПОИСК С САМООБУЧЕНИЕМ

219-

 

 

 

 

 

 

 

 

 

dAQW

приг"=1;

 

 

 

 

— dAQ<»

при

i = 6;

 

 

 

 

— dAQW

при

i = l l ;

 

M[AQ/W»]=

]?Яц№(3):

dAQW

при

i=16;

 

dAQw

при

t = 4;

 

 

3=1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

— dAQW

при

г' = 7;

 

 

 

 

2

 

 

 

 

 

 

— c?AQ<2> при

г = 10;

 

 

 

 

О

 

 

 

 

 

 

dAQ<2>

при

t=13,

 

где

 

 

 

 

(2.5.25)

 

 

 

 

 

 

A Q ' 1 » = ( a 1

+ a2 );

AQ< 2 >=(a, - a 2 );

 

 

 

AQ(3) = _ ( a

i + a 2 ) ;

A Q (4 ) =

_ ( a i _ a 2 ) .

 

 

 

Среднее приращение функции Q(X) при учете всех

со­

стояний W<*> вектора памяти W равно

 

 

 

 

16

 

 

 

 

 

M[AQ] = J^iM[AQ/W<*>)=[ ( P l - p I 6 ) + | - ( p 6 - p n ) ]

х

XdAQ«> + [

(p4 -Pis) + - | ( / W i o ) 1 ^ A Q ( 2 \

 

 

 

 

 

 

(2.5.26)

где предельные вероятности p{ определены формулами

(2.5.24).

когда отсутствует помеха ( 0 = 0 ) .

Рассмотрим случай,

В этом случае si=s 2 = 0; s3 = s 4

= l . Следовательно,

s»> = s W ~ ( l - d ) ;

S(13) =

5 ( 1 6 ) = - i ( l + d ) ;


ГЛАВА II

220

S (6) = S ( 7 ) = ^ . ( 1 _ 2 d ) ; s(io)= s u i ) = i _ (

l+\d).

(2.5.27)

Предельные вероятности равны: S(16)(S(11))2 s(16)(<j(ll)\2

 

(s<6))2s(o

Л<°>;

 

(S(16))2S(1)

 

 

 

 

P i 3 = - ~ ^ — ^ 2 ( 0 ) ;

 

 

 

 

 

 

 

(2.5.28)

Pe--

S(16)S(1I)S(1)

 

 

s (i6)s (ii)s <i)

 

 

 

РАО).

p

=

 

p

(0).

 

 

1 '

r /

 

S(D

2

'

 

s (i6)s (6)s (i)

 

 

S (i6)s (6)s (i)

 

 

S<i>

Л<°>;

 

PlO = -

S(i)

 

^2 ( 0 ) .

 

 

 

^

 

где

S(i) = 5<2) = s(i6 's(i1 )(s(1 ) + s(i1)) +s(6 >s(i)(s<1 6 )+s(6 )).

(2.5.29)

Подставляя эти вероятности и выражения (2.5.25) в формулу (2.5.26) и учитывая формулы (2.5.27), находим среднее приращение функции

M[AQ]=-

 

25d2

 

[ а 1 + ( Л ( 0

) - ^ 2 (

0

) ) а 2 ] ,

(2.5.30)

 

 

18 -f- 7fif2

 

 

 

 

 

 

 

где

ai, a2 1 направляющие

косинусы градиентного век­

тора

функции Q(X); /у°> и Р 2 (

0

)

определяются

форму­

лами (2.5.19) и (2.5.21). Из этой формулы имеем

 

lim M[AQ] = a i + ( Л ( 0 ) -

Л>( 0 ) ) « 2

 

 

 

(2.5.31) .

lim M[AQ] = 0.

 

 

 

 

 

 

 

(2.5.32)

Аналогичным

образом

можно

исследовать

случай,

когда m>16

(6<2d/3).

 

 

 

 

 

 


ПОИСК С САМООБУЧЕНИЕМ

221

§ 2.6. С Т А Т И С Т И Ч Е С К И Е С В О Й С Т В А К О Л Л Е К Т И В А О П Т И М И З И Р У Ю Щ И Х А В Т О М А Т О В И И Х С Р А В Н Е Н И Е

С О С В О Й С Т В А М И П О К О О Р Д И Н А Т Н О Г О

СА М О О Б У Ч Е Н И Я

Внастоящем параграфе исследованы ста­

тистические свойства оптимизирующих автоматов с де­ терминированными выходами и проведено их сравнение со свойствами алгоритма покоординатного самообучения

[14, 15]. Структурная схема системы оптимизации

изобра­

жена на рис. 2.6.1. Здесь Аи...,Ап

— независимые ве­

роятностные

автоматы, перерабатывающие

значения

функции Q(X)

в значения переменных хи...,хп-

Каж­

дая из переменных Xj (/ = 1 , . . . , п)

управляется своим ав­

томатом Aj. Входной переменной всех управляющих ав­ томатов является знак приращения функции signAQ(X). Внутреннее состояние автомата Aj определяет изменение

переменной согласно соотношениям

 

 

 

x J (^+D = X j (iv) +

AX j (iv+i)j

 

 

(2.6.1)

где AXJW+1>

— выход /-го

автомата,

равный

+ 1 или

1

в зависимости

от того,

находится

ли /-й

автомат

на.

4

Рис. 2.6.1. Схема системы оптимизации коллективом независимых автоматов.