Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 200

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

ГЛАВА I

 

 

 

 

 

Рассмотрим с л у ч а й б е з

в о з д е й с т в и я п о м е х и ,

т. е. когда

а = 0 . Тогда

по формулам

(1.5.4) имеем:

 

Г

1 при

i— 1 , . . . , п;

 

(1.6.30)

'

I

0

при

i = n+1,...,

 

2п.

 

 

По формулам (1.6.4)

находим:

 

_

Г

1

при

i = l

,

. . . . я;

 

г _

I

0

при

г' = п + 1 , . . . ,

2п;

(1.6.31)

 

 

 

 

 

 

 

 

 

 

Г 0

при

i = 1 , . . . , /г;

 

 

й ' ~

I

1 при

t' = n +

1 , . . . ,

2п.

 

Матрица

(1.6.6) при условии

(1.3.14)

имеет вид

 

 

 

00

1000

 

00

 

 

 

 

 

00

0100

 

00

 

 

A(S)

=

 

00

• 0000 -

10

 

(1.6.32)

 

00

• 0010 -

00

 

 

 

 

 

 

00 • 0000 ••• 01

10 • 0000 ••• 00

Из

матрицы

видно, что состояния от

2

до я этой

цепи

Маркова

являются невозвратными,

а

состояние 1

исостояния от п+1 до 2п — циклическими с пе­

риодом п + 1.

Следовательно,

предельные вероятности

равны

 

 

 

 

 

Pl~Pn+l=

•••

 

1

 

 

=Р2п:

'

 

 

 

 

П + 1

(1.6.33)

Р2 = РЗ=

••• =Рп = 0.

 

 

 

Среднее приращение функции

качества

M[AQ]=-

 

1

V «г

 

(1.6.34)

 

п+ 1

г=2

 

 


ПОИСК БЕЗ САМООБУЧЕНИЯ

 

87

 

Д ля двумерного

случая (п = 2) по

формулам (1.6.33)

и (1.6.34) имеем

 

 

Pi=P3 = P 4 = - j ;

р2 = 0\

(1.6.35)

M [ A Q ] = - 4 - « 2 .

 

(1.6.36)

О

 

 

§ 1.7. А Л Г О Р И Т М П О С Л Е Д О В А Т Е Л Ь Н О Г О Г Р А Д И Е Н Т А

В данном параграфе рассмотрим одну моди­ фикацию метода градиента. Эта модификация характе­ ризуется тем, что после пробного шага gi>0 рабочий шаг, имеющий величину

AXi = — at sign AQig

(1-7.1)

(гд-е AQig — приращение функции качества в результате пробного шага gi), делается в t'-м направлении. Такая процедура производится по всем координатам. Строгоговоря, этот метод нельзя назвать градиентным. Это,, скорее, полярный метод. Представим алгоритм как веро­ ятностный автомат.

1. Одномерный случай

( п = 1 ) . Состояния

автомата

пронумеруем в следующем

порядке:

 

AXW = g ; Д Х < 2 ) = - а ; АХ& = + а.

(1.7.2)

Здесь g — пробный шаг, а ±а — рабочие шаги поиска. Пусть вход автомата, как обычно, определяется величи­ ной штрафа

f 1, если

A Q ' ^ O ;

ч ч

c = s g n A Q ' = 1

л л / ^ - п

(1-7-3)

10, если

AQ < 0 .

 

Выход автомата совпадает с его состоянием и образует трехбуквенный алфавит (1.7.2).

Далее предположим, что a=g=\. Графы переходов автомата показаны на рис. 1.7.1, а его матрицы перехо­ дов имеют вид


ГЛАВА I

88

 

 

AG<0

Рис. 1.7.1. Графы переходов автомата для

случая

« = 1.

при нештрафе

(AQ'<0)

00 1

 

100

(1.7.4)

100

 

лри штрафе ( A Q ' ^ 0 )

0

1 0

 

1

0 О

(1.7.5)

1 О О

 

Случайная среда задается через вероятности штрафов действия автомата, которые в предположении о линей­ ности функции качества (grad Q(X) = const) и нормиро­

ванное™ его градиента

= 1 I равны

 

89 ПОИСК БЕЗ САМООБУЧЕНИЯ

(1.7.6)

Функционирование автомата поиска в случайной среде (1.7.6) описывается цепью Маркова с циклической мат­ рицей переходных вероятностей

 

! 0

Si

1 — S i

 

 

 

 

 

 

A(S)

= I

1

О

О

 

 

 

 

 

(1.7.7>

 

 

1 0

о

 

 

 

 

 

 

Предельные

вероятности

для

этой

цепи Маркова

равны

 

1

 

 

1

 

1

п

^

 

(1.7.8Х

Pi=~2'

Pa=YSl>

Р з = у

О -

^

-

 

Средний штраф рабочих

шагов

 

 

 

Pcv.v=slS2=±[l-<&(-±)],

 

 

 

 

(1.7.9),

а среднее смещение по направлению градиента

 

M [ A Q ] = p 3 - p 2 = - j С1 ~ 2 s i ) = - 4 Ф

( 27 ) *

( 1 - 7 Л 0 ) '

При а->-0 имеем

 

 

 

 

 

 

 

Рср.р-^О;

 

M[AQ]-»

 

2 '

 

 

 

(1J.11)>

 

 

 

 

 

 

 

 

 

 

а при

а->-оо

 

 

 

 

 

 

 

 

 

Р с р . р ^ - ^ ;

M[AQ]->0.

(1.7.12).,

 

2. Двумерный

случай

(п = 2). Состояния автомата про­

нумеруем в следующем

порядке:

 


ГЛАВА I

99

AQzO

UQ'<0

Рис. 1.7.2. Графы переходов автомата для случая п=2.

AXW=gei;

ДХ<2 > =

- а е , ;

Д Х ( 3 ) = с е , ;

 

 

 

(1.7.13)

Д Х < 4 > = £ е 2 ;

ДХ<5 > =

- а е 2 ;

Д Х ( 6 > = а е 2 .

Графы переходов автомата показаны на рис. 1.7.2. Имеем следующие матрицы переходов автомата:

при нештрафе (AQ'<0)

0 0 1 О О О

ОО О 1 О о

ОО О 1 О о

А0 =

 

(1.7.14)

О О О О 0 1

 

1

О ОО О О

 

1

О ОО О О

 


ПОИСК БЕЗ САМООБУЧЕНИЯ

 

91

 

 

 

 

при штрафе

 

(AQ'^O)

0

1

0

'0

0

0

0

0

0

'1

0

0

0

0

0

' 1

0

0

 

 

 

 

 

(1.7.15>

0

0

0

1 0

1 0

0

^0

0

0

1

0

0

.0

0

0

Функционирование автомата описывается цепью Мар­ кова

> Si

1 - 5 ! •о 0

0

)

0

0

• 1 0

0

)

0

0

• 1 0

0

 

 

 

 

 

(1.7.16);

) 0

0

'0

5 4

1 — Si

 

0

0

0

0

 

0

0

^0

0

0

где

s, - s, = y [ l + ® ( - g - ) ] ;

(1.7.17)

- • H ' - t e ) ] .

а; — направляющие косинусы вектора-градиента функ­ ции

Q(X) = a i * i + a2X2; a i 2 + a 2 2 = l .

(1.7.18)