Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 207

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ПОИСК БЕЗ САМООБУЧЕНИЯ

123

§1. 11. А В Т О М А Т Н А Я О П Т И М И З А Ц И Я ПРИ Н А Л И Ч И И ОГРАНИЧЕНИЙ

Выше рассматривались процессы оптимиза­ ции без ограничения на область поиска. Однако в реаль­ ных случаях на область поиска накладываются различ­ ного рода ограничения. Чаще всего в виде неравенств:

5 : /гг -(Х)^>0

Учет ограничений может быть сделан двояко. Во-пер­ вых, методом штрафных функций, т. е. путем образова­ ния новой функции качества вида

^ v ;

I Q(X)+</(X)

при ХфБ,

где а(Х) — штраф за нарушение ограничений, который строится следующим образом:

<7(Х)=0

при

X e S ;

4 ( Х ) > 0

при

ХфБ;

например,

<7(X) = - 8 m i n { 0 , « , ( X ) , . . . , n f e ( X ) } ,

где 5 — достаточно большой коэффициент штрафа.

Минимизируя функцию Q(X) в открытой области, т. е. решая задачу

Q(X) - v m i n ,

получаем X*, который при достаточно большом б совпа дает с решением исходной задачи (0.1.5), т. е.

Х* = Х*.

Такой подход, как это очевидно, не требует коррекции алгоритма, но допускает заход в область XsjfeS.

ГЛАВА I

124

Другой подход к решению оптимизационных задач с ограничениями связан с организацией реакции на заход в недопустимую область. Например, нарушение ограни­ чений отождествляется с неудачным шагом:

(XgfeS) = ( A Q ^ 0 ) .

В этом случае использование нелинейного алгоритма

(0.2.4), записанного в виде

 

=

| а Е

 

при

( A Q J v _ 1 < 0 ) A ( X w _ 1 s S ) ;

N

I - A X W

_ ,

при

( A Q w _ i > 0 ) V ( X f f _ l 4 E S ) I

гарантирует решение

поставленной задачи

(здесь знак

!Д логическое «И»; V логическое «ИЛИ»).

Линейный алгоритм

(0.2.2) запишется в виде

 

AXJV_ !

при (AQ W - i<0 )A (Xw - i«=S) ;

 

АХЛ ,=

аЗ

при ( A Q ^ - i ^ 0 ) A ( X A - i e S ) ;

(1.11.1)

 

— AXjv-i

при

X J Y - J ^ S .

 

Здесь обратный шаг введен как реакция на нарушение ограничений.

Рассмотрим работу последнего алгоритма для случая, когда множество возможных направлений {АХ} образу­ ется координатными направлениями (1.5.1), т. е. имеет место стохастический вариант алгоритма Гаусса—Зей- деля (см. § 1.5):

ati

при

t ^ n ;

Д Х < * > = {

при

n<is^2n,

-aei-n

где ег t-й орт. Здесь случайный вектор Н имеет дис­ кретное распределение

Р ( 0 = 2 ^ ( t = l , . . . , 2 n ) .

Ограничимся для простоты случаем п = 2, который рас­

смотрел И. Л. Антонов [17].

 

Схема рассмотренного им алгоритма

такова. В началь-

1

л

ныи момент с равной вероятностью

выбирается один


ПОИСК БЕЗ САМООБУЧЕНИЯ

125

из регулируемых параметров Xi или х2 и с вероятностью 1 2 по этому параметру делается шаг в ту или другую сто­

рону. Если этот шаг удачен, т. е. если приращение пока­ зателя качества имеет желаемый знак, то система про­ должает движение по той же координате и в том же направлении до тех пор, пока указанное приращение не сменит знак. После этого снова производится случайный выбор направления движения. Если первый шаг был не­ удачен, то процедура выбора направления движения повторяется сразу после этого шага.

Будем считать, что переход системы из точки в точку

происходит мгновенно, но в каждой точке

плоскости,

куда система попадает после n-го шага, она

задержива­

ется на единицу времени (например, на 1 сек).

Определим поведение системы в окрестности точек, яв­ ляющихся запрещенными, следующим образом. Сис­

тема, попав

в процессе поиска в точку,

принадлежащую

запрещенной

области,

остается

там

в течение 1 сек,

после чего с

вероятностью 1 возвращается в точку, ис­

ходную для

последнего

шага.

Если

при «отражении»

знак приращения показателя качества будет таким, ка­ кой нужен, система будет продолжать двигаться в том же направлении до момента, пока не сменится знак при­ ращения, после чего указанным образом производится выбор нового направления движения. Если при «отра­ жении» приращение показателя качества имеет нежела­ тельный знак, то выбор нового направления движения производится сразу.

В § 1.5 было показано, что такой процесс поиска по­ средством его автоматного представления сводится к не­ которой цепи Маркова, т. е. представляет собой случай­ ное блуждание по плоской решетке с шагом, равным единице. Легко заметить, что вероятности переходов сис­ темы из точки в точку будут зависеть только от того, в какой точке система находится в данный момент, т. е. процесс переходов также будет марковским. Точнее го­ воря, этот процесс будет описываться однородной мар­ ковской цепью со счетным множеством состояний.

Назовем переход системы из точки в точку между двумя последовательными остановками для выбора на­ правления движения тактом и рассмотрим процесс по-


ГЛАВА I

126

иска, принимая в качестве аргумента этого процесса число тактов.

Будем

считать,

что показатель

качества

системы

можно представить в виде

 

 

 

Q ( * i , * a ) = fi (*i)+fa ( *2 ),

 

 

 

где fi(xi)

и /2(^2)

— произвольные

функции,

имеющие

единственный строгий минимум.

 

 

 

Будем

считать,

что минимум

показателя

качества

Q(xu х2)

находится в точке (0, 0).

точки (1,1), (1, — 1),

Назовем окрестностью минимума

( — 1 , 1), ( — 1, —1) и найдем среднее число

тактов, не­

обходимое системе, чтобы из некоторой точки

плоскости

попасть впервые в одну из точек

окрестности

минимума.

Поскольку нас интересует среднее число тактов, необ­ ходимое системе для первого попадания в окрестность минимума, мы можем считать точки, принадлежащие этой окрестности, поглощающими, т. е. такими, что веро­ ятность перехода из этих точек в самих себя равна 1, и, следовательно, можем для определения искомого сред­ него числа тактов воспользоваться следующей форму­ лой [47]:

со

 

N= ^ / V ^ X ^ S ) ,

(1.11.2)

где X; исходное состояние системы;

S— множество всех возможных состояний сис­ темы, кроме состояний, принадлежащих окрестности минимума;

Pq(X{, S) — вероятность того, что, выходя из состоя­

ния Хг-, система после

q тактов

окажется

в одном из состояний

множества S, не за­

ходя при этом ни разу в точки,

принадле­

жащие окрестности минимума;

 

Pq(Xit S)=2Jp<i(9)

Для определения этих вероятностей разобьем мно­ жество на однородные подмножества.


ПОИСК БЕЗ САМООБУЧЕНИЯ

Разбиением на однородные подмножества назовем та­ кое разбиение множества 5, когда для любых двух со­ стояний Xj и Xj-eSft и для любого подмножества Si имеет место равенство

и подмножества 5, попарно не пересекаются. По край­ ней мере одно такое разбиение всегда существует: каж­ дое возможное состояние является однородным подмно­ жеством.

Обозначим J^j pij

для Xi^Sk

через p(Sk, Si). Ис-

 

 

xi6=s,

 

 

 

пользуя то, что подмножества Si,...,Sm

не пересекаются,

можем

записать

 

 

 

 

 

т

 

 

 

Pq(\itS)=

^P(XuSh).

 

 

(1.11.4)

 

 

ft=i

 

 

 

Вводя

производящую

функцию

A(s)

последователь­

ности

ад

 

 

 

 

 

 

со

 

 

 

A(s)=

]£aqs4,

 

 

(1.11.5)

 

 

9=1

 

 

 

умножая выражения (1.11.4) на si и суммируя их для всех q от 1 до оо, получим

со

P(s,S)=

^P(s,Sk),

(1.11.6)

 

fe=i

 

где P(s, S) и P(s, Sk) — соответственно производящие функции последовательностей Pq(Xi, S) и Pq(Xi, Sk).

Предположим, что Ро(Х,-, S) = l , т. е. что Xj=S . Тогда формулу (1.11.2) можно записать так:

т

A / = 1 + P ( l , 5 ) = l + ]?P(l,Sh).

(1.11.7)

й = 1

 


ГЛАВА I

128

 

 

Задача, таким образом,

свелась к отысканию

чисел

Р(\, Sh)• Для сокращения

записи в дальнейшем

будем

писать вместо Р(\, Sk) просто P(Sk).

Теперь найдем вероятность P(Sfe). Согласно определе­ нию переходной вероятности за q шагов

Используя уравнение Колмогорова—Чепмена, получим

Pq(Xi,Sl)=

]?pih«i-»

]?Ры =

 

 

xje=s,

xfte=s

 

 

т

2 phi>

(1Л1-9)

= 2 2 Pikiq~i)

 

s =i x^s,

xA<=ss

 

или, применяя введенные

обозначения,

 

 

ГЦ

 

 

Pq(\uSi)=

2p(St'Sl)p^(^i,Ss).

(1.11.10)

8=1

Переходя к уравнениям в производящих функциях и по­ лагая в них s = 1, получим

т т

P(Si)=

2P(Ss,Sl)P(Ss)+

2'

PiSs.S^PoiSs)

 

 

8=1

"\l=l,

. . . , m ) , (1.11.11)

 

 

 

где

Po(Ss)

есть вероятность того, что в начальный мо­

мент

X ; ^ 5 S .

 

 

Решая полученную линейную неоднородную систему

уравнений, найдем P(Si) (1=1,...,т).

Подставляя по­

лученные значения в

(1.11.7),

определим среднее число

тактов, необходимое

системе

для первого попадания

вокрестность экстремума.

Сточки зрения сравнения детерминированных и слу­ чайных методов поиска интересно рассмотреть ограни­

ченные запрещенные области, закрывающие прямой путь в окрестность экстремума из какой-либо части плос­ кости.