Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

Скачать файл (8,31Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 177

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ПОИСК БЕЗ САМООБУЧЕНИЯ

				Т а б л и ц а 1.2.1
Теория	поисковой	оптимизации	Теория вероятностных автоматов
Объект			Среда
Оптимизатор, работающий по ме Вероятностный автомат
тоду случайного		поиска
Реакция объекта			Входной алфавит автомата
			С = ( 0 , 1 )	(с=0)
AQ'scO			нештраф	(с=0)
AQ'>0			штраф (с=1)
ДХ Ь ДХ2 , ь	. . , Д Х т		Выходной	алфавит автомата
Состояние	объекта	?)	Состояние	среды
r-ero-(f-		?)	S = ( s i , . . . , sm)
			S = ( s i , . . . , sm)
	\ oxi	дх„!

Будем рассматривать сначала покоординатный поиск, когда вдоль координатных осей равновероятно делаются единичные шаги в обоих направлениях

А Х = ( ± 1 , ± 1 , . . . , ± 1 ) .

(1.2.1)

Очевидно, что в этом случае т четно. Определим индексы следующим образом:

AXH)=-kX(i+ml2)

( 1 - 2 . 2)

( ) •

„ т

т. е. шаги с индексами, различающимися величиной-^- ,

равны по модулю и противоположно направлены. Покажем теперь, как некоторые описанные ранее ал

горитмы покоординатного поиска записываются в тер минах теории автоматов.

ГЛАВА Г

Нелинейный алгоритм случайного поиска:

f	Н, если	A Q V i ^ O ;
* 1	R, если	A Q V J X ) ,

где

A Q V ^ Q ^ X i - O - Q ^ X ^ )

(1.2.3)

и Х*_, = Х М + ДХ1_,.

(1.2.4)

Здесь	S	— оператор	случайного		шага, который		пред
		ставляет	собой	равновероятный		выбор из
	R	т — 2п возможностей			(1.2.1);
		— оператор	реакции на AQ'> 0 (напомним,
		что рассматривается случай минимизации).
		Пусть для конкретности R выражает					опера
		цию возврата в		исходную точку,		т. е. Ri =
		= - Д Х ( _ , .					пока
Блок-схема оптимизации по этому алгоритму
зана	на	рис. 1.2.1, а. Здесь П		—	блок памяти	предыду

щего значения показателя качества; ИМ —• исполнитель ный механизм, выполняющий операцию (1.2.4); бук вой S обозначен генератор случайных шагов.

Заметим, что данный алгоритм не тождествен опи санному в работе [1]: в последнем после возврата необхо димо следует случайный шаг, в алгоритме же (1.2.3) реакция R может повторяться, если повторяется нера венство AQ'>6 .

Теперь сформулируем этот алгоритм в терминах функ ционирования вероятностных автоматов [39].

Вероятностный автомат, описывающий указанный ал горитм случайного поиска, оперирует двумя стохасти ческими матрицами, соответствующими двум реакциям

среды	(штраф и нештраф). Нештрафу		(с = 0) соответст
вует	стохастическая матрица	выбора	случайного	шага
АХ:				(1.2.5)
А0=\\рц\\				(1.2.5)
	( г , / = 1 , . . . , т ) ,
где	1
	1			(1.2.6)
				(1.2.6)
Штрафу ( с = 1 ) соответствует		нестохастическая		мат
рица	реакции

ПОИСК БЕЗ САМООБУЧЕНИЯ
45
^ i = llfl«ll					(1.2.7)
( t ' , / = l , . . . , m ) ,
где
1 при	2
1 при	т	( .	т .	\	(1-2.8)
	т	( .	т .	\	(1-2.8)
	~2	( i = — +		1 , . . . , т ] ;
	~2	\ '	2
О при остальных значениях i,				/.

Иначе говоря, матрица реакции состоит из четырех бло ков — двух единичных и двух нулевых:

Л , =	О
Л , =	(1.2.9)
	О

Нетрудно заметить, что эта матрица обеспечивает воз врат системы в исходное состояние при AQ'>0 .

Таким образом, вероятностный автомат, эквивалент ный алгоритму случайного поиска с возвратом, пред ставляется в виде следующей комбинации матриц:

А=(\-с)А0+сАь

(1.2.10)

Блок-схема оптимизации с применением этого вероят ностного автомата показана на рис. 1.2.1,6. Здесь блоке выполняет естественную операцию:

f 1, если AQ'>0;

(1.2.11)

\ 0, если AQ' 0.

Блок А\ представляет собой автомат, срабатывающий при с = 1 в соответствии с матрицей А\, т. е. реализую щий поведение при штрафе. Блок А0 реализует вероят ностный автомат Ло, т. е. образует случайный шаг S.

Заметим, что обе матрицы Ло и А\ можно	объединить
в одну следующего вида:
А{с) = \\сц?\	(1.2.12)

ГЛАВА I

46-

где			I . '	т\
1 + с ( / и - 1 ) I . . т			I . '	т\
	• / = H - T		( i = l , . . . , T ) ;
	при
1 - е	1 = 1 -
1 - е	при остальных значениях i, у.
l m	при остальных значениях i, у.
l m				(1.2.13)
				(1.2.13)
а) г '				1
	Объект
	О,-
		да
	АХ;
	Случайный	нет
	шаг

б)

им	к-	4-1
им		05ъе>'кт

Рис. 1.2.1. Блок-схема оптимизации:

а — с алгоритмом случайного поиска; б — с применением вероят

ностного автомата.

ПОИСК БЕЗ САМООБУЧЕНИЯ

Обе схемы на рис. 1.2.1, а и б работают строго иден тично. Поэтому дальнейшее изучение поведения системы оптимизации, работающей по алгоритму случайного поиска (1.2.3), можно производить с привлечением аппарата теорий вероятностных автоматов.

Среда в этой теории описывается	вектором
S = ( s b s 2 , , , . , s m ) ,	(1.2.14)

где Si — вероятность штрафа (с=1) при ДХ = ДХ<*>.

При отсутствии помех в определении приращения показателя качества получаем

AQi=(AXugradQ(X)),		(1.2.15)
и вероятность штрафа ( A Q ^ > 0 )		равна
S i = sgnAQ(*>		(1.2.16)
где
sgn z = { 1 -	если z>0;
О, если 2=^0.

При наличии нормальных некоррелированных помех, накладывающихся на показатель качества, получаем более общую формулу:

где Ф(г) — интеграл вероятности; а2 — дисперсия нормальной помехи;

Ф ( * ) = - / e-*ldt.

Очевидно, что с изменением градиента показателя качества вектор S будет также изменяться.

Далее, для полного описания функционирования сис темы случайного поиска как вероятностного автомата необходимо установить связь между поведением внеш ней среды и действиями автомата, т. е. замкнуть цепь обратной связи. Для этого в формулу (1.2.13) вместо коэффициента с подставим вероятность штрафа при £-м действии автомата, т. е.

ГЛАВА I

48-
l+Si(m-l)	I . . m	I . л	m\

при

( t ' = f - + 1 - . . . , m ) ;

	m	при остальных значениях г, j .
	m	(1.2.18)
		(1.2.18)

Тогда процесс оптимизации случайным поиском описы вается простой цепью Маркова со следующей матрицей переходных вероятностей (см. § 0,4):

A(S)	= (I-S)A0+SAu				(1.2.19)
здесь	Л о и А г — матрицы				(1.2.5) и (1.2.7) соответст
		I	венно;
		I	— единичная		матрица;
		5	— диагональная матрица
	5i	0	0 . . .	0	0
	0	s2	0 . . .	0	0
5 =					(1.2.20)
	О О О			Sm-l	О
	О О О			0	sm

где Si — вероятность штрафа при i-м действии автомата. Располагая этими данными и пользуясь аппаратом теории вероятностных автоматов, можно определить ста

тистические свойства поиска. Пусть

P=(Pl,p2,...,Pm)		(1.2.21)
— вектор	предельных вероятностей	шагов AX<! >,...
. . . , А Х ( т ) .	Тогда осредненный шаг, определяющий эф
фективность поиска, равен
М[АХ] - 2 PiАХ»),		(1.2.22)