ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.06.2024
Просмотров: 170
Скачиваний: 0
ОПТИМАЛЬНЫЕ АЛГОРИТМЫ
317 :
Вероятности Sj штрафов действий ДХ( ^ автомата опре деляются по формуле
Sj = Bep ( A Q > 0 / A X = AXO>) = ± [ i + o ( _ ^ L ) ] ,
(3.3.51)
где Ф(г) — интеграл вероятности. Учитывая формулы (3.3.50), находим:
„ 4 [ 1 + Ф ( ^ ) ] ; 5 2 4 [ , + ф ( ^ ) ] ;
(3.3.52)
1
* з = у
Определим вероятности штрафов s(') ( i = l , . . . , 4 ) по отношению к состояниям W( ') автомата. Для этого сна чала определим вероятности выходов цц\
<7ii = Bep (Axx = \/wx = wxW) •Bep(Ax 2 =l / ^2 = ^ 2 ( i ) ) =
qu=(l-FxW)F2^, |
|
|
|
где Fi(i> заданы формулой (3.3.4) |
при Wi = wi^. |
||
Предположим, |
что |
состояния |
W<») автомата располо |
жены симметрично относительно начала координат: |
|||
W('l = - W f f l ; |
W<4> = -W<2 >. |
(3.3.54) |
|
Тогда имеют место следующие равенства: |
|||
f 1 n . - f , « ' - f , » - W « - l ' . ; |
|
||
Fxw = F2w = FxM = |
F2w=:F2. |
|
|
При этом можно показать, что |
|
||
F2= |
|
|
(3.3.56) |
ОПТИМАЛЬНЫЕ АЛГОРИТМЫ
|
319 |
|
|
|
|
|
Решая эту систему |
уравнений |
и нормируя |
вероятности |
|||
pi, находим: |
|
|
|
|
|
|
p 1 = l [ l + ( r 1 - r 2 ) ( l - 2 S ( ' ) ) ] ; |
|
|
|
|||
P2=\[l |
+ |
{rl-r2){\-2sW)]; |
|
|
|
|
|
|
|
|
|
|
(3.3.63) |
Р З = 1 [ 1 + ( Г , - Г 2 ) ( 1 - 2 5 < 3 ) ) ] ; |
|
|
|
|||
p 4 = l [ l + ( r 1 - / - 2 ) ( l - 2 s H ) ) ] . |
|
|
|
|||
Можно |
показать, |
что |
среднее |
приращение функции |
||
Q(X) при фиксированном |
W ( i ) |
( i = l , . . . , 4 ) |
равно |
|||
M[AQ/WW] = (F^ |
+ F2w-l)AQW+ |
(F1 w - F2w) AQ<2)). |
||||
|
|
|
|
|
|
(3.3.64) |
По этой формуле с учетом равенств (3.3.55) находим:
Af[AQ/W<D]=(2i7 i-l)AQ(1 );
М[А Q/W<2>1 = (2Fi - |
1) AQ <2>; |
|
(3.3.65) |
||
|
|
|
|
||
Af[AQ/W<3>]= |
( l - 2 / 7 |
1 ) A Q < 1 > ; |
|
|
|
M[AQ/W<4>] = (1-2F,)AQ<2 >. |
|
|
|
||
С учетом этих выражений и формул |
(3.3.50) приращение |
||||
функции Q(X), осредненное по всем |
состояниям |
W ( i ) , |
|||
равно |
|
|
|
|
|
M[AQ] = [(Pl-p3) |
(а{ |
+ а2) + (Р2~Р4) |
( a i - a 2 ) ] ( 2 F 1 - |
1) = |
|
= - l [ ( s i - s 3 ) (ai + a2 ) + (s2-Si) |
(oci - a 2 )]X |
||||
X ( r 1 - r 2 ) ( 2 f 1 - l ) . |
|
(3.3.66) |
Очевидно, что M[AQ] достигнет своего минимального зна чения тогда, когда выражение
(r1-r2)(2Fl-l) |
(3.3.67) |
ГЛАВА III
320
примет свое максимальное значение. Это будет иметь место при
г , = |
1; r2 = 0; F, = |
l . |
(3.3.68) |
Fi = l |
тогда, когда |
в формуле (3.3.58) Wi^^q. |
По |
скольку oj] ( 1 ) = ffi>2(1\ алгоритм поиска будет оптимальным при следующих значениях его параметров:
г, = 1; r2 = 0; wxW = w2W^q. |
(3.3.69) |
Этот результат согласуется с результатом, полученным для одномерного случая ( я = 1 ) .
§3.4. С М Е Ш А Н Н Ы Е А Л Г О Р И Т М Ы
СЛ У Ч А Й Н О Г О П О И С К А
Будем называть смешанным алгоритмом (по аналогии со смешанной стратегией в теории игр) такой алгоритм, в котором некоторые переходы от одного опе ратора к другому осуществляются вероятностным обра зом. Простейшим смешанным алгоритмом поиска явля ется алгоритм, стратегия которого образуется вероят ностным взвешиванием чистых стратегий:
к |
|
|
s= 2 PiSi = [P S], |
. |
(3.4.1) |
где |
|
P=(pu...,pk) |
(3.4.2) |
— вектор вероятностей бесов выбранных стратегий;
h |
|
г = 1 |
|
S = ( s „ ...,sh) |
(3.4.3) |
— вектор имеющихся чистых стратегий поиска (напри мер, Si — стратегия метода градиента, s2 — стратегия