ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.06.2024
Просмотров: 224
Скачиваний: 1
ПОИСК С САМООБУЧЕНИЕМ
217
Здесь Pi<°) — начальная вероятность пребывания сис темы в первом замкнутом множестве;
Р,т = P l <o) + р б ( 0 ) + |
pu(0)+pi6(0) |
+p2Q)p3l |
+ р з т р з б |
+ |
|
+ |
Psi0)Psi+ |
Pai0)Pa,U+ |
Р9(0)Р9,6 |
+ Pl2WPl2,U |
+ |
+ |
Pl4(0)Pl4,ll+Pl5<°>Pl5,16. |
|
(2.5.18) |
Решая систему уравнений (2.5.15), получаем анало
гичные |
формулы |
для предельных |
вероятностей |
р^ |
рт, |
|||||||||
Рю, |
Pl3- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 ( . 3 » 5 0 0 ) ( 1 - 5 ( 7 ) ) |
|
|
|
|
|
|
|
|
||||
/ 4 |
|
S ( |
2 ) |
|
2 - |
|
|
|
|
|
|
|
|
|
Н7 |
с(13)с(10)с(4) |
|
|
|
|
|
|
|
|
|
|
|||
5 |
( 2 ) |
^2 |
, |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
(2.5.19) |
|
I h 0 = — s e T ~ |
2 |
* |
|
|
|
|
|
|
|
|
||||
Pl3 = |
( 1-S (10)) S (7)S (1) |
|
|
|
|
|
|
|
|
|||||
|
|
^ |
|
* V ' , |
|
|
|
|
|
|
|
|
||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5(2)=S (13)S (10)(S (4)+S (10)) + S ( 4 ) 5 ( 7 ) ( S ( 1 3) + |
S(7)), |
|
|
(2.5.20) |
||||||||||
Здесь |
/ V 0 |
) — начальная |
вероятность |
пребывания |
сис |
|||||||||
темы во втором замкнутом |
множестве; |
|
|
|
|
|
||||||||
/>2<о)= р 4 ( 0 ) + рт(0) + |
р ш (0) + р 1 3 ( о ) + р 2 ( 0 ) ; 7 2 |
7 + р |
з ( о ) ; 3 з 4 |
+ |
|
|
|
|||||||
|
|
+ |
P5(0)P5,10 + P8( 0 ) P8,4 + P9( 0 ) P9,13 + |
Pl2(0)Pl2,7 |
+ |
|
|
|||||||
|
|
+ |
Р14(0)Р14ЛЗ + Р15(0)Р15,20. |
|
|
|
|
(2.5.21) |
||||||
В |
формулах |
(2.5.12) — (2.5.21) |
входящие |
вероятности |
||||||||||
штрафов |
si |
(/=1, ... ,16) |
определяются по |
формуле |
||||||||||
(2.1.27) с учетом |
формул (2.1.41) и (2.2.11). |
q^ |
|
|
||||||||||
По формуле 2.1.41 определяем вероятности |
появле |
|||||||||||||
ния на выходе АХ^^ при условии, что вектор памяти W |
||||||||||||||
находится |
в |
состоянии |
W<J'>. |
Эти |
вероятности |
для |
ГЛАВА II
213
различных состояний приведены в таблице 2.2.1. Опре деленные по формуле (2.1.27) вероятности s( j ) штрафов состояний следующие:
S ( l ) = |
i . [ l + |
d ( |
S l _ S 4 ) |
] ; |
S ( 6 ) = |
! _ d ( S l _ S 4 ) ] ; |
|
s < n ) = у [ 1 - - | d ( s , - s 4 ) ] ; |
s 0 « = l [ i - d ( s , - s 4 ) ] ; |
||||||
|
|
|
|
|
|
|
(2.5.22) |
S ( 4 ) = |
_ ^ [ 1 |
+ d |
( S |
2 _ S 3 ) ] ; |
S (7)= |
| _ d ( s 2 _ S 3 ) ] ; |
|
S d 0 ) = |
1 [ i - |
A |
d (s 2 - s 3 )] ; |
s«3) = ~ |
[1 _ d ( s 2 - s 3 ) ] . |
||
Из этих формул находим |
равенства |
|
|||||
S (i) + S (1 6 > = l ; |
S ( 6 ) + S ( i i ) = i ; |
|
|
||||
S ( 4 ) + S ( 1 3 ) = |
l ; |
S (7)+ S (10)= |
l . |
|
(2.5.23) |
||
|
|
||||||
Следовательно, |
|
|
|
|
|||
5<l)= |
[s (16) + |
(S <6))2]S (1); |
S<2)=rs(13)+ (S<7>)2]s<4); |
||||
|
c(16)/s (ll))2 |
|
|
S (16)S (11)S (1) |
|
||
|
|
|
|
|
|
50) |
|
|
s (i6)s (6) s ( i) |
Л<°>; |
P l l = |
50) |
|
|
|
|
|
S (13)(S (10))2 |
P2 (0); |
P4 = |
|
|
|
S (13)S (7)S (4) |
|
Pio = |
S<2) |
P 2 ( 0 ) ; |
|
|
Pi6= |
(s(6))2sO) Л ( 0 ) ; |
(2.5.24) |
|
SO) |
|
S O 3 ) s ( 1 0 ) s ( 4)
p7 = |
P2 (0); |
|
5(2) |
(s<7>)2sO>
P i 3 =
5<2)
Среднее приращение функции Q(X) при нахождении вектора W в состоянии W<2'' равно
ПОИСК С САМООБУЧЕНИЕМ
219- |
|
|
|
|
|
|
|
|
|
dAQW |
приг"=1; |
|
|
|
|
|
— dAQ<» |
при |
i = 6; |
|
|
|
|
— dAQW |
при |
i = l l ; |
|
M[AQ/W»]= |
]?Яц№(3): |
dAQW |
при |
i=16; |
|
|
dAQw |
при |
t = 4; |
|
|||
|
3=1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
— dAQW |
при |
г' = 7; |
|
|
|
|
2 |
|
|
|
|
|
|
— c?AQ<2> при |
г = 10; |
|
|
|
|
|
О |
|
|
|
|
|
|
dAQ<2> |
при |
t=13, |
|
где |
|
|
|
|
(2.5.25) |
|
|
|
|
|
|
|
|
A Q ' 1 » = ( a 1 |
+ a2 ); |
AQ< 2 >=(a, - a 2 ); |
|
|
|
|
AQ(3) = _ ( a |
i + a 2 ) ; |
A Q (4 ) = |
_ ( a i _ a 2 ) . |
|
|
|
Среднее приращение функции Q(X) при учете всех |
со |
|||||
стояний W<*> вектора памяти W равно |
|
|
|
|||
|
16 |
|
|
|
|
|
M[AQ] = J^iM[AQ/W<*>)=[ ( P l - p I 6 ) + | - ( p 6 - p n ) ] |
х |
|||||
XdAQ«> + [ |
(p4 -Pis) + - | ( / W i o ) 1 ^ A Q ( 2 \ |
|
||||
|
|
|
|
|
(2.5.26) |
где предельные вероятности p{ определены формулами
(2.5.24). |
когда отсутствует помеха ( 0 = 0 ) . |
|
Рассмотрим случай, |
||
В этом случае si=s 2 = 0; s3 = s 4 |
= l . Следовательно, |
|
s»> = s W ~ ( l - d ) ; |
S(13) = |
5 ( 1 6 ) = - i ( l + d ) ; |
ГЛАВА II
220
S (6) = S ( 7 ) = ^ . ( 1 _ 2 d ) ; s(io)= s u i ) = i _ ( |
l+\d). |
(2.5.27)
Предельные вероятности равны: S(16)(S(11))2 s(16)(<j(ll)\2
|
(s<6))2s(o |
Л<°>; |
|
(S(16))2S(1) |
|
||
|
|
|
P i 3 = - ~ ^ — ^ 2 ( 0 ) ; |
||||
|
|
|
|
|
|
|
(2.5.28) |
Pe-- |
S(16)S(1I)S(1) |
|
|
s (i6)s (ii)s <i) |
|
|
|
|
РАО). |
p |
= |
|
p |
(0). |
|
|
|
1 ' |
r / |
|
S(D |
2 |
' |
|
s (i6)s (6)s (i) |
|
|
S (i6)s (6)s (i) |
|
||
|
S<i> |
Л<°>; |
|
PlO = - |
S(i) |
|
^2 ( 0 ) . |
|
|
|
^ |
|
где
S(i) = 5<2) = s(i6 's(i1 )(s(1 ) + s(i1)) +s(6 >s(i)(s<1 6 )+s(6 )).
(2.5.29)
Подставляя эти вероятности и выражения (2.5.25) в формулу (2.5.26) и учитывая формулы (2.5.27), находим среднее приращение функции
M[AQ]=- |
|
25d2 |
|
[ а 1 + ( Л ( 0 |
) - ^ 2 ( |
0 |
) ) а 2 ] , |
(2.5.30) |
|||
|
|
18 -f- 7fif2 |
|
|
|
|
|
|
|
||
где |
ai, a2 —1 направляющие |
косинусы градиентного век |
|||||||||
тора |
функции Q(X); /у°> и Р 2 ( |
0 |
) |
определяются |
форму |
||||||
лами (2.5.19) и (2.5.21). Из этой формулы имеем |
|
||||||||||
lim M[AQ] = a i + ( Л ( 0 ) - |
Л>( 0 ) ) « 2 |
|
|
|
(2.5.31) . |
||||||
lim M[AQ] = 0. |
|
|
|
|
|
|
|
(2.5.32) |
|||
Аналогичным |
образом |
можно |
исследовать |
случай, |
|||||||
когда m>16 |
(6<2d/3). |
|
|
|
|
|
|
ПОИСК С САМООБУЧЕНИЕМ
221
§ 2.6. С Т А Т И С Т И Ч Е С К И Е С В О Й С Т В А К О Л Л Е К Т И В А О П Т И М И З И Р У Ю Щ И Х А В Т О М А Т О В И И Х С Р А В Н Е Н И Е
С О С В О Й С Т В А М И П О К О О Р Д И Н А Т Н О Г О
СА М О О Б У Ч Е Н И Я
Внастоящем параграфе исследованы ста
тистические свойства оптимизирующих автоматов с де терминированными выходами и проведено их сравнение со свойствами алгоритма покоординатного самообучения
[14, 15]. Структурная схема системы оптимизации |
изобра |
||
жена на рис. 2.6.1. Здесь Аи...,Ап |
— независимые ве |
||
роятностные |
автоматы, перерабатывающие |
значения |
|
функции Q(X) |
в значения переменных хи...,хп- |
Каж |
|
дая из переменных Xj (/ = 1 , . . . , п) |
управляется своим ав |
томатом Aj. Входной переменной всех управляющих ав томатов является знак приращения функции signAQ(X). Внутреннее состояние автомата Aj определяет изменение
переменной согласно соотношениям |
|
|
|
|||
x J (^+D = X j (iv) + |
AX j (iv+i)j |
|
|
(2.6.1) |
||
где AXJW+1> |
— выход /-го |
автомата, |
равный |
+ 1 или |
— 1 |
|
в зависимости |
от того, |
находится |
ли /-й |
автомат |
на. |
4
Рис. 2.6.1. Схема системы оптимизации коллективом независимых автоматов.