Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 208

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ГЛАВА II

138

WN = W(WN_U

АХд'-ь A Q V - i ) .

(2.1.3)

В общем случае эта функция может быть и случайной. На изменение длины вектора памяти W накладывается ограничение

| W | ^ d y " n

(2.1.4)

(d = const),

 

где я — размерность пространства {W}.

 

Далее предполагается, что вектор памяти

W, а также

смещение АХ могут принимать значения из конечных множеств

W G { W < 4 ,

W(2), . . . , W<M >};

(2.1.5)

ДХе={ДХО>, АХ<2), . . ., ДХ<*>}.

(2.1.6)

Что касается

приращения

функции

качества AQ', то нас

будут интересовать только два значения:

 

sgnAQ' = C

= { 1'

е с л и Д

( ^ 0 '

( 2 17)

 

 

I 0,

если

A Q ' < 0 .

^

;

Поиск с самообучением

определим

как вероятностный

автомат следующим образом. Пусть состоянием авто­ мата является вектор памяти W, выходом автомата — вектор смещения АХ, а его входом sgnAQ' = c. Тогда множество состояний, множество выходов и мно­ жество входов автомата будут определяться соответст­ венно формулами (2.1.5), (2.1.6) и (2.1.7). Функция пере­ ходов автомата будет определяться выражением (2.1.3), а функция выходов — соотношением (2.1.2). Отметим,

что по формуле (2.1.3)

изменение

состояний

автомата

WJV-1-^-WJV зависит также

от выхода

автомата

ДХ^_1 на

(N— 1)-м шаге. Таким образом, с учетом предположений (2.1.5) и (2.1.6) алгоритмы самообучения при случайном поиске описываются как вероятностные автоматы с ко­ нечным числом состояний и конечным числом выходов. При этом вероятности выходов автомата зависят только от его состояния и не зависят от его входа, а вероятности


ПОИСК С САМООБУЧЕНИЕМ

139

переходов автомата из одного состояния в другое зави­ сят кроме состояния и входа автомата также от его вы­

хода на предыдущем

шаге.

 

 

 

 

 

 

 

Введем следующие

обозначения:

 

 

 

 

Р М . ( с ) ( / ) = В е р

( W ^ ^ - ^ W J V + I ^ / A X ^ ^ A X ^ . C )

(2.1.8)

 

 

 

 

 

 

(i'b

i 2 =

\,...,т;

с==0, 1);

<7 = Вер (AX

W

= AX«)/W

J V

= W<*))

 

 

 

(2.1.9)

У

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(i' =

1, . . . ,

m;

у'=1,

. . . , v);

s, = Bep

=1/АХ = АХ0))

 

=

у [

1 + Ф

( ~ ^ ) ]

(2.1.10)

 

 

Z

 

 

 

 

 

 

(j=\,...,v);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф(г)

=

J e~t2dt

интеграл

вероятности.

Здесь

 

 

Уя о-7

 

 

 

 

 

 

 

 

 

 

 

Рг,л,м

(/)

обозначает

вероятность

 

перехода

автомата из

состояния W ( i i )

 

в состояние

W<»2), если на

предыдущем

шаге

поиска на

выходе автомата

появился

сигнал АХ<-»>,

а потом на его вход поступил входной сигнал с; цц — ве­ роятность появления на выходе сигнала ДХ<з) при нахождении автомата в состоянии W'1 ''; s'-*' — вероят­

ность штрафа /-го

действия (выхода) автомата.

П е р е х о д н у ю

2v

ф у н к ц и ю

автомата будем зада­

вать при помощи

следующих

стохастических матриц:

для с = 0

 

 

 

/>11<°>0')

- / W 0 ) ( / )

 

Ао(1) =

 

 

(2.1.11)

для с = 1

 

 

 

?,><"(/)

- / W ' > ( / )

(2.1.12)

Л , ( / ) =

 

 

В ы х о д н у ю ф у н к ц и ю автомата

задаем при по-

мощи прямоугольной матрицы порядка

mXv


ГЛАВА II

140

qvi qw (2.1.13)

q-mi ••• q-n

Далее, используя формулы (2.1.8) и (2.1.9), находим

совместную

вероятность события, состоящего в том, что

у автомата

появился

выход Д Х ^ и автомат потом пере­

ходит из состояния

W ( i i )

в состояние W ( i 2 )

при

условии,

что на его вход поступил сигнал с:

 

 

 

Вер (Ww«-> - * V W 4 ДХл г = ДХ(Я/с)

=qi[jPiii2(j).

 

 

 

 

 

 

 

(2.1.14)

Совместная

вероятность

следующих трех

событий:

WN (».>->W^+i<4

ДХ= ДХ<Я И с = 1

равна

 

 

В е р ( \ У ^ ) ^ \ У д Г + 1

^ , ДХл г = ДХи),

c = l ) = s j < 7 V p M i n M / ) .

 

 

 

 

 

 

 

(2.1.15)

Аналогично для с = 0 имеем

 

 

 

Вер (WWW>

W w + l < 4 ДХ= ДХ«), с = 0) =

 

=

( l - s j ) ^ i 1 < , w > ( / ) .

 

'

(2.1.16)

Суммируя эти вероятности, получаем совместную вероят­

ность перехода автомата

из состояния W^1 ' в состояние

W(*2) при появлении сигнала ДХ( ^ на его выходе:

Вер ( W w < * - > W w + 1 ( 4

AXN

= AXU))=Pii,.(/)

=

 

=qU^-si)Pb4w(i)

+ s j P i ^ 4 j ) l

 

 

 

 

 

(2.1.17)

Суммируя вероятности

Pi^U)

по всем выходам ДХ<-?>

(j = l,...,

v), находим полную вероятность

перехода ав­

томата

из состояния W ( ! | )

в состояние W'J '2 ':

 


ПОИСК С САМООБУЧЕНИЕМ

141

Рчч- ^ a ( l - S i ) P ; l i 2 < ° > ( / ) +*>Рг^ЧП]

(2.1.18)

3=1

,т).

{h,i2=\,...

Следовательно, полное функционирование автомата в случайной среде (2.1.10) описывается цепью Маркова с переходными вероятностями (2.1.18). Запишем эту цепь Маркова в виде стохастической матрицы порядка тХт

Ри

••• Pit

(2.1.19)

А =

 

Pml ••• рп

 

где рцц

(I'I, t 2 = l , . . . , m ) определяются

формулой

(2.1.18). Предельные вероятности этой цепи Маркова,

если она однородная и эргодическая, находятся

как ре­

шение системы алгебраических

уравнений

 

Р =

Л'Р,

 

(2.1.20)

где Л

' транспонированная

матрица (2.1.19);

 

Р

вектор предельных

вероятностей;

Р=(ри...

...,рт).

В некоторых случаях для исследования матрицы (2.1.19) удобнее представить ее при помощи более прос­ тых матриц. Для этого вводим квадратные матрицы

Qi(j) и S(j) порядка т:

ям

о

о -

0

0

0

q2j

0 ••

0

0

Qi(i) =

 

 

 

(2.1.21)

 

 

 

 

0

0

0 ••• 0

qn

Sj

0

0 ••• 0

0

0

S;

0 ••• 0

0

S(/) =

 

 

 

(2.1.22)

0

0

0 ••• 0

s j


ГЛАВА II

142

-При помощи введенных матриц (2.1.21) и (2.1.22) и мат­ риц (2.1.11), (2.1.12) матрица Л представляется в виде

v

(2Л-23)

А= 2[{I-S{j))Qi{i)Ao{j)+S{j)Qi{i)Aim

где / — единичная матрица порядка т.

Отметим, что при помощи конечных вероятностных ав­ томатов, переходные функции которых зависят от их вы­ ходов, представляется любой алгоритм дискретного са­ мообучения (векторы W и АХ принимают значения из дискретного множества векторов). Рассмотрим некото­ рые частные случаи автоматов, функционирование кото­ рых описывается цепью Маркова с матрицей переходных

вероятностей

(2.1.23).

 

 

 

1.

Вероятностный автомат, переходная

функция

кото­

рого

не зависит

от его выходов.

В этом

случае все мат­

рицы Ac(j)

при

фиксированном

с равны между

собой,

т. е.

 

 

 

 

 

 

Л 0 ( / ) = Л 0 ;

A i ( / ) = A ,

 

 

(2.1.24)

 

 

 

0 = 1,

 

 

 

Матрица Л равна

 

 

 

A=(I-S*)A0

+ S'AU

 

 

(2.1.25)

где

V

 

 

 

 

 

 

 

 

 

 

 

3=1

0

0

 

V

о

(2.1.26)

о

 

V

оо