Файл: Растригин Л.А. Автоматная теория случайного поиска.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 168

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ВВЕДЕНИЕ

23

P u h A l {У\У2

•••УМ--

./*1*2 . . . X N . . . ) =

 

 

 

 

 

 

= Pufl{yiy2---yN..Jxlx2...xN...)

 

 

 

 

 

(0.3.26)

при всех

парах

входных

и выходных

последовательнос­

тей XiX2...xN...

 

и У\У2-..Ун---

Здесь

{UA'}

и {UA>} —

множества

внутренних

состояний

автоматов

А{ и А2

соответственно;

ри1А{

(У\Уг • • -1х2

... )

—•

вероятность

появления на выходе автомата Л*

( i = l , 2 )

последова­

тельности у\у2...,

если на вход была подана

последова­

тельность Х2...

и в начальный момент автомат Лг- на­

ходился В СОСТОЯНИИ Uj.

 

 

 

 

 

 

 

 

Стохастическая

эквивалентность

автоматов.

Вероят­

ностные

автоматы А\

и

Л 2

называются

стохастически

эквивалентными, если для каждого начального распре­

деления

Р г ^ ' ^ Р д , 1 0 ' }

найдется

такое

начальное распре­

деление

Р ; - ( 0 ) е { Р д 2 ( 0 ) } , что

 

 

 

 

 

Pptml

(УМ* • • • W * i * 2 ...xN)

=

 

 

 

 

=Pv.^i{y\y2-.-yNlxlx2...xN)

 

 

 

 

(0.3.27)

и для каждого

начального

распределения

Р ь ( 0 ) е { Р А 2 ( 0 ) }

найдется

такое

начальное

распределение

Рг( 0 >е{Рл,< 0 ) },

что

 

 

 

 

 

 

 

 

PpkW2

\У2 • • • Un/XiX2

...xn)

=

 

 

 

 

=PP ; ( 0 ) т ' (У1У2 •. • Ук1ххх2

...xN)

 

 

(0.3.28)

для всех пар входных

и выходных

последовательностей

x\X2...xN

и У\У2---Уя

и для

всех

N.

Здесь { Р А , ( 0 ) } И

{Рд2 ( 0 ) } обозначают класс начальных распределений ав­ томатов Л] и А2 соответственно.

В некоторых случаях для установления эквивалент­ ности автоматов удобно пользоваться понятием гомо­

морфизма

автоматов.

 

 

 

 

 

Гомоморфизм

вероятностных

автоматов

[22]. Вероят­

ностный автомат Ai = (X, Y, {T^X/Y)}}

гомоморфно

ото­

бражается

на

вероятностном

автомате

А2

= (Х,

Y,

{T2(XjY)}y,

если

существует такая

матрица

В, число

строк которой равно числу внутренних состояний авто­ мата Л ь число столбцов —• числу внутренних состояний


ВВЕДЕНИЕ

 

 

24

 

 

 

автомата

А2, все строки

матрицы

В

стохастические, а

все ее столбцы линейно независимые,

и для всех х е Х ,

г/еУ справедливо равенство

 

 

Т11/х)В

= ВТ2(у/х).

 

 

(0.3.29)

Если

вероятностный автомат А\

гомоморфно отобра­

жается

на

вероятностном

автомате

А2,

то они стохасти­

чески эквивалентны, причем начальному вектору Pi( 0 >

эквивалентен начальный вектор

Рг'0 ', т. е.

Р2 (0) = Р1 (о)5.

(0.3.30)

Если матрица гомоморфизма В состоит только из ну­ лей и единиц, то автоматы А\ и А2 эквивалентны по со­ стояниям.

Приведем еще некоторые положения, которые пона­

добятся в дальнейшем при исследовании

эквивалент­

ности алгоритмов поиска.

 

 

Ах и

1. Для того чтобы два вероятностных автомата

А2 со случайными реакциями были

эквивалентны

по со­

стояниям, необходимо и достаточно, чтобы

существовал

автомат Аз со случайными реакциями, на котором

гомо­

морфно отображаются автоматы Ах

и А2 [21].

экви­

2. Любой вероятностный автомат

стохастически

валентен некоторому вероятностному автомату Мура. При этом всякий вероятностный автомат со случайными реакциями эквивалентен вероятностному автомату Мура со случайными реакциями [21].

3. Для всякого вероятностного автомата типа Мили, имеющего m внутренних состояний и / входных симво­ лов, можно построить эквивалентный ему по состояниям вероятностный автомат типа Мура, имеющий 1{пг-\-\) внутренних состояний [21].

§ 0.4. АВТОМАТЫ В СЛУЧАЙНЫХ СРЕДАХ

Модель объекта в общем случае можно представить как некоторую случайную среду, с которой взаимодействует автомат — алгоритм поиска. Поэтому •естественно рассмотреть основные положения и резуль­ таты, полученные в области исследования поведения ав-


ВВЕДЕНИЕ

25

томатов в случайных средах [28], учитывая, что имеется

ввиду автомат поиска.

Некоторые дополнительные определения. Рассмотрим

автомат типа Мура. Задаем этот автомат его каноничес­ кими уравнениями

u{t+\)=Q>(u(t),x[t+\))\

(0.4.1)

y(t)=F(u(t)).

(0.4.2)

Переменная t здесь обозначает время. Обычно она

принимает

целочисленные

значения

t=

1,2,...,

N,....

Предполагается,

что входная

переменная

автомата

x(t)

может принимать лишь два значения: 0 и 1, т. е.

 

* = { 0 , 1 } .

 

 

 

 

 

 

 

(0.4.3)

Значение

х = 0 соответствует

единичному

выигрышу ав­

томата,

а

значение х=\

— его единичному проигрышу.

Предполагается,

что

выходная

переменная

y(t)

авто­

мата

А

может

принимать

к

различных

значений

Значения переменной

y(t)

будем

также

называть

действиями автомата. В момент времени t

автомат А

произвел действие уа,

если y(t)=ya

( а = 1 , 2, . . . , х ) . Ав­

томат может находиться в некотором из m его состояний

U\,...,um.

 

Число

m

называется памятью автомата. Оче­

видно, что для автомата с детерминированной

функ­

цией выхода F(u(t))

m ^ x . Автомат А

в момент

времени

t находится в /-м состоянии

( / = 1 , 2, . . . , т ) ,

если

« ( 0 =

= «j.

 

Действие

уа

соответствует

состоянию

Uj, если

F(Uj)

 

а.

 

описывает

зависимость

действия

Уравнение (0.4.2)

автомата

от его состояния,

а уравнение (0.4.1)

изме­

нения

его состояния

под воздействием

входной

перемен­

ной

x(t).

В

случае

детерминированных

автоматов

Q)(u(t),x(t+1))

и

F(u(t))

являются

детерминирован­

ными

 

функциями,

а в

случае

вероятностных

автома­

тов — функциями плотности вероятностей.

 

 

 

Входная переменная

x(t)

принимает лишь

два

значе­

ния:

0 и

1. Поэтому формула

(0.4.1)

задает

пару

«ото­

бражений в себе» множества состояний автомата. Эти отображения будем записывать в виде переходных мат­ риц автомата:

\\ац(х) ||

(0.4.4)

(i,/ = 1, 2, . . . , m;

х = 0, 1).


ВВЕДЕНИЕ

26

Переходные матрицы детерминированного автомата просты: каждая ее строка при любом фиксированном значении х содержит только один элемент, равный еди­ нице, а остальные элементы равны нулю. Переходы де­ терминированного автомата из одного состояния в дру­ гое определяются следующим образом: если в момент t автомат находился в состоянии щ, то в момент t+l он перейдет в такое состояние Uj, для которого

atj(x(t+l))

= l.

(0.4.5)

Для вероятностного (стохастического) автомата пере­ ходные матрицы являются стохастическими. Элементы переходных матриц ац(х) обозначают вероятность пе­ рехода из i-ro состояния в /-е при заданном значении входной переменной х, т. е.

ац(х) = B E P ( u ( * + 1) =Uj/u(t) =щ, х).

(0.4.6)

Детерминированный автомат является частным слу­

чаем вероятностного

автомата.

Случайная

среда.

Обычно различают стационарную

и составную случайные среды. Говорят, что автомат на­

ходится в с т а ц и о н а р н о й

с л у ч а й н о й

с р е д е

[28]

С={ах2

Он),

 

 

 

 

(0.4.7)

 

если действия автомата и значения его входной

перемен­

ной связаны

следующим

образом: действие

уа

(а =

= 1, 2

 

х), произведенное автоматом

в момент

t,

влечет за собой в момент £ +1 значение

х=\

(проиг­

рыш, штраф)

с вероятностью

 

 

 

 

 

 

* а = - Ц ^ -

 

 

 

 

 

 

(0.4.8)

 

и х = 0 (выигрыш)

с вероятностью

 

 

 

 

 

l - s . - i ± ^ .

 

 

 

 

 

(0.4.9)

 

Здесь аа — средний выигрыш автомата при действии

уа.

При этом предполагается, что

 

 

 

 

 

 

| а а | ^ 1 .

 

 

 

 

 

 

(0.4.10)

 

Пусть

в момент

t автомат

находится

в

состоянии

щ

(i=l,

2 , . . . ,

т),

которому

соответствует

действие

г/а ,=


ВВЕДЕНИЕ

27

= F(Ui). Тогда вероятность рц перехода автомата из со­ стояния щ в состояние Uj определяется формулой

Pii = saiaij(l)+

(l-sai)aij(0)

(0.4.11)

 

( i , / = l , 2 , . . . . m).

 

Нетрудно убедиться, что матрица

 

A (S) = \\pijW

 

(0.4.12)

является стохастической. Следовательно, функциониро­ вание автомата в стационарной случайной среде описы­ вается цепью Маркова [29, 30].

Введем диагональную матрицу размерности тХт,. элементами которой являются вероятности штрафов, действия автомата [14, 31]:

Sl

о

о

о

о

0

s2

0

о

о

 

 

 

 

(0.4.13)

О

О

О

о

 

где sj (j l,...,m)

определяется формулой (0.4.8), а

т — память автомата.

 

Тогда при учете формулы (0.4.11) имеем цепь Мар­

кова с матрицей переходных вероятностей

 

A(S)=SAl+(I-S)A0,

(0.4.14)

где Л] и Лг — переходные матрицы

автомата

при про­

игрыше и выигрыше соответственно.

 

 

Обозначим через pi (i=l,... ,т)

финальную

вероят­

ность состояния щ автомата, находящегося в стационар­ ной случайной среде С, а через оа ( а = 1,2,..., и) — сумму финальных вероятностей таких состояний щ, ко­

торым соответствует действие уа.

сга имеет смысл

веро­

ятности действия

уа автомата Л в среде

С. Тогда

в слу­

чае эргодической

цепи Маркова

(0.4.14)

математическое

ожидание W(A,C)

выигрыша для автомата А в среде С

выражается формулой

 

 

 

W(A,C)

 

 

(0.4.15)

а = 1