Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 115

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

где. через I1, £2 и \ обозначены независимые случайные векторы ошибок измерения и начального приближения соответственно.

Компоненты I** и представляют собой ошибки измерения функции F (х) в точках х1 + c;es и х1— c£es. Учитывая ста­ тистическую независимость этих ошибок и предполагая, что

дисперсия ошибок не зависит от х и равна Оі, можно представить разность

- V

в виде случайного вектора £1‘ с статистическими характеристиками

М [1‘} = 0; М [11Ъ1*] = 2о\Е.

Будем предполагать, что статистические характеристики век­ тора начального приближения £ имеют вид

М [|1 = 0; М [|&*] = D E ,

где Е — единичная матрица, D — положительный скалярный параметр.

Рассмотрим итерационную последовательность \х1} в новой системе координат, координаты у в которой связаны с коорди­ натами X старой системы посредством ортогонального преобра­ зования

X = Ау,

где А — ортогональная матрица 1 = А*). Тогда последова­ тельность точек \у1\, соответствующая \х1\

X1 = Ау1,

может быть получена на основе рекуррентного соотношения

у і+1 — у 1а I A*QAy‘ -і-А Г

(304)

Способом, аналогичным описанному в п. 1 данной главы, вы­ берем ортогональную матрицу А из условия приведения матрицы A*QA к диагональному виду:

 

ІК

°\

 

 

I ^2

 

 

A*QA = Л =

I

 

 

 

' ^4 /

 

Обозначим

 

 

 

 

(305)

Л*£' = ц.

Очевидно, что для вектора

г}1 справедливы

условия:

м [V] = о:м [т]Ѵ1 = М

\ А * 1 11 1* А ]

= 2 а \ Е .

9*

131


Учитывая диагональность матрицы А и обозначение (305), получим рекуррентное соотношение (304) в форме

УІ+1 = УІ - at (ЪУ‘ +

-^ 7 4 )

=

y‘s (1 -

a X ) ---- , (306)

s = 1, 2, . .

tv,

i =

0, 1,

2, . . .

Из свойства ортогональности матрицы А и характеристик вектора начального приближения | следует, что статистические характеристики вектора начального приближения у0 в простран­ стве переменных у имеют вид:

 

М [у°] = А*М [§] = 0; М [у°у°* ] = DA А*

= DE.

Поставим задачу определения

наилучших

параметров {ос,-}

и {с,-}

в зависимости от характера F (х), дисперсии о2

и числа ите­

раций

N. С этой целью выведем

уравнение

для

определения

М[F (xw)].

Учитывая рекуррентные соотношения (306), некоррелирован­

ность компонент векторов гр и у0, легко доказать некоррелирован­

ность компонент

вектора у1.

Рекуррентное

соотношение для

М [ ( # ] = Os можно получить, возведя равенство (306)

в квадрат

и усредняя по совокупности:

 

 

 

 

 

Ѳ'+1 =

Ѳ*( 1 -

а i h f

+

(307)

s — 1, 2,

. . . . n\

i =

2 ci

 

0, 1, 2, . . .

 

Очевидно, что

математическое ожидание

значения

функции

F (xN) = F (AyN) после совершения N итерации запишется в виде

М [F (лА)] = М

xN*QxN] = М

yN*AyN = 4-2

(308)

 

 

^ s = l

 

Таким образом, задача определения наилучших последова­ тельностей {аг} и {с,-} свелась к минимизации функции (308) при наличии связей (307).

Из соотношений (307) и (308) можно увидеть, что уменьшение

параметров с,- приводит к увеличению Of и, следовательно, к воз­ растанию М [F(;cA/)]. Однако обычно не имеется возможности увеличивать ct до бесконечности, так как минимизируемая функ­ ция F (х) только в некоторой локальной области может быть пред­ ставлена квадратичной. Поэтому в дальнейшем примем с,- в виде постоянной величины:

Сі = с, і — 1, 2, . . ., п.

Так как минимизируемая функция F (х) предварительно не­ известна, то естественно рассматривать параметры %s (s = 1, 2, . . ., п) в виде случайных параметров. Предположим, что закон распределения этих параметров одинаков для всех Ks и равен

132


р (X). Тогда из соотношений (307), (308) следует, что задача выбора оптимальной последовательности {аг} в рассматриваемой много­ мерной задаче может быть сведена к выбору оптимальной после­ довательности {<%г} в одномерной задаче минимизации математи­ ческого ожидания функционала

/ = -і- J ЯѲ'Ѵ(X) р (X) dX,

(309)

где 0N (X) определяется в результате решения системы рекуррент­ ных соотношений

Ѳг+І = Ѳ; (1 —a£Xf -)-

0° = D,

(310)

i = 0, 1, 2, . . .,

N — 1.

 

К сожалению, аналитическое решение этой задачи имеет отно­ сительно простой вид только для неслучайного и известного зна­ чения X = Х0.

Дифференцируя в этом случае уравнение (309) по ah получим

уравнение связи а,- и Ѳ‘:

 

 

 

0Ѳг+!

0 = — 2Ѳ1(1 — а£Х0)Х0

2ai0j

да{

2с2

 

 

 

Отсюда

 

 

 

 

 

а,

_

Ѳ%

(311)

 

 

ot'l2 j__ 21

ѲЯо + -2?

Подставляя выражение (311) в формулу (310) и решая рекур­ рентное соотношение, получим

Ѳг

(312)

01/2 с2 +

iXqD

Следовательно, дисперсия после совершения конечной N-й итерации выразится соотношением

,лг

Daj/2c2

Ѳ

(313)

 

01/2с2 + NXlD

Из равенств (311) и (312) следует выражение для элементов оптимальной последовательности |а г}

а, —

DXo

 

оу 2с2+ (і + 1) DXq

133


Это выражение было принято за основу для определения квазиоптимальной последовательности {а,-} в задаче (309), (310), когда параметр X случаен и равномерно распределен в интервале (т, М). Легко показать, что эта задача сводится к определению

оптимальной последовательности {а,-} из условия минимума функционала

 

2 - t

 

 

 

ѵ = Т ( Г = 1 ) \ l PN^

dX'

(зн)

 

t

 

 

 

где pN (^) определяется на основании

решения

уравнений

р‘+1 =

р1 (1 — аД)2

-f- а 2,

 

р° = 100,

і = 0, 1, . . .,

N — 1.

Характерной особенностью постановки задачи (314) является условие р° = 100, также то, что параметр X равномерно распреде­ лен на отрезке (t, 2 — t), и, следовательно, М [X] = 1. Между параметрами исходной задачи и задачи (314) существует следу­ ющая связь:

_

I

 

a i ~

M + m ’

Ѳг = p‘D /100;

t =

2m

(315)

m -f- M

а2 _

a f 100

 

2c2D

'

Оптимальная последовательность {аг} в соответствии с выра­ жением (312) может быть записана в виде

— ___

X

аі ~ о2 + (і-f 1)х2 ’

где параметр к определяется методом сканирования на отрезке

((; 2 — /) с интервалом А == 1~ *, т. е. всего просматривается

101 точка. При этом в процессе вычисления функционала (314) интеграл заменялся суммой

ShPN (h),

шk=\

где Xk — t - 1- —у — k\ k — 1, 2, . . ., 5. Такое представление инте­

грала соответствует замене исходного непрерывного равномер­ ного распределения дискретным распределением.

134


С помощью прямых расчетов получена зависимость оптималь­

ного параметра х в зависимости от N,

t и о2.

Естественно,

что при

t = 1 оптимальное

значение х = 1.

При

этом

в соответствии

с формулой

(313) конечное

значение

 

 

 

 

5

 

 

100а2

 

a2/N

(316)

 

 

 

 

5"

 

=

р = а2+ 100ІѴ =

100 o2/N + 100'

Отсюда

следует,

что при t = 1

значение р

зависит

только

от отношения a2IN = е2. В таблице приложения приведена зави­ симость параметра х от N и t при фиксированном значении е2 =

= а 2/N и, следовательно,

при фиксированном значении

k =

100

а2IN

o2/N -f- 100'

Параметр k характеризует то значение pN, которое можно было бы достичь при условии t = 1, т. е. при условии точного знания второй производной минимизируемой квадратичной функ­ ции. Указанные таблицы приведены для следующих значений k:

50; 20; 10; 50; 10; 0,1; 0,05; 0,01; 0,005; 0,001. Такой способ пред­ ставления данных объясняется тем, что в некоторых случаях, из­

меняя дисперсию ошибки вычисления значения функции о2, например методом дополнительного усреднения, можно варьиро­ вать число итераций N, так что общее число ^измерений минимизи­ руемой функции остается постоянным:

82 = o2/N = const.

При этом возникает вопрос о том, что более рационально; совершить значительное число итераций с неточной оценкой гра­ диента или небольшое число итераций с уточненными оценками

градиента. На рис. 37 приведены графики зависимости значения р от параметров t и N при различных значениях е2 при оптимальном

выборе параметра х. Параметр е2 на рис. 37, а, б, в соответственно принимает значения 11,1; 1,01; 0,1.

Из этих графиков видно, что уменьшение параметра t, т. е. увеличение степени неопределенности второй производной функ­ ции, приводит к снижению точности метода стохастической ап­ проксимации. С другой стороны, не рационально выбирать слиш­ ком большое значение N, так как это не снижает существенно

дисперсии р, но увеличивает сложность реализации численной процедуры из-за возрастания числа итерации.

Из графиков видно, что

при t

= 1 точность минимизации р

не зависит от N. Это вполне согласуется с формулой (316).

Пользуясь табл. 1— 10,

легко

получить оптимальный вид

последовательности {а,} для общей задачи (307), (308) в предпо­ ложении равномерности распределения параметра (і = 1 , 2 , .. . ,

135