Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 113

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

п) на отрезке (т, М), Для этого, задаваясь значениями D , с, оі и N, определим параметр

100

o2/JV

lOOaf

о2/1Ѵ+ 100

of - f 2Nc2D

Параметр k характеризует степень уменьшения дисперсии Of по отношению к Ѳ? в предположении, что значение Я фиксировано

ffl I Д/J

 

 

и (307)

и равно —^ — . Действительно, из формул (315), (310)

следует

 

 

 

k = 1 0 0 І Д = 100-^-,

( і = 1 , 2, ... ,

п).

 

В соответствии со значением k

определяется

номер

таблицы

в приложении и затем по значениям N и t =

определяется

оптимальное значение и. Отсюда можно найти оптимальный вид последовательности {а/}:

а г- = ----------

2х__________

50а?

\

 

(от + М) ^ + 0 + 1) к2]

136


12. Определение градиента в условиях помех

При применении метода стохастической аппроксимации или любого другого метода минимизации функции в условиях помех обычно возникает потребность вычисления оценки градиента минимизируемой функции F (х) или более старших производных в точке очередного приближения х‘. Причем, так как обычно ана­ литическое выражение функций неизвестно, то оценки градиента или вторых частных производных получаются в виде отношения конечных разностей. Рассмотрим случай вычисления первых частных производных функции F (х). Предположим, что функ­ ция F (х) вычисляется на ЦВМ методом Монте-Карло на основе определения среднего значения некоторой функции Ф (х , £), где £ — случайный вектор с известным распределением

F (х) = М (х, I)].

Функция Ф (х, £), как и F (х), неизвестна, однако в результате моделирования ее значение можно определить для любой сово­ купности (х, £). Будем предполагать, что оценка среднего значе­ ния функции Ф (х, £) производится по т испытаниям. Тогда оценка s-й частной производной функции F (х) будет иметь сле­ дующий вид

 

dF(x)

_

F(x +

Aes) — F (x — Aes) _

 

 

 

dxs

 

 

2A

 

 

 

 

m

 

 

m

Ф (x Де5,

if)

 

 

2 ф (x + Aes, gO — 2

 

 

i= 1__________________t=i________________

(317)

 

 

 

 

2 Am

 

 

 

где

и y\l — значения

случайных

векторов

в

статистических

исйытаниях.

 

и іф = 1,

2, . . ., т)

попарно незави-

 

Предположим, что

 

 

~

 

 

dF{x)

л

 

 

симы. Тогда дисперсия оценки

д

будет иметь вид

 

D - d F (X) -

D — Aes, I)] + D (х — Де5, г))1

 

. dxs .

 

 

4 Д2т

 

 

Предполагая, что величина А достаточно мала, так что

 

D [Ф (х -f Де5, I)] л* D [Ф (x — Ae5,

ц)]

D [Ф (x,

!)],

получим выражение для дисперсии

 

 

 

Г dF (х)

Р[ф(*. і)1

 

(318)

D L дХ5 .

2 Д2т

'

 

Следовательно, с уменьшением А дисперсия оценки частной производной возрастает до бесконечности.

137


Другим подходом

[76]

dF (я)

является исполь-

вычисления .д

зование в выражении (317)

ох$

 

одних и тех же реализаций векторов

V у]1 (і = 1, 2, . .

т).

Очевидно, что такой способ статисти­

ческого моделирования не повлияет на математическое ожидание оценки. Дисперсия оценки будет выражаться равенством

D Г dF (je) 1

Г)

Гф(х +

Де5, б ) - Ф

( х - Д е М ) І

. dxs .

 

L

J

 

 

D

ГдФ(*, I)

(319)

 

 

 

dxs

 

Сравнивая формулы (318) и (319), можно заключить, что при достаточно малом значении А второй метод, называемый методом зависимых испытаний, оказывается более экономичным. В част­ ности, если влияние вектора | в функции Ф (х, £) можно предста­ вить в виде аддитивного слагаемого

Ф(х, I) = ФХ(*) + Ф а (5),

то, как видно из формулы (319), метод зависимых испытаний дает точную оценку частной производной. В монографии Ю. Г. Полляка [76] приведены примеры, иллюстрирующие эффективность применения зависимых испытаний в процессе оптимизации систем.

Для некоторого частного класса задач [6] можно получить еще более экономичное в смысле объема вычислений выражение для градиента функции и матрицы вторых производных, чем метод зависимых испытаний.

Предположим, что минимизируемая функция F (х), как и ра­ нее, вычисляется в виде среднего значения некоторой функции

Ф (?, г]):

 

F(x) = М (I, т])],

(320)

где плотность вероятности р (£, х) вектора £ зависит от вектора х, а плотность вероятности вектора rj равна / (rj). Относительно функции р (I, х) предполагается выполнение следующих усло­ вий:

1) функция должна быть дифференцируема по всем компонен­ там вектора х при любом значении

2) при произвольных значениях х и | функция р (£, х) =/= 0. Конечно, такие предположения относительно функции Р (Е. х) удовлетворяются не во всех задачах, но практически для

всех интересных случаев можно сколь угодно точно аппроксими­ ровать истинный закон распределения некоторым другим законом, для которого указанные условия выполняются. Заметим, что тре­ буемые условия оказываются выполненными, если вектор £ рас-

138


пределен по нормальному закону, а вектор х характеризует его математическое ожидание:

Р(Ъ, х) =

n/ZiftPA ехР {—

І ^ - * ) * 0"1 (£ -* )}

=

 

(2п)п'г \ ѲI

 

 

 

 

 

 

exp - T

S S

 

Ѳп1(a

■*<)(£/

(321)

(2п)п/2 I ѲI

=i /=i

 

 

 

где Q7jl — элементы матрицы

Ѳ_1,

которая

является

обратной

матрицей по отношению к дисперсионной матрице Ѳ; | Ѳ| — опре­ делитель матрицы Ѳ.

Подобная задача возникает, например, при выборе оптималь­ ных средних значений случайных параметров системы регулиро­ вания, находящейся под воздействием случайного полезного сигнала и помехи. В этом случае вектор а представляет истинные значения случайных параметров в системе. С помощью вектора т] можно представить полезный сигнал и помеху, если воспользо­ ваться методом канонического разложения случайного про­ цесса [82]. Показателем качества работы системы может служить квадрат ошибки в некоторый фиксированный момент времени:

Ф (I, т]) = еа.

Из соотношения (320) следует, что функция F (х) может быть представлена в виде

F (х) = J J Ф (а, г,) Р (É, X) f (л) dl йц.

(322)

Для получения частной производной функции F (х) продиф­ ференцируем выражение (322) по х{ и, учитывая сделанные отно­ сительно р (а, х) предположения, получим

дР(Х) = Ші И

Ф & Л) Р (£, х) / (л) dl di\ =

 

дхі

 

 

 

 

 

 

= J j ф

(2Л), д~д77Х) f (Л) dl dr\ =

 

 

=■ J J ф (S. n)

ö ln р (I,

X)

Р (l, X) f

Cn) dl dr\ =

 

вхі

 

 

= м [Ф (а,т))0,Ox,пр(|’х> (i= 1,

2

n).

(323)

В векторной форме это равенство имеет вид

дх

М ф (6. л)

дх

х) '

дР{х)

 

д In р (I,

Формула (323) дает возможность свести вычисление градиента функции F (X) к вычислению математического ожидания некото-

139


рои вектор-функции. Это обстоятельство позволяет определять

dF (X)

на основании метода Монте-Карло:

одновременно F (х) и ^

 

N

dF (х) 2

дх N

п k=\

N

Ф (£*, т,*) д In р {lk, X)

дх

(324)

(325)

где N — число

испытаний; £к, rjfe — значения случайных век­

торов £ и т] в

k-u испытании.

При проведении расчетов по формулам (324), (325) на ЦВМ основное машинное время, как правило, тратится на формирова­

ние случайных векторов \ к и цк с заданными законами

распреде­

ления и на вычисление функции Ф (Ік, тЦ), так как для

этого не­

обходимо провести моделирование работы

всей системы. Следова­

тельно, совместное вычисление F (х) и

по формулам

(324), (325) не намного увеличивает объем расчетов по сравнению

свычислением только функции F (х).

Внекоторых случаях для ускорения сходимости итерационных методов нахождения минимума функции оказывается целесообраз-

ным использовать матрицу вторых производных d2F Выражение

для элементов этой матрицы можно получить дифференцирова­ нием выражения (323) по х;-:

 

d2F (х)

_ д

 

а р ’ Х) Р (£,

х) /

(ti) dl dr1=

 

дхI.дх.1

„ Л)

 

дх.1

 

 

І

 

 

 

 

 

 

 

Э2 1п р (£,

х)

 

 

 

 

= м ф (і, л)

дх.дх.

 

 

 

 

+

din р (£, X) д In р (£,

X)

і, / = 1, 2, . . ., п.

 

д х .

д х .

 

 

 

і

J

 

 

 

 

 

Матричная форма этого равенства имеет вид

 

л

д2 F (х) = М

ф

(

5 ( ,д2 1пл

р ()£, х{)

+

 

дх2

 

 

дх2

 

 

 

 

Р (£. *)

( д \ п р (£, X) \ П1

(326)

 

 

дх

 

\

дх

)

Л

 

где

 

d2F (х) \

 

d2F (х)

 

 

 

 

 

 

 

 

 

 

 

дх2 ) tj ~

дх. дх.

 

 

 

Таким образом, как и при

нахождении

градиента функции

dF (х)

вычисление матрицы

вторых

производных сводится к вы-

дх

 

 

 

 

 

 

 

140