Файл: Методы оптимизации в статистических задачах управления..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 113
Скачиваний: 0
п) на отрезке (т, М), Для этого, задаваясь значениями D , с, оі и N, определим параметр
100 |
o2/JV |
lOOaf |
о2/1Ѵ+ 100 |
of - f 2Nc2D |
Параметр k характеризует степень уменьшения дисперсии Of по отношению к Ѳ? в предположении, что значение Я фиксировано
ffl I Д/J |
|
|
и (307) |
и равно —^ — . Действительно, из формул (315), (310) |
|||
следует |
|
|
|
k = 1 0 0 І Д = 100-^-, |
( і = 1 , 2, ... , |
п). |
|
В соответствии со значением k |
определяется |
номер |
таблицы |
в приложении и затем по значениям N и t = |
определяется |
оптимальное значение и. Отсюда можно найти оптимальный вид последовательности {а/}:
а г- = ---------- |
2х__________ |
||
50а? |
\ |
||
|
(от + М) ^ + 0 + 1) к2]
136
12. Определение градиента в условиях помех
При применении метода стохастической аппроксимации или любого другого метода минимизации функции в условиях помех обычно возникает потребность вычисления оценки градиента минимизируемой функции F (х) или более старших производных в точке очередного приближения х‘. Причем, так как обычно ана литическое выражение функций неизвестно, то оценки градиента или вторых частных производных получаются в виде отношения конечных разностей. Рассмотрим случай вычисления первых частных производных функции F (х). Предположим, что функ ция F (х) вычисляется на ЦВМ методом Монте-Карло на основе определения среднего значения некоторой функции Ф (х , £), где £ — случайный вектор с известным распределением
F (х) = М [Ф (х, I)].
Функция Ф (х, £), как и F (х), неизвестна, однако в результате моделирования ее значение можно определить для любой сово купности (х, £). Будем предполагать, что оценка среднего значе ния функции Ф (х, £) производится по т испытаниям. Тогда оценка s-й частной производной функции F (х) будет иметь сле дующий вид
|
dF(x) |
_ |
F(x + |
Aes) — F (x — Aes) _ |
|
|
|
|
dxs |
|
|
2A |
|
|
|
|
m |
|
|
m |
Ф (x — Де5, |
if) |
|
|
2 ф (x + Aes, gO — 2 |
|
|||||
|
i= 1__________________t=i________________ |
(317) |
|||||
|
|
|
|
2 Am |
|
|
|
где |
и y\l — значения |
случайных |
векторов |
в |
статистических |
||
исйытаниях. |
|
и іф (і = 1, |
2, . . ., т) |
попарно незави- |
|||
|
Предположим, что |
|
|||||
|
~ |
|
|
dF{x) |
л |
|
|
симы. Тогда дисперсия оценки |
д |
будет иметь вид |
|||||
|
D - d F (X) - |
D [Ф (х — Aes, I)] + D [Ф (х — Де5, г))1 |
|||||
|
. dxs . |
|
|
4 Д2т |
|
|
Предполагая, что величина А достаточно мала, так что |
|
|||
D [Ф (х -f Де5, I)] л* D [Ф (x — Ae5, |
ц)] |
D [Ф (x, |
!)], |
|
получим выражение для дисперсии |
|
|
|
|
Г dF (х) |
Р[ф(*. і)1 |
|
(318) |
|
D L дХ5 . |
2 Д2т |
' |
|
Следовательно, с уменьшением А дисперсия оценки частной производной возрастает до бесконечности.
137
Другим подходом |
[76] |
dF (я) |
является исполь- |
вычисления .д |
|||
зование в выражении (317) |
ох$ |
|
|
одних и тех же реализаций векторов |
|||
V — у]1 (і = 1, 2, . . |
т). |
Очевидно, что такой способ статисти |
ческого моделирования не повлияет на математическое ожидание оценки. Дисперсия оценки будет выражаться равенством
D Г dF (je) 1 |
— Г) |
Гф(х + |
Де5, б ) - Ф |
( х - Д е М ) І |
. dxs . |
|
L |
2Д |
J |
|
|
D |
ГдФ(*, I) |
(319) |
|
|
|
dxs |
|
Сравнивая формулы (318) и (319), можно заключить, что при достаточно малом значении А второй метод, называемый методом зависимых испытаний, оказывается более экономичным. В част ности, если влияние вектора | в функции Ф (х, £) можно предста вить в виде аддитивного слагаемого
Ф(х, I) = ФХ(*) + Ф а (5),
то, как видно из формулы (319), метод зависимых испытаний дает точную оценку частной производной. В монографии Ю. Г. Полляка [76] приведены примеры, иллюстрирующие эффективность применения зависимых испытаний в процессе оптимизации систем.
Для некоторого частного класса задач [6] можно получить еще более экономичное в смысле объема вычислений выражение для градиента функции и матрицы вторых производных, чем метод зависимых испытаний.
Предположим, что минимизируемая функция F (х), как и ра нее, вычисляется в виде среднего значения некоторой функции
Ф (?, г]): |
|
F(x) = М [Ф (I, т])], |
(320) |
где плотность вероятности р (£, х) вектора £ зависит от вектора х, а плотность вероятности вектора rj равна / (rj). Относительно функции р (I, х) предполагается выполнение следующих усло вий:
1) функция должна быть дифференцируема по всем компонен там вектора х при любом значении
2) при произвольных значениях х и | функция р (£, х) =/= 0. Конечно, такие предположения относительно функции Р (Е. х) удовлетворяются не во всех задачах, но практически для
всех интересных случаев можно сколь угодно точно аппроксими ровать истинный закон распределения некоторым другим законом, для которого указанные условия выполняются. Заметим, что тре буемые условия оказываются выполненными, если вектор £ рас-
138
пределен по нормальному закону, а вектор х характеризует его математическое ожидание:
Р(Ъ, х) = |
n/ZiftPA ехР {— |
І ^ - * ) * 0"1 (£ -* )} |
= |
|||
|
(2п)п'г \ ѲI |
|
|
|
|
|
|
exp - T |
S S |
|
Ѳп1(a |
■*<)(£/ |
(321) |
(2п)п/2 I ѲI |
=i /=i |
|
|
|
||
где Q7jl — элементы матрицы |
Ѳ_1, |
которая |
является |
обратной |
матрицей по отношению к дисперсионной матрице Ѳ; | Ѳ| — опре делитель матрицы Ѳ.
Подобная задача возникает, например, при выборе оптималь ных средних значений случайных параметров системы регулиро вания, находящейся под воздействием случайного полезного сигнала и помехи. В этом случае вектор а представляет истинные значения случайных параметров в системе. С помощью вектора т] можно представить полезный сигнал и помеху, если воспользо ваться методом канонического разложения случайного про цесса [82]. Показателем качества работы системы может служить квадрат ошибки в некоторый фиксированный момент времени:
Ф (I, т]) = еа.
Из соотношения (320) следует, что функция F (х) может быть представлена в виде
F (х) = J J Ф (а, г,) Р (É, X) f (л) dl йц. |
(322) |
Для получения частной производной функции F (х) продиф ференцируем выражение (322) по х{ и, учитывая сделанные отно сительно р (а, х) предположения, получим
дР(Х) = Ші И |
Ф & Л) Р (£, х) / (л) dl di\ = |
|
||||
дхі |
|
|
|
|
|
|
= J j ф |
(2Л), д~д77Х) f (Л) dl dr\ = |
|
|
|||
=■ J J ф (S. n) |
ö ln р (I, |
X) |
Р (l, X) f |
Cn) dl dr\ = |
|
|
вхі |
|
|
||||
= м [Ф (а,т))0,Ox,пр(|’х> (i= 1, |
2 |
n). |
(323) |
В векторной форме это равенство имеет вид
дх |
М ф (6. л) |
дх |
х) ' |
дР{х) |
|
д In р (I, |
Формула (323) дает возможность свести вычисление градиента функции F (X) к вычислению математического ожидания некото-
139
рои вектор-функции. Это обстоятельство позволяет определять
dF (X) |
на основании метода Монте-Карло: |
одновременно F (х) и ^ |
|
|
N |
dF (х) 2
дх N
п k=\
N
Ф (£*, т,*) д In р {lk, X)
дх
(324)
(325)
где N — число |
испытаний; £к, rjfe — значения случайных век |
торов £ и т] в |
k-u испытании. |
При проведении расчетов по формулам (324), (325) на ЦВМ основное машинное время, как правило, тратится на формирова
ние случайных векторов \ к и цк с заданными законами |
распреде |
ления и на вычисление функции Ф (Ік, тЦ), так как для |
этого не |
обходимо провести моделирование работы |
всей системы. Следова |
тельно, совместное вычисление F (х) и |
по формулам |
(324), (325) не намного увеличивает объем расчетов по сравнению
свычислением только функции F (х).
Внекоторых случаях для ускорения сходимости итерационных методов нахождения минимума функции оказывается целесообраз-
ным использовать матрицу вторых производных d2F Выражение
для элементов этой матрицы можно получить дифференцирова нием выражения (323) по х;-:
|
d2F (х) |
_ д |
|
а р ’ Х) Р (£, |
х) / |
(ti) dl dr1= |
||
|
дхI.дх.1 |
„ Л) |
||||||
|
дх.1 |
|
|
І |
|
|
|
|
|
|
|
|
Э2 1п р (£, |
х) |
|
|
|
|
|
= м ф (і, л) |
дх.дх. |
|
|
|
||
|
+ |
din р (£, X) д In р (£, |
X) |
і, / = 1, 2, . . ., п. |
||||
|
д х . |
д х . |
|
|||||
|
|
і |
J |
|
|
|
|
|
Матричная форма этого равенства имеет вид |
||||||||
|
л |
д2 F (х) = М |
ф |
( |
5 ( ,д2 1пл |
р ()£, х{) |
+ |
|
|
дх2 |
|
|
дх2 |
|
|
||
|
|
Р (£. *) |
( д \ п р (£, X) \ П1 |
(326) |
||||
|
|
дх |
|
\ |
дх |
) |
Л ’ |
|
где |
|
d2F (х) \ |
|
d2F (х) |
|
|
|
|
|
|
|
|
|
|
|||
|
|
дх2 ) tj ~ |
дх. дх. |
|
|
|
||
Таким образом, как и при |
нахождении |
градиента функции |
||||||
dF (х) |
вычисление матрицы |
вторых |
производных сводится к вы- |
|||||
дх |
’ |
|
|
|
|
|
|
|
140