Файл: Методы оптимизации в статистических задачах управления..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 115
Скачиваний: 0
где. через I1, £2 и \ обозначены независимые случайные векторы ошибок измерения и начального приближения соответственно.
Компоненты I** и представляют собой ошибки измерения функции F (х) в точках х1 + c;es и х1— c£es. Учитывая ста тистическую независимость этих ошибок и предполагая, что
дисперсия ошибок не зависит от х и равна Оі, можно представить разность
- V
в виде случайного вектора £1‘ с статистическими характеристиками
М [1‘} = 0; М [11Ъ1*] = 2о\Е.
Будем предполагать, что статистические характеристики век тора начального приближения £ имеют вид
М [|1 = 0; М [|&*] = D E ,
где Е — единичная матрица, D — положительный скалярный параметр.
Рассмотрим итерационную последовательность \х1} в новой системе координат, координаты у в которой связаны с коорди натами X старой системы посредством ортогонального преобра зования
X = Ау,
где А — ортогональная матрица (А 1 = А*). Тогда последова тельность точек \у1\, соответствующая \х1\
X1 = Ау1,
может быть получена на основе рекуррентного соотношения
у і+1 — у 1— а I A*QAy‘ -і-А Г |
(304) |
Способом, аналогичным описанному в п. 1 данной главы, вы берем ортогональную матрицу А из условия приведения матрицы A*QA к диагональному виду:
|
ІК |
°\ |
|
|
I ^2 |
|
|
A*QA = Л = |
I |
|
|
|
\о |
' ^4 / |
|
Обозначим |
|
|
|
|
|
(305) |
|
Л*£' = ц. |
|||
Очевидно, что для вектора |
г}1 справедливы |
условия: |
|
м [V] = о:м [т]Ѵ1 = М |
\ А * 1 11 1* А ] |
= 2 а \ Е . |
9* |
131 |
Учитывая диагональность матрицы А и обозначение (305), получим рекуррентное соотношение (304) в форме
УІ+1 = УІ - at (ЪУ‘ + |
-^ 7 4 ) |
= |
y‘s (1 - |
a X ) ---- , (306) |
s = 1, 2, . . |
tv, |
i = |
0, 1, |
2, . . . |
Из свойства ортогональности матрицы А и характеристик вектора начального приближения | следует, что статистические характеристики вектора начального приближения у0 в простран стве переменных у имеют вид:
|
М [у°] = А*М [§] = 0; М [у°у°* ] = DA А* |
= DE. |
||
Поставим задачу определения |
наилучших |
параметров {ос,-} |
||
и {с,-} |
в зависимости от характера F (х), дисперсии о2 |
и числа ите |
||
раций |
N. С этой целью выведем |
уравнение |
для |
определения |
М[F (xw)].
Учитывая рекуррентные соотношения (306), некоррелирован
ность компонент векторов гр и у0, легко доказать некоррелирован
ность компонент |
вектора у1. |
Рекуррентное |
соотношение для |
|||
М [ ( # ] = Os можно получить, возведя равенство (306) |
в квадрат |
|||||
и усредняя по совокупности: |
|
|
|
|
||
|
Ѳ'+1 = |
Ѳ*( 1 - |
а i h f |
+ |
’ |
(307) |
s — 1, 2, |
. . . . n\ |
i = |
2 ci |
|
||
0, 1, 2, . . . |
|
|||||
Очевидно, что |
математическое ожидание |
значения |
функции |
F (xN) = F (AyN) после совершения N итерации запишется в виде
М [F (лА)] = М |
xN*QxN] = М |
yN*AyN = 4-2 |
(308) |
|
|
^ s = l |
|
Таким образом, задача определения наилучших последова тельностей {аг} и {с,-} свелась к минимизации функции (308) при наличии связей (307).
Из соотношений (307) и (308) можно увидеть, что уменьшение
параметров с,- приводит к увеличению Of и, следовательно, к воз растанию М [F(;cA/)]. Однако обычно не имеется возможности увеличивать ct до бесконечности, так как минимизируемая функ ция F (х) только в некоторой локальной области может быть пред ставлена квадратичной. Поэтому в дальнейшем примем с,- в виде постоянной величины:
Сі = с, і — 1, 2, . . ., п.
Так как минимизируемая функция F (х) предварительно не известна, то естественно рассматривать параметры %s (s = 1, 2, . . ., п) в виде случайных параметров. Предположим, что закон распределения этих параметров одинаков для всех Ks и равен
132
р (X). Тогда из соотношений (307), (308) следует, что задача выбора оптимальной последовательности {аг} в рассматриваемой много мерной задаче может быть сведена к выбору оптимальной после довательности {<%г} в одномерной задаче минимизации математи ческого ожидания функционала
/ = -і- J ЯѲ'Ѵ(X) р (X) dX, |
(309) |
где 0N (X) определяется в результате решения системы рекуррент ных соотношений
Ѳг+І = Ѳ; (1 —a£Xf -)- |
0° = D, |
(310) |
i = 0, 1, 2, . . ., |
N — 1. |
|
К сожалению, аналитическое решение этой задачи имеет отно сительно простой вид только для неслучайного и известного зна чения X = Х0.
Дифференцируя в этом случае уравнение (309) по ah получим
уравнение связи а,- и Ѳ‘: |
|
|
|
||
0Ѳг+! |
0 = — 2Ѳ1(1 — а£Х0)Х0 |
2ai0j |
|||
да{ |
2с2 |
||||
|
|
|
|||
Отсюда |
|
|
|
|
|
|
а, |
_ |
Ѳ% |
(311) |
|
|
|
ot'l2 j__ 21 |
ѲЯо + -2?
Подставляя выражение (311) в формулу (310) и решая рекур рентное соотношение, получим
Ѳг |
(312) |
01/2 с2 + |
iXqD |
Следовательно, дисперсия после совершения конечной N-й итерации выразится соотношением
,лг |
Daj/2c2 |
Ѳ |
(313) |
|
01/2с2 + NXlD |
Из равенств (311) и (312) следует выражение для элементов оптимальной последовательности |а г}
а, — |
DXo |
|
оу 2с2+ (і + 1) DXq |
133
Это выражение было принято за основу для определения квазиоптимальной последовательности {а,-} в задаче (309), (310), когда параметр X случаен и равномерно распределен в интервале (т, М). Легко показать, что эта задача сводится к определению
оптимальной последовательности {а,-} из условия минимума функционала
|
2 - t |
|
|
|
ѵ = Т ( Г = 1 ) \ l PN^ |
dX' |
(зн) |
||
|
t |
|
|
|
где pN (^) определяется на основании |
решения |
уравнений |
||
р‘+1 = |
р1 (1 — аД)2 |
-f- а 2, |
|
|
р° = 100, |
і = 0, 1, . . ., |
N — 1. |
Характерной особенностью постановки задачи (314) является условие р° = 100, также то, что параметр X равномерно распреде лен на отрезке (t, 2 — t), и, следовательно, М [X] = 1. Между параметрами исходной задачи и задачи (314) существует следу ющая связь:
_ |
2аI |
|
a i ~ |
M + m ’ |
|
Ѳг = p‘D /100; |
||
t = |
2m |
(315) |
m -f- M ’ |
||
а2 _ |
a f 100 |
|
2c2D |
' |
Оптимальная последовательность {аг} в соответствии с выра жением (312) может быть записана в виде
— ___ |
X |
аі ~ о2 + (і-f 1)х2 ’
где параметр к определяется методом сканирования на отрезке
((; 2 — /) с интервалом А == 1~ *, т. е. всего просматривается
101 точка. При этом в процессе вычисления функционала (314) интеграл заменялся суммой
ShPN (h),
шk=\
где Xk — t - 1- —у — k\ k — 1, 2, . . ., 5. Такое представление инте
грала соответствует замене исходного непрерывного равномер ного распределения дискретным распределением.
134
С помощью прямых расчетов получена зависимость оптималь
ного параметра х в зависимости от N, |
t и о2. |
Естественно, |
что при |
||||
t = 1 оптимальное |
значение х = 1. |
При |
этом |
в соответствии |
|||
с формулой |
(313) конечное |
значение |
|
|
|
|
|
5 |
|
|
100а2 |
|
a2/N |
(316) |
|
|
|
|
|
||||
5" |
|
= |
р = а2+ 100ІѴ = |
100 o2/N + 100' |
|||
Отсюда |
следует, |
что при t = 1 |
значение р |
зависит |
только |
от отношения a2IN = е2. В таблице приложения приведена зави симость параметра х от N и t при фиксированном значении е2 =
= а 2/N и, следовательно, |
при фиксированном значении |
|
k = |
100 |
а2IN |
o2/N -f- 100' |
Параметр k характеризует то значение pN, которое можно было бы достичь при условии t = 1, т. е. при условии точного знания второй производной минимизируемой квадратичной функ ции. Указанные таблицы приведены для следующих значений k:
50; 20; 10; 50; 10; 0,1; 0,05; 0,01; 0,005; 0,001. Такой способ пред ставления данных объясняется тем, что в некоторых случаях, из
меняя дисперсию ошибки вычисления значения функции о2, например методом дополнительного усреднения, можно варьиро вать число итераций N, так что общее число ^измерений минимизи руемой функции остается постоянным:
82 = o2/N = const.
При этом возникает вопрос о том, что более рационально; совершить значительное число итераций с неточной оценкой гра диента или небольшое число итераций с уточненными оценками
градиента. На рис. 37 приведены графики зависимости значения р от параметров t и N при различных значениях е2 при оптимальном
выборе параметра х. Параметр е2 на рис. 37, а, б, в соответственно принимает значения 11,1; 1,01; 0,1.
Из этих графиков видно, что уменьшение параметра t, т. е. увеличение степени неопределенности второй производной функ ции, приводит к снижению точности метода стохастической ап проксимации. С другой стороны, не рационально выбирать слиш ком большое значение N, так как это не снижает существенно
дисперсии р, но увеличивает сложность реализации численной процедуры из-за возрастания числа итерации.
Из графиков видно, что |
при t |
= 1 точность минимизации р |
не зависит от N. Это вполне согласуется с формулой (316). |
||
Пользуясь табл. 1— 10, |
легко |
получить оптимальный вид |
последовательности {а,} для общей задачи (307), (308) в предпо ложении равномерности распределения параметра (і = 1 , 2 , .. . ,
135