Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

Скачать файл (13,51Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 250

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

100	М И Н И М И З А Ц И Я Ф У Н К Ц И Й М НОГИ Х ПЕРЕМЕННЫ Х	[ Г л . 2
где Г =	inf J (и), а В >■ 0 — некоторая константа, не зависящая от п.
	иеи

Д о к а з а т е л ь с т в о . Сначала покажем, что при выполнении условий теоремы величину а п из (8) можно искать в виде [82, 155] an==YnPn, где

• - min ( l ; - L - - — ),			0 < e i < V „ < 2(1~					e)-	(« = 0 , 1 , . . . ) , (Ю)
l	I	- UnP J					L
a e, Sj — заданные параметры алгоритма,							0<^е1 <		2 ^ ~ е^г 0<<в<<1.
Возможно,	или
Р„ =	К	I J п(Цп) 1	> ИЛИ	1J п(цп) \|			<Р„ =		[ ^п (Цп) \|	J
Р„ =	К	_	> ИЛИ		D 2		<Р„ =
		IUn — Un Р			D 2				\ и п — и п \|а
где D — диаметр множества U. В					обоих		случаях		имеем
0 < P n —	~ -	< 1 ;	min \| l;		■' ^	--'j <		Р„ < 1 (л =		0 , 1 , . . . ) .
										( И )
Заметим, что		если ип= ип или / п (« л )= 0,						то ип — стационарная

точка. В этом случае, как уже говорилось выше, итерации прекра щаются и при необходимости проводится дополнительное изуче

ние поведения функции в_ окрестности			точки	В дальнейшем
будем предполагать, что ипф и п> J n(un) # 0 .
Из формулы (1.18) при v = и„, « =			«„4-1 имеем
J . K ) — J	(“п+1) >	a n\JnЮ \|-------I ип— ип \|2 =
= « J	J а (“я) I	2	I Jn (Ия) \| )

Отсюда с учетом (10— 11)		получим
J(u n) — J (Ия+ i) > о л \|/л (йя)\|^1 —			>	ССПЕ I J n (йп) I >
> e 1e m	i n \| l ; ^ ^ i \| \| 4 ( « n)\| (« =			0 , 1 , . . . ) .	(12)

Повторяя рассуждения, аналогичные проведенным в доказатель стве предыдущей теоремы,' из (12) имеем /п (йп)->-0 («->-оо), а также убеждаемся в том, что в случае выпуклости /(«) последо вательность {«л} будет минимизирующей.

Метод

сопряженных градиентов

101

Так как

J n («„)-»• 0, то

т1П { 1; ~БГ I Jn (“»)l} =

i Jn[fan)\

при)£всех) п >

п0,

и неравенство

(12) перепишется в

виде

а п — ап+х > -ЦЧ J n fan) |2, п >

п0.

Согласно оценке

(6) |/л (ы„) |>

а„,

поэтому

an — an+i > - ^ - a 2n ,

п > п 0.

помощью леммы 1.2

отсюда имеем

ап <

»о Ч~ 1

« > л 0;

евх

оценке'(9)

остается

принять Д =

т а х / - ^ —;

<з01

(я0 + 1 ) . А

(

ева

Упражнение. Описать различные варианты метода условного

градиента

для

функций

(и)

упражнений

1.15— 16, когда

U = {и : |п— их| < ^ },

или

U = {и : а^ Щ г^ р ,-,

i = l , . . . , m},

щ ^ Е т, R, a*,

заданы.

Написать оценки

(4),

(9)

с указанием явных выражений для

констант С,

В через данные рассматриваемой задачи.

§7. МЕТОД СОПРЯЖЕННЫХ ГРАДИЕНТОВ

1.Пусть функция J(u)<=Cl (Em). Для минимизации этой фу ции на всем пространстве Ет можно использовать метод сопря женных градиентов, суть которого заключается в построении сле дующего итерационного процесса. Пусть начальное приближение и0 известно. Далее строим последовательность {ип} по правилам

^л+1	^л	CLnрп (П		0,	1, •••),		( 1)
Ро ^ fao) > Р п	J	fan)	РлРл—1		fa == 1, 2, •■•),		(2)
где величины ап, рл выбираются из условий
g n (ап) = min gn (a),			gn (а) =		J (ип— арп)		(3)
а>0
и
(J'	(ип), J ' (M n -i) —			J ' fan))		п £ 1 !,
Р„ =		1г (Ия- i ) Is					(4)

о, « 6 / 2,

102	М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О Г И Х П ЕРЕМЕННЫ Х	[Г а. 2
а множества индексов 1ц /2 таковы, что /iU^2 = {0, 1, 2, . . . } ,		0е / 2.

В зависимости от выбора множеств /i, /2 молено получить различ ные варианты метода сопряженных градиентов. В‘ частности, если

/ i — 0 ,	/2= {0, 1,	2, . . . },	то Рп= 0 при всех п, и метод превратится
в уже	известный	нам	метод скорейшего	спуска.	Если	/2 = {0},
/i = {l,	2, . . . }, то получим обычный, классический вариант метода
сопряженных градиентов. Если /2= { 0 , s,				2s, 3s, . . . },	то	придем к
так называемому s -шаговому методу скорейшего спуска						(на прак

тике часто принимают s, равным размерности и). Те значения п,

для которых Р« = 0, называют моментами обновления метода.			Оче
видно, что J (ий)	(« 1)	(ип)^ -. ■.
Оказывается,	метод	сопрялсенных градиентов сходится,	вооб

ще говоря, быстрее градиентного метода и в то лее время нена много сложнее метода скорейшего спуска. Более того, для задачи минимизации квадратичной функции метод сопряженных градиен тов в отличие от градиентных методов сходится за конечное число шагов (см. ниже теорему 1). Отсюда следует, что эффективность метода сопрялсенных градиентов возрастает на завершающем эта пе поиска минимума, когда последовательные приблшкення близки к точке минимума, ибо в окрестности минимума достаточно глад кая функция, вообще говоря, близка к квадратичной выпуклой функции. Это обстоятельство подтверждается таклсе и практиче ским опытом решения конкретных задач минимизации.

Принятая здесь схема (1) — (4) метода сопряженных градиен

тов предложена и исследована в работе [190]1; обзор	других схем
и модификаций, обсуждение практического опыта	применения

этого метода см. в работах [27, 35, 84, 149, 166, 170, 190, 235, 266].

Перейдем к исследованию сходимости метода сопрялсенных

градиентов. (1) — (4). Для этого сначала докалсем							некоторые свой
ства последовательностей,			получаемых	по формулам (1)-— (4).
Л е м м а	1. Пусть	J ( u ) ^ C l (E,„).		Тогда		при любом		выборе
множества индексов Д,		/2,	лишь бы /1U/2 =		{0,	1,	2, . . . }, Of=/2,		по
следовательности {пп}, {Рп} удовлетворяют соотношениям
(J'(un+l) ,p n) = О,		(J'(u n) ,p n) = \J’ (un)\z				(п =	0, 1, . . . )		(5)
и
\|р„Г =	1^(«„)\|2 +	Рл\|рп-.\|2 > \| Д (и л)\|2 (Л =					1,2, . . . ) .		(6)
Д о к а з а т е л ь с т в о .			Соотношения		(6)	являются		простым

следствием равенств (2), (5), поэтому достаточно доказать (5). Воспользуемся методом полной математической индукции. Так

как /?о = Д («о), то второе из	равенств	(5)	при		п = 0	очевидно, а
1 Следует заметить, что в [190]	выражение для		\|3П дано с точностью до зна
ка. Это проще всего обнаружить проверкой условия				[Арп, Рп-0 = 0 , имеющего
место для квадратичных функций^	(см. ниже	лемму		2);	эта же	ошибка по
вторена в работе [35].

S 7]		Метод сопряженных градиентов							103
равенство			—	J'(u 0) ) —0			следует	из того, что
g '(a 0) = 0 при ао> 0			и	g'Q(ct-0) > 0 при а0 = 0 и формулы					(1.4).
"Пусть равенства			(5)	имеют место при некотором п^О . Пока
жем, что тогда	(5)		верно и для		п + 1.	В самом деле, если			а „ > 0 ,
то согласно (3)
ё'пК ) =	~	(J>(ип — апРп), Рп) =				— (J' (Ы/Н-l). р„) = о.
Если же а„ = 0,	то ип+1 = и„ и
0 < g'n (0) =	— ( j’ («„), р„) =				— (/' (иа),		J' (ип) — P„pn_l) =
	=	— \|		(«„) I2 =	— \|/' (un+i) \|2 < О,
следовательно, /' («„+]) =				0 и ( J ' (ип+1), рп) = 0. Наконец,
(J ' (Un+l)i p n + l) — { J ' (Un+l), j ' (Цл+1)						Рл+lPn) = \|J '		( Lin + 1)\|2- A

2.Сначала остановимся на случае квадратичной функции

J(u) = ± ( A u ,u ) - { b ,u ) ,

(7)

где Л — известная симметричная положительно определенная матрица порядка m X m , Ь— заданный вектор. К задаче миними зации такой функции сводится решение системы линейных алге браических уравнений А и = Ь . В самом деле, здесь

J' (и) = Аи — Ь.

(8)

Так как J (и) — выпуклая (и даже сильно выпуклая) функция, то согласно теореме 1.3 m in/(«) будет достигаться в точке и* тогда

Еm

и только тогда,			когда / '(«) = А и —Ь — 0.
Для минимизации функции (7) применим метод сопряженных
градиентов.	Так как
8п («) =	J	(«л — арл) =		-j-	а 2 (Лрп, Рп) — a (J' («„), р„) + J Ю ,	■
то min g n (а)		достигается		при .
а>0
а = а п			( J (Цд), Рп)		I г Ы I2 > 0 , п = 0, 1,	О)
			( Арп ,Рп)		■ (Арп, Рп)