Файл: Основы автоматического управления..pdf

Скачать файл (24,30Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 314

Скачиваний: 15

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

652 ГЛ . 16. М ЕТО ДЫ О П Р Е Д Е Л Е Н И Я ОПТИМ А ЛЬН О ГО У П Р А В Л Е Н И Я

Добавим к (16.2.1) уравнение (16.1.9), которое в данном случае имеет вид

	»n+i =	S	0 + “Л»		Уп+і(іо) = Р(У (to))-		(16.2.9)
		3=1
Так	как никаких		ограничений	на	конечное	состояние	объекта
не	наложено,	то	л = уп+і (<„).	Учитывая		(16.2.1) и	(16.2.9),

находим функцию Гамильтона (16.1.13);

П п

Н = У_	(фі + фп+і\|^) фі (ff, І )+ У , (фі + фп+l^ -) Ui-
i=l	i=l

Отсюда видно, что H будет иметь наибольшее возможное значение в любой момент t, если

ui = RiSgn (фг + фп+і!^) (і =1, (16.2.10)

Таким образом, управления и в этом случае имеют релейный характер с функциями переключения фі + фп+і дF • Для опре

деления этих функций переключения необходимо проинтегриро вать уравнения (16.1.14), которые в данном случае имеют вид

V	,	9F \ да:		,	Г d*F	/	,
3=1							I (16.2.11)
3=1
Фп+і = 0					= 1, . . ., п), фп+і (tK) = —1.
с конечными условиями фі (*K) =			0	(і	= 1, . . ., п), фп+і (tK) = —1.
Из этих уравнений		следует,	что		фп+1 (t) =	—1.	Присоединяя

к уравнениям (16.2.11) систему (16.2.1) и формулу (16.2.10), полу чим полную систему уравнений, определяющих фі и Уі. Численное их решение дает возможность найти функции фі и уі и оконча тельно определить оптимальные управления Ui. Отметим, что только в случае линейного объекта (функции фі линейно зависят от уі) уравнения (16.2.11) интегрируются отдельно.

П р и м е р	16.2.2. Объект управления					описывается линейными урав
нениями
Уі — ° н (0 Уі +		а 12 (0 У2 +		ui>	Уг — а2і(1) УI -Г а 22 (0 Уг
при начальных	условиях	уі ( 0 ) =		у )0,	Уі ( 0	) = у го.	Требуется	определить
оптимальное управление, ограниченное по						модулю,	\| щ \| < R,	минимизи
рующее модуль	координаты		у, в момент времени tK: I (tK) = F (уі (tK)) =
= I Уі U h ) I - Дополнительное			уравнение для			у 3 в данном случае		имеет вид
		Уз=	\| ѴіІ.	0з(О) =		\|у ю \|.

§ 16.2. П РИ М Е Н Е Н И Е П РИ Н Ц И П А МАКСИМУМА

053

Всоответствии с (16.2.10) оптимальное управление определяется формулой

щ= R sgn (ф4 — sgn yi).

Для определения фі служат уравнения

фі =	— <Чі (t) фі — azl (г) ф2 + аи sgn Уl.	Фі (6<)=0>
ф2 =	—ai2 (0 фі — a 22 (0 фг + а 12 (0 sgn Уi>	фг (*к)— 0 .

Численное решение этих уравнений совместно с уравнениями для yt, у2 при учете формулы для щ дает возможность определить оптимальное управ ление Ui (t).

Рассмотрим третью типовую задачу определения оптимального управления для объекта, поведение которого описывается теми же

уравнениями (16.2.1),	при	заданном начальном состоянии	у0 =
= у (t0). Требуется определить оптимальные управления и,-,			огра
ниченные по модулю,	I ui I	Ri, и переводящие объект из началь

ного состояния Уі (t0) в заданное конечное состояние yt (tK) за задан ное время tK— tQ при минимизации интеграла (16.1.7).

Добавляя к уравнениям (16.2.1) уравнение (16.1.10) и учиты вая, что конечное состояние объекта задано, запишем минимизи руемый функционал в виде

я = г/п+і (<к) + 2	ЬіУі Ѵк).	(16.2.12)
2=	1

Используя уравнения (16.2.1) и (16.1.10), находим функцию Гамильтона (16.1.13):

П
н = 2 фі [фг (г/. 0 + иі1 + фп+іГ(у, ад, t).	(16.2.13)

Условие максимума этого выражения с учетом ограничений | и,- | ^ ^ Ri определяет оптимальное управление ад как функцию величин Фг/фп+ь У и t. Для определения вспомогательных переменных Фг> Фп-и составим уравнения (16.1.14) при конечных условиях

(16.1.15):

ф; = - 2	д<Рj		dF	ф< (tK) = О
ф; = - 2	Ф> дУі	■Фп+l дУі		ф< (tK) = О
2 = 1				(16.2.14)
				(І — 1 , • • •, п),
Фп+І -- 0 ,	фп+1 (^к) --		!•	J

Из последнего уравнения следует, что фп+1 (t) == —1. Объединяя уравнения (16.2.1), (16.2.14) и формулу для и, полученную из усло вия максимума Н, и учитывая начальные и конечные условия, получаем полную систему уравнений, численное решение которой дает возможность определить все переменные и вычислить опти мальные управления Ui (t).

654	ГЛ . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я
П р и м е р			16.2.3. Рассмотрим систему,		поведение которой описывается
уравнениями			•*
			Уі = У2,	У2 = —<1Уі+иі		(в > 0).
Требуется		найти оптимальное управление			щ,	ограниченное	по	модулю,
I щ I	Я,	переводящее объект из начального				состояния уі0,	у2о	в состоя
ние	у1к, у2к за		заданное	время tK и минимизирующее интеграл

гк

I(tK) = j I «i (О I

Дополнительное уравнение (16.1.10) в данном случае имеет вид

і/з==І “ 1 1. г/з(0)= о .

С учетом заданного конечного положения объекта минимизируемый функцио нал принимает вид (16.2.12). Функция Гамильтона определяется формулой

	Н =	фіу2 + Фг {— ауг + щ) + Фз I «і I-
Уравнения (16.2.14), определяющие функции ф( и ф2, имеют вид
Фі = 0,	ф2=	—фг+ афг, фі(*к)= —^l, Ф2 (<к)= —Х2,
а фз (<) = —1.	Оптимальное управление, доставляющее максимум функ
ции Я , имеет вид щ =		0 при \| ф2 (<) \| < 1, щ = R sgn ф2 (t) при \| ф2 (t) \| ;> 1.

Оптимальный процесс и оптимальное управление іц (t) определяются путем численного решения уравнений для уі, у2, фі, ф2 при учете полученной форму

лы для mj, а	также	начальных	н конечных	условий.
П р и м е р	16.2.4. Объект		управления	описывается уравнением
	У =	—о,бу + и,	у (t0) = 0,	у (tK) =	10.

Требуется определить оптимальное управление и, ограниченное по модулю,

I и I	25,	при котором объект за заданное время tK — t0 = 1 с переводится
из начального состояния у0 =			0	в конечное ук = 10	и при этом функционал
			«к
		/( 'к ) =	{	[у2 (0 + 1-25^2 (О] dt
			to
принимает		минимальное значение.			вид
Минимизируемый функционал (16.2.12) имеет					вид
		я = Уг Uk) + ^іУі ({к)<
где у2	= УІ + l,252;t2, yi = у. Функция Гамильтона в данном случае имеет вид

Н = ф (— 0,6yt + M) — уі — l,252u2.

Оптимальное управление, минимизирующее функцию Я, имеет вид

	§ 16.3.	Д И Н А М И Ч ЕС К О Е П РО ГРА М М И РО ВА Н И Е	655
где	к = 1,25, R =	25. Для определения функции ф составим	уравне
ние	(16.2.14):

Ф = 0 ,6ф + 2уі, ф (tK) = 0 .

Далее решение задачи можно получить путем совместного численного инте грирования уравнений для yt и ф при учете найденного вида управления и.

§ 16.3. Динамическое программирование

Метод динамического программирования был разработан прак тически одновременно с принципом максимума и представляет собой другой способ решения тех же вариационных задач с огра ничениями на управления и на фазовые координаты объекта. Этот метод достаточно полно обоснован для оптимизации дискрет ных систем, в области которых лежит основная сфера его приме нения. При этом вариационная задача рассматривается как много этапный процесс решения более простых задач, а оптимальное управление отыскивается последовательно шаг за шагом.

При применении динамического программирования к вариаци онным задачам теории управления снимается трудность решения граничной двухточечной задачи, к которой приводит применение принципа максимума. Однако возникают свои вычислительные трудности, связанные с возрастанием размерности решаемых задач.

Метод динамического программирования обладает большой общностью и применим для решения широкого круга задач, в которых связи между координатами, управлениями и сами критерии могут быть заданы в виде уравнений произвольного вида, графиков или таблиц.

При некоторых допущениях метод динамического программи рования применим непосредственно и к непрерывным системам, описываемым дифференциальными уравнениями. В этом случае вариационная задача также сводится к некоторой граничной зада че дифференциальных уравнений в частных производных, решение которой, однако, связано с вычислительными трудностями.

В основе метода динамического программирования лежит принцип оптимальности, доказанный Р. Веллманом, как общее необходимое условие оптимального процесса, справедливое как для дискретных, так и для непрерывных систем. Этот принцип формулируется следующим образом: оптимальное управление обладает тем свойством, что, каково бы ни было начальное состоя ние и управление до данного момента, последующее управление должно быть оптимальным при том состоянии, в которое пришла система в результате первого этапа управления [77, 78]. Из прин ципа оптимальности следует, что оптимальное управление опре деляется лишь состоянием системы в каждый данный момент

G5C гл. 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

времени и целью и не зависит от состояний в предыдущие моменты

времени.

Для изложения существа метода и получения рекуррентных расчетных соотношений рассмотрим простейшую одномерную дис кретную систему, поведение которой описывается разностным уравнением на заданном интервале tK— t0 = Т:

у (к + 1) = у (к) + / (у (к), и (к), к),

(16.3.1)

где у (к) — координата системы, и (к) — управление в момент времени кТп (к = 0, 1, . . ., N), Ти = (£к — t0)/N — интервал дискретности. Пусть начальная координата объекта равна у (£0) = = у0, а управление ограничено, | и | ^ R. Требуется определить последовательность оптимальных управлений и (0), . . ., и (N — 1), минимизирующую сумму

I = % lF(y(k),u{k)) + Q(y(N)),	(16.3.2)
h= 0
где F н Q — некоторые известные функции. Задача минимизации
функции (16.3.2) многих переменных и (0), и (1), . . .,	и (N — 1)

сложна. Однако, воспользовавшись принципом оптимальности, можно свести общую операцию минимизации функции многих переменных к последовательной минимизации функций одной

переменной.	Действительно, рассмотрим			последний интервал
(N — 1) Тп ^	t ^ NTa,	предполагая,	что	состояние	у (N — 1)
известно. На	основании	принципа	оптимальности		управление

и (N — 1) на этом интервале зависит от у (N — 1), должно удов летворять ограничению и минимизировать на этом интервале сумму, входящую в (16.3.2):

I N-1 = F (у (N - 1),		и (N -	1)) + Q (у (АО).			(16.3.3)
Заменив	у (N) его выражением из		уравнения	(16.3.1),		получим
/ * - . =	F ( y ( N - 1), и (N -	1)) +	Q (у (N -	1) +	/ (у (N - 1),
		и (N — 1), N -			1)).	(16.3.4)

Сумма (16.3.4) зависит от одной неизвестной и (N — 1), которую следует выбрать из условия минимума I N-i при учете ограни чения на и. Обозначим это оптимальное значение и* (N — 1), а минимальное значение I N-\, зависящее от у (N — 1), через

S . V - . ( У ( Л Г —	1 ) ) :
SN-i (y(N —1))=		min IN-! =
		\|u(N—1)\|<R
=	min	{F (у (N — 1), u ( N - i ) ) + Q ( y ( N - i ) +

|u(N-l)KR

+ f { y ( N - 1), u ( N — 1), N — 1))). (1 6 . 3 .5 )

Смотрите также файлы

Переходы через водотоки..pdf

Петросьянц А.М. Атомная энергетика зарубежных стран. США, Канада, Великобритания, Франция, ФРГ, Италия, Швеция, Швейцария, Япония.pdf

Проворов К.Л. Радиогеодезия учеб. пособие.pdf

Райт П. Полиуретановые эластомеры.pdf

Рогов И.А. Физические методы обработки пищевых продуктов.pdf

Файл: Основы автоматического управления..pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно